Buscar

Prévia do material em texto

129
CAPÍTULOCAPÍTULOCAPÍTULOCAPÍTULO 4444 
 
SANTANA, A. C. de. Métodos quantitativos em economia: elementos e aplicações. Belém: UFRA, 2003. 
 
MODELO DE REGRESSÃO LINEAR MÚLTIPLA 
 
 
Introdução, 130 
4.1 O modelo de três variáveis - 131 
4.2 Hipóteses clássicas do modelo de RLM - 134 
4.3 Estatísticas dos estimadores de MQO - 136 
4.4 Teste de restrição linear dos parâmetros - 139 
4.5 Aplicação do modelo - 140 
4.6 Regressão múltipla com variável dummy - 150 
4.7 Aplicações do modelo de RLM à economia brasileira - 156 
 
OBJETIVOS DO CAPÍTULO 
 Desenvolver o modelo de regressão múltipla e introduzir algumas extensões 
 Avaliar a contribuição de cada variável independente para o modelo de regressão 
múltipla 
 Determinar o poder explicativo e a validade do modelo de regressão múltipla 
 Fazer aplicações do modelo de regressão múltipla a problemas micro e macroeconômicos 
da economia brasileira 
 
 
 
 
 130
CAPÍTULO 4 
MODELO DE REGRESSÃO LINEAR MÚLTIPLA 
 
 
INTRODUÇÃO 
 modelo geral de regressão linear múltipla (RLM) é uma técnica econométrica que pode 
ser utilizada para analisar a relação entre uma variável dependente e duas ou mais variáveis 
independentes. O objetivo do modelo de RLM é utilizar variáveis independentes cujos 
valores são conhecidos para prever os valores da variável dependente selecionada. 
A idéia contida neste modelo de RLM é de que uma parcela substancial das variações da 
variável dependente (Y) é explicada pelo conjunto das variáveis independentes ou explicativas 
(Xi; i=1, 2, ..., k), e a parcela não-explicada dessas variações é representada pelo termo de erro 
aleatório. 
No caso das variações explicadas, a contribuição parcial de cada uma das variáveis 
independentes é isolada por meio dos parâmetros (βi, i=1, 2, ..., k). Assim, β1 indica o quanto Y 
deve variar em resposta a uma mudança unitária na variável X1, ceteris paribus. 
O poder explicativo de cada variável independente pode ser isolado por meio de 
regressões simples entre Y e cada uma das variáveis Xi e computando-se o valor do coeficiente de 
determinação simples. Ou de outra maneira, calculando a correlação simples entre Y e cada 
variável Xi. 
Portanto, percebe-se que o modelo de RLM é um importante instrumental de análise de 
problemas econômicos, porque permite relacionar variáveis, quantificar seus efeitos e testar as 
hipóteses teóricas subjacentes aos fenômenos estudados. 
Na prática, o modelo de regressão linear simples apresenta pouca utilidade, porque os 
fenômenos econômicos que podem ser explicados por apenas uma variável independente são 
poucos (capítulo 3). Os problemas econômicos geralmente exigem mais de uma variável 
explicativa para representá-los. A demanda de carne de frango, por exemplo, necessita além dos 
preços relativos para explicar as variações nas quantidades demandadas, a renda per capita dos 
consumidores e o preço dos produtos complementares ou substitutos. 
Há, pois, necessidade de se ampliar o número de variáveis explicativas do modelo 
simples. Fazendo isto, a análise remete o leitor para a discussão do modelo de regressão linear 
múltipla (RLM), em que a variável dependente (Y) é regressada contra duas ou mais variáveis 
explicativas (Xi). Deve-se ter em mente que o modelo continua linear nos parâmetros, mas não 
necessariamente nas variáveis explicativas. 
O modelo geral de regressão linear múltipla, envolvendo k variáveis explicativas pede ser 
representado como a seguir: 
O 
 
 131
εβββββ tktktttt XXXXY ++++++= ...3322110 4.1 
em que: 
Y é a variável dependente; 
X1,...,Xk são as variáveis independentes ou explicativas incluídas na regressão; 
t é a t-ésima observação de cada variável dependente e independente; 
ε termo de erro aleatório e satisfaz as hipóteses clássicas do modelo de RLC; 
β0 ,β1,...,βk são os coeficientes parciais ou parâmetros de regressão múltipla a serem 
estimados, em que β0 é o intercepto e os demais βi (i=1,2,...,k) são as inclinações. 
 
Para efeito de didática, iniciar-se-á o estudo da regressão múltipla pelo modelo mais 
simples. Tal modelo envolve apenas três variáveis: uma dependente (Y) e duas independentes ( X1 
e X2 ), isto é, Y f X X= ( , )1 2 . 
4.1 O MODELO DE TRÊS VARIÁVEIS 
A teoria do consumidor prega que a demanda de um produto pode ser explicada pela 
influência do preço do produto, da renda do consumidor e dos preços dos produtos relacionados 
no consumo. Para o modelo de RLM de três variáveis, adicionar a variável renda ao modelo de 
demanda de frango apresentada no capítulo anterior. 
Em geral, a teoria não indica qual a forma matemática da função de demanda. Por isso, 
pode-se especificar o comportamento da quantidade demandada de carne de frango (Y) em função 
do preço real da carne de frango (X1) e da renda real per capita dos consumidores brasileiros (X2), 
assumindo uma relação linear. 
XXY iii 22110 βββ ++= , para (i = 1, 2, ..., n) 
Esta relação exata mostra que as variações nas quantidades demandadas são plenamente 
explicadas por variações no preço e na renda, ou seja, indica apenas a componente sistemática ou 
não-estocástica da regressão. Entretanto, além dessas variáveis há outras que não foram incluídas 
no modelo e podem gerar erros nos valores dos parâmetros estimados por MQO. A influência 
desses fatores deve ser representada por uma componente aleatória εt, introduzida na função de 
regressão, para especificar o modelo econométrico de regressão linear múltipla 4.2. 
Regressão múltipla: εβββ tttt XXY +++= 22110 4.2 
em que: 
Y é a variável dependente; 
X1,. ., Xk são as variáveis independentes ou explicativas; 
t é a t-ésima observação; 
ε termo de erro aleatório. 
 
 132
β0 é o intercepto ou valor médio de Y quando X1 e X2 forem iguais a zero; 
β1 mede a mudança no valor médio de Y, E Y( ) , resultante da variação unitária em X1, 
mantendo-se o valor de X2 constante; 
β2 mede a mudança no valor médio de Y, E Y( ) , resultante da variação unitária em X2, 
mantendo-se o valor de X1 constante. 
 
Neste caso, as mudanças no valor médio de Y, E Y( ) , são atribuídas em parte a X1 e em 
parte a X2. Assim, cada variável independente contribui parcialmente para explicar as mudanças 
totais na variável dependente. 
Matematicamente, essa contribuição é determinada por meio da aplicação do conceito de 
derivada parcial, dado pro: 
i
it
t
X
Y
β=
∂
∂
, para i = 1, 2. 
4.1.1 Estimação dos parâmetros por MQO 
A estimação dos parâmetros da RLM é feita pelo método dos mínimos quadrados 
ordinários (MQO) já descrito no capítulo 3. Da mesma maneira deve-se tomar a regressão 
representativa dos dados da população, em que os parâmetros são indicados com letras gregas. 
Esta regressão não pode ser estimada por causa da não disponibilidade de informações sobre o 
todo da população, ou em função dos custos elevados e de outras dificuldades operacionais para 
obtê-las. Portanto, a análise é feita com base em dados amostrais, que representam a população. 
Os testes estatísticos dos parâmetros, portanto, serão construídos em relação às suas respectivas 
estimativas. Os parâmetros da regressão amostral, representados em letras minúsculas do alfabeto 
latino, são os estimadores lineares não-viesados dos parâmetros populacionais. 
As regressões múltiplas da população (RMP) e da amostra (RMA) são especificadas em 
seguida: 
 
Regressão da população (RMP): εβββ tttt XXY +++= 22110 4.3 
Regressão da amostra (RMA): t t t tY b b X b X e= + + +0 1 1 2 2 4.4 
em que: 
b0 é o estimador não-viesado de β0; 
b1 é o estimador não-viesado de β1; 
b2 é o estimador não-viesado de β2; 
et é o estimador não-viesado de εt. 
O valor médio ou valor estimado da regressão amostral é dado por: 
Valor médio de Y : E t t t tY b b X b X Y( ) $= + + =0 1 1 2 2 4.5 
 
 133
Valor estimado de Y: 
t t tY b b X b X$ = + +0 1 1 2 2 4.6 
Termo de erro et : t t t t t te Y Y Y b b X b X= − = − − −$ 0 1 1 2 2 4.7 
O método de mínimos quadrados diz respeito ao processode estimação dos parâmetros 
da regressão, de tal modo que o termo de erro seja o menor possível. Para isto, o primeiro passo é 
tomar a soma de quadrados dos erros, dado na equação 4.7. Isto é feito como em 4.8. 
Soma do erro ao quadrado (SEQ): ∑ ∑ −−−= )( 22110
22
XbXbbYe tttt 4.8 
O método de MQO consiste em obter a derivada parcial de (4.8) em relação aos 
parâmetros e igualar o resultado a zero, como a seguir: 
∂
∂
t
i
e
b
i
2
0 0 1 2∑ = =; ( , , ) 
Derivada parcial em relação ao parâmetro b0: 
∑ −−−∑
∑
=−=−= 0)2(2 )( 22110
0
2
XbXbbY
b
e
ttti
t e
∂
∂ 
∑ ∑∑ ++= XbXbnbY ttt 22110 
Derivada parcial em relação ao parâmetro b1: 
∑ −−−∑
∑
=−=−= 0)2(2 )( 2211011
1
2
XbXbbYX
b
e
ttttti
t Xe
∂
∂
 
t t t t t tY X b X b X b X X1 0 1 1 1
2
2 1 2= + +∑ ∑ ∑ ∑ 
Derivada parcial em relação ao parâmetro b2: 
∑ −−−∑
∑
=−=−= 0)2(2 )( 2211022
2
2
XbXbbYX
b
e
ttttti
t Xe
∂
∂
 
∑∑∑∑ ++= XbXXbXbXY tttttt
2
22211202
 
O sistema de equações normais do modelo é o seguinte: 
∑ ∑∑ ++= XbXbnbY ttt 22110 
t t t t t tY X b X b X b X X1 0 1 1 1
2
2 1 2= + +∑ ∑ ∑ ∑ 
∑∑∑∑ ++= XbXXbXbXY tttttt
2
22211202
 
4.9 
O sistema de três variáveis e três equações pode ser resolvido por substituição simples ou 
pelo método da regra de Cramer, como feito no capítulo 3. Aplicando um destes métodos e 
tomando as variáveis na forma reduzida, obtêm-se os seguintes resultados: 
 
 134
t ty Y Y= −( ) , 1 1 1t tx X X= −( ) e 2 2 2t tx X X= −( ) 
 
0 1 1 2 2b b X b XY= − − 
∑ ∑ ∑
∑ ∑ ∑ ∑
−⋅
⋅−⋅
=
)( 21)()(
)()()()(
22
2
2
1
212
2
21
1
xxxx
xxxyxxy
b
tttt
ttttttt 
∑ ∑ ∑
∑ ∑ ∑∑
−⋅
⋅−⋅
=
)( 21)()(
)()()()(
22
2
2
1
211
2
12
2
xxxx
xxxyxxy
b
tt
t
tt
tttttt 
4
4.10 
A equação na forma reduzida, de forma didática, é obtida da seguinte maneira: 
t t t tY b b X b X e= + + +0 1 1 2 2 4.11 
Somando-se todas as observações das variáveis e fazendo-se a divisão por n, tem-se a 
equação média 4.12. 
Y b b X b X e t= + + +0 1 1 2 2 4.12 
Subtraindo-se 4.12 de 4.11, obtém-se a equação na forma reduzida, dada por 4.13. 
( ) ( ) ( ) ( )t t tY Y b b b X X b X X− = − + − + −0 0 1 1 1 2 2 2 
t t t t
y b x b x e= + +1 1 2 2 4.13 
Termo de erro: t t t t t te Y y Y b x b x= − = − −( ) ( )1 1 2 2 
Soma do erro ao quadrado: te Y b x b xt t t
2 2
1 1 2 2∑ − −∑= ( ) 
Por fim, a aplicação do método de MQO para estimar os parâmetros do modelo de 
regressão múltipla está subordinada às hipóteses apresentadas na próxima seção. 
4.2. HIPÓTESES CLÁSSICAS DO MODELO DE MQO 
Para o modelo de regressão múltipla 4.3, a hipótese sete é adicionada às seis hipóteses 
apresentadas para o modelo de regressão simples do capítulo 3. 
Hipótese 1: linearidade dos parâmetros; 
Hipótese 2: o termo de erro tem média zero: 0)( =ε tE ; 
Hipótese 3: homocedasticidade, variância constante: σε
2
1 ),...,|( =kXXVar ou σε
22
)( =
t
E ; 
Hipótese 4: não autocorrelação entre os erros: )(,0),cov( ht
ht
≠∀=εε ; 
 
 135
Hipótese 5: as observações das variáveis explicativas Xi são fixas e tais variáveis não estão 
correlacionadas com o termo de erro; 
Hipótese 6: o termo de erro tem distribuição normal: ),0(~
2
σε Nt ; 
Hipótese 7: não há exata colinearidade entre pares de variáveis explicativas, isto é, não há uma 
combinação linear exata entre duas ou mais das variáveis explicativas. A violação desta hipótese 
torna o sistema de equações normais redundante, e não se pode mais resolver o sistema para os 
estimadores de MQO dos k coeficientes. 
Na realidade, os casos de perfeita multicolinearidade são raros; o que de fato pode estar 
presente entre as variáveis explicativas é a multicolinearidade imperfeita, ou seja, os casos em 
que nenhuma das variáveis independentes pode ser expressa como uma exata combinação linear 
com outra variável, ou com as demais variáveis, como por exemplo, X1 = f(X2,...,Xk). 
Qual a real implicação da multicolinearidade imperfeita para o modelo de RLM? 
Para responder esta pergunta, pode-se lançar mão da equação 4.4 e assumir que a variável 
X1t seja expressa como uma relação linear exata da variável X2t, da seguinte forma: 
XX tt 21 22 += ou 1 25t tX X= 
Isto significa que estas duas variáveis são colineares, dado que há uma exata relação linear 
entre X1t e X2t. Fazendo a substituição de X1t = 5X2t na equação 4.4 e calculando o valor esperado 
de Yt, tem-se que: 
E At t t t tY b b X b X b b b X b X( ) (5 ) (5 )= + + = + + = +0 1 2 2 2 0 1 2 2 0 2 
E At tY b X( ) = +0 2 
A b b= +5 1 2 
Isto mostra que o modelo é de duas variáveis e não de três. Da estimação do modelo 
acima, obtém-se o valor de A, porém, isto não permite que os valores de b1 e b2 sejam 
determinados. Assim, não é possível isolar os efeitos das variáveis X1 ou X2, sobre a variável 
dependente Yt. 
Sabe-se que na prática a multicolinearidade perfeita é rara, o que geralmente ocorre são 
casos de alta colinearidade, ou quase perfeita colinearidade. Este aspecto volta a ser abordado, 
com maior profundidade, no capítulo 5. 
4.3 ESTATÍSTICAS DOS ESTIMADORES DE MQO 
O objetivo desta seção é apresentar as fórmulas utilizadas no cálculo da variância, desvio 
padrão e estatísticas t dos parâmetros amostrais da regressão múltipla. 
a) Variância e desvio padrão dos estimadores 
Parâmetro bo : 
 
 136
σ
2
22
2
2
1
2121
2
1
2
2
2
2
2
1
0
2
0
)( 21
21
)var( ⋅







−
−+
+==
∑ ⋅∑
∑ ∑ ∑
∑ tt xxxx
xxXXxXxXbs
tt
tttt
b n
 
)var()( 000 bbdpsb == 
4.14 
Parâmetro b1: 
σ
2
22
2
2
1
2
2
1
2
1
)( 21
)var( ⋅







−
==
∑ ⋅∑
∑
∑ tt xxxx
x
bs
tt
t
b 
)var()(
11
1 bbdpsb == 
4.15 
Parâmetro b2: 
σ
2
22
2
2
1
2
1
2
2
2
)( 21
)var( ⋅








−
==
∑ ⋅∑
∑
∑ tt xxxx
x
bs
tt
t
b 
)var()(
22
2 bbdpsb == 
4.16 
 
Variância da regressão 
2
σ : 
2
2
σ =
−
∑ te
n k
 4.17 
 
b) Teste de hipótese dos estimadores 
Os testes de hipóteses dos parâmetros da regressão amostral são avaliados com base no 
valor da estatística t de Student, relativa a cada parâmetro. As fórmulas são dadas em 4.18. 
Parâmetro bo : t
b
t knb
bs )(
0
0 ~
0
−
= 
4.18 Parâmetro b1 : t
b
t knb
bs )(
1
1 ~
1
−
= 
Parâmetro b2 : t
b
t knb
bs )(
2
2 ~
2
−
= 
A aferição da significância dos parâmetros resultará do confronto entre as estatísticas t, 
calculadas a partir dos resultados obtidos pelas estimativas geradas por MQO e os respectivos 
valores críticos, ou valores tabulados, com (n - k) graus de liberdade e um nível de significância 
de 5%. Estes valores críticos são obtidos na tabela de estatísticas t, disponível no Apêndice A. 
 
 137
Uma “regra de bolso” válida para aferição imediata da significância dos parâmetros, por 
meio da estatística t, a 5% de probabilidade, em teste bilateral, é dada por: 
i. Se bibis 2
1
f ou ibtbi 2p aceita-se a hipótese nula, ou seja, aceita-se que o estimador bi não é 
estatisticamente diferente de zero, a 5% de probabilidade para um teste bilateral; 
ii. Se bibis 2
1
p ou ibtbi 2f rejeita-se a hipótese nula, ou seja, aceita-se que o estimador bi é 
estatisticamente diferente de zero, a 5% de probabilidade para um teste bilateral. 
c) O coeficiente de determinação múltipla (R2) e a estatística F 
A estatística R2 expressa a proporção da variabilidade amostral da variável dependente 
que pode ser explicada pela dependência linear com as variáveis independentes. Isto pode ser 
determinado obtendo-se a soma de quadrados como a seguir: 
Soma de quadrados: SQT SQR SQE= + 
∑ ∑ ∑+= eyy ttt
222 ˆ 4.19 
A soma de quadrados totais (SQT) é igual à soma de quadrados da regressão (SQR) ou 
variação amostral explicada pelas variáveis independentes e a soma de quadrados do erro (SQE) 
ou variação amostral não-explicada pelas variáveis independentes incluídas na regressão. 
Portanto, o coeficiente de determinação múltipla (R2) é a proporção da variação explicada em 
relação à variação total da variável dependente, e é calculado como a seguir:i. Coeficiente de determinação: 
∑
∑ ∑
∑
∑ +
==
y
xYbxYb
y
y
R
t
tttt
t
t
2
2211
2
2
2 ˆ 
∑
∑
−=
y
e
R
t
t
2
2
2
1 4.20 
Assim, um R2 = 0,90 indica que 90% da variabilidade amostral de Y é explicado pela sua 
dependência linear com as variáveis independentes. 
ii. Coeficiente de determinação ajustado: 2 21 1
1
R R
n
n k
= − − ⋅
−
−
( )
( )
( )
 
A interpretação do coeficiente de determinação ajustado ( 2R ) é idêntica à atribuída ao 
coeficiente de determinação simples ou não-ajustado ( 2R ). Para as situações em que k > 1, tem-
se que o 2R ≤ 
2
R . No caso de 
2
R assumir valor próximo de zero ou zero, o 2R pode assumir um 
valor negativo. No limite, com k se aproximando de n, pode-se obter um valor de 2R próximo de 
- ∞. Portanto, a estatística 2R pode variar no intervalo (- ∞, 1). 
 
 138
iii. Teste de validade da regressão – Estatística F 
O teste F é aplicado para avaliar se as variáveis independentes X1, X2, ..., Xn, incluídas no 
modelo de regressão múltipla, apresentam alguma influência significativa sobre a variável 
dependente Y. Formalmente, o teste de significância global ou teste de validade da regressão para 
a hipótese nula é dado por 
0...: 210 ==== bbbH k 
Esta hipótese significa que, em conjunto, as variáveis não são importantes para explicar o 
modelo, ou seja, para explicar as variações de Y. Portanto, conclui-se que o modelo não é 
adequado para representar o fenômeno estudado. A hipótese alternativa é dada por 
:H a nem todos os bi são iguais a zero (i = 1, 2, ..., k). 
Se a hipótese nula é aceita, não deve haver relação linear entre a variável dependente Y e 
todas as variáveis independentes e vice-verso. 
O teste F, utilizado para avaliar a importância global das variáveis independentes ou 
validade da regressão, é dado pela fórmula 4.21. 
Estatística F : 
)/()1(
)1/(
)/(
)1/(
2
2
,1
kn
k
knSQE
kSQR
R
R
F knk
−−
−
=
−
−
=−− 4.21 
 
em que: 
SQR é a soma de quadrados da regressão; 
SQE é a soma de quadrados dos resíduos da regressão; 
k é o número de parâmetros da regressão, inclusive o intercepto; 
n é o número de observações. 
A estatística F, então, é dada pela razão entre a variação explicada e a variação não-
explicada da regressão. 
4.4 TESTE DE RESTRIÇÃO LINEAR DOS PARÂMETROS 
Os testes de significância dos parâmetros, tipicamente são realizados de forma individual. 
Entretanto, há um caminho interessante que permite testar a significância conjunta de dois ou 
mais parâmetros simultaneamente, ou testar se uma restrição linear estabelecida entre os 
coeficientes é satisfeita, ou ainda para testar a introdução de outras variáveis explicativas no 
modelo. 
O teste de restrição é realizado com base nos resíduos da regressão. A estratégia é a de 
que o modelo que inclui a restrição ou modelo restrito deve ser estimado para se obter a soma de 
quadrados dos erros restritos, denominado SQEr. Igualmente, o modelo sem restrição ou modelo 
irrestrito é estimado para se obter a soma de quadrados dos erros irrestritos, denominado SQEi. 
Com base nestas estimativas, uma estatística F é determinada, como a seguir: 
 
 139
)/(
/)(
knSQEi
mSQEiSQEr
F
−
−
= 4.22 
 
em que: 
m é o número de restrições ou de variáveis adicionadas ao modelo; 
n é o número de observações; 
k é o número de parâmetros, inclusive o intercepto; 
n-k é o número de graus de liberdade do modelo irrestrito. 
A idéia deste teste é de que se a restrição é correta, a SQEr pode não ser muito diferente 
da SQEi. Se elas forem diferentes rejeita-se a restrição. 
Alternativamente, o teste F pode também ser expresso em termos do coeficiente de 
determinação 
2
R , respectivamente, dos modelos restritos e irrestritos, como a seguir. 
)/()1(
/)(
2
22
knR
mRR
F
I
RI
−−
−
= 4.21 
 
em que: 
RR
2
 e IR
2
 são os valores dos coeficientes de determinação obtidos, respectivamente, das 
regressões restritas e irrestritas. Observe que 
I RR R
2 2≥ 
A distribuição de F segue com m e (n -k) graus de liberdade. 
A aplicação do teste pode ser ilustrada por meio dos seguintes exemplos: 
Exemplo 1: Testar a significância conjunta dos parâmetros b1 e b2 da seguinte regressão 
múltipla: Yi = b0 + b1 X1i + b2 X2i + b3 X3i + ei. A hipótese nula seria dada por: 
H0: b1 = b2 = 0 
Observa-se que são duas restrições b1=0 e b2=0 a serem testadas simultaneamente. Sabe-
se que estas hipóteses individuais são testadas por meio da estatística t, porém o teste conjunto é 
feito pela estatística F. A hipótese alternativa é dada por: 
Ha: pelo menos um bi é diferente de zero. 
Neste caso, o modelo restrito impõe a remoção das variáveis X1 e X2 da regressão, ou seja, 
a equação restrita a ser estimada é: Yi = b0 + b3 X3i + ei. O número de restrições é igual a dois (m 
= 2) e o número de graus de liberdade (n-k) é igual a (n – 4). 
Exemplo 2: Tomando-se o modelo de regressão do exemplo anterior, o teste é feito para verificar 
se os parâmetros b2 e b3 são iguais. Neste caso, o modelo restrito a ser estimado é especificado da 
seguinte maneira: Yi = b0 + b1 X1i + b2 (X2i + X3i) + ei, dado que b2=b3. 
 
 140
Exemplo 3: Também se pode testar a inclusão de variáveis relevantes na equação. Por exemplo, 
admita-se que uma função de demanda de um produto X seja especificada em função do preço e 
da renda: Qx = f(Px, R) e que, adicionalmente, esteja interessado em testar a inclusão da variável 
preço do produto Y que se julga relacionado ao consumo de X. Neste caso, a equação irrestrita é 
a que inclui o preço do produto Y, como a seguir: 
Modelo restrito: ieRbPbbQ ixixi +++= 210 
4.22 
Modelo irrestrito: ii ePbRbPbbQ yixixi ++++= 3210 
 
O teste de hipótese para aferir a relevância da variável Py no modelo é estabelecido da 
seguinte forma: 
Hipótese nula: 0: 30 =bH 
Hipótese alternativa: 0: 3 ≠bHa 
Aplica-se o teste F, após a estimação dos dois modelos, para verificar a validade da 
hipótese nula de que a variável Py não influencia o consumo do produto X. Se a hipótese 
alternativa for aceita, automaticamente conclui-se que Y influencia o consumo do produto X. 
4.5 APLICAÇÃO DO MODELO 
A aplicação será realizada para a função de demanda brasileira de carne de frango, 
trabalhada no capítulo 3. A diferença é que será incluída a variável renda, para gerar o caso do 
modelo de regressão múltipla com três variáveis independentes. Em seguida, adiciona-se o preço 
da carne de boi ao modelo, visando captar a influência de outra variável associada ao consumo de 
frango e tornar o modelo mais geral. 
A análise será iniciada com a especificação do modelo, descrição das variáveis e 
apresentação das hipóteses. Depois, passa-se à estimação dos parâmetros passo a passo via Excel 
e o software Eviews. A razão deste processo é apresentar para o leitor uma generalização do 
modelo desenvolvido no capítulo 3, aplicando-se a regressão em casos reais da economia agrícola 
brasileira. 
Especificação do modelo: 
);,0(~
2
210
σNe
eRbPbbQ
t
tt
f
t
f
t
+++= 
4.23 
 
a) Descrição das variáveis 
t
f
Q É a quantidade per capita de carne de frango demandada (ou consumo aparente é dado 
por: produção + importação – exportações), no Brasil, no ano t, em kg/hab.; 
t
f
P é o preço real da carne de frango, no Brasil, no ano t, em R$/kg; 
tR É a renda real per capita do consumidor brasileiro (no caso é o PIB dividido pela 
 
 141
população residente), no ano t, em R$/hab; 
et É o termo de erro aleatório; 
bi São os parâmetros a serem estimados (i = 0, 1, 2). 
b) Hipóteses teóricas 
0 0
0H b: = De que o intercepto é zero, ou seja quando os preços do frango e a renda forem zero 
não haverá consumo; 
aH b: 0 0f De que, independentemente do preço e da renda, haverá consumo de carne de 
frango; 
0 1
0H b: = De que os preços não influenciam as quantidades demandadas de carne de frango, 
ceteris paribus; 
aH b: 1 0p De que os preços apresentam uma correlação negativa com a quantidade 
demandada de carne de frango, indicandoque o efeito será inverso sobre as 
quantidades (lei da demanda); 
0 2
0H b: = De que a renda não influencia o consumo de carne de frango, ceteris paribus; 
aH b: 2 0f De que a renda apresenta uma correlação positiva com o consumo, indicando que o 
efeito será direto sobre a demanda (teoria do consumidor). 
 
O processo manual de estimação dos parâmetros da regressão múltipla é realizado a partir 
dos cálculos da Tabela 4.1. 
 
 
 
Tabela 4.1. Dados empregados na estimação da equação de demanda de carne de frango, Brasil. 
 A B C D E F G H I J K L 
1 Ano Qf Pf R q p r q.p q.r p.r p
2 
r
2 
2 1989 12,40 0,92 2893 -5,356 0,283 -631,889 -1,517 3384,116 -179,035 0,0803 399283,568 
3 1990 13,40 0,88 3042 -4,356 0,243 -482,889 -1,060 2103,249 -117,503 0,0592 233181,679 
4 1991 15,00 0,66 2617 -2,756 0,023 -907,889 -0,064 2501,738 -21,184 0,0005 824262,235 
5 1992 16,00 0,60 2526 -1,756 -0,037 -998,889 0,064 1753,605 36,626 0,0013 997779,012 
6 1993 17,00 0,55 2892 -0,756 -0,087 -632,889 0,065 478,183 54,850 0,0075 400548,346 
7 1994 18,50 0,52 3675 0,744 -0,117 150,111 -0,087 111,749 -17,513 0,0136 22533,346 
8 1995 22,50 0,50 4602 4,744 -0,137 1077,111 -0,648 5110,294 -147,205 0,0187 1160168,346 
9 1996 22,00 0,60 4738 4,244 -0,037 1213,111 -0,156 5148,983 -44,481 0,0013 1471638,568 
10 1997 23,00 0,50 4739 5,244 -0,137 1214,111 -0,717 6367,338 -165,929 0,0187 1474065,790 
11 No obs. Q P R q∑ p∑ r∑ q p⋅∑ q r⋅∑ p r⋅∑ 
2
p∑ 
2
r∑ 
12 9 17,756 0,637 3524,889 0,000 0,000 0,000 -4,119 26959,256 -601,373 0,201 6983460,889 
 
 
Modelo de regressão múltipla 
 143
Nota-se que as letras minúsculas são os desvios das variáveis: 
RRrPPpQQq iii −=−=−= ;; 
 
4607,15889,524.300282,0637,0)032,12(756,17210 =⋅−⋅−−=−−= RPY bbb 
032,12
)889,460.983.6()201,0(
)373,601()256,959.26()889,460.983.6()119,4(
)()(
)()()()(
)373,601()(
2222
2
1 −=
−⋅
−⋅−⋅−
=
−⋅
⋅⋅⋅−⋅⋅
=
−⋅∑∑
∑∑∑∑
∑ rprp
r
b
rprqpq
 
00282,0
)889,460.983.6()201,0(
)373,601()119,4()201,0()256,959.26(
)()(
)()()()(
)373,601()(
2222
2
2
=
−⋅
−⋅−−⋅
=
∑−⋅
⋅⋅⋅−⋅⋅
=
−⋅∑∑
∑∑∑∑
rprp
p
b
rppqrq
 
Regressão múltipla estimada: Qf = 15,4607 - 12,032 P
f + 0,00282 R 
 
 
c) Estimação do modelo por MQO, usando Excel 
Tomando os dados das colunas B, C e D da Tabela 4.1, o processo de estimação dos 
parâmetros e das estatísticas, por meio do Excel, é realizado da seguinte maneira: 
i. Abre-se o menu Dados e elege-se a opção analise de dados; 
ii. Escolhe-se regressão e preenche-se a tela de trabalho: intervalo Y: B2.B10; intervalo X: 
C2.D10; intervalo de saída: F2. 
Pelo que se observa, os dados da variável dependente Qf estão na coluna B, no intervalo 
de B2 até B10 e, das variáveis explicativas estão nas colunas C (variável preço Pf) e D (variável 
renda R), iniciando em C2 e findando em D10. Os resultados da estimação são os seguintes: 
 
Estatística de regressão 
R múltiplo 0,993 
R- quadrado 0,986 
R-quadrado ajustado 0,981 
Erro padrão 0,544 
Observações 9 
Estatística F 217,276 F de significação: 0,000 
ESTIMATIVAS DOS COEFICIENTES DE REGRESSÃO 
Parâmetro Coeficiente Erro padrão Estatística t Valor - p 
Interseção ( b0 ) 15,461 1,5203 10,1691 0,0000 
Variável X 1 ( b1 ) -12,032 1,4077 -8,547 0,0001 
Variável X 2 ( b2 ) 0,00282 0,0002 11,820 0,0000 
Observação: Um valor-p (valor-p x 100) inferior a 5% permite aceitar a hipótese alternativa 
para a estatística t. 
 
Santana, Antônio Cordeiro 
 144
d) Apresentação e análise dos resultados 
Os resultados incluem as estimativas dos parâmetros e suas respectivas estatísticas t entre 
parênteses. Também são incluídos os coeficientes de determinação múltipla simples e ajustado 
por graus de liberdade, a estatística F e os coeficientes de elasticidade-preço, dado por 
)/()/( QPPQp ⋅∂∂=ε e elasticidade-renda )/()/( QRRQr ⋅∂∂=ε . 
561,0;431,0
28,212;981,0;986,0 )6,2(
22
)820,11()547,8()169,10(
00282,0032,12461,15
=−=
===
+−=
−
εε rp
gl
t
f
t
f
t
FRR
RPQ
 
e) Interpretação estatística dos resultados 
1. Os parâmetros são estatisticamente diferentes de zero, a 1% de probabilidade de erro, 
atestando a veracidade dos postulados teóricos; 
2. O coeficiente de determinação ajustado para graus de liberdade, da ordem de 0,981 indica que 
98,1% das variações nas quantidades demandadas de carne de frango são explicadas pelas 
variações simultâneas nos preços da carne de frango e na renda do consumidor; 
3. A estatística F=212,28, estatisticamente significante a 1% de probabilidade de erro, indica que 
a hipótese nula, de que o consumo de carne de frango não é influenciado pelas variáveis 
independentes preço e renda, é rejeitada. 
 
f) Gráfico exibindo o grau de ajustamento do modelo 
 
 
 Figura 4.1. Demanda de carne de frango observada, prevista e os resíduos. 
 
-1,2
-1
-0,8
-0,6
-0,4
-0,2
0
0,2
0,4
0,6
0,8
10,00
12,00
14,00
16,00
18,00
20,00
22,00
24,00
1989 1990 1991 1992 1993 1994 1995 1996 1997
( 
k
g
 /
 h
a
b
.)
Q observado
Q estimado
Resíduos
Modelo de regressão múltipla 
 145
g) Interpretação econômica dos resultados 
1. Os sinais dos coeficientes da regressão estão coerentes com a teoria do consumidor, indicando 
que um aumento de preço leva a uma redução nas quantidades demandadas e um incremento 
de renda induz a um aumento no consumo de carne de frango; 
2. O coeficiente de elasticidade-preço da ordem de - 0,431, indica que para cada variação de 10% 
nos preços da carne, as quantidades demandadas tendem a variar de 4,31% em sentido 
contrário, ceteris paribus. Este resultado permite afirmar que a demanda de carne de frango é 
inelástica a preço; 
3. O coeficiente de elasticidade-renda de 0,561, significa que um aumento de 10% na renda real 
per capita do consumidor, tende a produzir incrementos de 5,61% na demanda de carne de 
frango, ceteris paribus. Isto permite concluir que a carne de frango é um bem normal. 
4.5.1 Teste para inclusão de variáveis no modelo 
Aplicar-se-á um teste de hipótese para avaliar a importância da inclusão da variável preço 
da carne de boi ao modelo de demanda de carne de frango. Com isto se pretende avaliar o tipo de 
relação de substitutibilidade ou de complementaridade entre as carnes de frango de boi. 
No caso, o teste envolve o confronto entre dois modelos de regressão múltipla: o primeiro 
é denominado modelo irrestrito, incluindo apenas a variável preço da carne de boi; o segundo é 
denominado modelo restrito, sem incluir a variável preço da carne de boi, como a seguir: 
Modelo irrestrito: ePbRbPbbQ t
b
tt
f
t
f
t
++++= 3210 
Modelo restrito: eRbPbbQ tt
f
t
f
t
+++= 210 
a) Apresentação das hipóteses 
0: 30 =bH de que os produtos carnes de frango e carne de boi não são relacionados; 
0: 3 ≠bH a de que os produtos carnes de frango e carne de boi são substitutos ( 3 0b f ) ou 
complementares ( 3 0b p ). 
O teste F pode ser expresso da seguinte maneira: 
)/()1(
/)(
2
22
knR
mRR
F
I
RI
−−
−
= 
em que: 
RR
2 e IR
2 são os valores dos coeficientes de determinação obtidos, respectivamente, nas 
regressões restritas e irrestritas. Observe que 
I RR R
2 2≥ e I Re e
2 2≤ ∑∑ 
A distribuição de F segue com m e (n -k) graus de liberdade. 
Os valores encontrados para a estatística R2 foram os seguintes: 
Santana, Antônio Cordeiro 
 146
I
R
R
R
2
2
0 996
0 986
=
=
,
,
 
E o valor da estatística F é o seguinte: 
50,12
5/004,0
01,0
)49/()996,01(
1/)986,0996,0(
)5,1( ==
−−
−
=F gl 
O valor crítico para o ( , )1 5glF é 6,61, para o nível de significância de 5% (Tabela A.1 do 
Apêndice). 
Como o valor observado é superior ao valor crítico de F, rejeita-se a hipótese nula e 
decide-se em favor da hipótese alternativa de que os produtos carne de frango e carne de boi, no 
período da análise, são complementares. 
Este mesmo teste poderia ser aplicado para verificar a propriedade da regressão múltipla 
contra o modelo de regressão simples. No caso, a regressão múltiplaseria o modelo irrestrito e a 
regressão simples o modelo restrito. Na demanda de carne de frango, têm-se duas restrições: b2 = 
0 e b3 = 0. Os resultados são os seguintes: 
IR
2 0 996= , e RR
2 0 662= , 
e a estatística F 
( , )
( , , ) /
( , ) / ( )
, /
, /
,
,
,2 5
0 996 0 662 2
1 0 996 9 4
0 334 2
0 004 5
0 167
0 0008
208 75glF =
−
− −
= = = 
O valor crítico da estatística F a 1% de probabilidade é 13,3, logo aceita-se a hipótese 
alternativa de que o modelo de regressão múltipla é mais apropriado ao estudo da demanda de 
carne de frango. 
b) Especificação do modelo: 
),0(~
2
3210
σNe
ePbRbPbbQ
t
t
b
tt
f
t
f
t
++++=
 
i. Descrição das variáveis 
t
f
Q É a quantidade per capita de carne de frango demandada pelos consumidores brasileiros 
(quantidade demandada é igual ao consumo aparente = produção + importação - 
exportação), do Brasil, no ano t, em kg/hab.; 
t
f
P É o preço real da carne de frango, no Brasil, no ano t, em R$/kg; 
tR É a renda real per capita do consumidor brasileiro (no caso é o PIB dividido pela 
população residente), no ano t, em R$/hab.; 
t
b
P É o preço real da carne de boi, no Brasil, no ano t, em R$/kg; 
et É o termo de erro aleatório. 
 
ii. Hipóteses teóricas do modelo 
0 0 0H b: = 
De que o intercepto é zero, ou seja, quando os preços e a renda forem zero não 
haverá consumo; 
Modelo de regressão múltipla 
 147
aH b: 0 0f 
De que independentemente dos preços e da renda, haverá consumo de carne de 
frango; 
0 1 0H b: = 
De que os preços da carne de frango não influenciam as quantidades demandadas 
de carne de frango, ceteris paribus; 
aH b: 1 0p 
De que os preços da carne de frango apresentam uma correlação negativa com a 
quantidade demandada de carne de frango, indicando que o efeito será inverso 
sobre as quantidades, ceteris paribus (lei da demanda); 
0 2 0H b: = De que a renda não influencia o consumo de carne de frango, ceteris paribus; 
aH b: 2 0f 
De que a renda apresenta uma correlação positiva com o consumo, indicando que 
o efeito será direto sobre a demanda (teoria do consumidor); 
0 3 0H b: = 
De que o preço da carne de boi não influencia o consumo de carne de frango, 
ceteris paribus; 
aH b: 3 0p 
De que o preço da carne de boi pode apresentar uma correlação negativa com o 
consumo, indicando que o efeito será inverso sobre a demanda (os produtos são 
complementares); 
aH b: 3 0f 
De que o preço da carne de boi pode apresentar uma correlação positiva com o 
consumo, indicando que o efeito será direto sobre a demanda (os produtos são 
substitutos). 
 
As informações empregadas na estimação dos parâmetros da regressão estão na Tabela 
4.2 e em seguida os resultados obtidos pelo Excel. 
 
 Tabela 4.2. Dados para estimar a demanda de carne de frango, Brasil. 
 A B C D E 
1 Ano Qf Pf R Pb 
2 1989 12,4 0,92 2893 1,53 
3 1990 13,4 0,88 3042 1,65 
4 1991 15,0 0,66 2617 1,34 
5 1992 16,0 0,60 2526 1,21 
6 1993 17,0 0,55 2892 1,39 
7 1994 18,5 0,52 3675 1,73 
8 1995 22,5 0,50 4602 1,75 
9 1996 22,0 0,60 4738 1,52 
10 1997 23,0 0,50 4739 1,50 
 
 
Os resultados obtidos com a aplicação das ferramentas do Excel são apresentados a 
seguir: 
 
 
Santana, Antônio Cordeiro 
 148
iii) Resultados do Excel 
Estatística de regressão 
R múltiplo 0,998 
R- quadrado 0,996 
R- quadrado ajustado 0,993 
Erro padrão 0,329 
Observações 9 
Estimativas dos coeficientes de regressão 
Parâmetro Coeficiente Erro padrão Estatística t Valor - p 
Interseção ( b0 ) 17,557 1,109 15,829 0,0000 
Variável X 1 ( b1 ) -10,827 0,923 -11,731 0,0000 
Variável X 2 ( b2 ) 0,00323 0,0002 17,204 0,0000 
Variável X 3 ( b3 ) -2,835 0,8392 -3,3780 0,0197 
 Obs.: Um valor-p inferior a 5% permite aceitar a hipótese alternativa para a estatística t. 
 
 
Na Figura 4.2, mostra-se o comportamento dos dados observados e estimados da 
quantidade demandada de carne de frango e os respectivos desvios entre o valor estimado e o 
valor observado, no período de 1989 a 1997. 
 
 
 Figura 4.2. Quantidade demandada observada, prevista e resíduos. 
 
-0,5
-0,4
-0,3
-0,2
-0,1
0
0,1
0,2
0,3
0,4
0,5
10,00
12,00
14,00
16,00
18,00
20,00
22,00
24,00
1989 1990 1991 1992 1993 1994 1995 1996 1997
Q observado
Y previsto
Resíduos
Modelo de regressão múltipla 
 149
iv. Interpretação estatística dos resultados 
1. Os parâmetros são estatisticamente diferentes de zero a 1% de probabilidade de erro, atestando 
a veracidade dos postulados teóricos; 
2. O coeficiente de determinação ajustado para graus de liberdade, da ordem de 0,996, indica que 
99,6% das variações nas quantidades demandadas de carne de frango são explicadas pelas 
variações simultâneas nos preços da carne de frango, na renda do consumidor e no preço da 
carne de boi; 
3. A estatística F = 411,99, estatisticamente significante a 1% de probabilidade de erro, indica 
que a regressão proposta é adequada para estudar o fenômeno proposto; 
v. Interpretação econômica dos resultados 
1. Os sinais dos coeficientes da regressão estão coerentes com a teoria do consumidor, indicando 
que um aumento de preço leva a uma redução nas quantidades demandadas, um incremento de 
renda induz a um aumento no consumo de carne de frango e um incremento no preço da carne 
de boi leva a uma redução da demanda de carne de frango; 
2. O coeficiente de elasticidade-preço, da ordem de - 0,388, indica que para cada variação de 
10% nos preços da carne de frango, as quantidades demandadas tendem a variar de 3,88% em 
sentido contrário, ceteris paribus. Este resultado permite afirmar que a demanda de carne de 
frango é inelástica a preço; 
3. O coeficiente de elasticidade-renda, de 0,641, significa que um aumento de 10% na renda real 
per capita do consumidor tende a produzir incrementos de 6,41% na demanda de carne de 
frango, ceteris paribus. Isto permite concluir que a carne de frango é um bem normal. 
4. O coeficiente de elasticidade-cruzada da demanda de carne de frango, igual a -0,244, indica 
que para cada variação de 10% nos preços da carne de boi, a demanda de carne de frango 
tende a variar em 2,44% em sentido contrário, ceteris paribus. Este resultado permite afirmar 
que as carnes de frango e de boi são produtos complementares e não substitutos como 
normalmente é esperado (SANTANA, 1999). Uma razão pode estar associada aos tipos de 
carne de boi. O tipo de carne que concorre com o frango é o acém (ou carne de segunda) e a 
carne de primeira é adquirida como complemento da carne de frango, para as classes de renda 
mais alta. Como o preço empregado aqui reflete o agregado da carne, prevaleceu o efeito 
complementar. Outra explicação mais plausível está no fato de que o consumo de carne 
mudou na direção dos alimentos processados, em que os dois tipos de carne compõem um 
mesmo produto e, sobretudo, no hábito da alimentação fora de casa, que se realiza nos 
restaurantes a quilo, nas redes de fast food e nas churrascarias, em que ambas as carnes são 
consumidas em conjunto. 
 
vi. Análise de resíduos 
Para avaliar se a distribuição do termo de erro apresenta distribuição normal considerar a 
análise dos seguintes resultados: 
Santana, Antônio Cordeiro 
 150
Média 0,0000 
Desvio padrão 0,2601 
Valor mínimo -0,3892 
Valor máximo 0,4577 
Curtose 1,8085 
Assimetria 0,2679 
Teste Jarque-Bera - JB 0,6401 
 
Como a soma dos erros de MQO é zero, a distribuição dos resíduos é centrada na média 
zero. Os resíduos da regressão variam de –0.3892 a 0,4577, que são considerados pequenos, cuja 
amplitude de variação é inferior a um quilo de carne por ano. Isto é aferido pelo desvio padrão 
relativamente baixo e um alto valor de R2=0,996. 
A mediana é maior do que a média e a assimetria de 0,2679 indica que a distribuição é 
ligeiramente assimétrica positiva. O valor da curtose de 1,81 está mais próximo de 3, indicando 
que a distribuição é pouco achatada. 
O teste de Jarque-Bera, da ordem de JB = 0,6401, é menor do que o valor crítico da 
distribuiçãoχ2, com dois graus de liberdade que é igual a 5,99, para a significância de 5%. Assim 
pode-se aceitar a hipótese nula de que os erros apresentam distribuição normal. Este resultado é 
importante porque em se tratando de pequenas amostras, há necessidade de que a distribuição dos 
erros seja normal para garantir a validade dos testes t e F. 
4.6 REGRESSÃO MÚLTIPLA COM VARIÁVEL DUMMY 
Nos modelos de regressão linear, as variáveis explicativas Xi (i=1,2,...,n) são quantitativas. 
Entretanto, há casos especiais em que tais variáveis ao invés de quantitativas ou numéricas, 
podem ser qualitativas. Essas variáveis de natureza qualitativa são denominadas de variáveis 
dummy, variáveis binárias ou variáveis artificiais. Este capítulo se dedicará ao estudo de tais 
modelos. 
4.6.1 Natureza das variáveis dummy 
Alguns fenômenos presenciados não podem ser medidas, apenas observadas. Exemplos 
de tais fenômenos são as características de pessoas, tempo, etc. A observação que se faz consiste 
em indicar a presença ou ausência da “qualidade” ou atributo, tais como sexo, cor, grau de 
instrução, etc. Para quantificar esses atributos, constroem-se variáveis artificiais, atribuindo 
valores 1 ou zero. No caso, o valor 1 indica a presença e o valor 0 indica ausência do fenômeno. 
A representação do modelo estatístico para o problema envolvendo a remuneração 
(salário) de técnicos com curso de graduação e com mestrado é dado por: 
Modelo de variável dummy: εββ ttt XY ++= 10 4.24 
 
em que: 
Yt salário anual dos técnicos (graduados e com mestrado); 
Modelo de regressão múltipla 
 151
Xt 
= 1 se o técnico tem curso de mestrado e 
= 0 se o técnico é apenas graduado; 
εt é o termo de erro aleatório. 
 
Os valores médios de Yt, correspondentes aos dois valores de Xt são: 
βββ
010
)0()0|( =+==XY ttE 
ββββ 1010 )1()1|( +=+==XY ttE 
Observa-se que o intercepto β0 proporciona o valor médio dos salários dos técnicos 
graduados e o coeficiente de inclinação β1 indica de quanto a média do salário dos técnicos com 
mestrado difere da média dos graduados. A soma dos parâmetros (β0+β1) dá a média dos salários 
dos técnicos com mestrado. 
Uma aplicação do modelo pode ser feita para testar a evolução inflacionária do Brasil, 
antes e durante o Plano Real. A especificação do modelo é a seguinte: 
edbbp ttt ++= 10& 
em que: 
t
p& é a taxa de inflação brasileira de 1987 a 1997; 
td 
= 1 para o período de 1995 a 1997 e 
= 0 para o período de 1987 a 1994; 
et é o termo de erro aleatório, e satisfaz às hipóteses clássicas do modelo de regressão 
linear clássico. 
 
As hipóteses sobre as estimativas de MQO dos parâmetros são as seguintes: 
Parâmetro b0: 
0: 00 =bH de que a média da inflação do período coberto pela análise é zero; 
0:
0
fbH a de que a média da inflação do período coberto pela análise é maior do que zero. 
Parâmetro b1: 
0: 10 =bH de que a média da inflação do período de 1995 a 1997 é igual à inflação do período 
anterior; 
0:
1
pbH a de que a média da inflação do período de 1995 a 1997 é menor do que no período 
anterior. 
Os resultados das estimativas de MQO são apresentados em seguida. 
85,21;708,02
)674,4()89,9(
215,2448,2
==
−=
−
FR
dummyp
t
&
 
Santana, Antônio Cordeiro 
 152
Os sinais dos parâmetros estão de acordo com o esperado e são estatisticamente diferentes 
de zero, a 1% de probabilidade. Isto confirma que a média inflacionária do período foi realmente 
positiva e que, durante o Plano Real, o patamar inflacionário diminuiu bastante em relação ao 
período anterior. 
4.6.2 Uma variável quantitativa e outra qualitativa 
Adicionando ao modelo 4.24 uma variável de tendência, tem-se uma regressão múltipla, 
que pode ser escrita da seguinte forma: 
etbdbbp ttt +++= 210& 4.25 
 
em que: 
t
p& é a taxa de inflação brasileira de 1987 a 1997; 
t é a variável de tendência; 
td 
= 1 para o período de 1995 a 1997 e 
= 0 para o período de 1987 a 1994; 
et é o termo de erro aleatório. 
 
A inflação média é dada por: 
tbbtp dE t 20)0,|( +==& 
tbbbtp dE t 210 )()1,|( ++==& 
As hipóteses sobre as estimativas de MQO dos parâmetros são as seguintes: 
Parâmetro b0: 
0: 00 =bH de que a média da inflação do período coberto pela análise é zero; 
0:
0
fbH a de que a média da inflação do período coberto pela análise é maior do que zero. 
Parâmetro b1: 
0: 10 =bH de que não houve mudança na tendência inflacionária no período de 1995 a 1997; 
0: 1 fbH a . de que houve mudança na tendência inflacionária no período de 1995 a 1997. 
Parâmetro b2: 
0: 20 =bH de que a taxa de variação da inflação não evoluiu no período da análise; 
0: 2 fbH a de que a taxa de variação da inflação evoluiu no período da análise. 
Os resultados das estimativas de MQO são apresentados em seguida. 
28,72;948,0
089,0154,559,6
2
)03,1()37,8()97,14(
==
+−=
−
FR
tdpt&
 
Modelo de regressão múltipla 
 153
Os sinais dos parâmetros estão de acordo com o esperado e são estatisticamente diferentes 
de zero, a 1% de probabilidade, exceto o da variável tendência que não foi significativo. Isto 
confirma que a média inflacionária do período foi realmente positiva, mas sem tendência, e que 
durante o Plano Real, o patamar inflacionário diminuiu bastante em relação ao período anterior. 
4.6.3 Demanda linear com variável dummy 
A demanda de carne bovina de 52 famílias da região metropolitana de Belém-PA é 
estimada com o objetivo de verificar a influência do poder aquisitivo no consumo de carne, ou 
seja, testar se há diferença no consumo de carne entre as famílias que ganham até 10 salários 
mínimos e aquelas que percebem mais de 10 salários mínimos. 
O modelo é especificado da seguinte maneira: 
eDbPBbbQB tiii +++= 210 4.26 
em que: 
QBi é a quantidade de carne bovina consumida pela família i, no mês de janeiro de 2003. 
PBi é o preço da carne de bovina adquirida pela família i, no mês de janeiro de 2003; 
Di 
= 1 para a família com renda superior a 10 salários mínimos, em 2003; 
= 0 para a família que ganha até 10 salários mínimos por mês; 
ei é o termo de erro aleatório. 
Os resultados obtidos para a estimação do modelo são: 
24,13;351,0
2
)83,3()62,4()21,7(
185,9558,480,35
==
+−=
−
FR
DPFQB iii 
Os sinais dos parâmetros estão teoricamente corretos e significativos ao nível de 1% de 
probabilidade de erro. O sinal positivo para o coeficiente da variável dummy indica que as 
famílias de renda superior a 10 salários mínimos têm um consumo médio de 9,185 kg/mês 
superior ao consumo das famílias de renda inferior a 10 salários mínimos, mantendo constante o 
preço da carne. 
4.6.4 Demanda logarítmica com variável dummy 
Outra maneira muito freqüente de especificação da demanda é na forma logarítmica, em 
que as variáveis quantitativas (dependente e independente) são expressas na forma logarítmica e a 
variável dummy na forma linear. 
Como deve ser interpretado o coeficiente da variável dummy? O coeficiente tem uma 
interpretação porcentual. 
O modelo de demanda logarítmico é especificado como em 4.27. 
eDbPFbbQF tiii +++= 210 lnln 4.27 
 
Santana, Antônio Cordeiro 
 154
em que: 
lnQFt é o logaritmo da quantidade demandada per capita de carne de frango, no ano t; 
lnPFt é o logaritmo do preço da carne de frango, no ano t; 
Dt 
= 1 para o período do Plano Real, de 1994 a 2003; 
= 0 para o período antes do Plano Real, de 1980 a 1993; 
et é o termo de erro aleatório. 
 
Nesse caso, a variação na quantidade demandada (lnQBi), em resposta à variável dummy é 
dada em termos porcentual (100*b2), mantendo o preço fixo. Todavia, quando o objetivo é 
determinar a mudança proporcional em QF em relação à variável dummy, calcula-se o coeficiente 
de semi-elasticidade, calculado da seguinte maneira: 
]1)[exp(100 2 −• b 
Este resultado foi derivado da seguinte maneira: 
lnQFt – lnQFt-t = b2 
Tomando a exponencial e subtraindo um dos dois lados da equação acima, tem-se: 
(QFt – QFt-t)/ QFt-t = exp(b2)-1 
 
Os resultados são os seguintes: 
74,90;901,02
)76,1()57,5()7,22(
223,0ln721,0166,3ln
==
+−=
−
FR
DPFQF iit 
Este resultado mostra que a quantidade demandada de carne de frango, durante o Plano 
Real, foi superior ao período anterior em 100.(0,223) = 22,3%, mantido o preço fixo. Já o 
coeficiente da semi-elasticidade foi da ordem de: 
100.[exp(0,223) – 1] = 24,98 
Esta estimativa mais rigorosa implica que o consumo no Plano Real foi, em média, 
24,98% superior ao período antes do referido plano. 
4.6.5 Modelo de transmissão de preços 
Em outro exemplo, tomar-se-á o caso da análise de transmissão de preços do boi gordo, 
do atacado para o produtor, realizado por Santana (1998). O modelo, além de variável dummy, 
testa a hipótese de autocorrelação dos resíduos, assunto que será esclarecido no próximo capítulo. 
A especificação é a seguinte: 
eDbTbPCPbbPCA ttt ++++= 3210 4.28 
Modelo de regressão múltipla 
 155
t t te e= + −−ρ ρν1 1 1; p p 
 
em que: 
PCAt É o preço real da carne de boi, no mercado atacadista do Estado do Pará, no período de 
1980 a 1996, em R$/kg; 
PCPt É o preço real da carne de boi, em nível do produtor, no período de 1980 a 1996, em 
R$/kg; 
T É a variável de tendência, com valores: 1980=1, 1981=2, 1982=3, 1984=4,...; 
D é uma variável dummy, introduzida para captar a influência do período de 1993 a1995 
que coincide com os governos Jader e Carlos Santos, e houve uma mudança muito forte 
na tendência dos preços; 
et É o termo de erro aleatório; 
bi (i=0,1,2,3) são os parâmetros da regressão; 
ρ É um parâmetro de autocorrelação e tem valor entre (-1 e +1). 
 
As hipóteses sobre os estimadores de MQO são as seguintes: 
Parâmetro b0: 
0: 00 =bH De que a média do preço da carne de boi no atacado é zero; 
0:
0
fbH a De que a média do preço da carne de boi no atacado é maior do que zero. 
Parâmetro b1: 
0: 10 =bH De que o preço da carne de boi em nível do produtor não influenciou o preço da carne 
de boi do atacado no período de 1980 a 1996; 
0: 1 fbH a De que o preço da carne de boi em nível do produtor influenciou o preço da carne de 
boi do atacado no período de 1980 a 1996. 
Parâmetro b2: 
0: 20 =bH De que o preço da carne de boi no atacado não apresentou tendência no período de 
1980 a 1996; 
0: 2 ≠bH a De que o preço da carne de boi no atacado apresentou tendência positiva ou negativa 
no período de 1980 a 1996. 
Os resultados das estimativas dos parâmetros, por meio do software Shazam, para captar a 
transmissão de preços do atacado para o produtor são apresentados em seguida. 
Transmissão de preços do atacado para o produtor: 
t t
tp
PCA PCP T D
R
= + − +
= = = −
11 37 1 69 7 23 9 95
2
3 52 0 217 0 1183 1899
0 92 0 11 0 149
, , , ,
, , , ,
, ; , ; ,ε ρ
 
Os resultados estatísticos para esta equação são coerentes e estatisticamente diferentes de 
zero a 5% de probabilidade, indicando que as margens de comercialização não se mantiveram 
Santana, Antônio Cordeiro 
 156
constantes no período [a margem de comercialização do atacado (MCA) é dada pela diferença 
entre o preço da carne de boi no atacado e o preço da carne em nível de produtor: MCA = PCA - 
PCP]. 
Com relação ao coeficiente de elasticidade de transmissão de preços, da ordem de 0,11 
(para a primeira equação), confirma-se a hipótese teórica para os produtos agropecuários de que a 
demanda de carne de boi gordo é mais elástica em nível de atacado do que em nível de produtor, 
uma vez que este coeficiente é inferior à unidade. A implicação direta deste fato é que, quando a 
oferta de carne de boi varia, o preço de atacado tende a se distanciar proporcionalmente menos da 
média do que o preço em nível do produtor. 
Com relação à variável dummy, tem-se que se esta não fosse incluída no modelo, o 
intercepto da equação seria subestimado. 
Adicionalmente, os resultados mostram que, mantido o preço recebido pelo produtor, os 
preços do atacado declinam no período analisado, conforme indica o sinal negativo da variável 
tendência. 
 
4.7 APLICAÇÃO DO MODELO DE RLM À ECONOMIA BRASILEIRA 
4.7.1 Modelo polinomial 
Inicialmente será apresentada uma aplicação da regressão múltipla ao modelo de regressão 
polinomial, que é bastante empregado na análise econométrica de custo de produção. O modelo 
geral de regressões polinomiais é dado por: 
εβββββ t
n
tntttt XXXXY ++++++= 1
3
13
2
12110
... 4.29 
em que n representa o grau do polinômio. 
O exemplo a ser apresentado diz respeito à estimativa da tendência do preço da pimenta-
do-reino, no período de 1987 a 1997. O modelo proposto é o seguinte: 
etbtbbP t
p
t +++=
2
210 4.30 
 
em que t
p
P é o preço real da pimenta-do-reino, em R$/kg - FOB, e t é a variável de tendência 
(Tabela 4.3 e Figura 4.3). 
 
Tabela 4.3 - Dados de preço da pimenta-do-reino (R$/kg - FOB) 
Ano Preço tempo - t tempo - t
2
 
1987 13,12 1 1 
1988 5,63 2 4 
1989 2,98 3 9 
1990 2,12 4 16 
1991 1,77 5 25 
Modelo de regressão múltipla 
 157
1992 1,45 6 36 
1993 1,79 7 49 
1994 2,33 8 64 
1995 2,44 9 81 
1996 2,78 10 100 
1997 4,54 11 121 
 
Os resultados da estimativa dos parâmetros são apresentados em seguida: 
997,18;826,0 )8,2(
2
2
)16,5()79,5()03,8(
276,0815,3922,13
==
+−=
−
FR
ttP
gl
p
t
 
Os sinais estão coerentes com o comportamento dos dados e são estatisticamente 
diferentes de zero a 1% de probabilidade. Os sinais, negativo para o coeficiente da variável 
tendência linear e positivo para a tendência ao quadrado, indicam que a função é côncava para 
cima, exibindo a forma da letra “U”, como na figura abaixo, que mostra os valores dos preços 
observados e estimados pelo modelo. 
 
 
Santana, Antônio Cordeiro 
 158
 
 Figura 4.3 – Valores observados e previstos dos preços da pimenta-do-reino (R$/kg – FOB). 
 
 
4.7.2 Modelo de demanda de carne bovina no Brasil 
A demanda de carne de boi no Brasil, no período de 1990 a 1997, será representada por um 
modelo de regressão múltipla. O interesse está em determinar as elasticidades-preço (diretas e 
cruzadas) e renda da demanda, bem como avaliar a influência do Plano Real sobre o consumo de 
carne de boi. Isto será feito incluindo-se uma variável dummy na equação para captar o efeito do 
Plano Real como deslocador da curva de demanda. 
Os dados de quantidade e preços são do Anualpec (1998) e os dados de salário mínimo e 
do índice geral de preços (IGP-DI) são de Conjuntura Econômica (1998). 
O modelo é especificado nos logaritmos naturais das variáveis dependentes e 
independentes, por ser a forma funcional que melhor se ajusta aos dados (Santana, 1999). 
t t t t t tQCB b b PCB b PCF b PCS b SM b VD eln ln ln ln ln= + + + + + +0 1 2 3 4 5 4.31 
em que: 
lnQCBt quantidade demandada de carne de boi no mês t, em toneladas; 
lnPCBt preço real da carne de boi no mês t, em R$/t; 
lnPCFt preço real da carne de frango no mês t, em R$/t; 
lnPCSt preço real da carne suína no mês t, em R$/t; 
0
2
4
6
8
10
12
14
1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997
Preço
Y previsto
Modelo de regressão múltipla 
 159
lnSMt salário mínimo real no mês t, em R$/mês; 
VD variável dummy que assume valor igual a 1 no período de janeiro de 1994 a 
dezembro de 1997 e valor zero no período de janeiro de 1990 a dezembro de 
1993; 
et Termo de erro aleatório, sob as hipóteses da RLC. 
 
 
i. Hipóteses do modelo 
Com base na teoria do consumidor espera-se obter uma relação inversa entre preços e 
quantidades de carne de boi e uma relação direta entre a demanda de carne de boi e os preços das 
carnes de frango e de suíno por admitir que tais produtos são substitutos no consumo, e entre a 
demanda de carne de boi e a renda dos consumidores, expressa por meio do salário mínimo. 
Também, espera-se que a demanda de carne de boi tenha se deslocado para cima e para a direita 
por força do Plano Real, que ao reduzir a inflação e estabilizar a economia brasileira, 
proporcionou um incremento do poder aquisitivo da população, beneficiando sobretudo os mais 
pobres, que foram incluídas no mercado.Com relação ao efeito cruzado entre a carne de frango e de boi, Santana (1999) mostrou 
que as relações ao invés de serem de substitutibilidade são de complementaridade. Isto ocorre por 
causa da expansão do consumo de alimentos processados e da alimentação fora de casa que se 
realiza nos restaurantes a quilo e nas redes de alimentação rápida. 
Também será testada a hipótese da teoria do consumidor de que a demanda ordinária (ou 
demanda marshalliana) é homogênea de grau zero em preços e renda. 
A equação de demanda foi estimada empregando-se o software Eviews. Neste modelo, 
supõe-se que os preços, salário mínimo e a variável dummy são exógenas como, aliás, assegura a 
teoria do consumidor. Sendo assim, quaisquer mudanças na demanda, causadas pela influência de 
fatores aleatórios, os preços e a renda não serão afetados, o que assegura que estas variáveis não 
estão correlacionadas com o termo de erro e, portanto, os parâmetros da regressão podem ser 
estimados por mínimos quadrados ordinários. 
ii. Análise dos resultados 
Os resultados são apresentados na Tabela 4.4. Tais resultados mostram que os sinais das 
estimativas estão de acordo com o esperado, indicando que variações positivas nos preços e na 
renda produzem uma variação em sentido contrário nas quantidades demandadas quando a 
variação é do próprio preço da carne bovina; variações diretas ocorrem na demanda em resposta 
às variações nos preços da carne suína e na renda, enquanto que variações inversas ocorrem em 
relação ao preço da carne de frango. De todas as estimativas, apenas a relativa ao salário mínimo 
não influencia a demanda de carne de boi no Brasil, dado que não é diferente de zero a 5% de 
probabilidade. 
O coeficiente de determinação ajustado por graus de liberdade, da ordem de 0,562 ( R
2 = 
0,562) mostra que 56,2% das mudanças que ocorreram na variável dependente QCBt no período 
Santana, Antônio Cordeiro 
 160
analisado foram explicadas pelas variáveis independentes incluídas na regressão, e que, os 43,8% 
restantes são devidos à influência de fatores aleatórios. 
A estatística F = 25,39, significativa a 1% de probabilidade permite rejeitar a hipótese 
nula de que não há relação linear entre a variável dependente e as variáveis independentes. 
Na Figura 4.4 apresenta-se o comportamento da variável QCBt para os dados observados 
e estimados, bem como os desvios do ajustamento. 
Na Tabela 4.4, a estatística de Durbin-Watson testa a hipótese nula para autocorrelação 
dos resíduos. Um valor próximo de 2,0 para esta estatística indica ausência de autocorrelação dos 
resíduos. O resultado encontrado foi de DW = 0,973, sugerindo que os resíduos são 
autocorrelacionados e, portanto, viola a Hipótese 4, apresentada no capítulo 3. Neste caso, os 
estimadores ainda são não-viesados, porém não se garante que sejam eficientes. A solução para 
casos como este será dada no capítulo 5. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Figura 4.4. Ajustamento da regressão de demanda de carne de boi, Brasil. 
 
 
Como as variáveis estão expressas nos logaritmos naturais, os coeficientes representam as 
elasticidades, de modo que podem ser interpretados diretamente, pois 
1
11
ln
ln
b
QCB
PCB
PCB
QCB
PCB
PCB
QCB
QCBPCB
QCB
p =⋅=











==
∂
∂
∂∂
∂
∂
ε 
Assim, para variações porcentuais unitárias e positivas nas variáveis independentes 
(preços e renda), tem-se que as quantidades demandadas de carne de boi variam 0,34% em 
sentido contrário em relação ao preço da carne de boi, indicando que a demanda é inelástica a 
preço; que a demanda de carne de boi aumenta em 0,17% em relação ao preço da carne suína, 
indicando que estes produtos são substitutos; que a demanda de carne de boi cai em 0,134% em 
relação ao preço da carne de frango, indicando que estes produtos são complementares; que a 
demanda de carne de boi não varia em relação às mudanças no salário mínimo. 
 
- 0 . 2 
- 0 . 1 
0 . 0 
0 . 1 
0 . 2 
1 2 . 7 
1 2 . 8 
1 2 . 9 
1 3 . 0 
1 3 . 1 
1 3 . 2 
1 3 . 3 
9 0 9 1 9 2 9 3 9 4 9 5 9 6 9 7 
R e s i d u a l A c t u a l F i t t e d 
Modelo de regressão múltipla 
 161
Com relação à variável dummy, tem-se que a estimativa da ordem de 0,108 indica que o 
Plano Real produziu um deslocamento médio na curva de demanda de carne de boi desta 
magnitude. Ou seja, significa que a não-inclusão da variável dummy na regressão causaria um 
erro na estimação do valor do intercepto da equação. 
 
Tabela 4.4 - Resultados da demanda de carne de boi, Brasil, 1990/1997. 
Variável dependente: ln QCBT 
Método: mínimos quadrados 
Número de observações: 96 
Variável Coeficiente Desvio padrão Estatística - t Probabilidade 
C 13.42503 0.251693 53.33886 0.0000 
ln PCBT -0.337242 0.072819 -4.631239 0.0000 
ln PCAT -0.133656 0.053262 -2.509401 0.0139 
ln PCST 0.171307 0.057277 2.990864 0.0036 
ln SM 0.031516 0.036267 0.868988 0.3872 
VD 0.108218 0.018468 5.859906 0.0000 
R2 - quadrado 0.585137 Estatística de Durbin-Watson - d 0.973924 
R2 - quadrado ajustado 0.562089 Estatística - F 25.38785 
SQE 0.397963 Probabilidade de F 0.000000 
 
 
 
iii. Teste de homogeneidade de grau zero 
Uma análise interessante da teoria do consumidor diz respeito à aferição empírica do teste 
de homogeneidade da função demanda de carne de boi em relação a preços e renda. Isto significa 
que se os preços e a renda variarem na mesma proporção, a demanda não varia, ou seja, não afeta 
a posição de equilíbrio do consumidor. 
A restrição de homogeneidade é posta da seguinte maneira: 
Hipótese nula: H0: b1 + b2 + b3 + b4 = 0 
Este teste é realizado no Eviews, aplicando-se a seqüência de comandos a seguir: 
View/Coeficient tests/Wald - coeficient restrictions. Em seguida aparece uma tela de trabalho 
em que a restrição deve ser escrita da seguinte forma: 
c(2)+c(3)+c(4)+c(5)=0, 
Os elementos desta equação correspondem aos coeficientes das variáveis preço e renda, 
sendo que c(1) é o intercepto. O Eviews apresenta dois testes estatísticos: a estatística F e a 
estatística qui-quadrado χ2, conforme apresentado na Tabela 4.5. 
Como os resultados são diferentes de zero a 1% de probabilidade, aceita-se a hipótese 
nula de que a demanda de carne de boi é homogênea de grau zero nos preços e renda. 
É bom deixar claro, antes de prosseguir com a análise, que os testes são realizados à luz 
dos conhecimentos apresentados até aqui. 
Santana, Antônio Cordeiro 
 162
 
Tabela 4.5. Teste de restrição de homogeneidade da demanda. 
Teste de Wald 
Hipótese nula: b1 + b2 + b3 + b4 =0 
Estatística - F 26.12405 Probabilidade 0.000002 
Qui-quadrado 26.12405 Probabilidade 0.000000 
 
 
iv. Análise de resíduos 
Para se fazer a análise de resíduos no Eviews, deve-se escolher o caminho: Procs/Make 
residual series, aparece uma tela com os dizeres: Type residual ordinary. Este comando é 
necessário para criar uma variável para representar o resíduo da regressão, portanto deve ser 
aceito por meio da tecla OK. A série é gerada para permitir realizar o teste Jarque-Bera e 
construir o histograma dos resíduos: View/Descriptive Statistics/Histogram and Stats. Os 
resultados são os apresentados na Figura 4.5. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Figura 4.5 - Histograma e estatística de Jarque-Bera 
 
 
 
O teste Jarque-Bera, da ordem de JB=2,057, indica que a distribuição dos erros da 
regressão apresenta distribuição normal, o que transparece no histograma e nas estatística 
simetria (skewness) próxima de zero e curtose (kurtosis) próxima de três. Isto assegura a validade 
dos testes t e F. 
 
0
2
4
6
8
-0.15 -0.10 -0.05 0.00 0.05 0.10
Series: RESID01
Sample 1990:01 1997:12
Observations 96
Mean -5.14E-15
Median -0.002464
Maximum 0.124270
Minimum -0.159282
Std. Dev. 0.064723
Skewness -0.102179
Kurtosis 2.312543
Jarque-Bera 2.057438
Probability 0.357465
Modelo de regressão múltipla 
 163
4.7.3 Modelo de ajustamento do salário 
Uma versão modificadada curva de Phillips pode ser apresentada tomando-se o índice de salários 
como variável dependente e o índice de preços, a taxa de desemprego e o PNB como variáveis 
independentes. A apresentação do modelo é a seguinte: 
Equação de salário: eePNBIGPbW
tt vUbb
t
b
tt
321
0= 4.32 
 
em que: 
Wt índice de salário nominal da economia brasileira, no ano t; 
IGPt índice geral de preços da economia brasileira, no ano t; 
PNBt produto interno bruto da economia brasileira, no ano t; 
Ut taxa de desemprego do Brasil, no ano t; 
vt termo de erro aleatório. 
 
Aplicando-se logaritmo natural de ambos os lados da equação (4.32), tem-se o modelo na 
forma logarítmica 4.33. 
vUbPNBbIGPbbW ttttt ++++= 3210 lnlnln 4.33 
 
Teoricamente, espera-se obter uma relação positiva entre as variáveis índice de salário 
lnWt e índice geral de preços lnIGPt, dado que os salários nominais tendem a variar na mesma 
direção do nível geral de preços e entre lnWt e lnPNBt per capita dado que o incremento no 
produto representa um sinal de que as empresas estão operando com menor capacidade ociosa e 
ampliando a demanda por mão-de-obra, o que pressiona os salários para cima, e uma relação 
negativa entre lnWt e a taxa de desemprego Ut, uma vez que elevados níveis de desemprego 
pressiona os salários para baixo, pois as pessoas estão dispostas a aceitar salários mais baixos 
para trabalhar ou para não perder o emprego. 
Os dados utilizados na estimação dos parâmetros da regressão são de Conjuntura 
Econômica da Fundação Getúlio Vargas. 
i. Análise dos resultados 
Os resultados mostram que os sinais das estimativas estão de acordo com o esperado, e 
são diferentes de zero, a 5% de probabilidade. O coeficiente de determinação ajustado por graus 
de liberdade ( 932,02 =R ), indica que 93,2% das variações nos salários dos trabalhadores da 
indústria brasileira são explicados, simultaneamente, pelas variáveis independentes, no período 
analisado. O grau de ajustamento é representado na Figura 4.6 em que se verifica o 
comportamento dos dados observados, estimados e desvio do ajustamento. Veja que nos anos de 
1983 e 1991 têm-se grandes desvios negativos e nos anos de 1981, 1986 e 1993 têm-se grandes 
desvios positivos. É possível que alguns destes desvios representem autovalores, mas este assunto 
será abordado no próximo capítulo. A estatística F=83,54, significativa ao nível de 1% de 
Santana, Antônio Cordeiro 
 164
probabilidade, permite rejeitar a hipótese nula de que não há relação linear entre lnWt e os 
regressores. Ou seja, a regressão é apropriada para representar o fenômeno estudado. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Figura 4.6. Ajustamento da equação de salário, Brasil. 
 
 
Com relação aos resultados econômicos, tem-se que para cada variação porcentual 
unitária das variáveis IGPt, PNBt e Ut, os salários variam na mesma direção e nas magnitudes de 
0,14% para o IGP e de 21,12% para PNB e na direção inversa de -8,77% para a taxa de 
desemprego. Os resultados estão na Tabela 4.6. 
 
Tabela 4.6. Modelo estimado dos salários, Brasil, 1980/1998. 
Variável dependente: ln Wt Observações: 19 
Variável Coeficiente Desvio padrão Estatística - t Probabilidade 
C 2.228047 0.869756 2.561693 0.0217 
ln IGPt 0.001496 0.003363 0.444965 0.6627 
ln PNBt 0.211248 0.066049 3.198360 0.0060 
Ut -0.087723 0.009553 -9.183164 0.0000 
R2 - quadrado 0.943527 Estatística de Durbin-Watson 1.859924 
R2 – quadrado ajustado 0.932232 Estatística - F 83.53736 
SQE 0.038462 Probabilidade de F 0.000000 
 
-0.15
-0.10
-0.05
0.00
0.05
0.10
4.0
4.2
4.4
4.6
4.8
80 82 84 86 88 90 92 94 96 98
Residual Actual Fitted
Modelo de regressão múltipla 
 165
ii. Análise de resíduos 
Nos resultados do Eviews aparece a estatística Durbin-Watson que serve para testar a 
hipótese nula de não-autocorrelação dos erros, cujo desenvolvimento será feito no próximo 
capítulo. Um valor próximo de 2, como é o caso, indica ausência de autocorrelação serial dos 
resíduos da regressão de salário. 
Com relação à normalidade dos resíduos, tem-se um valor para a estatística Jarque-Bera, 
JB=4,29, indicando que o termo de erro da regressão apresenta distribuição normal (Figura 4.7). 
 
 
 
 
 
 
 
 
 
 
Figura 4.7. Histograma de resíduos e estatística de Jarque-Bera 
 
iii. Modelo modificado 
Incluiu-se uma variável dummy para captar os efeitos atípicos relativos aos anos de 
1983, 1990 e 1991, que resultaram em grandes desvios e mudança de tendência dos dados. Os 
resultados obtidos são os seguintes, para a regressão estimada (Tabela 4.7 e Figuras 4.8 e 4.9). 
 
Tabela 4.7. Modelo estimado dos salários, Brasil, 1980/1998. 
Variável dependente: ln Wt Observações: 19 
Variável Coeficiente Desvio padrão Estatística - t Probabilidade 
C 2.822774 0.519986 5.428558 0.0001 
ln IGPt 0.003165 0.001990 1.590600 0.1340 
ln PNBt 0.167774 0.039424 4.255637 0.0008 
Ut -0.089377 0.005593 -15.98066 0.0000 
VD -0.104452 0.019106 -5.466937 0.0001 
R2 - quadrado 0.981985 Estat. Durbin-Watson 3.156481 
R2 – quadrado ajustado 0.976838 Estatística - F 190.7837 
SQE 0.012269 Probabilidade de F 0.000000 
 
0
2
4
6
8
-0.10 -0.05 0.00 0.05
Series: RESID01
Sample 1980 1998
Observations 19
Mean 1.11E-16
Median 0.005446
Maximum 0.056574
Minimum -0.124373
Std. Dev. 0.046225
Skewness -1.065656
Kurtosis 3.933548
Jarque-Bera 4.286086
Probability 0.117297
Santana, Antônio Cordeiro 
 166
Nota-se que o ajustamento melhorou, pois o valor do 977,02 =R , assim como a 
significância da estimativa da variável preço. Também o valor da estatística JB=1,03 tornou-se 
mais próxima de zero, o que assegura a normalidade na distribuição dos resíduos. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Figura 4.8. Ajustamento do modelo de salário, incluindo a dummy. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Figura 4.9. Histograma e teste de Jarque-Bera 
 
0
1
2
3
4
5
-0.04 -0.02 0.00 0.02 0.04
Series: RESID01
Sample 1980 1998
Observations 19
Mean 5.43E-16
Median -0.000760
Maximum 0.046002
Minimum -0.041343
Std. Dev. 0.026108
Skewness 0.003094
Kurtosis 1.858766
Jarque-Bera 1.031109
Probability 0.597169
-0.06
-0.04
-0.02
0.00
0.02
0.04
0.06
4.0
4.2
4.4
4.6
4.8
80 82 84 86 88 90 92 94 96 98
Residual Actual Fitted
Modelo de regressão múltipla 
 167
Os dados utilizados na estimação das equações de salário da economia brasileira estão 
mostrados na Tabela 4.8. 
 
Tabela 4.8. Dados utilizados na estimação da equação de salário, Brasil. 
Ano Wt Ut IGPt PNBt (US$10
6) VD 
1980 64,26 7,20 8,33E-10 242.155 0 
1981 65,10 8,04 1,75E-09 256.184 0 
1982 69,20 6,42 3,43E-09 255.930 0 
1983 60,83 6,70 8,7E-09 176.797 1 
1984 62,65 7,12 2,79E-08 176.215 0 
1985 76,94 5,25 9,08E-08 198.973 0 
1986 96,33 3,59 2,2E-07 244.583 0 
1987 91,51 3,73 7,14E-07 271.294 0 
1988 97,27 3,85 5,61E-06 294.114 0 
1989 105,93 3,35 7,96E-05 398.232 0 
1990 91,21 4,28 0,00226 427.875 1 
1991 80,17 4,83 0,0116 374.187 1 
1992 86,74 5,97 0,127 367.823 0 
1993 92,64 5,32 2,7988 426.159 0 
1994 98,48 5,06 70,162 554.355 0 
1995 105,50 4,64 117,492 704.972 0 
1996 101,60 5,42 130,528 762.006 0 
1997 102,90 5,66 140,855 788.266 0 
1998 102,30 5,43 146,330 776.442 0 
Fonte: Conjuntura Econômica (1999) 
 
4.7.4 Modelo do fluxo de comércio exterior 
O balanço comercial de uma economia, conforme Zini Jr. (1995), pode ser especificado em 
função de três variáveis básicas: a taxa de câmbio real (TCR), a renda interna (RI) e a renda do 
resto do mundo (RM), como no modelo econômico a seguir (SANTANA, 2002): 
SBC = f(TRC, RI, RM) 
O balanço comercial depende positivamente da TRC e da RM e negativamente da RI. Para 
aplicar o modelo deve-se tomar os dados de Conjuntura Econômica (1999) sobre o saldo na 
balança comercial (SBC), dado pelo valor das exportações menos o valor das importações, taxa 
de câmbio (TRC), dada pelo produto da taxa de câmbio nominal vezes a relação de preços 
externo e interno e a rendainterna (RI), expressa pelo produto interno bruto (PIB) per capita do 
Brasil. Não foi possível obter informações sobre a renda bruta externa dos principais parceiros 
comerciais brasileiros. O modelo especificado para análise empírica do fluxo de comércio é o 
seguinte: 
Balanço comercial: 
t t t tSBC b b TRC b RI b VD e= + + + +0 1 2 3 4.34 
Santana, Antônio Cordeiro 
 168
em que: 
SBCt Valor do balanço comercial da pimenta-do-reino, no mês t, em US$; 
TRCt Taxa real de câmbio: TRCt = TNC x (P*/Pb), onde TCN é a taxa nominal, P* é o 
índice de preço ao consumidor dos EUA e Pb é o índice geral de preços do Brasil; 
RIt Renda interna per capita, em US$/hab., dada pelo PIB/população residente; 
VD Variável dummy para captar a influência do Plano Real, assumindo valor igual a 1 
para o período de 1994 a 1998 e zero no restante do período da análise; 
et Termo de erro aleatório. 
 
Teoricamente, espera-se obter estimativas com sinais positivos para a taxa real de câmbio 
(TRCt), uma vez que a desvalorização do câmbio induz aumento das exportações brasileiras, ou 
seja, quanto maior foi a taxa de câmbio, maior tende a ser o volume de produtos que as empresas 
desejam exportar e vice-versa. Com relação à renda interna bruta (RIt), espera-se sinal negativo, 
pois quando a renda interna aumenta, os consumidores tendem a aumentar suas despesas com 
produtos internos e importados, assim a elevação da renda tende a reduzir as exportações. 
i. Análise dos resultados 
De acordo com os resultados, todas as estimativas dos coeficientes são diferentes de zero 
a 5% de probabilidade, exceto o relativo à taxa real de câmbio, que foi significativo apenas a 10% 
de probabilidade. Da mesma forma, os sinais dessas estimativas estão de acordo com o esperado, 
com exceção da renda interna que apresentou sinal contrário. Isto se deve à política cambial 
sobrevalorizada que o Brasil adotou em quase todo o período analisado, conforme pode ser 
visualizado na Figura 4.10, em que é nítida a tendência de valorização do câmbio a partir de 
1985. 
 
Figura 4.10. Taxa real de câmbio do Brasil, 1981/1998. 
 
A estatística 2 0 795R = , indica que 79,5% das variações na variável saldo da balança 
comercial são explicadas pelas variáveis independentes incluídas na regressão. A estatística 
F=22,97, significativa ao nível de 1% de probabilidade, permite rejeitar a hipótese nula de que 
0
50
100
150
200
250
TRC
Modelo de regressão múltipla 
 169
não há relação linear entre a variável dependente e as variáveis independentes da equação (Tabela 
4.9). 
Os resultados obtidos para a variável dummy mostram que na sua ausência, o valor 
numérico do intercepto seria superestimado em 22.875,82. 
 Tabela 4.9. Modelo estimado do fluxo de comércio exterior, Brasil 
Variável dependente: SBCt 
Variável Coeficiente Desvio padrão Estatística - t Probabilidade 
C -35564.62 14959.20 -2.377441 0.0322 
TCRt 72.83598 39.15251 1.860314 0.0840 
RBIt 0.054083 0.016519 3.274056 0.0055 
VD -22875.82 3408.365 -6.711671 0.0000 
R2- quadrado 0.831164 Estatística de Durbin-Watson 1.723768 
R2 – quadrado ajustado 0.794985 Estatística - F 22.97362 
SQE 2.06E+08 Probabilidade de F 0.000011 
 
Cabe observar, entretanto, que teoricamente o modelo é subespecificado, uma vez que a 
variável relevante renda bruta externa (RE) ficou de fora da regressão. Também há argumentos 
teóricos e que a prática confirma, de que há alguma defasagem no processo de transmissão dos 
efeitos do câmbio sobre a balança comercial. Este fato exige a inclusão da variável TRC defasada 
de um ou mais períodos na regressão. Este processo representa outro tipo de modelo que será 
tratado no capítulo 6, onde será abordada a temática dos modelos dinâmicos. 
 
ii. Análise de resíduos 
Nos resultados do Eviews aparece a estatística Durbin-Watson, que serve para testar a 
hipótese nula de não-autocorrelação de primeira ordem dos erros, cujo desenvolvimento será feito 
no capítulo 5. Um valor próximo de 2, como é o caso, indica ausência de autocorrelação serial 
dos resíduos da regressão de salário (Figura 4.11). 
 
 
0
2
4
6
8
-7500 -5000 -2500 0 2500 5000 7500
Series: RESID01
Sample 1981 1998
Observations 18
Mean 9.09E-12
Median -546.9585
Maximum 7049.026
Minimum -5163.681
Std. Dev. 3478.429
Skewness 0.483566
Kurtosis 2.212904
Jarque-Bera 1.166148
Probability 0.558180
Figura 4.11. Histograma e estatística de Jarque-Bera 
Santana, Antônio Cordeiro 
 170
 
Com relação à normalidade dos resíduos, tem-se um valor para a estatística Jarque-Bera, 
JB=1,166, indica que o termo de erro da regressão apresenta distribuição normal. 
Os dados utilizados na estimação do modelo de fluxo de comércio brasileiro estão na 
Tabela 4.10, considerando o período de 1981 a 1998. Repita a estimação do modelo com a 
amostra completa até 2002 e confronte os resultados. 
 
Tabela 4.10. Dados empregados na estimação do modelo de fluxo de comércio, Brasil, 
1981/2002. Os dados até 1998 estão em Conjuntura Econômica (maio 1998). 
Ano SBCt RBIt TCRt VD 
1981 1.200 256.553 176,09 0 
1982 781 271.252 184,25 0 
1983 6.470 189.459 240,41 0 
1984 13.090 189.744 250,25 0 
1985 12.488 211.092 266,63 0 
1986 8.304 257.812 247,10 0 
1987 11.171 282.357 227,20 0 
1988 19.184 305.707 201,17 0 
1989 16.120 415.916 160,45 0 
1990 10.753 469.318 143,53 0 
1991 10.579 405.679 173,90 0 
1992 15.308 387.295 181,08 0 
1993 12.938 429.685 166,35 0 
1994 10.440 543.087 135,00 0 
1995 -3.158 770.350 119,06 1 
1996 -5.554 840.268 120,88 1 
1997 -8.357 871.274 122,91 1 
1998 -6.474 843.985 129,35 1 
1999 -1.284 586.777 185,85 1 
2000 -751 644.984 170,13 1 
2001 2.651 553.771 203,48 1 
2002 13.122 504.359 226,33 1 
2003 24.793 553.603 198,66 1 
2004 33.640 663.783 177,21 1 
2005 44.758 882.439 143,76 1 
2006 46.086 1.071.973 130,39 1 
 Fonte: Conjuntura Econômica (maio 1998, jul. 2003 e out. 2009). 
4.7.5 Interação envolvendo variável dummy 
Esta aplicação mostra como a variável dummy pode influenciar a inclinação da curva de 
demanda. O modelo é especificado como em 4.35. 
Modelo de regressão múltipla 
 171
ePFDbDbPFbbQF
eDbPFbbQF
ttttt
tttt
++++=
+++=
.3210
210 
4.35 
em que: 
QFt é o a quantidade demandada per capita de carne de frango, no ano t, em kg/hab/ano; 
PFt é o preço real da carne de frango, no ano t, em R$/kg; 
Dt 
= 1 para o período do Plano Real, de 1994 a 2003; 
= 0 para o período antes do Plano Real, de 1980 a 1993; 
D.PFt É a interação entre a dummy a o preço, cujo impacto recai na inclinação da demanda; 
et é o termo de erro aleatório. 
 
De uma maneira mais didática, o modelo pode ser reescrito da seguinte forma: 
ePFDbbDbbQF ttttt ++++= )()( 3120 4.36 
Nota-se que no período anterior ao Plano Real, em que Dt = 0, a equação 4.34 volta à 
forma original, com o intercepto b0 e a inclinação b1, indicando que o Plano Real não influenciou 
o consumo de carne de frango. Por outro lado, quando Dt = 1, durante o Plano Real, o intercepto 
é dado pela soma (b0 + b2) e a inclinação é (b1 + b3). Com efeito, b2 mede a diferença no 
intercepto entre o Plano Real e o período antes do Plano, e b3 mede a diferença na contribuição 
do preço antes e depois do Plano Real. 
Os resultados são apresentados em seguida: primeiro mostra apenas a mudança no 
intercepto e depois a mudança conjunta no intercepto e na inclinação. 
192,55;847,0
2
)89,3()12,3()67,6(
851,8259,323,21
==
+−=
−
FR
DPFQF ttt 
Os resultados estão teoricamente corretos e significantes ao nível de 1% de probabilidade 
de erro. O coeficiente da variável dummy indica que o consumo per capita de carne de frango, ao 
longo do Plano Real, aumentou de 8,85 kg/hab/ano, mantendo-se o preço constante. 
O modelo conjunto, captando o deslocamento do intercepto e na inclinação, é o seguinte: 
84,71;919,0
2
)12,4()24,5()55,3()29,8(
.58,2242,37794,287,19
==
−+−=
−−
FR
PFDDPFQF tttt 
A estimativa da influência do preço nesta equação, no período anterior ao Plano

Mais conteúdos dessa disciplina