Carlos Silva Ribeiro - Econometria-Escolar Editora (2014)

•
UFRA

Sheryle Hamid
11/09/2020
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 1021 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 1021 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 1021 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Econometria

6.349 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
CAPÍTULO 1 
 
INTRODUÇÃO 
 
 
1.1 - De que trata a Econometria? 
 
 Numa primeira aproximação, pode dizer-se que a Econometria procura fornecer 
uma base empírica para o estudo de relações entre variáveis económicas (ou, em ge-
ral, de natureza social). Para atingir este objectivo, a Econometria dedica-se ao desen-
volvimento de métodos estatísticos para estimar e testar tais relações. Em especial, no 
campo da Economia, estes métodos devem possibilitar o teste das teorias económicas 
que podem estar na base das relações preconizadas, e a avaliação e fundamentação de 
decisões de natureza empresarial ou de política económica. 
 Estas considerações vão ser analisadas nas secções seguintes deste capítulo. Para 
motivar a análise que vai ser feita, apresentam-se alguns exemplos. 
 
Exemplo 1.1 – O consumo privado, considerado como agregado macroeconómico, é 
uma variável cujo comportamento tem sido amplamente estudado pela teoria macroeco-
nómica. A especificação mais simples é a função consumo keynesiana, onde, para su-
cessivos períodos de tempo, se procura explicar o consumo, cons, a partir do rendimento 
disponível, rdisp: )(rdisphcons = . É habitual propor a função h seguinte: 
rdispcons 21 αα += , 
onde 1α e 2α são parâmetros desconhecidos (em particular, 2α é a propensão marginal 
para consumir, a verificar 10 2 <<α ). Esta função é razoavelmente adequada para anali-
sar a evolução do consumo privado? Se a resposta for afirmativa, é desejável conhecer 
uma boa estimativa da propensão marginal a consumir. 
∇ 
 
Exemplo 1.2 – Para as unidades produtivas que se dedicam ao fabrico de um bem é, 
muitas vezes, possível estabelecer, em certas condições, e para um determinado período 
de tempo, uma relação funcional h entre a produção, Q, do bem, e determinada combi-
nação de factores produtivos (por exemplo: capital, K, e trabalho, L): ),( LKhQ = . Esta 
relação funcional chama-se função de produção. O estudo deste tipo de funções faz 
parte de um capítulo muito importante da teoria microeconómica: a teoria da produção. 
Uma especificação muito utilizada é a função Cobb-Douglas, 
Capítulo 1 – Introdução 2 
 
 
32
1
ααα LKQ = , 
onde 1α , 2α e 3α são parâmetros positivos ( 2α e 3α representam, neste caso, as elasti-
cidades pontuais da quantidade produzida relativamente ao capital e ao trabalho, respec-
tivamente; ver secção 1.4). A análise estatística destas elasticidades (estimação pontual 
e por intervalos, teste de hipóteses, etc.) é uma preocupação empírica muito importante. 
Outra especificação corrente, na teoria da produção, é a função de produção 
CES (elasticidade de substituição constante), 
ρ
γ
ρρ δδβ
−
−− +−= })1{( KLQ , 
com parâmetros 0>β , 0>γ , 10 << δ e ρ . 
∇ 
 
Exemplo 1.3 – Quando pretende explicar-se o comportamento, ao longo de vários pe-
ríodos de tempo, das importações portuguesas, a nível agregado, em função de um indi-
cador de preços relativos e de um indicador do nível de actividade, pode estabelecer-se 
a relação funcional h, 
)( pibprm,himport = , 
onde: import designa as importações portuguesas a preços constantes; prm é o rácio en-
tre o índice de preços implícito nas importações e o índice de preços implícito no PIB; 
pib é o produto interno bruto português a preços constantes. 
 Uma especificação possível da função h é a seguinte: 
32
1
αα pibprmαimport = )0( 1 >α . 
 Estabelecida esta relação teórica entre as três variáveis, põe-se a questão de esti-
mar os respectivos parâmetros (nomeadamente as elasticidades pontuais), e de proceder 
a outras análises estatísticas. 
∇ 
 
Exemplo 1.4 – Considere-se as variáveis educ (número de anos de escolaridade de um 
trabalhador) e salar (salário mensal médio num determinado ano do mesmo trabalha-
dor), com o objectivo de saber se educ influencia salar. O efeito da escolaridade sobre o 
salário chama-se habitualmente retorno da educação. 
É consenso na economia do trabalho que exper (número de anos de experiência 
profissional do trabalhador), empc (número de anos de trabalho no emprego corrente), 
mulher (variável binária que assume o valor 1 quando se trata de uma mulher, e o valor 
0 quando é um homem; a discriminação salarial com base no género do trabalhador con-
tinua a ser realidade em muitos sectores de actividade) e aptid (aptidão ou capacidade 
inata da pessoa; variável não observável) são variáveis que também podem influenciar o 
salário. Tem-se, então, 
),,,,( aptidmulherempcexpereduchsalar = . 
Capítulo 1 – Introdução 3 
 
 
Evidentemente, outros factores – como o número de anos de escolaridade da 
mãe, do pai e do cônjuge do trabalhador, e outros antecedentes familiares, o número de 
filhos, o estado civil, a localização da habitação, a região onde trabalha, a origem social 
ou étnica, a nacionalidade, etc. – poderiam ser acrescentados à relação funcional; facil-
mente se compreende que não é candidato a figurar em h o número de golos que o clube 
de futebol da preferência do trabalhador faz em média por mês. 
 Desprezando a variável aptid, podia propor-se a seguinte especificação: 
}exp{ 54321 mulherempcexpereducsalar ααααα ++++= , 
ou ainda, 
mulherempcexpereduclsalar 54321 ααααα ++++= , 
onde )ln(salarlsalar = . Com facilidade se interpreta o significado dos parâmetros (esta 
questão vai ser aprofundada nas próximas secções). Por exemplo: 2α (multiplicado por 
100) mede, aproximadamente, a variação percentual do salário quando um trabalhador 
tem mais um ano de escolaridade (em estudos deste tipo é particularmente útil conhecer 
uma estimativa deste parâmetro, que representa o retorno da educação); 5α (multiplica-
do por 100) mede, aproximadamente, a diferença percentual de salário entre uma mu-
lher e um homem. 
∇ 
 
Exemplo 1.5 – Procura saber-se se a assiduidade às aulas de um aluno de Estatística du-
rante um semestre (assid) é factor explicativo da nota no exame final da unidade curri-
cular (nest). Para isso, considera-se que 
),,( mistaeassidhnest = , 
onde tae (nota obtida num teste geral de aptidão escolar) e mis (média geral das notas já 
obtidas até ao início do semestre) são medidas gerais que reflectem a capacidade e os 
hábitos de estudo dos alunos. Estas variáveis (conjuntamente com assid) são adequadas 
para explicar nest? Talvez não, porque podem não reflectir a aptidão e o interesse do 
aluno pela Estatística. Sendo assim, seria importante a inclusão de uma variável que 
contemplasse estes aspectos, mas teria o inconveniente de não ser observável. 
∇ 
 
Exemplo 1.6 – Suponha-se que pretende estimar-se o número diário de viagens de au-
tomóvel (viag) entre os concelhos da Área Metropolitana de Lisboa (AML) situados a 
norte do Tejo, por motivo de deslocação para o trabalho, com vista a tomar decisões so-
bre a construção de novas vias rápidas ou alargamento das existentes. Com o objectivo 
de melhor entender estes movimentos, decidiu-se propor uma relação funcional, onde os 
factores explicativos de viag são a população activa no concelho de origem (pop), o nú-
mero de empresas no concelho de destino (nemp) como sucedâneo do emprego, e a dis-
tância entre as sedes dos concelhos de origem e destino (dist). Assim, 
),,( distnemppophviag = . 
Capítulo 1 – Introdução 4 
 
 
 Podia propor-se a seguinte especificação de h: 
432
1
ααα distnemppopαviag = )0( 1 >α . 
∇ 
 
 Os exemplos seguintes consideram modelos económicos com duas ou mais rela-
ções. 
 
Exemplo 1.7 – Sabe-se da teoria económica que, em muitos casos, o factor principal 
que explica a procura mensal de um certo bem, dq , é o respectivo preço, p. Tem-se, en-
tão, a seguinte função procura: )( phq dd = . 
 Como se sabe, a quantidade e o preço de equilíbrio do mercado (respectivamen-
te, ∗q e ∗p ) não podem ser determinados apenas com aquela função. É indispensável 
considerar também a função oferta, )( phq ss = , e a relação de equilíbrio, sd qq = , o que 
permite determinar simultaneamente ∗q e ∗p . Obtém-se, assim, um modelo de procu-
ra e oferta num mercado em equilíbrio:




=
=
=
).mercado de equilíbrio(
)oferta função()(
procura) (função)(
sd
ss
dd
qq
phq
phq
 
 A especificação mais habitual é a seguinte: 





=
+=
+=
).mercado de equilíbrio(
)oferta função(
procura) (função
10
10
sd
s
d
qq
pq
pq
ββ
αα
 
 Devido à simultaneidade atrás referida, o modelo apresentado tem o grave in-
conveniente de nem sequer permitir estimar a função procura (ou a função oferta), por-
que são observáveis apenas a quantidade e o preço de equilíbrio: muitas funções procura 
(oferta) são compatíveis com o par ( ∗q , ∗p ). 
 Uma especificação mais adequada seria, por exemplo, 




=
++=
++=
).mercado de equilíbrio(
)oferta função(
procura) (função
210
210
sd
s
d
qq
zpq
rpq
βββ
ααα
 
onde r é o rendimento médio dos consumidores do bem, e z é um indicador da dimensão 
média das empresas que vendem o bem. Este assunto será retomado no capítulo 4. 
∇ 
 
Exemplo 1.8 – Sabe-se da teoria macroeconómica que a função consumo introduzida 
no exemplo 1.1 não deve ser considerada isoladamente, mas integrada num sistema de 
equações que traduza as relações entre os agregados macroeconómicos. 
 Por exemplo, podia considerar-se o seguinte modelo macroeconómico simples: 
Capítulo 1 – Introdução 5 
 
 



+=
+=
),PNB do identidade(
consumo) (função21
investconspnb
pnbcons ββ
 
onde cons é o consumo agregado, pnb é o produto nacional bruto (PNB) ou rendimento 
nacional, e invest é o investimento agregado. O parâmetro 2β desempenha um papel 
fundamental neste modelo, já que representa a propensão marginal a consumir a partir 
do rendimento ( 10 2 << β ). 
 Outro caso típico é o modelo keynesiano simples da procura agregada, onde 
se tem, por exemplo, 





++=
+=
+−+=
,
)(
21
221
dpinvestconspnb
tjuroinvest
tjuroimpdpnbcons
γγ
βββ
 
onde impd é a receita dos impostos directos, tjuro é a taxa de juro, e dp é a despesa púb-
lica. 
Podia, também, propor-se o seguinte modelo: 





++=
−++=
++−+=
−
−
,
)(
)(
1321
14321
dpinvestconspnb
pnbpnbtjuroinvest
constjuroimpdpnbcons
γγγ
ββββ
 
onde 1−cons é consumo do período anterior, e 1−pnb é o PNB do período anterior. 
 O estudo empírico destes pequenos protótipos de funcionamento de uma econo-
mia pode ser particularmente útil para esclarecer certos aspectos das complexas relações 
entre as grandezas macroeconómicas. 
∇ 
 
Exemplo 1.9 – Suponha-se que pretende determinar-se a influência do número de agen-
tes de polícia (pol) existente em cada cidade sobre a respectiva taxa de criminalidade 
(crime), admitindo que outro factor explicativo de crime é o rendimento percapita dos 
habitantes da cidade (rpc). Assim, tem-se 
),(1 rpcpolhcrime = . 
 Mesmo admitindo que esta relação traduz adequadamente o comportamento dos 
criminosos, o modelo a considerar não pode ser composto apenas por 1h , pois é admis-
sível que crime e pol sejam interdependentes, e, portanto, determinados simultaneamen-
te. Assim, teria de considerar-se uma segunda relação que reflectisse o comportamento 
das autoridades camarárias relativamente a pol. Por exemplo, poderia supor-se que 
),(2 imunicipcrimehpol = , 
onde imunicip é a receita de impostos municipais. 
 Podia, então, especificar-se o seguinte modelo: 



++=
++=
.321
321
imunicipγcrimeγγpol
rpcβpolββcrime
 
Capítulo 1 – Introdução 6 
 
 
 A análise empírica da interdependência entre as variáveis crime e pol pode ser 
um objectivo importante do estudo econométrico. 
∇ 
 
Exemplo 1.10 – Os países de economia mais aberta têm menores taxas de inflação? 
Para responder a esta pergunta, considerou-se que 
),(1 rpcgahinf = , 
onde inf é a taxa de inflação, ga é o grau de abertura da economia medido pelo quo-
ciente entre as importações e o PIB, e rpc é o rendimento per capita. 
 Como é admissível supor que ga também é influenciado por inf (há interdepen-
dência entre as duas variáveis), deve considerar-se uma segunda relação funcional, que, 
por exemplo, poderia ser 
),,(1 aprpcfinhga = , 
onde ap é a área do país em quilómetros quadrados. 
 Fazendo 



+++=
++=
,)ln()ln(
)ln(
4321
321
aprpcfinga
rpcgafin
γγγγ
βββ
 
é de admitir, por exemplo, que 02 <β (quanto maior é o grau de abertura da economia, 
menor a taxa de inflação), e 04 <γ (quanto menor é o país, maior é o grau de abertura). 
A interdependência sugerida entre inf e ga deve ser submetida a uma análise em-
pírica adequada. 
∇ 
 
 Ragnar Frisch (economista norueguês, prémio Nobel da Economia em 1969 – 
conjuntamente com o economista holandês Jan Tinbergen –, e um dos fundadores da 
Econometric Society), apresentou em 1936 (“Note on the term `Econometrics´”, Eco-
nometrica, vol. 4) a primeira definição consistente de Econometria. Trata-se de uma 
definição ampla (“ideal”), enunciada nos seguintes termos: “a Econometria é uma disci-
plina que visa estudar a aplicação da Matemática e dos métodos estatísticos à análise 
dos dados económicos”. O mesmo economista já afirmava, em 1933, o seguinte: “A ex-
periência tem mostrado que cada um destes três pontos de vista, o da Estatística, o da 
Teoria Económica e o da Matemática, é condição necessária, mas não em si suficiente, 
para uma verdadeira compreensão das relações quantitativas na vida económica moder-
na. É a unificação dos três pontos de vista que é fecunda e constitui a Econometria” 
(Econometrica, Editorial, 1933). 
 Outra definição célebre deve-se a Samuelson (prémio Nobel em 1970), Koop-
mans (prémio Nobel em 1975) e Stone (prémio Nobel em 1984): “A Econometria pode 
ser definida como a análise quantitativa dos fenómenos económicos, baseada na teoria e 
na observação, e utilizando os métodos de inferência apropriados”. 
Muitos outros autores têm apresentado definições de Econometria. Indicam-se 
mais três citações de econometristas proeminentes: 
Capítulo 1 – Introdução 7 
 
 
− “A Econometria pode ser definida como a ciência social em que as ferramentas da 
teoria económica, da matemática e da inferência estatística são utilizadas na análise 
de fenómenos económicos” (Goldberger). 
− “A Econometria preocupa-se com a determinação empírica de leis económicas” 
(Theil). 
− “A arte do econometrista consiste em procurar o conjunto de hipóteses que são sufi-
cientemente específicas e suficientemente realistas para permitir tirar o melhor parti-
do dos dados disponíveis” (Malinvaud). 
 
Embora se esteja ainda relativamente distante desta situação ideal, a Econome-
tria constitui, actualmente, uma área científica autónoma, que muito tem contribuído 
para o avanço da ciência económica. Este avanço está bem patente nos contributos de 
alguns econometristas que foram prémios Nobel recentemente. No ano 2000, o prémio 
foi atribuído a dois microeconometristas: James Heckman (University of Chicago, 
USA) [“for his development of theory and methods for analyzing selective samples”]; 
Daniel Mc Fadden (University of California, at Berkeley, USA) [“for his development 
of theory and methods for analyzing discrete choice”]. Em 2003, os galardoados foram 
dois macroeconometristas: Clive Granger (University of California, at San Diego, 
USA) [“for methods of analyzing economic time series with common trends (cointegra-
tion)”]; Robert Engle (University of New York, USA) [“for methods of analyzing eco-
nomic time series time-varying volatility (ARCH)”]. A econometria não é, longe disso, 
“um conjunto de métodos para medir a altura dos economistas”. 
 Em termos muito gerais, pode afirmar-se que o progresso da Econometria é re-
levante nos seguintes aspectos: a) nas técnicas de estimação e de análise estatística dos 
modelos (nos métodos econométricos); b) nas aplicações; c) e mais recentemente, nas 
tentativas de sistematizar os seus fundamentos metodológicos. 
 
1.2 - Modelo teórico 
 
Quando se estuda, com base em dados, um determinado fenómeno de natureza 
social (em particular, de índole económica), com o objectivo de descrever, explicar ou 
prever o seu comportamento, procura-seconceber, ainda que de forma aproximada ou 
simplificada, o mecanismo subjacente ao fenómeno observável. Este mecanismo é desi-
gnado habitualmente por modelo teórico. O modelo é assim adjectivado para salientar 
que deve ser baseado numa determinada teoria (construção conceptual fornecedora de 
uma descrição idealizada do fenómeno em estudo). No entanto, a teoria subjacente ao 
modelo não é necessariamente uma conceptualização matemática formal (como mui-
tas vezes acontece em macroeconomia e em microeconomia), mas pode consistir numa 
análise menos formal – em muitos casos apoiada no bom senso e na intuição – com 
vista a estabelecer meras relações entre variáveis. Deve enfatizar-se ainda que o mode-
lo a adoptar é objecto de uma teoria, mas também deve ser encarado como a fonte gera-
dora dos dados observáveis. 
 
Capítulo 1 – Introdução 8 
 
 
Exemplo 1.11 – Retome-se os exemplos anteriores: 
a) No exemplo 1.4 sugeriu-se, tendo por base considerações da área da economia do 
trabalho, que o modelo teórico a adoptar poderia ser 
mulherempcexpereduclsalar 54321 ααααα ++++= . 
b) Na sequência do exemplo 1.8, e apoiados na teoria macroeconómica, podia ser ra-
zoável adoptar o modelo teórico 





++=
−++=
++−+=
−
−
,
)(
)(
1321
14321
dpinvestconspnb
pnbpnbtjuroinvest
constjuroimpdpnbcons
γγγ
ββββ
 
para estudar as relações entre os agregados económicos referidos. 
c) O exemplo 1.9 sugere que o modelo teórico para estudar as interdependências entre 
a taxa de criminalidade e o efectivo policial numa cidade poderia ser 



++=
++=
.321
321
imunicipγcrimeγγpol
rpcβpolββcrime
 
d) Fica ao cuidado do leitor indicar modelos teóricos para estudar os fenómenos referi-
dos nos exemplos 1.1, 1.2, 1.3, 1.5, 1.6, 1.7 e 1.10. 
∇ 
 
Cada relação do modelo teórico proposto – exceptuando possíveis relações de 
equilíbrio ou identidades (ver exemplos 1.7 e 1.8) – procura estabelecer o comporta-
mento de uma variável, z, em função de outras variáveis, pwww ,,, 21 K . Na relação 
funcional considerada, diz-se que z é a variável explicada (a variável dependente ou a 
variável resposta), e pwww ,,, 21 K são as variáveis explicativas (as variáveis indepen-
dentes ou as variáveis controlo). Pode dizer-se que “z é explicado como função de 
pwww ,,, 21 K ”; “os factores explicativos de z são pwww ,,, 21 K ”. 
Assim, tem-se a função h de p variáveis 
(1.1) ),,,( 21 pwwwhz K= . 
Pressupõe-se que (1.1) envolve um conjunto finito de parâmetros desconheci-
dos, kααα ,,, 21 K . Diz-se, então, que se tem uma relação paramétrica. O modelo teó-
rico pode ser composto por várias relações de tipo (1.1). 
 As variáveis que fazem parte de um modelo teórico podem ser consideradas atri-
butos de uma determinada população em estudo. Deste modo, o modelo teórico compor-
ta uma ou mais relações que visa explicar o comportamento de certos atributos da popu-
lação. Por exemplo, a relação (1.1) procura estudar o comportamento do atributo z das 
entidades de uma determinada população em função dos atributos pwww ,,, 21 K das 
mesmas entidades. Assim, como para qualquer modelo teórico está subjacente uma po-
pulação, também se diz que este modelo é um modelo da população. 
A relação (1.1) também pode ser apresentada na forma seguinte: 
)(whz = , 
Capítulo 1 – Introdução 9 
 
 
onde, por convenção, w é o vector-linha das variáveis explicativas, e α é o vector-colu-
na dos parâmetros desconhecidos. Assim, 
=w [ pwww L21 ] e 










=
kα
α
α
α
M
2
1
. 
 
Exemplo 1.12 – Considerem-se, novamente, os exemplos 1.1, 1.2, 1.4 e 1.5, e as últi-
mas especificações propostas (os outros exemplos da secção 1.1 ficam ao cuidado do 
leitor). Tem-se: 
a) Exemplo 1.1: consz = e rdispw = . 
b) Exemplo 1.2: Qz = , Kw =1 e Lw =2 . 
c) Exemplo 1.4: lsalarz = , educw =1 , experw =2 , empcw =3 e mulherw =4 . 
d) Exemplo 1.5: nestz = , assidw =1 , taew =2 e misw =3 . 
∇ 
 
1.3 - Relações lineares 
 
Um caso particular muito importante das relações de tipo (1.1) é aquele que é 
caracterizado pela linearidade relativamente aos parâmetros, isto é, as relações assu-
mem a forma 
(1.2) kk xβxβxβy +++= L2211 , 
onde y é a variável explicada ou dependente (ou uma função desta variável), kx,xx ,, 21 K 
são as variáveis explicativas ou independentes (ou determinadas funções destas variá-
veis), e kβββ ,,, 21 K são os parâmetros. 
 Muitas vezes, a variável 1x é identicamente igual a 1. Trata-se de uma conven-
ção que permite considerar, na relação linear, um termo independente ou constante. 
Na maioria das situações a relação (1.2) tem termo independente, 1β , uma vez que ape-
nas em casos muito especiais se supõe que a nulidade das variáveis explicativas implica 
a nulidade de y. 
 A relação (1.2), também, pode apresentar-se da seguinte maneira: 
βxy = , 
onde 
=x [ kxxx L21 ] e 












=
kβ
β
β
β
M
2
1
. 
 Em muitas situações, a relação (1.1) não é linear (relativamente aos parâmetros), 
mas mediante uma transformação da variável z, )(zg , consegue obter-se uma relação da 
forma (1.2), ou seja, linearizou-se (1.1). Uma relação linear ou linearizável diz-se 
intrinsecamente linear (relativamente aos parâmetros). 
Capítulo 1 – Introdução 10 
 
 
 
Exemplo 1.13 – Retome-se alguns dos dez exemplos da secção 1.1: 
a) A função de consumo keynesiana referida no exemplo 1.1, rdispcons 21 ββ += , é li-
near relativamente aos parâmetros. Tem-se: consy = , 11 =x , rdispx =2 , 11 αβ = e 
22 αβ = . 
b) A função de produção Cobb-Douglas (exemplo 1.2), 321
ααα LKQ = )0( 1 >α , é li-
nearizável. Com efeito, logaritmizando a expressão anterior, obtém-se uma função, 
linear nos parâmetros, equivalente à relação anterior, 
)ln()ln()ln( 321 LKQ βββ ++= , 
onde: )ln(Qy = , 11 =x , )ln(2 Kx = , )ln(3 Lx = , )ln( 11 αβ = , 22 αβ = e 33 αβ = . 
Verifica-se, assim, que a função de produção Cobb-Douglas, embora não linear nos 
parâmetros, é intrinsecamente linear, pois a transformação logarítmica permite con-
vertê-la numa função linear. 
c) A função de produção CES (ver exemplo 1.2) não é intrinsecamente linear nos parâ-
metros, pois não existe qualquer transformação de Q que permita obter uma relação 
linear. 
d) Considere-se a relação 321 αα pibprmαimport = )0( 1 >α do exemplo 1.3. Logaritmi-
zando esta expressão, obtém-se 
)ln()ln()ln( 321 pibprmimport βββ ++= , 
em que: )ln(importy = , 11 =x , )ln(2 prmx = , )ln(3 pibx = , )ln( 11 αβ = , 22 αβ = e 
33 αβ = . 
e) No exemplo 1.4 a relação 
}exp{ 54321 mulherempcexpereducsalar ααααα ++++= 
não é linear nos parâmetros. No entanto, facilmente se passa a 
mulherempcexpereduclsalar 54321 βββββ ++++= , 
onde: lsalary = , 11 =x , educx =2 , experx =3 , empcx =4 , mulherx =5 , 11 αβ = , 
22 αβ = , 33 αβ = , 44 αβ = e 55 αβ = . 
f) Se, no exemplo 1.5, a especificação de ),,( mistaeassidhnest = for 
mistaeassidnest 4321 ββββ +++= , 
obtém-se uma relação linear relativamente aos parâmetros, onde nesty = , 11 =x , 
assidx =2 , taex =3 e misx =4 . 
∇ 
 
 É particularmente importante não confundir linearidade relativa aos parâme-
tros com linearidade relativa às variáveis. Por exemplo, uma relação linear nos parâ-
metros, mas não linear nas variáveis, é dada por 2321 wαwααz ++= . Contudo, a relação 
3
2
2221 wwz ααα ++= é linear nas variáveis, mas não é linear (nem linearizável) nos pa-
râmetros. A função de produção Cobb-Douglas referida no exemplo 1.2 é intrinseca-
mente linear nos parâmetros, mas não é linear relativamente às variáveis. A relação 
Capítulo 1 – Introdução 11 
 
 
w
z
+
+=
2α
α 11 , 
não é, nem linear nas variáveis, nem (intrinsecamente) linear nos parâmetros. 
Como vai ver-se, para a estimação dos parâmetros de uma relação (intrinseca-
mente) linear, a linearidade relativamente às variáveis tem pouca importância. A expres-
são “a relação é linear” significa que a relação é linear ou linearizável relativamente 
aos parâmetros. No entanto, a linearidade, ou não, relativamenteàs variáveis desem-
penha um papel decisivo para interpretar os parâmetros (ver secção seguinte). 
 
1.4 - Efeitos parciais, elasticidades e semi-elasticidades 
 
Esta secção tem por objectivo apresentar alguns conceitos de grande importância 
para a interpretação dos parâmetros – muito particularmente no quadro da Economia –, 
o que vai permitir dar conteúdo à última frase da secção anterior (“a linearidade, ou não, 
relativamente às variáveis desempenha um papel decisivo para interpretar os parâme-
tros”). 
O objectivo de muitos estudos empíricos em Economia (e nas Ciências Sociais, 
em geral) é determinar relações de causalidade entre duas variáveis. Trata-se de saber 
se a variação de uma variável implica ou causa uma variação noutra variável. Neste 
contexto, é crucial a noção de ceteris paribus [“supondo todos os outros factores (rele-
vantes) fixos”]. 
 
Exemplo 1.14 – Considere-se as seguintes perguntas: 
− Uma variação do rendimento disponível dá lugar a uma variação no consumo (ver 
exemplo 1.1)? 
− Uma variação da quantidade do factor trabalho altera a quantidade produzida (ver 
exemplo 1.2)? 
− Uma alteração dos preços relativos (ver a variável prm referida no exemplo 1.3) 
causa uma variação nas importações? 
− Possuir mais um ano de escolaridade aumenta o salário mensal de um trabalhador 
(ver exemplo 1.4)? 
− O aumento da taxa de frequência das aulas de Estatística provoca um aumento das 
notas dos alunos (ver exemplo 1.5)? 
− Como variam entre si a procura (oferta) e o preço (ver exemplo 1.7)? 
− O aumento do número de agentes policiais faz diminuir a taxa de criminalidade (ver 
exemplo 1.9)? Ou, pelo contrário, a subida da taxa de criminalidade influencia o au-
mento do número de polícias? 
− Um acréscimo no grau de abertura de economia de um país implica a diminuição da 
taxa de inflação (ver exemplo 1.10)? Ou, pelo contrário, é a diminuição desta taxa 
que provoca um aumento do grau de abertura? 
∇ 
 
 
Capítulo 1 – Introdução 12 
 
 
Efeitos parciais 
 
Dado o modelo ),,,( 1 pj wwwhz KK= , a análise ceteris paribus da relação de 
causalidade entre cada variável explicativa, jw , e z pretende medir as respostas de z às 
alterações de jw , supondo que os factores fixos (também designados por variáveis de 
controlo) são as outras variáveis explicativas. Como se admite que estas variáveis estão 
controladas (a necessidade de as controlar resulta de haver razões para concluir que jw 
está relacionada com outros factores que também influenciam z), a análise visa medir os 
efeitos parciais de jw sobre z. Naturalmente, estes efeitos dependem, em geral, dos 
valores assumidos por todas as variáveis explicativas e dos valores dos parâmetros. 
 Suponha-se que as variáveis z e jw são quantitativas (contínuas ou discretas). 
Quando o valor de jw passa para jj ww ∆+ , o valor da variável z altera-se para 
),,,,( 1 pjj wwwwhzz KK ∆+=∆+ . 
As variações absolutas das duas variáveis são, respectivamente, jw∆ e z∆ (po-
dem calcular-se estas variações porque as variáveis são quantitativas). Nestas condições, 
o efeito parcial de jw sobre z é dado por 
(1.3) 
jw
z
∆
∆ . 
Como este efeito mede, ceteris paribus, a variação (absoluta) de z quando jw 
varia de uma unidade, é designado por efeito marginal (parcial), que pode depender das 
variáveis explicativas, pwww ,,, 21 K , e dos parâmetros. 
 Quando, em particular, as variáveis z e jw são contínuas, e a função h é deri-
vável (pelo menos em relação a jw ), o efeito marginal de jw sobre z pode ser determi-
nado para uma variação infinitesimal de jw . Neste caso, tem-se o efeito marginal pon-
tual, que é dado pela respectiva derivada parcial 
(1.4) 
jwj w
z
w
z
j ∆
∆
=
∂
∂
→∆ 0
lim . 
Para 0≈∆ jw , tem-se 
jj w
z
w
z
∆
∆
≈
∂
∂ . 
Considerem-se os seguintes exemplos: 
1) Seja a relação linear nas variáveis, 33221 wαwααz ++= , onde z, 2w e 3w são variá-
veis contínuas. O efeito marginal (parcial) de 2w sobre z é medido pelo parâmetro 
2α (constante), isto é, 
2
22
α=
∆
∆
=
∂
∂
w
z
w
z . 
Neste caso, 2α é igual à variação de z quando 2w varia de uma unidade. 
Capítulo 1 – Introdução 13 
 
 
2) Seja 2321 wαwααz ++= , relação quadrática entre z e w (variáveis contínuas). O 
efeito marginal pontual de w sobre z (para uma variação infinitesimal de w) já não é 
medido por 2α , mas por 
wααwd
zd
32 2+= . 
Como este efeito depende linearmente de w, o parâmetro 3α tem uma interpretação 
interessante: o seu sinal permite saber se o efeito marginal de w sobre z é crescente 
( 03 >α ) ou decrescente ( 03 <α ), uma vez que 
32
2
2α
wd
zd
= . 
O valor de w que anula a primeira derivada (ponto de estacionaridade) é 
3
2
2α
αw −=∗ . 
Este valor é maximizante ou minimizante da função conforme o sinal da segunda de-
rivada em ∗w . Por exemplo, no caso de maximizante, a função é côncava, sendo 
crescente à esquerda de ∗w , e decrescente à sua direita. 
Note-se que 
wd
zdwwααw
z
≠∆++=
∆
∆
332 2 α e w
z
wd
zd
w ∆
∆
=
→∆ 0
lim . 
3) Suponha-se que a relação (não linear) entre z, 2w e 3w (variáveis contínuas) é dada 
por 32433221 wwαwαwααz +++= , onde existe um termo de interacção entre duas va-
riáveis explicativas. Neste caso, o efeito marginal de 2w sobre z, ceteris paribus, é 
medido por 
342
22
ww
z
w
z αα +=
∆
∆
=
∂
∂ , 
que depende do valor de 3w (obtém-se um efeito marginal para cada valor fixado pa-
ra 3w ). 
4) Seja a relação linear nas variáveis, 33221 wαwααz ++= , onde z e 3w são variáveis 
contínuas, e 2w é uma variável discreta. Suponha-se, para fixar ideias, que a variável 
discreta 2w é uma variável de contagem (por exemplo, o número de dias de falta ao 
trabalho de determinado trabalhador). Para medir as variações de z quando 2w se al-
tera, não se pode calcular a derivada parcial. Neste caso, quando 2w varia para 
22 ww ∆+ , z passa para 332221 )( wαwwααzz +∆++=∆+ . Facilmente se verifica que 
22 wαz ∆=∆ ou 
2
2
α=
∆
∆
w
z . 
Pode dizer-se que 2α mede a variação de z quando 2w varia de uma unidade (por 
exemplo, 2α mede o efeito parcial sobre z de mais uma falta ao trabalho). 
 
Capítulo 1 – Introdução 14 
 
 
 Suponha-se, agora, que a variável z ainda é quantitativa (contínua ou discreta), e 
que existe um factor qualitativo explicativo do comportamento de z. Se este factor cor-
responde à realização ou não de determinado acontecimento, ele pode ser representado 
por uma variável binária, jw , que assume apenas os valores 1 ou 0. Tem-se: 1=jw , 
quando se realiza o acontecimento; 0=jw , no caso contrário. No exemplo 1.4, supõe-se 
que o género é um factor qualitativo explicativo dos salários dos trabalhadores. A variá-
vel binária respectiva, mulher, é igual a 1 quando o trabalhador é do género feminino 
(igual a 0, quando é um homem). Nestes casos, o efeito parcial de jw sobre z é medido 
comparando os valores assumidos por z para os dois valores possíveis de jw (no caso 
do exemplo 1.4, quando se comparam homens com mulheres). Este tópico vai ser 
aprofundado no capítulo 2, na secção dedicada ao estudo das variáveis artificiais (ver 
secção 2.11). 
Considerem-se os seguintes exemplos: 
1) Seja a relação linear nas variáveis, 33221 wαwααz ++= , onde z e 3w são variáveis 
contínuas, e 2w é uma variável binária. O efeito parcial de 2w sobre z é calculado 
fazendo a diferença dos valores de z que correspondem aos dois valores possíveis de 
2w : para 02 =w , tem-se 3310 wααz += ; para 12 =w , vem 33211 wαααz ++= . Então, 
quando 2w passa de 0 para 1, a variação de z é 201 αzzz =−=∆ . 
2) Nas mesmas condições de 1), seja a relação 32433221 wwαwαwααz +++= , onde exis-
te um termo de interacção entre a variável contínua, 3w , e a variável binária, 2w . 
O efeito marginal pontual de 3w sobre z, 
243
3
w
w
z αα +=
∂
∂ , 
depende de 2w . Há um efeito marginal para cada valor de 2w : 3α , quando 02 =w ; 
43 αα + , para 12 =w . 
Para medir as variações de z quando 2w passa de 0 para 1, começa-se por calcular os 
respectivos 1z e0z : 
3433211 wαwαααz +++= e 3310 wααz += . 
Então, 34201 wααzzz +=−=∆ depende de 3w . 
 
Elasticidades 
 
 Admita-se que as variáveis z e jw são quantitativas (contínuas ou discretas). 
Quando os valores de jw e z passam, respectivamente, para jj ww ∆+ e zz ∆+ , verifi-
cam-se as seguintes variações relativas: 
j
j
w
w∆
 e z
z∆ . 
Multiplicando por 100 as variações relativas, obtêm-se as respectivas variações 
percentuais (variações em pontos percentuais) ou taxas de variação, que se represen-
tam com os seguintes símbolos: 
Capítulo 1 – Introdução 15 
 
 
j
j
j w
w
w
∆
=∆ 100% e 
z
zz ∆=∆ 100% . 
 A elasticidade de z em relação a jw é dada por 
(1.5) z
w
w
z
w
z
ww
zzwz j
jjjj
j ∆
∆
=
∆
∆
=
∆
∆
= %
%
/
/);(EL . 
Esta elasticidade mede, ceteris paribus, a variação percentual de z quando jw 
varia de um ponto percentual. Obviamente, este efeito pode depender de pwww ,,, 21 K , 
e dos parâmetros. 
O logaritmo pode ser utilizado para fazer várias aproximações. Uma delas, es-
tabelece que xx ≈+ )1ln( , para 0≈x . A qualidade da aproximação diminui à medida 
que x se afasta de zero. Por exemplo, para x igual a 0.015, 0.15 e 0.6 tem-se, respectiva-
mente, 0149.0)015.1ln( = , 1398.0)15.1ln( = e 47.0)6.1ln( = . 
Outra aproximação importante que envolve logaritmos é dada por 
x
xx ∆≈∆ )ln( , 
para 0>x e pequenas variações relativas. Por exemplo, se 600=x e 606=∆+ xx , 
tem-se 01.0/ =∆ xx e 00995.0)ln()ln()ln( =−∆+=∆ xxxx . No entanto, se 600=x e 
720=∆+ xx , resulta 2.0/ =∆ xx e 1823.0)ln( =∆ x (a qualidade da aproximação pio-
ra). 
 Suponha-se que 0>z e 0>jw . Para pequenas variações relativas, podem esta-
belecer-se as seguintes aproximações: 
)ln(100% jj ww ∆≈∆ e )ln(100% zz ∆≈∆ . 
Facilmente se conclui que 
)ln(
)ln();(EL
j
j w
zwz
∆
∆
≈ . 
No caso particular em que as variáveis z e jw são contínuas, e a função h é de-
rivável (pelo menos em relação a jw ), a elasticidade de z em relação a jw pode ser de-
finida para uma variação infinitesimal de jw . Neste caso, a elasticidade pontual de z 
em relação a jw é dada por 
(1.6) z
w
w
z
z
w
w
z
ww
zzwz j
j
j
jwjjw
j
jj ∂
∂
=
∆
∆
=
∆
∆
=
→∆→∆
∗
00
lim/
/lim);(EL . 
Facilmente se verifica que 
);(ELlim);(EL
0 jwj
wzwz
j →∆
∗ = . 
Para 0≈∆ jw , tem-se );(EL);(EL jj wzwz ≈∗ . 
Quando 0>z e 0>jw , pode também demonstrar-se que 
Capítulo 1 – Introdução 16 
 
 
)ln(
)ln();(EL
j
j w
zwz
∂
∂
=∗ . 
Com efeito, notando que )}exp{ln( jj ww = e que 
j
w
j
w
j
j wewd
ed
wd
wd
j
j
=== )ln(
)ln(
)ln()ln( , 
aplicando duas vezes a regra da derivada da função composta, obtém-se 
);(EL1)ln(
)ln(
)ln(
)ln(
j
j
j
j
jj
j
jj
wzw
z
z
w
ww
z
zwd
wd
w
z
zd
zd
w
z ∗=
∂
∂
=
∂
∂
=
∂
∂
=
∂
∂ . 
Considerem-se os seguintes exemplos: 
1) Seja a relação linear nas variáveis, wααz 21 += , onde z e w são variáveis contínuas. 
Dada a variação w∆ , tem-se )(21 wwααzz ∆++=∆+ . A elasticidade de z em relação 
a w é dada por 
w
w
z
w
w
zwz
21
2);(EL ααα +=∆
∆
= , 
que depende de w. Conclui-se imediatamente que );(EL);(EL wzwz =∗ . 
2) Seja 221 wααz += , relação quadrática entre z e w (variáveis contínuas). Dada a va-
riação w∆ , vem })(2{)( 2221221 wwwwααwwααzz ∆+∆++=∆++=∆+ . A elastici-
dade de z em relação a w é 
2
21
2 )2();(EL w
wwwz
w
w
zwz
αα
α
+
∆+=
∆
∆
= . 
Facilmente se verifica que 
2
21
22);(EL w
wwz
w
wd
zdwz
αα
α
+
==∗ . 
Para 0→∆w , tem-se );(EL);(EL wzwz ∗→ . 
3) Suponha-se que a relação (não linear) entre z, 2w e 3w (variáveis contínuas) é dada 
por 32433221 wwαwαwααz +++= (a quarta parcela é termo de interacção entre 2w e 
3w ). Dado 2w∆ , obtém-se 3224332221 )()( wwwαwαwwααzz ∆+++∆++=∆+ . Então, 
);(EL)();(EL 2
32433221
2
342
2
2
2 wzwwαwαwαα
wwz
w
w
zwz ∗=
+++
+=
∆
∆
= αα . 
 
Semi-elasticidades 
 
 Suponha-se que as variáveis z e jw são quantitativas (contínuas ou discretas). 
A semi-elasticidade de z em relação a jw é dada por 
(1.7) zw
z
w
z
w
zzwz
jjj
j
1
100
%/);SEL(
∆
∆
=
∆
∆
=
∆
∆
= . 
Capítulo 1 – Introdução 17 
 
 
A semi-elasticidade mede, ceteris paribus, a variação relativa de z quando jw 
varia de uma unidade. Obviamente, este efeito pode depender de pwww ,,, 21 K , e dos 
parâmetros. 
Facilmente se verifica que 
j
j w
zwz
∆
∆
=×
%);SEL(100 
mede, ceteris paribus, a variação percentual de z quando jw varia de uma unidade. 
Quando 0>z , e para pequenas variações relativas, tem-se 
j
j w
zwz
∆
∆
≈
)ln();SEL( . 
Quando as variáveis z e jw são contínuas, e a função h é derivável (pelo me-
nos em relação a jw ), a semi-elasticidade z em relação a jw pode ser definida para uma 
variação infinitesimal de jw . Neste caso, a semi-elasticidade pontual z em relação a 
jw é dada por 
(1.8) zw
z
zw
z
w
zzwz
jjwjw
j
jj
11lim/lim);(SEL
00 ∂
∂
=
∆
∆
=
∆
∆
=
→∆→∆
∗ . 
Resulta imediatamente que 
);SEL(lim);(SEL
0 jwj
wzwz
j →∆
∗ = . 
Para 0≈∆ jw , tem-se );SEL();(SEL jj wzwz ≈∗ . 
Quando 0>z , vem 
j
j w
zwz
∂
∂
=∗
)ln();(SEL . 
Considerem-se os seguintes exemplos: 
1) Seja wααz 21 += , onde z e w são variáveis contínuas. A semi-elasticidade de z em re-
lação a w é dada por 
);(SEL1);SEL(
21
2 wzwzw
zwz ∗=
+
=
∆
∆
= αα
α , 
que depende de w. 
2) Considere-se 221 wααz += , onde z e w são variáveis contínuas. A semi-elasticidade 
de z em relação a w é 
2
21
2 )2(1);SEL(
w
ww
zw
zwz
αα
α
+
∆+
=
∆
∆
= . 
A respectiva semi-elasticidade pontual é dada por 
2
21
221);(SEL
w
w
zwd
zdwz
αα
α
+
==∗ . 
Para 0→∆w , tem-se );(SEL);SEL( wzwz ∗→ . 
Capítulo 1 – Introdução 18 
 
 
3) Considere-se a relação 32433221 wwαwαwααz +++= entre variáveis contínuas. Vem 
);(SEL1);SEL( 2
32433221
342
2
2 wzwwαwαwαα
w
zw
zwz ∗=
+++
+
=
∆
∆
=
αα . 
 
1.5 - Algumas relações linearizáveis 
 
Existe uma grande variedade de relações que se podem estudar sob a capa das 
relações lineares. Com o objectivo de aprofundar esta questão, vão apresentar-se alguns 
tipos de relações funcionais muito utilizados na prática. Por simplicidade de exposição, 
estas relações consideram apenas uma variável explicativa, mas podem ser imediata-
mente generalizadas para duas ou mais variáveis. 
 
a) A relação log-log. Considere-se a função potência (ver figura 1.1) 
(1.9) αwγz = )0;0( >> γw . 
Esta função verifica uma propriedade muito importante: a elasticidade pontual 
de z em relação a w é constante (igual a α ). Com efeito, 
(1.10) α==∗
z
w
wd
zdwz );(EL . 
Por esta razão, é também designada por função de elasticidade constante. 
 
0 1 2
 
Fig. 1.1 – Função potência. 
 
Linearizando (1.9), obtém-se a especificação log-log, 
(1.11) )ln()ln( 21 wββz += , 
onde )(ln1 γβ = e αβ =2 . 
Capítulo 1 – Introdução 19 
 
 
Então, 
w
z
w/w
/zz
w
z
wd
zdβ
∆
∆
=
∆
∆
≈
∆
∆
== %
%
ln
ln
)ln(
)ln(
2 , 
ou seja, 2β é, aproximadamente, o quociente entre a variação relativa de z e a variação 
relativa de w (variação percentual de z quando w varia de um ponto percentual). 
 Pode, também, escrever-se 
wz ∆≈∆ %% 2β . 
 O valor exacto de z∆% pode ser calculado sem dificuldade. Suponha-se que o 
valor de w passa para ww ∆+ . Atendendo a (1.9), tem-se αγ )( wwzz ∆+=∆+ . Então, 
111}){( −




 ∆+=−




 ∆+=
−∆+
=
∆ αα
α
αα
γ
γ
w
w
w
ww
w
www
z
z . 
 Multiplicando ambos os membros por 100, obtém-se 








−




 ∆+×=∆ 11100%
α
w
wz . 
 Então, 
(1.12) 
w
w
w
w
w
zwz
∆
−






 ∆
+
=
∆
∆
=
11
%
%);(EL
α
. 
O grau de aproximação entre (1.12) e (1.10) é ilustrado a seguir. Por exemplo, 
suponha-se que 33.0wz = . O quadro seguinte apresenta os desvios entre 33.02 ==αβ e 
wz ∆∆ %% : 
 
w w∆ w∆% z∆% );(EL wz α=∗ );(EL wz Desvios 
600 6 1 0.3289 0.3289 0.33 – 0.0011 
600 60 10 3.1952 0.3195 0.33 – 0.0105 
600 120 20 6.2013 0.3101 0.33 – 0.0199 
600 180 30 9.0439 0.3015 0.33 – 0.0285 
 
b) A relação log-lin. Considere-se a função exponencial (ver figura 1.2) 
(1.13) wαγz = )0;0( >> γα . 
Logaritmizando,obtém-se a relação semi-logarítmica ou log-lin, 
(1.14) wββz 21)ln( += , 
onde )ln(1 γβ = e )ln(2 αβ = . 
A semi-elasticidade pontual de z em relação a w é constante (igual a 2β ). De 
facto, 
Capítulo 1 – Introdução 20 
 
 
(1.15) 2
)ln(1);(SEL βwd
zd
zwd
zdwz ===∗ . 
A função dada por (1.13) também é conhecida pela designação de função de se-
mi-elasticidade constante. 
-2 -1 0 1 2
 
Fig. 1.2 – Função exponencial. 
 
 Tem-se 
w
z
w
z
w
zz
w
z
wd
zd
∆
∆
≈⇔
∆
∆
=
∆
∆
≈
∆
∆
==
%100100
%/)ln()ln(
22 ββ , 
ou seja, 2β é, aproximadamente, o quociente entre a variação relativa de z e a variação 
absoluta de w (se w varia de 1 unidade, z varia, aproximadamente, de %100 2β ). 
 Pode, também, escrever-se 
wz ∆≈∆ 2100% β . 
 O valor exacto de z∆% pode ser determinado sem dificuldade. Suponha-se que 
o valor de w passa para ww ∆+ . Atendendo a (1.13) ou (1.14), tem-se 
)}(exp{ 21 wwzz ww ∆++==∆+ ∆+ ββαγ . 
Então, 
11)( −=−=−=∆ ∆
∆+∆+
w
w
ww
w
www
z
z α
α
α
αγ
ααγ ou 1}exp{ 2 −∆=
∆ wz
z β . 
 Multiplicando ambos os membros de qualquer destas igualdades por 100, vem 
)1}(exp{100)1(100% 2 −∆×=−×=∆ ∆ wz w βα . 
 Então, 
(1.16) w
w
ww
zz
w
zwz
w
∆
−∆
=
∆
−
=
∆
∆
=
∆
∆
=
∆ 1}exp{1/
100
%);(SEL 2βα . 
Capítulo 1 – Introdução 21 
 
 
A aproximação entre (1.16) e (1.15) é ilustrada a seguir. Por exemplo, supondo 
que 094.02 =β , o quadro seguinte mostra os desvios entre 2β e )100(% wz ∆×∆ : 
 
w∆ z∆% );(SEL wz 2);(SEL β=
∗ wz Desvios 
0.1 0.9444 0.0944 0.094 0.0004 
0.5 4.8122 0.0962 0.094 0.0022 
1.0 9.8560 0.0986 0.094 0.0046 
5.0 59.9994 0.1200 0.094 0.0260 
10.0 155.9981 0.1560 0.094 0.0620 
20.0 555.3505 0.2777 0.094 0.1837 
 
A relação log-lin é particularmente interessante quando a variável explicativa é o 
tempo (considerada variável contínua): tw = . Neste caso, tem-se 
tββzeγzαγz tβt 21)ln(2 +=⇔=⇔= , 
onde )ln(1 γβ = e )ln(2 αβ = . Diz-se, então, que z tem tendência exponencial, e )ln(z 
tem tendência linear. 
Verifica-se que 
t
z
t
z
t
z
ztd
zd
td
zd
∆
∆
≈⇔
∆
∆
≈
∆
∆
===
%100100
%)ln(1)ln(
22 ββ , 
é a taxa instantânea de variação de z no momento t. 
Se o tempo for considerado de forma discreta, a variável z é observada nos mo-
mentos KK ,,,2,1,0 t , e 1=∆ t . Pode fazer-se tt gz )(1+= γ , onde g é a taxa média de 
variação de z no período t (entre o momento 0 e o momento t) Com efeito, basta consi-
derar que: para 0=t , tem-se γ=0z ; para 1=t , vem )1(1 gz += γ ; quando 2=t , resulta 
2
2 )1( gz += γ ; em geral, tem-se tt gz )(1+= γ . Omitindo o índice t da variável z, pode 
escrever-se 
tgz )(1+= γ 
onde g+=1α , e, portanto, )1ln(2 gβ += . 
Como tgz )1ln()ln()ln( ++= γ e 1=∆ t , vem 
ggz ≈+=∆ )1ln()ln( , 
para g pequeno. Assim, nestas condições, a variação de )ln(z (a taxa instantânea de va-
riação de z) é aproximadamente igual à taxa média de variação de z. 
 
c) A relação lin-log é outro tipo de relação semi-logarítmica, mas onde os papéis das 
variáveis estão trocados, isto é, a variável explicada é especificada em níveis, e a variá-
vel explicativa, em logaritmos. Tem-se, então (ver figura 1.3), 
(1.17) )ln(21 wββz += )0( >w . 
Esta relação verifica a propriedade 
Capítulo 1 – Introdução 22 
 
 
(1.18) 2)ln( β=wd
zd . 
Como 
wwd
zd 2β= e wwwd
wd
wd
zd
wd
zd 2
)ln()ln(
β
== , 
também se conclui que 
wwd
zd
=2β . 
A partir de (1.18), vem 
w
z
w
z
w/w
z
w
z
wd
zd
∆
∆
≈⇔
∆
∆
=
∆
∆
≈
∆
∆
== %100%
100
)ln()ln(
2
2
ββ . 
ou seja, 2β é, aproximadamente, o quociente entre a variação absoluta de z e a varia-
ção relativa de w. Também se pode dizer que 100/2β é, aproximadamente, o quociente 
entre a variação absoluta de z e a variação percentual de w (variação absoluta de z quan-
do w varia de um ponto percentual). Assim, 
wz ∆≈∆ %100
2β . 
0 1 2
 
Fig. 1.3 – Função logarítmica. 
 
Por exemplo, supondo que 4.422 =β , o quadro seguinte mostra os desvios entre 
2β e wz ∆∆× %)100( [note-se que )}ln(){ln(2 wwwz −∆+=∆ β ]: 
 
w w∆ w∆% z∆ wz ∆∆× %)100( 2β Desvios
600 6 1 0.4219 42.1894 42.4 – 0.2106
600 60 10 4.0412 40.4115 42.4 – 1.9885
600 120 20 7.7304 38.6522 42.4 – 3.7478
600 180 30 11.1242 37.0808 42.4 – 5.3192
Capítulo 1 – Introdução 23 
 
 
 
Esta relação é utilizada quando pretende estudar-se o efeito da variação relativa 
de uma variável (por exemplo, a taxa de crescimento da oferta de moeda, m) sobre a va-
riação absoluta de outra variável (por exemplo, o nível do PIB): )ln(21 mpib ββ += . 
 
d) A relação inversa é dada pela função (ver figura 1.4), 
(1.19) 
w
ββz 121 += )0( ≠w . 
Como 
2
2
w
β
wd
zd
−= e 3
2
2
2 2
w
β
wd
zd
= , 
e supondo 0>w (que corresponde à situação mais habitual para as variáveis económi-
cas), verifica-se facilmente que: se 02 >β , a função é decrescente e convexa, com uma 
assíntota horizontal igual a 1β ; se 02 <β , a função é crescente e côncava, com uma 
assíntota horizontal igual a 1β . 
 
 
Fig. 1.4 – Função hiperbólica com 0>w e 02 >β . 
 
e) A relação polinomial, 
(1.20) ppwδwδwδz ++++= L
2
210δ , 
é uma relação linear (nos parâmetros) em que as variáveis jx são as sucessivas potên-
cias de w. Por exemplo, quando 2=p (relação quadrática na variável w), os efeitos 
marginais w sobre z são crescentes ou decrescentes conforme o sinal de 2δ . 
 Quando tw = , a variável z tem tendência (linear, quando 1=p ; quadrática, 
quando 2=p ; etc.). 
 
Capítulo 1 – Introdução 24 
 
 
f) A relação logística (ver figura 1.5) é intrinsecamente não linear, 
(1.21) 
}exp{1 wαβ
γz
−+
= , 
onde 0>γ , 0>β e 0>α são os parâmetros. 
O estudo desta função mostra que se trata de uma função crescente, convexa en-
tre ∞− e αβ /)ln( , côncava a partir deste ponto, e com uma assíntota horizontal igual a 
γ . 
 
Fig. 1.5 – Função logística )1( =β . 
 
1.6 - O valor esperado condicionado estrutural 
 
Embora algumas questões sobre a análise empírica dos modelos, e sobre a natu-
reza dos dados, sejam abordadas mais adiante (ver secções 1.7 e 1.8), é importante, des-
de já, chamar a atenção para duas questões. 
A primeira questão tem a ver com o modo como os dados podem ser obtidos 
ou gerados. Assim: 
a) Nas Ciências da Natureza (Física, Biologia, etc.), sobretudo em ambientes laborato-
riais, os dados resultam, muitas vezes, de uma situação controlada pelo investigador. 
Neste caso, os dados dizem-se experimentais. 
b) Em Economia (e, em geral, nas Ciências Sociais) os dados decorrem, quase sempre, 
de um fenómeno passivamente observado pelo investigador. Nesta situação, os dados 
são não experimentais. 
 
Esta distinção é crucial para a Econometria, porque põe a questão da natureza 
estocástica das variáveis do modelo, bem como das respectivas observações. 
Pode, então, estabelecer-se a premissa básica da Econometria: 
 
Capítulo 1 – Introdução 25 
 
 
Premissa básica da Econometria 
Devido à natureza não experimental dos dados, as variáveis explicadas e as variáveis 
explicativas do modelo – e as respectivas observações – são consideradas variáveis 
aleatórias. 
 
Esta premissa abrange o caso de as observações de algumas variáveis explicati-
vas serem determinísticas; estas observações são consideradas, então, variáveis aleató-
rias degeneradas. 
Porventura, é esta premissa básica que pode justificar que a Econometria tenha 
evoluído como uma disciplina científica autónoma (separada da estatística clássica, 
que teve a sua génese no tratamento e análise de dados predominantemente experimen-
tais). A Econometria impôs-se como uma disciplina própria a partir do momento em que 
se acumularam desenvolvimentos metodológicos que não existiam na estatística clássi-
ca. Por exemplo, embora o modelo de regressão linear (a apresentar nos capítulos se-
guintes) seja muito estudado na estatística clássica, ele tem a sua interpretação própria 
na Econometria; os econometristas desenvolveram novas técnicas e métodos para estu-
dar este modelo que têm em conta as suas aplicações (por exemplo, testar as previsõesdas teorias económicas) e as complexidades dos dados económicos. 
 A segunda questão diz respeito à flexibilidade relacional do modelo teórico 
que vai ser submetido à análise econométrica. 
Quando se considera a relação (1.1), )(whz = , está subentendido que os únicos 
factores explicativos de z são pwww ,,, 21 K . Contudo, é de esperar (sobretudo, quando 
se procura caracterizar fenómenos de natureza social ou económica), que existam mui-
tos outros factores explicativos de z que não estão explicitados (no exemplo 1.4, o loga-
ritmo dos salários dos trabalhadores não é explicado apenas pelos factores explicitados 
– educ, exper, empc, mulher, aptid –, mas também por muitos outros, como os referidos 
no mesmo exemplo). Deste modo, (1.1) não é operacional porque estabelece uma rela-
ção rígida entre as variáveis do modelo. 
A flexibilidade relacional pretendida pode obter-se introduzindo uma variável 
adicional, u, que abrange todos os factores que não foram considerados, mas que podem 
afectar o comportamento da variável explicada. Em especial, aqueles factores podem 
incluir variáveis não observáveis, variáveis omitidas observáveis e erros de medida. 
Se u for incorporado de forma aditiva, o modelo teórico passa a ser 
(1.22) uwhz += )( . 
A variável u não é observável, chama-se variável residual (erro ou termo per-
turbador), e desempenha um papel fundamental na relação (1.22), como vai ver-se nos 
capítulos subsequentes. Desta forma, a variável explicada, z, é decomposta em duas 
componentes aditivas: a componente sistemática ou sinal, )(wh ; a componente resi-
dual ou ruído, u. Como vai ver-se, esta especificação é muito útil para fazer um trata-
mento unificado das propriedades estatísticas de vários métodos econométricos. 
Do mesmo modo, quando a relação é linear pode escrever-se [ver (1.2)] 
Capítulo 1 – Introdução 26 
 
 
(1.23) uxuxβxβxβy kk +=++++= βL2211 . 
 Para aligeirar as notações é habitual fazer-se em Econometria a seguinte conven-
ção: 
 
Convenção 
Vai utilizar-se o mesmo símbolo para representar as variáveis aleatórias e os res-
pectivos valores concretamente observados. 
 
O modelo (1.22) é formado apenas por uma equação que representa uma relação 
de causalidade. Nestas condições, diz-se que (1.22) é uma equação estrutural, e os 
respectivos parâmetros, jα , chamam-se parâmetros estruturais. Muitas vezes, estes 
parâmetros são estimáveis exclusivamente apenas tendo por base a equação estrutural. 
Diz-se, então, que a equação estrutural é directamente estimável. Outras vezes, tal não 
acontece, sendo necessário combinar hipóteses adicionais sobre outras variáveis com 
manipulações algébricas para obter uma equação estimável. Neste caso, é de esperar 
que esta equação permita estimar alguns parâmetros estruturais (ou mesmo todos). Além 
disso, pode haver motivos para estimar equações não estruturais, que pode ser, 
nalguns casos, um passo preliminar para estimar uma equação estrutural. 
Muitas vezes, supõe-se que 
(1.24) )()|()( wwzEwh µ== , 
ou seja, a componente sistemática do modelo é o valor esperado de z condicionado por 
w. Daqui resulta que 0)|( =wuE , isto é, o valor esperado da componente residual con-
dicionado por w é nulo. Neste caso, tem-se que )()|( wzwzEzu µ−=−= , ou seja, a 
variável residual não é mais do que o desvio entre z e o seu valor esperado condicionado 
por w. 
 Quando se verifica (1.24), o valor esperado condicionado passa a desempenhar 
um papel primordial na análise econométrica, uma vez que )|( wzE coincide com a 
componente sistemática do modelo. De facto, uma parte substancial dos desenvolvimen-
tos metodológicos em Econometria tem a ver com métodos de estimação de valores es-
perados condicionados. Neste contexto, é fundamental apresentar a seguinte definição: 
 
Definição 1.1 – Valor esperado condicionado estrutural. 
Considere-se a relação (1.22). Se )()|( whwzE = , então a função ℜ→ℜ pw :)(µ dada 
por 
(1.25) )|()( wzEw =µ 
designa-se por valor esperado condicionado estrutural. 
 
A função )(wµ tem esta designação porque supõe-se que representa o compor-
tamento médio da variável z (normalmente associada a um certo tipo de agentes eco-
nómicos, ou outros), quando variam as componentes do vector w. 
Capítulo 1 – Introdução 27 
 
 
 Considere-se a relação na forma (1.22), admitindo que )(wh é o valor esperado 
condicionado estrutural: uwz += )(µ . Quando se pretende analisar o efeito parcial de 
jw sobre z, o conjunto dos factores fixos ou das variáveis de controlo é formado pelas 
outras variáveis explicativas. Para facilitar a exposição, vai utilizar-se o símbolo c para 
designar o vector-linha das variáveis de controlo; tem-se ),( cww j= . A análise ceteris 
paribus pretende medir a resposta média ou esperada – como é habitual em muitas si-
tuações –, estimando o valor esperado de z condicionado por w, )()( z|wEw =µ . 
 Todas as considerações feitas nas secções 1.4 e 1.5 – a propósito de efeitos par-
ciais, de elasticidades, de semi-elasticidades e de relações linearizáveis – são aplicáveis 
neste contexto, desde que se considere a função )(wµ . Por exemplo: 
1) Se jw e z são variáveis aleatórias quantitativas, é usual focar a atenção no efeito 
marginal médio de jw sobre z, dado por 
(1.26) 
jj w
z|wE
w
w
∆
∆
=
∆
∆ )()(µ . 
2) Se as variáveis aleatórias jw e z são contínuas, e a função )(wµ é derivável em rela-
ção a jw , pode obter-se o respectivo efeito marginal pontual médio resultante de uma 
variação infinitesimal de jw . Tem-se 
(1.27) 
jj w
z|wE
w
w
∂
∂
=
∂
∂ )()(µ . 
3) A elasticidade pontual média de z em relação a jw é dada por 
(1.28) )(
)(
)(
)(};)({EL z|wE
w
w
z|wE
w
w
w
www j
j
j
j
j ∂
∂
=
∂
∂
=∗ µ
µµ . 
4) Se 0)( >wµ e 0>w (como acontece muitas vezes), tem-se 
(1.29) )ln(
)}(ln{
)ln(
)}(ln{};)({EL
jj
j w
z|wE
w
www
∂
∂
=
∂
∂
=∗
µµ . 
5) Se jw é variável binária, os efeitos parciais médios são calculados comparando 
)(wµ para os dois valores possíveis de jw : 0=jw e 1=jw . 
 
 Quando o modelo tem a forma uwgz += )()ln( , onde g é uma função de w e 
0)|( =wuE , é natural definir a elasticidade pontual média de )ln(z em relação a jw da 
seguinte maneira: 
(1.30) )ln(
}){ln(
jw
w|zE
∂
∂ . 
 Como se pode comparar (1.30) com (1.29)? Como )}(ln{}){ln( z|wEw|zE ≠ , as 
duas elasticidades são diferentes. Contudo, se w e u são independentes, a igualdade é 
verificada. Com efeito, notando que }exp{)}(exp{})(exp{ uwguwgz =+= , vem 
)}(exp{)|}exp{)}((exp{)|( wgwuwgEwzE δ== , 
Capítulo 1 – Introdução 28 
 
 
onde })(exp{)|}(exp{ uEwuE ==δ , uma vez que }exp{u e w também são independen-
tes. Então, 
)(}|)({}){ln( wgwuwgEw|zE =+= e )()ln()}(ln{ wgz|wE += δ 
têm derivadas iguais em relação a )ln(w . Por exemplo, se 
uwwz +++= 22121 )ln()ln( βββ , 
e se u tem valor esperado nulo e é independente de ),( 21 ww , a elasticidade de z em rela-
ção a 1w é 2β , usando qualquer das duas definições. 
 Se 0)|( =wuE , mas w e u não são independentes, as duas definições dão resul-
tados diferentes, embora, em muitas situações, as diferenças não sejam significativas, 
desde que 0>z . Contudo, a primeira definição é mais geral porque pode utilizar-se em 
casos em que não existe )ln(z [mas existe )}(ln{ z|wE ]. 
 Escolher a lista adequada de variáveis de controlo nem sempre é fácil; a utiliza-
ção de listas diferentes pode conduzir a conclusões diferentes sobre a relação de causali-
dade entre z e jw . É por esta razão que estabelecer causalidades pode ser complicado, 
pois depende dos factores que se supõem constantes. 
 Admitindo que se conhece a lista de variáveis de controlo, e supondo que estas 
variáveis são observáveis, não é complicado, em geral, estimar o efeito parcial pretendi-
do. Infelizmente, em Economia (nas Ciências Sociais) muitas das variáveis de controlo 
não são observáveis. 
Podem, ainda, surgir outros problemas que interferem na estimação de relações 
de causalidade. Para exemplificar, vão referir-se duas situações: 
a) Errosde medida nas variáveis. Mesmo que a lista de variáveis de controlo esteja 
correctamente especificada, pode acontecer que não seja possível dispor de medidas 
suficientemente rigorosas de jw ou de z; 
b) Simultaneidade. As variáveis jw e z são simultaneamente determinadas, e as únicas 
observações disponíveis são valores de equilíbrio (como pode acontecer nos casos 
dos exemplos 1.7, 1.9 e 1.10). 
 
Em situações como estas, tem-se 0)|( ≠wuE ou )()( wwh µ≠ , isto é, a compo-
nente sistemática do modelo não é um valor esperado condicionado estrutural. No 
entanto, embora continue a existir )(wµ , o econometrista não está condições de obter 
dados para o estimar. O estudo de situações deste tipo vai ser feito em capítulos poste-
riores. 
 
Exemplo 1.15 – Considere-se as seguintes situações: 
a) Retome-se o exemplo 1.4, e suponha-se que procura detectar-se uma relação de cau-
salidade de educ sobre lsalar, em que as variáveis de controlo são exper, empc, mu-
lher e aptid. Embora aptid não seja observável, admita-se que 
uaptidmulherempcexpereduclsalar ++++++= 654321 ββββββ . 
Fazendo ),|(),( ceduclsalarEceduc =µ , com =c [ aptidmulherempcexper ], su-
põe-se que o comportamento médio do logaritmo do salário é dado por 
Capítulo 1 – Introdução 29 
 
 
aptidmulherempcexpereducceduc 654321),( ββββββµ +++++= , 
ou seja, a componente sistemática do modelo é o valor esperado condicionado estru-
tural. Tem-se 
educ
ceduc
educ
ceduclsalarE
∂
∂
=
∂
∂
=
),(),|(
2
µβ . 
Assim, 2β mede o efeito parcial de educ sobre o valor esperado do logaritmo do sa-
lário condicionado por educ e pelas variáveis de controlo. Este efeito não é estimá-
vel, uma vez que a variável de controlo aptid não é observável. 
A semi-elasticidade (pontual) média de salar em relação a educ é, então, 
),(
1),(
ceduceduc
ceduc
µ
µ
×
∂
∂ . 
É óbvio que esta semi-elasticidade também não é estimável. 
Desprezando a variável não observável, aptid, esta passa a estar incluída na variável 
residual, u. Como é de esperar que haja correlação entre aptid e educ, verifica-se 
que 0)( ≠× aptideducE . Então, 0),|( ≠ceducuE , onde o vector das variáveis de 
controlo é, agora, =c [ mulherempcexper ]. Neste caso, 
),|(),|( 54321 ceducuEmulherempcexpereducceduclsalarE +++++= βββββ , 
e a componente sistemática do modelo não é um valor esperado condicionado estru-
tural. 
b) Suponha-se que pretende estabelecer-se uma relação de causalidade de assid sobre 
nest (ver exemplo 1.5). Seja 
umistaeassidhnest += ),,( . 
Suponha-se que 
),(),(),|( cassidhcassidcassidnestE == µ , 
onde =c [ mistae ] é composto por variáveis observáveis. Embora já se saiba que 
estas variáveis são medidas gerais da capacidade e dos hábitos de estudo dos alunos, 
pode pôr-se a dúvida sobre a sua adequação para controlar a relação de causalidade, 
porque não entram em linha de conta com a aptidão específica e o interesse do aluno 
para estudar Estatística. A inclusão em c de uma variável deste tipo pode ser impor-
tante, embora não seja observável. 
O efeito parcial de assid sobre ),|( cassidnestE é medido por 
assid
cassid
assid
cassidnestE
∂
∂
=
∂
∂ ),(),|( µ . 
∇ 
 
Para terminar esta secção vão apresentar-se algumas propriedades gerais dos va-
lores esperados condicionados (médias, variâncias e covariâncias), envolvendo variá-
veis aleatórias e vectores aleatórios. 
 
Capítulo 1 – Introdução 30 
 
 
Propriedades dos valores esperados condicionados 
Seja a variável aleatória z, e os vectores aleatório x, w e v. Tem-se: 
a) Regra do valor esperado total: 
)}|({)( wzEEzE = . 
b) Regra do valor esperado iterado: 
}|)|({)|( wxzEEwzE = , 
onde w é função de x, )(xgw = . 
c) Caso especial da regra do valor esperado iterado: 
}|),|({)|( wvwzEEwzE = . 
d) Linearidade do valor esperado condicionado: Considerem-se as funções de w, )(wai 
),,1( mi K= e )(wb , e as variáveis aleatórias mzz ,,1 K . Então, 
)()|()()|()(}|)()()({ 1111 wbwzEwawzEwawwbzwazwaE mmmm +++=+++ LL , 
desde que +∞<|)(| izE , +∞<|))((| ii zwaE e +∞<|))((| wbE . 
e) Se )|( wzEzu −= , então 0=})({ uwhE , onde )(wh é uma função (vectorial) de w, 
desde que +∞<|))((| uwhE i [os )(whi são as componentes de )(wh ] e +∞<|)(| uE . 
Em particular, 0)( =uE e 0),( =uwCov j [os jw são as componentes de w]. 
f) Desigualdade de Jensen para valores esperados condicionados: se ℜ→ℜ:g é 
uma função convexa com domínio ℜ , e +∞<|)(| zE , então 
}|)({)}|({ wzgEwzEg ≤ . 
g) Considerem-se as funções de w, )(wa e )(wb . Então, 
)|(Var)}({}|)()({Var 2 wzwawwbzwa =+ . 
h) Tem-se: 
)}|({Var)}|(Var{)(Var wzEwzEz += . 
i) Tem-se: 
}|),|({Var}|),|(Var{)|(Var wvwzEwvwzEwz += . 
j) Se 1z e 2z são variáveis aleatórias, vem 
)}|(),|({Cov)}|,(Cov{),(Cov 212121 wzEwzEwzzEzz += . 
Considerando dois vectores aleatórios w e z quaisquer, vem: 
k) )}|({Cov)}|(Cov{)(Cov wzEwzEz += , onde: o símbolo )(Cov ⋅ representa a matriz 
das covariâncias de um vector aleatório; o símbolo )(⋅E refere-se ao valor esperado 
de uma matriz aleatória ou de um vector aleatório. 
 
Podem fazer-se os seguintes comentários a estas propriedades: 
− Em muitos casos, o cálculo directo de )(zE pode ser complicado. No entanto, se 
for conhecido (ou se for relativamente fácil de calcular) )()|( wwzE µ= , a proprie-
dade a) permite determinar )(zE , calculando o valor esperado de )(wµ . Deste mo-
Capítulo 1 – Introdução 31 
 
 
do, o problema difícil [o cálculo directo de )(zE ] pode ser resolvido mediante a re-
solução de dois problemas mais simples: o conhecimento ou a determinação da fun-
ção )(wµ ; o cálculo do respectivo valor esperado. 
Apresentam-se dois exemplos simples: 
1. Se awzE =)|( (constante) então .)( azE = Com efeito, 
aaEwzEEzE === )()}|({)( 
Contudo, azE =)( não implica awzE =)|( . 
2. Seja w é um vector aleatório discreto que assume os valores mccc ••• ,,, 21 K com 
probabilidades mppp ,,, 21 K , respectivamente. Então, 
)|()|()|()( 2211 mm cwzEpcwzEpcwzEpzE ••• =++=+== L , 
isto é, o valor esperado de z é a média ponderada dos )|( icwzE •= , onde os pesos 
são as respectivas probabilidades ip . 
− A propriedade b) é a versão mais geral que vai considerar-se da regra do valor espe-
rado iterado. Recordando que )(xgw = , a propriedade é dada por 
)}(|)|({)}(|{ xgxzEExgzE = . 
Se se fizer )|()(1 xzEx =µ e )|()(2 wzEw =µ , a propriedade b) estabelece que 
}|)({)( 12 wxEw µµ = . 
Assim, pode determinar-se )(2 wµ , calculando o valor esperado de )(1 xµ condiciona-
do por w. 
Há outra propriedade que parece semelhante à anterior, mas é muito mais simples 
de verificar. Trata-se de 
)|)}(|{()}(|{ xxgzEExgzE = , 
ou 
}|)({)(}|)|({)|( 22 xwEwxwzEEwzE µµ =⇔= , 
onde se trocaram as posições de w e x. Com efeito, como w é função de x, conhecer x 
implica conhecer w; como )|()(2 wzEw =µ , o valor esperado de )(2 wµ , dado x, é, 
obviamente, )(2 wµ . 
Estas duas propriedades podem resumir-se com a seguinte frase: “o conjunto de in-
formação menor é sempre dominante”. Dito de outro modo: “menos informação do-
mina mais informação”. Aqui, w representa menos informação do que x, uma vez 
que conhecer x implica conhecer w (mas não inversamente). 
− A propriedade c) é um caso especial da lei do valor esperado iterado. Neste caso, 
tem-se ),( vwx = [como x é o par ),( vw , obviamente w é função de x]. Fazendo 
),|(),(1 vwzEvw =µ [função de w e v] e )|()(2 wzEw =µ [função de w], tem-se 
}|),({)( 12 wvwEw µµ = , 
onde o valor esperado do segundo membro, )|( wE ⋅ , é calculado em relação a v. 
− Vai fazer-se uma interpretação muito interessante da propriedade c). Suponha-se 
que num determinado estudo econométrico se admite que as variáveis explicativas 
Capítulo 1 – Introdução 32 
 
 
importantes de z são w e v, o que significa que o interesse da análise incida sobre o 
valor esperado condicionado estrutural ),|(),(1 vwzEvw =µ , que é função de w e v. 
Se o vector v não é observável, não pode estimar-se ),(1 vwµ directamente. No entan-
to, se w e z são observáveispode estimar-se )|()(2 wzEw =µ , que é função apenas 
de w. 
Em geral, a obtenção de )|()(2 wzEw =µ à custa de ),|(),(1 vwzEvw =µ é muito 
complicada. Contudo, em muitas situações, a forma de ),(1 vwµ é suficientemente 
simples para que o problema tenha uma resolução fácil, desde que se introduzam al-
gumas hipóteses adicionais. Por exemplo, suponha-se que se começa com o modelo 
vwvwwvwwzEvww 1432211021211 ),,|(),,( βββββµ ++++== , 
onde v não é observável. As propriedades c) e d) permite estabelecer que 
.),|(),|(
),|(
},|),,|({),|(),(
211421322110
2114322110
212121212
wwvEwwwvEww
wwvwvwwE
wwvwwzEEwwzEww
βββββ
βββββ
µ
++++=
++++=
==
 
O cálculo de ),|( 21 wwvE é, em geral, uma tarefa muito complicada, uma vez que 
exige o conhecimento da distribuição de v condicionada por 1w e 2w . Contudo, ad-
mitindo a hipótese adicional, 
2211021 ),|( wwwwvE δδδ ++= , 
obtém-se 
214
2
132211021212 ),|(),( wwwwwwwzEww αααααµ ++++== , 
onde 








=
=
+=
++=
+=
.244
143
2322
041311
0300
δβα
δβα
δββα
δβδββα
δββα
 
− A regra do valor esperado iterado [propriedade b)] tem outra implicação importan-
te. Suponha-se que para alguma função vectorial, )(xg , e para alguma função (esca-
lar), h, tem-se )}({)|( xghxzE = . Então, 
)}({)|()}(|{ xghxzExgzE == . 
Com efeito, de acordo com a propriedade b), tem-se 
)|()}({)}(|)}({{)}(|)|({)}(|{ xzExghxgxghExgxzEExgzE ==== . 
Este resultado pode ser apresentado de outro modo. Com efeito, fazendo )(xgw = , 
vem )()|( whwzE = . 
Pode concluir-se que: se o valor esperado de z condicionado por x é uma função de x, 
é redundante condicioná-lo por )(xg ; basta condicioná-lo por x. 
Por exemplo, suponha-se que 
Capítulo 1 – Introdução 33 
 
 














=
21
2
2
2
1
21 ),(
xx
x
x
x
xxg , 
e que 214223221102121 )},({),|( xxxxxxxghxxzE βββββ ++++== . Então, 
214
2
232211021
2
221 ),,,|( xxxxxxxxxxzE βββββ ++++= . 
Assim, se o valor esperado condicionado por 1x e 2x é função destas variáveis, é re-
dundante condicioná-lo, também, por 22x e por 21xx . 
Este exemplo pode ser enquadrado numa formalização mais geral. Suponha-se que 
)|( xzE é linear relativamente aos parâmetros, 
)()()()|( 2211 xgxgxgxzE kkβββ +++= L , 
onde )(xg j ( kj ,,2,1 K= ) são funções de x. Fazendo )(xgw jj = , tem-se 
kkk wwwwwwzE βββ +++= LK 221121 ),,,|( . 
Assim, qualquer valor esperado condicionado linear relativamente aos parâmetros 
pode considerar-se, também, como linear relativamente a certas variáveis condicio-
nantes. Quando se considera explicitamente a variável residual u, pode escrever-se 
uwwwz kk ++++= βββ L2211 . 
Supondo que 0)|( =xuE , e como )(xgw jj = , pode concluir-se que u não está corre-
lacionado com qualquer jw (e com qualquer função dos jw ). 
− A propósito da regra do valor esperado iterado, pode enunciar-se uma outra pro-
priedade muito importante: 
− Sejam u, x e w três vectores aleatórios. Se ( xu, ) é independente do vector w, en-
tão ),|()|( wxuExuE = . 
− Para justificar a propriedade d), basta invocar que nos valores esperados condicio-
nados por w, as funções de w são consideradas constantes. 
− Para provar a propriedade e), começa-se por notar que 0)|( =wuE . Então, devido à 
propriedade a), tem-se 0=== )}|()({})|)({(})({ wuEwhEwuwhEEuwhE . Fica ao 
cuidado do leitor verificar que 0)( =uE e que 0),(Cov =uwj . 
− Pode referir-se dois casos particulares importantes da propriedade f): 
− )|()}|({ 22 wzEwzE ≤ ; 
− Se 0>z , então }|)ln({)}|(ln{ wzEwzE −≤− , ou )}|(ln{}|){ln( wzEwzE ≤ . 
− As propriedades h) e j) são passíveis de comentário semelhante ao da propriedade 
a): o problema do cálculo directo de )(Var z ou de ),(Cov 21 zz é decomposto em ou-
tros problemas mais simples. Por exemplo, para determinar ),(Cov 21 zz , primeiro de-
termina-se )|,(Cov)( 2112 wzzwσ = , )|()( 11 wzEw =µ e )|()( 22 wzEw =µ . Em segui-
da, calcula-se )}({ 12 wE σ e )}(),({Cov 21 ww µµ . 
− Como consequência da propriedade i), pode provar-se que 
Capítulo 1 – Introdução 34 
 
 
(1.31) )},|(Var{)}|(Var{ vwzEwzE ≥ . 
Com efeito, atendendo à propriedade i), }|),|(Var{)|(Var wvwzEwz ≥ , porquanto 
0}|),|({Var ≥wvwzE . Então, devido à propriedade a), tem-se 
)},|(Var{})|),|(Var{()}|(Var{ vwzEwvwzEEwzE =≥ . 
O resultado (1.31) pode ser interpretado da seguinte maneira: em média, a dispersão 
de z condicionada por certas variáveis não aumenta quando se acrescentam variáveis 
condicionantes. Em particular, quando )|(Var wz e ),|(Var vwz são constantes, vem 
),|(Var)}|(Var vwzwz ≥ . 
− A propriedade k), que generaliza as propriedades h) e j), vai ser analisada com de-
talhe. Considerando o vector aleatório 












=
mz
z
z
z
M
2
1
, 
a respectiva matriz das covariâncias é dada por 












=
)(Var),(Cov),(Cov
),(Cov)(Var),(Cov
),(Cov),(Cov)(Var
)Cov(
21
2212
1211
mmm
m
m
zzzzz
zzzzz
zzzzz
z
L
MMM
L
L
. 
Do mesmo modo, tem-se 












=
)|(Var)|,(Cov)|,(Cov
)|,(Cov)|(Var)|,(Cov
)|,(Cov)|,(Cov)|(Var
)|Cov(
21
2212
1211
wzwzzwzz
wzzwzwzz
wzzwzzwz
wz
mmm
m
m
L
MMM
L
L
, 
ou 
,
)()()(
)()()(
)()()(
)|Cov(
21
22221
11211












=
www
www
www
wz
mmmm
m
m
σσσ
σσσ
σσσ
L
MMM
L
L
 
onde )|,(Cov)( wzzw jiij =σ , para mji ,,2,1, K= . Então, 












=
)}({)}({)}({
)}({)}({)}({
)}({)}({)}({
)}|Cov({
21
22221
11211
wEwEwE
wEwEwE
wEwEwE
wzE
mmmm
m
m
σσσ
σσσ
σσσ
L
MMM
L
L
. 
Capítulo 1 – Introdução 35 
 
 
Também se tem 












=












=
)(
)(
)(
)|(
)|(
)|(
)|( 2
1
2
1
w
w
w
wzE
wzE
wzE
wzE
mm µ
µ
µ
MM
, 
onde )|()( wzEw ii =µ , para mi ,,2,1 K= . 
Então, 












=
)}({Var)}(),({Cov)}(),({Cov
)}(),({Cov)}({Var)}(),({Cov
)}(),({Cov)}(),({Cov)}({Var
)}|({Cov
21
2212
1211
wwwww
wwwww
wwwww
wzE
mmm
m
m
µµµµµ
µµµµµ
µµµµµ
L
MMM
L
L
. 
Por exemplo, verifica-se imediatamente que 
)}.(),({Cov)}({
)}|(),|({Cov)}|,(Cov{),(Cov
4224
424242
wwwE
wzEwzEwzzEzz
µµσ +=
+=
 
 
 Suponha-se que se pretende analisar os efeitos parciais das variáveis explicati-
vas observáveis (as componentes do vector w) sobre a variável explicada, z, consideran-
do explicitamente factores não observáveis. Seja, então, o valor esperado condicionado 
estrutural, ),|(),(1 vwzEvw =µ , onde v representa o vector dos factores não observáveis 
(designado por heterogeneidade não observada). Para simplificar a exposição vai su-
por-se que v é um escalar (a análise é imediatamente generalizável quando v é um vec-
tor). A análise vai ser feita para o caso em que jw (componente genérica de w) e z são 
variáveis aleatórias contínuas e )(1 ⋅µ é derivável pelo menos em relação a jw [fica ao 
cuidado do leitor proceder a análise semelhante quando estas variáveis são quantitativas, 
mas não necessariamente contínuas; quando jw é binária, os efeitos parciais são obtidos 
determinando as diferenças de )(1 ⋅µ para os dois valores de jw ]. 
Para o caso em estudo, e para uma variação infinitesimal de jw , o efeito parcial 
médio de jw sobre z é 
jj
j w
vw
w
vwzEvw
∂
∂
=
∂
∂
=
),(),|(),( 1µθ . 
 Como, em geral, este efeito parcial depende de v, não é possível estimá-lo. Con-
tudo, em certas condições, é possível determinar o valor esperado de ),( vwjθ , a partir 
da distribuição de v. Este valor esperado avaliado em 0w (valor assumido por w) é dado 
por 
)},({)( 00 vwEw jvj θδ = . 
 Supondo que v é contínua, com densidade vf , vem 
∫ℜ= dvvfvww vjj )(),()(
00 θδ . 
Capítulo 1 – Introdução 36 
 
 
 Note-se que: ),( vwjθ é o efeito parcial de jw sobre o comportamento médio de 
z; )( 0wjδ é a média ou o valor esperado deste efeito (em relação a v). 
É possível estimar )( 0wjδ a partir de um valor esperado condicionado que de-
penda apenas de variáveis condicionantes observáveis? Em geral, a resposta é não. Con-tudo, estabelecendo hipóteses sobre a relação entre v e w, é possível estimar )( 0wjδ . 
 As hipóteses são as seguintes: 
1) Independência condicional. Os factores explicativos v e w são condicionalmente 
independentes em relação a um vector q de variáveis observáveis, 
)|()|()|,( qwFqvFqwvF wv= , 
onde F é a função de distribuição conjunta, e vF e wF são as respectivas funções de 
distribuição marginais. Em muitos casos, o vector q pode ser considerado como um 
vector de variáveis proxy. Quando q é vazio, a independência condicional reduz-se 
à independência entre v e w. 
2) O vector q é redundante ou ignorável no valor esperado condicionado estrutural, 
ou seja, 
),|(),,|( vwzEqvwzE = . 
 
 Pode provar-se que 






∂
∂
=
j
qj w
qwzEEw ),|()(
0
0δ . 
 Com efeito, fazendo ),|(),(2 qwzEqw =µ , tem-se 
∫ℜ=== dvqvfvwqwvwEqwqvwzEEqw )|(),(},|),({},|),,|({),( 112 µµµ , 
onde: a primeira igualdade decorre a lei do valor esperado iterado; a segunda, resulta da 
hipótese da redundância; a terceira, é consequência da independência condicional. Deri-
vando parcialmente, e supondo que a derivada parcial é permutável com o integral, vem 
∫ℜ=∂
∂ dvqvfvww
qw
j
j
)|(),(),(2 θµ . 
 Para 0ww = , o segundo membro desta igualdade é }|),({ 0 qvwE jθ . Então, 
)(})|),({(),( 00
0
2 wqvwEEw
qwE jj
j
q δθ
µ
==





∂
∂ . 
 A utilidade deste resultado é a seguinte: a heterogeneidade não observada, v, de-
sapareceu totalmente, e ),|(),(2 qwzEqw =µ pode ser estimado porque ),,( qwz é ob-
servável. Dispondo desta estimativa quando 0ww = , ),(ˆ 02 qwµ , a estimação do efeito 
parcial médio para 0ww = consiste em determinar a média amostral de 
jw
qw
∂
∂ ),(ˆ 02µ . 
 
Capítulo 1 – Introdução 37 
 
 
1.7 - Análise empírica 
 
Proposto um modelo teórico para explicar as relações entre as variáveis em estu-
do, é indispensável avaliar a sua adequação à realidade, por meio da estimação dos pa-
râmetros desconhecidos, nomeadamente para explicar ou prever a evolução do fenó-
meno. Então, torna-se necessário dispor de um modelo econométrico que permita proce-
der a uma análise empírica das relações propostas [por exemplo, estimar as funções re-
feridas nos exemplos 1.1 a 1.10 e fazer a respectiva inferência estatística (construir in-
tervalos de confiança; efectuar testes de hipóteses) sobre os respectivos parâmetros]. 
Como é fácil de compreender, o modelo teórico não está preparado para a análi-
se empírica. Para dar operacionalidade ao modelo teórico é necessário ter em conta, 
entre outros, os seguintes aspectos: 
1) Especificar as relações funcionais do modelo (propor as respectivas expressões 
analíticas), e estabelecer, se for caso disso, restrições sobre os parâmetros. 
2) Estabelecer hipóteses sobre o comportamento probabilístico das variáveis, dan-
do especial atenção às variáveis não observáveis. 
3) Conhecer ou delimitar a população subjacente ao modelo. Como o modelo diz res-
peito à população em estudo, pode dizer-se que as variáveis consideradas represen-
tam a respectiva população. 
4) Adoptar um processo de amostragem (processo para obtenção dos dados), ou esta-
belecer hipóteses sobre o processo de amostragem subjacente ao fenómeno em estu-
do. 
5) Dispor de observações das variáveis, que são os dados ou a amostra do modelo. 
6) Utilizar os métodos adequados para obter estimativas dos parâmetros. 
7) Dispor de técnicas que permitam efectuar inferências estatísticas. 
 
O tópico 1) já foi abordado, ainda que de forma pouco sistemática. No entanto, 
nas secções 1.3 e 1.5 deu-se particular relevo a um tipo particular de especificação das 
relações funcionais: as relações lineares ou linearizáveis. Também nos exemplos tem 
havido, embora parcialmente, este tipo de preocupações [no exemplo 1.4 é proposta 
uma especificação para a relação explicativa de lsalar, mas o mesmo não acontece no 
exemplo 1.5 a propósito da relação que explica a variável nest; no exemplo 1.1 referiu-
se que o parâmetro 2α deveria obedecer à condição 10 2 <<α ; etc.]. 
 Como o tópico 2) tem a ver com as hipóteses que, em cada caso, se propõem so-
bre o comportamento probabilístico das variáveis, é óbvio que, em termos gerais, pouco 
há a dizer; o assunto vai ser sistematicamente retomado nos capítulos que se seguem. 
Os tópicos 3), 4) e 5) são comentados na próxima secção, a propósito da nature-
za dos dados. Esta abordagem preliminar deve servir para reforçar a ideia de que as 
questões relacionadas com a população e com a amostra devem ser uma preocupação 
permanente nos desenvolvimentos teóricos dos capítulos seguintes, e nas aplicações 
práticas. 
Os tópicos 6) e 7) dizem respeito aos métodos econométricos, e serão estudados 
aprofundadamente nos restantes capítulos. 
Capítulo 1 – Introdução 38 
 
 
Os comentários anteriores permitem ter uma noção aproximada das caracterís-
ticas que deve ter um modelo econométrico. Pode apresentar-se uma definição preli-
minar, uma vez que está esclarecido o alcance e o sentido da premissa básica da Econo-
metria (as variáveis observáveis, e as respectivas observações, são variáveis aleatórias). 
 
Definição 1.2 – Modelo econométrico 
Um modelo econométrico é uma família de distribuições conjuntas das observações das 
variáveis explicadas e das variáveis explicativas, a verificar um conjunto de restrições 
ou hipóteses. 
 
1.8 - Estruturas de dados 
 
As duas categorias básicas de dados são as seguintes: 
a) Dados seccionais. Os dados são seccionais quando as observações se referem a de-
terminadas entidades (unidades seccionais) em certa data (momento ou período de 
tempo). Por exemplo: as quantidades produzidas e as quantidades de factores de 
produção utilizados nas empresas de uma certa indústria num determinado ano; as 
despesas em bens de consumo e as receitas das famílias em determinado mês. 
Este tipo de dados pode ser apresentado num quadro onde a chave identificadora é 
o nome da unidade seccional (US). Como é habitual, tz ),,2,1( nt K= representa a 
observação genérica de z, e tjw ),,2,1;,,2,1( pjnt KK == é a observação genérica 
da variável explicativa jw (ver quadro 1.1). 
 
Quadro 1.1 
Dados seccionais 
N.º US z 1w 2w … pw 
1 1US 1z 11w 12w … pw1 
2 2US 2z 21w 22w … pw2 
M M M M M M 
n nUS nz 1nw 2nw … npw 
 
Nalguns casos, pode acontecer que os dados não correspondam exactamente, para 
todas as entidades observadas, à mesma data. No entanto, se os dados se referem a 
datas relativamente próximas, pode considerar-se que fazem parte do mesmo con-
junto de dados seccionais. Por exemplo, se há observações de despesas e de recei-
tas de certas famílias realizadas num certo mês, e há observações de outras famílias 
feitas no mês seguinte, é lícito, em muitos casos (depende dos meses!), supor que 
esta pequena variação temporal não afecta significativamente a análise empírica. 
Uma característica fundamental dos dados seccionais é que a ordem das observa-
ções é irrelevante (pouco importa qual é a primeira família observada ou a vigési-
ma quinta!). 
Capítulo 1 – Introdução 39 
 
 
Os dados seccionais são muito utilizados em Economia (e noutras Ciências Sociais), 
e, em especial, em certos ramos da microeconomia aplicada (economia do traba-
lho, finanças públicas locais, economia regional e urbana, demografia, economia da 
saúde, economia da educação, etc.). 
b) Dados temporais. Os dados são temporais ou cronológicos quando as observações 
se referem a uma mesma entidade, para várias datas (momentos ou períodos de tem-
po). Por exemplo: as quantidades produzidas por ano e as quantidades de factores de 
produção utilizados anualmente numa determinada indústria; o consumo e o rendi-
mento disponível trimestrais num determinado país. 
Quando os dados são numéricos, e se pretende descrever a evolução no tempo dos 
valores observados, os dados devem, como é evidente, conservar-se associados à da-
ta em que ocorreram, e apresentarem-se sob a forma de série temporal, dando ori-
gem
Carlos Silva Ribeiro - Econometria-Escolar Editora (2014)

UFRA

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Agora você pode testar o

Passei Direto grátis

Econometria

Continue navegando

Outros materiais