Baixe o app para aproveitar ainda mais
Prévia do material em texto
CAPÍTULO 1 INTRODUÇÃO 1.1 - De que trata a Econometria? Numa primeira aproximação, pode dizer-se que a Econometria procura fornecer uma base empírica para o estudo de relações entre variáveis económicas (ou, em ge- ral, de natureza social). Para atingir este objectivo, a Econometria dedica-se ao desen- volvimento de métodos estatísticos para estimar e testar tais relações. Em especial, no campo da Economia, estes métodos devem possibilitar o teste das teorias económicas que podem estar na base das relações preconizadas, e a avaliação e fundamentação de decisões de natureza empresarial ou de política económica. Estas considerações vão ser analisadas nas secções seguintes deste capítulo. Para motivar a análise que vai ser feita, apresentam-se alguns exemplos. Exemplo 1.1 – O consumo privado, considerado como agregado macroeconómico, é uma variável cujo comportamento tem sido amplamente estudado pela teoria macroeco- nómica. A especificação mais simples é a função consumo keynesiana, onde, para su- cessivos períodos de tempo, se procura explicar o consumo, cons, a partir do rendimento disponível, rdisp: )(rdisphcons = . É habitual propor a função h seguinte: rdispcons 21 αα += , onde 1α e 2α são parâmetros desconhecidos (em particular, 2α é a propensão marginal para consumir, a verificar 10 2 <<α ). Esta função é razoavelmente adequada para anali- sar a evolução do consumo privado? Se a resposta for afirmativa, é desejável conhecer uma boa estimativa da propensão marginal a consumir. ∇ Exemplo 1.2 – Para as unidades produtivas que se dedicam ao fabrico de um bem é, muitas vezes, possível estabelecer, em certas condições, e para um determinado período de tempo, uma relação funcional h entre a produção, Q, do bem, e determinada combi- nação de factores produtivos (por exemplo: capital, K, e trabalho, L): ),( LKhQ = . Esta relação funcional chama-se função de produção. O estudo deste tipo de funções faz parte de um capítulo muito importante da teoria microeconómica: a teoria da produção. Uma especificação muito utilizada é a função Cobb-Douglas, Capítulo 1 – Introdução 2 32 1 ααα LKQ = , onde 1α , 2α e 3α são parâmetros positivos ( 2α e 3α representam, neste caso, as elasti- cidades pontuais da quantidade produzida relativamente ao capital e ao trabalho, respec- tivamente; ver secção 1.4). A análise estatística destas elasticidades (estimação pontual e por intervalos, teste de hipóteses, etc.) é uma preocupação empírica muito importante. Outra especificação corrente, na teoria da produção, é a função de produção CES (elasticidade de substituição constante), ρ γ ρρ δδβ − −− +−= })1{( KLQ , com parâmetros 0>β , 0>γ , 10 << δ e ρ . ∇ Exemplo 1.3 – Quando pretende explicar-se o comportamento, ao longo de vários pe- ríodos de tempo, das importações portuguesas, a nível agregado, em função de um indi- cador de preços relativos e de um indicador do nível de actividade, pode estabelecer-se a relação funcional h, )( pibprm,himport = , onde: import designa as importações portuguesas a preços constantes; prm é o rácio en- tre o índice de preços implícito nas importações e o índice de preços implícito no PIB; pib é o produto interno bruto português a preços constantes. Uma especificação possível da função h é a seguinte: 32 1 αα pibprmαimport = )0( 1 >α . Estabelecida esta relação teórica entre as três variáveis, põe-se a questão de esti- mar os respectivos parâmetros (nomeadamente as elasticidades pontuais), e de proceder a outras análises estatísticas. ∇ Exemplo 1.4 – Considere-se as variáveis educ (número de anos de escolaridade de um trabalhador) e salar (salário mensal médio num determinado ano do mesmo trabalha- dor), com o objectivo de saber se educ influencia salar. O efeito da escolaridade sobre o salário chama-se habitualmente retorno da educação. É consenso na economia do trabalho que exper (número de anos de experiência profissional do trabalhador), empc (número de anos de trabalho no emprego corrente), mulher (variável binária que assume o valor 1 quando se trata de uma mulher, e o valor 0 quando é um homem; a discriminação salarial com base no género do trabalhador con- tinua a ser realidade em muitos sectores de actividade) e aptid (aptidão ou capacidade inata da pessoa; variável não observável) são variáveis que também podem influenciar o salário. Tem-se, então, ),,,,( aptidmulherempcexpereduchsalar = . Capítulo 1 – Introdução 3 Evidentemente, outros factores – como o número de anos de escolaridade da mãe, do pai e do cônjuge do trabalhador, e outros antecedentes familiares, o número de filhos, o estado civil, a localização da habitação, a região onde trabalha, a origem social ou étnica, a nacionalidade, etc. – poderiam ser acrescentados à relação funcional; facil- mente se compreende que não é candidato a figurar em h o número de golos que o clube de futebol da preferência do trabalhador faz em média por mês. Desprezando a variável aptid, podia propor-se a seguinte especificação: }exp{ 54321 mulherempcexpereducsalar ααααα ++++= , ou ainda, mulherempcexpereduclsalar 54321 ααααα ++++= , onde )ln(salarlsalar = . Com facilidade se interpreta o significado dos parâmetros (esta questão vai ser aprofundada nas próximas secções). Por exemplo: 2α (multiplicado por 100) mede, aproximadamente, a variação percentual do salário quando um trabalhador tem mais um ano de escolaridade (em estudos deste tipo é particularmente útil conhecer uma estimativa deste parâmetro, que representa o retorno da educação); 5α (multiplica- do por 100) mede, aproximadamente, a diferença percentual de salário entre uma mu- lher e um homem. ∇ Exemplo 1.5 – Procura saber-se se a assiduidade às aulas de um aluno de Estatística du- rante um semestre (assid) é factor explicativo da nota no exame final da unidade curri- cular (nest). Para isso, considera-se que ),,( mistaeassidhnest = , onde tae (nota obtida num teste geral de aptidão escolar) e mis (média geral das notas já obtidas até ao início do semestre) são medidas gerais que reflectem a capacidade e os hábitos de estudo dos alunos. Estas variáveis (conjuntamente com assid) são adequadas para explicar nest? Talvez não, porque podem não reflectir a aptidão e o interesse do aluno pela Estatística. Sendo assim, seria importante a inclusão de uma variável que contemplasse estes aspectos, mas teria o inconveniente de não ser observável. ∇ Exemplo 1.6 – Suponha-se que pretende estimar-se o número diário de viagens de au- tomóvel (viag) entre os concelhos da Área Metropolitana de Lisboa (AML) situados a norte do Tejo, por motivo de deslocação para o trabalho, com vista a tomar decisões so- bre a construção de novas vias rápidas ou alargamento das existentes. Com o objectivo de melhor entender estes movimentos, decidiu-se propor uma relação funcional, onde os factores explicativos de viag são a população activa no concelho de origem (pop), o nú- mero de empresas no concelho de destino (nemp) como sucedâneo do emprego, e a dis- tância entre as sedes dos concelhos de origem e destino (dist). Assim, ),,( distnemppophviag = . Capítulo 1 – Introdução 4 Podia propor-se a seguinte especificação de h: 432 1 ααα distnemppopαviag = )0( 1 >α . ∇ Os exemplos seguintes consideram modelos económicos com duas ou mais rela- ções. Exemplo 1.7 – Sabe-se da teoria económica que, em muitos casos, o factor principal que explica a procura mensal de um certo bem, dq , é o respectivo preço, p. Tem-se, en- tão, a seguinte função procura: )( phq dd = . Como se sabe, a quantidade e o preço de equilíbrio do mercado (respectivamen- te, ∗q e ∗p ) não podem ser determinados apenas com aquela função. É indispensável considerar também a função oferta, )( phq ss = , e a relação de equilíbrio, sd qq = , o que permite determinar simultaneamente ∗q e ∗p . Obtém-se, assim, um modelo de procu- ra e oferta num mercado em equilíbrio: = = = ).mercado de equilíbrio( )oferta função()( procura) (função)( sd ss dd qq phq phq A especificação mais habitual é a seguinte: = += += ).mercado de equilíbrio( )oferta função( procura) (função 10 10 sd s d qq pq pq ββ αα Devido à simultaneidade atrás referida, o modelo apresentado tem o grave in- conveniente de nem sequer permitir estimar a função procura (ou a função oferta), por- que são observáveis apenas a quantidade e o preço de equilíbrio: muitas funções procura (oferta) são compatíveis com o par ( ∗q , ∗p ). Uma especificação mais adequada seria, por exemplo, = ++= ++= ).mercado de equilíbrio( )oferta função( procura) (função 210 210 sd s d qq zpq rpq βββ ααα onde r é o rendimento médio dos consumidores do bem, e z é um indicador da dimensão média das empresas que vendem o bem. Este assunto será retomado no capítulo 4. ∇ Exemplo 1.8 – Sabe-se da teoria macroeconómica que a função consumo introduzida no exemplo 1.1 não deve ser considerada isoladamente, mas integrada num sistema de equações que traduza as relações entre os agregados macroeconómicos. Por exemplo, podia considerar-se o seguinte modelo macroeconómico simples: Capítulo 1 – Introdução 5 += += ),PNB do identidade( consumo) (função21 investconspnb pnbcons ββ onde cons é o consumo agregado, pnb é o produto nacional bruto (PNB) ou rendimento nacional, e invest é o investimento agregado. O parâmetro 2β desempenha um papel fundamental neste modelo, já que representa a propensão marginal a consumir a partir do rendimento ( 10 2 << β ). Outro caso típico é o modelo keynesiano simples da procura agregada, onde se tem, por exemplo, ++= += +−+= , )( 21 221 dpinvestconspnb tjuroinvest tjuroimpdpnbcons γγ βββ onde impd é a receita dos impostos directos, tjuro é a taxa de juro, e dp é a despesa púb- lica. Podia, também, propor-se o seguinte modelo: ++= −++= ++−+= − − , )( )( 1321 14321 dpinvestconspnb pnbpnbtjuroinvest constjuroimpdpnbcons γγγ ββββ onde 1−cons é consumo do período anterior, e 1−pnb é o PNB do período anterior. O estudo empírico destes pequenos protótipos de funcionamento de uma econo- mia pode ser particularmente útil para esclarecer certos aspectos das complexas relações entre as grandezas macroeconómicas. ∇ Exemplo 1.9 – Suponha-se que pretende determinar-se a influência do número de agen- tes de polícia (pol) existente em cada cidade sobre a respectiva taxa de criminalidade (crime), admitindo que outro factor explicativo de crime é o rendimento percapita dos habitantes da cidade (rpc). Assim, tem-se ),(1 rpcpolhcrime = . Mesmo admitindo que esta relação traduz adequadamente o comportamento dos criminosos, o modelo a considerar não pode ser composto apenas por 1h , pois é admis- sível que crime e pol sejam interdependentes, e, portanto, determinados simultaneamen- te. Assim, teria de considerar-se uma segunda relação que reflectisse o comportamento das autoridades camarárias relativamente a pol. Por exemplo, poderia supor-se que ),(2 imunicipcrimehpol = , onde imunicip é a receita de impostos municipais. Podia, então, especificar-se o seguinte modelo: ++= ++= .321 321 imunicipγcrimeγγpol rpcβpolββcrime Capítulo 1 – Introdução 6 A análise empírica da interdependência entre as variáveis crime e pol pode ser um objectivo importante do estudo econométrico. ∇ Exemplo 1.10 – Os países de economia mais aberta têm menores taxas de inflação? Para responder a esta pergunta, considerou-se que ),(1 rpcgahinf = , onde inf é a taxa de inflação, ga é o grau de abertura da economia medido pelo quo- ciente entre as importações e o PIB, e rpc é o rendimento per capita. Como é admissível supor que ga também é influenciado por inf (há interdepen- dência entre as duas variáveis), deve considerar-se uma segunda relação funcional, que, por exemplo, poderia ser ),,(1 aprpcfinhga = , onde ap é a área do país em quilómetros quadrados. Fazendo +++= ++= ,)ln()ln( )ln( 4321 321 aprpcfinga rpcgafin γγγγ βββ é de admitir, por exemplo, que 02 <β (quanto maior é o grau de abertura da economia, menor a taxa de inflação), e 04 <γ (quanto menor é o país, maior é o grau de abertura). A interdependência sugerida entre inf e ga deve ser submetida a uma análise em- pírica adequada. ∇ Ragnar Frisch (economista norueguês, prémio Nobel da Economia em 1969 – conjuntamente com o economista holandês Jan Tinbergen –, e um dos fundadores da Econometric Society), apresentou em 1936 (“Note on the term `Econometrics´”, Eco- nometrica, vol. 4) a primeira definição consistente de Econometria. Trata-se de uma definição ampla (“ideal”), enunciada nos seguintes termos: “a Econometria é uma disci- plina que visa estudar a aplicação da Matemática e dos métodos estatísticos à análise dos dados económicos”. O mesmo economista já afirmava, em 1933, o seguinte: “A ex- periência tem mostrado que cada um destes três pontos de vista, o da Estatística, o da Teoria Económica e o da Matemática, é condição necessária, mas não em si suficiente, para uma verdadeira compreensão das relações quantitativas na vida económica moder- na. É a unificação dos três pontos de vista que é fecunda e constitui a Econometria” (Econometrica, Editorial, 1933). Outra definição célebre deve-se a Samuelson (prémio Nobel em 1970), Koop- mans (prémio Nobel em 1975) e Stone (prémio Nobel em 1984): “A Econometria pode ser definida como a análise quantitativa dos fenómenos económicos, baseada na teoria e na observação, e utilizando os métodos de inferência apropriados”. Muitos outros autores têm apresentado definições de Econometria. Indicam-se mais três citações de econometristas proeminentes: Capítulo 1 – Introdução 7 − “A Econometria pode ser definida como a ciência social em que as ferramentas da teoria económica, da matemática e da inferência estatística são utilizadas na análise de fenómenos económicos” (Goldberger). − “A Econometria preocupa-se com a determinação empírica de leis económicas” (Theil). − “A arte do econometrista consiste em procurar o conjunto de hipóteses que são sufi- cientemente específicas e suficientemente realistas para permitir tirar o melhor parti- do dos dados disponíveis” (Malinvaud). Embora se esteja ainda relativamente distante desta situação ideal, a Econome- tria constitui, actualmente, uma área científica autónoma, que muito tem contribuído para o avanço da ciência económica. Este avanço está bem patente nos contributos de alguns econometristas que foram prémios Nobel recentemente. No ano 2000, o prémio foi atribuído a dois microeconometristas: James Heckman (University of Chicago, USA) [“for his development of theory and methods for analyzing selective samples”]; Daniel Mc Fadden (University of California, at Berkeley, USA) [“for his development of theory and methods for analyzing discrete choice”]. Em 2003, os galardoados foram dois macroeconometristas: Clive Granger (University of California, at San Diego, USA) [“for methods of analyzing economic time series with common trends (cointegra- tion)”]; Robert Engle (University of New York, USA) [“for methods of analyzing eco- nomic time series time-varying volatility (ARCH)”]. A econometria não é, longe disso, “um conjunto de métodos para medir a altura dos economistas”. Em termos muito gerais, pode afirmar-se que o progresso da Econometria é re- levante nos seguintes aspectos: a) nas técnicas de estimação e de análise estatística dos modelos (nos métodos econométricos); b) nas aplicações; c) e mais recentemente, nas tentativas de sistematizar os seus fundamentos metodológicos. 1.2 - Modelo teórico Quando se estuda, com base em dados, um determinado fenómeno de natureza social (em particular, de índole económica), com o objectivo de descrever, explicar ou prever o seu comportamento, procura-seconceber, ainda que de forma aproximada ou simplificada, o mecanismo subjacente ao fenómeno observável. Este mecanismo é desi- gnado habitualmente por modelo teórico. O modelo é assim adjectivado para salientar que deve ser baseado numa determinada teoria (construção conceptual fornecedora de uma descrição idealizada do fenómeno em estudo). No entanto, a teoria subjacente ao modelo não é necessariamente uma conceptualização matemática formal (como mui- tas vezes acontece em macroeconomia e em microeconomia), mas pode consistir numa análise menos formal – em muitos casos apoiada no bom senso e na intuição – com vista a estabelecer meras relações entre variáveis. Deve enfatizar-se ainda que o mode- lo a adoptar é objecto de uma teoria, mas também deve ser encarado como a fonte gera- dora dos dados observáveis. Capítulo 1 – Introdução 8 Exemplo 1.11 – Retome-se os exemplos anteriores: a) No exemplo 1.4 sugeriu-se, tendo por base considerações da área da economia do trabalho, que o modelo teórico a adoptar poderia ser mulherempcexpereduclsalar 54321 ααααα ++++= . b) Na sequência do exemplo 1.8, e apoiados na teoria macroeconómica, podia ser ra- zoável adoptar o modelo teórico ++= −++= ++−+= − − , )( )( 1321 14321 dpinvestconspnb pnbpnbtjuroinvest constjuroimpdpnbcons γγγ ββββ para estudar as relações entre os agregados económicos referidos. c) O exemplo 1.9 sugere que o modelo teórico para estudar as interdependências entre a taxa de criminalidade e o efectivo policial numa cidade poderia ser ++= ++= .321 321 imunicipγcrimeγγpol rpcβpolββcrime d) Fica ao cuidado do leitor indicar modelos teóricos para estudar os fenómenos referi- dos nos exemplos 1.1, 1.2, 1.3, 1.5, 1.6, 1.7 e 1.10. ∇ Cada relação do modelo teórico proposto – exceptuando possíveis relações de equilíbrio ou identidades (ver exemplos 1.7 e 1.8) – procura estabelecer o comporta- mento de uma variável, z, em função de outras variáveis, pwww ,,, 21 K . Na relação funcional considerada, diz-se que z é a variável explicada (a variável dependente ou a variável resposta), e pwww ,,, 21 K são as variáveis explicativas (as variáveis indepen- dentes ou as variáveis controlo). Pode dizer-se que “z é explicado como função de pwww ,,, 21 K ”; “os factores explicativos de z são pwww ,,, 21 K ”. Assim, tem-se a função h de p variáveis (1.1) ),,,( 21 pwwwhz K= . Pressupõe-se que (1.1) envolve um conjunto finito de parâmetros desconheci- dos, kααα ,,, 21 K . Diz-se, então, que se tem uma relação paramétrica. O modelo teó- rico pode ser composto por várias relações de tipo (1.1). As variáveis que fazem parte de um modelo teórico podem ser consideradas atri- butos de uma determinada população em estudo. Deste modo, o modelo teórico compor- ta uma ou mais relações que visa explicar o comportamento de certos atributos da popu- lação. Por exemplo, a relação (1.1) procura estudar o comportamento do atributo z das entidades de uma determinada população em função dos atributos pwww ,,, 21 K das mesmas entidades. Assim, como para qualquer modelo teórico está subjacente uma po- pulação, também se diz que este modelo é um modelo da população. A relação (1.1) também pode ser apresentada na forma seguinte: )(whz = , Capítulo 1 – Introdução 9 onde, por convenção, w é o vector-linha das variáveis explicativas, e α é o vector-colu- na dos parâmetros desconhecidos. Assim, =w [ pwww L21 ] e = kα α α α M 2 1 . Exemplo 1.12 – Considerem-se, novamente, os exemplos 1.1, 1.2, 1.4 e 1.5, e as últi- mas especificações propostas (os outros exemplos da secção 1.1 ficam ao cuidado do leitor). Tem-se: a) Exemplo 1.1: consz = e rdispw = . b) Exemplo 1.2: Qz = , Kw =1 e Lw =2 . c) Exemplo 1.4: lsalarz = , educw =1 , experw =2 , empcw =3 e mulherw =4 . d) Exemplo 1.5: nestz = , assidw =1 , taew =2 e misw =3 . ∇ 1.3 - Relações lineares Um caso particular muito importante das relações de tipo (1.1) é aquele que é caracterizado pela linearidade relativamente aos parâmetros, isto é, as relações assu- mem a forma (1.2) kk xβxβxβy +++= L2211 , onde y é a variável explicada ou dependente (ou uma função desta variável), kx,xx ,, 21 K são as variáveis explicativas ou independentes (ou determinadas funções destas variá- veis), e kβββ ,,, 21 K são os parâmetros. Muitas vezes, a variável 1x é identicamente igual a 1. Trata-se de uma conven- ção que permite considerar, na relação linear, um termo independente ou constante. Na maioria das situações a relação (1.2) tem termo independente, 1β , uma vez que ape- nas em casos muito especiais se supõe que a nulidade das variáveis explicativas implica a nulidade de y. A relação (1.2), também, pode apresentar-se da seguinte maneira: βxy = , onde =x [ kxxx L21 ] e = kβ β β β M 2 1 . Em muitas situações, a relação (1.1) não é linear (relativamente aos parâmetros), mas mediante uma transformação da variável z, )(zg , consegue obter-se uma relação da forma (1.2), ou seja, linearizou-se (1.1). Uma relação linear ou linearizável diz-se intrinsecamente linear (relativamente aos parâmetros). Capítulo 1 – Introdução 10 Exemplo 1.13 – Retome-se alguns dos dez exemplos da secção 1.1: a) A função de consumo keynesiana referida no exemplo 1.1, rdispcons 21 ββ += , é li- near relativamente aos parâmetros. Tem-se: consy = , 11 =x , rdispx =2 , 11 αβ = e 22 αβ = . b) A função de produção Cobb-Douglas (exemplo 1.2), 321 ααα LKQ = )0( 1 >α , é li- nearizável. Com efeito, logaritmizando a expressão anterior, obtém-se uma função, linear nos parâmetros, equivalente à relação anterior, )ln()ln()ln( 321 LKQ βββ ++= , onde: )ln(Qy = , 11 =x , )ln(2 Kx = , )ln(3 Lx = , )ln( 11 αβ = , 22 αβ = e 33 αβ = . Verifica-se, assim, que a função de produção Cobb-Douglas, embora não linear nos parâmetros, é intrinsecamente linear, pois a transformação logarítmica permite con- vertê-la numa função linear. c) A função de produção CES (ver exemplo 1.2) não é intrinsecamente linear nos parâ- metros, pois não existe qualquer transformação de Q que permita obter uma relação linear. d) Considere-se a relação 321 αα pibprmαimport = )0( 1 >α do exemplo 1.3. Logaritmi- zando esta expressão, obtém-se )ln()ln()ln( 321 pibprmimport βββ ++= , em que: )ln(importy = , 11 =x , )ln(2 prmx = , )ln(3 pibx = , )ln( 11 αβ = , 22 αβ = e 33 αβ = . e) No exemplo 1.4 a relação }exp{ 54321 mulherempcexpereducsalar ααααα ++++= não é linear nos parâmetros. No entanto, facilmente se passa a mulherempcexpereduclsalar 54321 βββββ ++++= , onde: lsalary = , 11 =x , educx =2 , experx =3 , empcx =4 , mulherx =5 , 11 αβ = , 22 αβ = , 33 αβ = , 44 αβ = e 55 αβ = . f) Se, no exemplo 1.5, a especificação de ),,( mistaeassidhnest = for mistaeassidnest 4321 ββββ +++= , obtém-se uma relação linear relativamente aos parâmetros, onde nesty = , 11 =x , assidx =2 , taex =3 e misx =4 . ∇ É particularmente importante não confundir linearidade relativa aos parâme- tros com linearidade relativa às variáveis. Por exemplo, uma relação linear nos parâ- metros, mas não linear nas variáveis, é dada por 2321 wαwααz ++= . Contudo, a relação 3 2 2221 wwz ααα ++= é linear nas variáveis, mas não é linear (nem linearizável) nos pa- râmetros. A função de produção Cobb-Douglas referida no exemplo 1.2 é intrinseca- mente linear nos parâmetros, mas não é linear relativamente às variáveis. A relação Capítulo 1 – Introdução 11 w z + += 2α α 11 , não é, nem linear nas variáveis, nem (intrinsecamente) linear nos parâmetros. Como vai ver-se, para a estimação dos parâmetros de uma relação (intrinseca- mente) linear, a linearidade relativamente às variáveis tem pouca importância. A expres- são “a relação é linear” significa que a relação é linear ou linearizável relativamente aos parâmetros. No entanto, a linearidade, ou não, relativamenteàs variáveis desem- penha um papel decisivo para interpretar os parâmetros (ver secção seguinte). 1.4 - Efeitos parciais, elasticidades e semi-elasticidades Esta secção tem por objectivo apresentar alguns conceitos de grande importância para a interpretação dos parâmetros – muito particularmente no quadro da Economia –, o que vai permitir dar conteúdo à última frase da secção anterior (“a linearidade, ou não, relativamente às variáveis desempenha um papel decisivo para interpretar os parâme- tros”). O objectivo de muitos estudos empíricos em Economia (e nas Ciências Sociais, em geral) é determinar relações de causalidade entre duas variáveis. Trata-se de saber se a variação de uma variável implica ou causa uma variação noutra variável. Neste contexto, é crucial a noção de ceteris paribus [“supondo todos os outros factores (rele- vantes) fixos”]. Exemplo 1.14 – Considere-se as seguintes perguntas: − Uma variação do rendimento disponível dá lugar a uma variação no consumo (ver exemplo 1.1)? − Uma variação da quantidade do factor trabalho altera a quantidade produzida (ver exemplo 1.2)? − Uma alteração dos preços relativos (ver a variável prm referida no exemplo 1.3) causa uma variação nas importações? − Possuir mais um ano de escolaridade aumenta o salário mensal de um trabalhador (ver exemplo 1.4)? − O aumento da taxa de frequência das aulas de Estatística provoca um aumento das notas dos alunos (ver exemplo 1.5)? − Como variam entre si a procura (oferta) e o preço (ver exemplo 1.7)? − O aumento do número de agentes policiais faz diminuir a taxa de criminalidade (ver exemplo 1.9)? Ou, pelo contrário, a subida da taxa de criminalidade influencia o au- mento do número de polícias? − Um acréscimo no grau de abertura de economia de um país implica a diminuição da taxa de inflação (ver exemplo 1.10)? Ou, pelo contrário, é a diminuição desta taxa que provoca um aumento do grau de abertura? ∇ Capítulo 1 – Introdução 12 Efeitos parciais Dado o modelo ),,,( 1 pj wwwhz KK= , a análise ceteris paribus da relação de causalidade entre cada variável explicativa, jw , e z pretende medir as respostas de z às alterações de jw , supondo que os factores fixos (também designados por variáveis de controlo) são as outras variáveis explicativas. Como se admite que estas variáveis estão controladas (a necessidade de as controlar resulta de haver razões para concluir que jw está relacionada com outros factores que também influenciam z), a análise visa medir os efeitos parciais de jw sobre z. Naturalmente, estes efeitos dependem, em geral, dos valores assumidos por todas as variáveis explicativas e dos valores dos parâmetros. Suponha-se que as variáveis z e jw são quantitativas (contínuas ou discretas). Quando o valor de jw passa para jj ww ∆+ , o valor da variável z altera-se para ),,,,( 1 pjj wwwwhzz KK ∆+=∆+ . As variações absolutas das duas variáveis são, respectivamente, jw∆ e z∆ (po- dem calcular-se estas variações porque as variáveis são quantitativas). Nestas condições, o efeito parcial de jw sobre z é dado por (1.3) jw z ∆ ∆ . Como este efeito mede, ceteris paribus, a variação (absoluta) de z quando jw varia de uma unidade, é designado por efeito marginal (parcial), que pode depender das variáveis explicativas, pwww ,,, 21 K , e dos parâmetros. Quando, em particular, as variáveis z e jw são contínuas, e a função h é deri- vável (pelo menos em relação a jw ), o efeito marginal de jw sobre z pode ser determi- nado para uma variação infinitesimal de jw . Neste caso, tem-se o efeito marginal pon- tual, que é dado pela respectiva derivada parcial (1.4) jwj w z w z j ∆ ∆ = ∂ ∂ →∆ 0 lim . Para 0≈∆ jw , tem-se jj w z w z ∆ ∆ ≈ ∂ ∂ . Considerem-se os seguintes exemplos: 1) Seja a relação linear nas variáveis, 33221 wαwααz ++= , onde z, 2w e 3w são variá- veis contínuas. O efeito marginal (parcial) de 2w sobre z é medido pelo parâmetro 2α (constante), isto é, 2 22 α= ∆ ∆ = ∂ ∂ w z w z . Neste caso, 2α é igual à variação de z quando 2w varia de uma unidade. Capítulo 1 – Introdução 13 2) Seja 2321 wαwααz ++= , relação quadrática entre z e w (variáveis contínuas). O efeito marginal pontual de w sobre z (para uma variação infinitesimal de w) já não é medido por 2α , mas por wααwd zd 32 2+= . Como este efeito depende linearmente de w, o parâmetro 3α tem uma interpretação interessante: o seu sinal permite saber se o efeito marginal de w sobre z é crescente ( 03 >α ) ou decrescente ( 03 <α ), uma vez que 32 2 2α wd zd = . O valor de w que anula a primeira derivada (ponto de estacionaridade) é 3 2 2α αw −=∗ . Este valor é maximizante ou minimizante da função conforme o sinal da segunda de- rivada em ∗w . Por exemplo, no caso de maximizante, a função é côncava, sendo crescente à esquerda de ∗w , e decrescente à sua direita. Note-se que wd zdwwααw z ≠∆++= ∆ ∆ 332 2 α e w z wd zd w ∆ ∆ = →∆ 0 lim . 3) Suponha-se que a relação (não linear) entre z, 2w e 3w (variáveis contínuas) é dada por 32433221 wwαwαwααz +++= , onde existe um termo de interacção entre duas va- riáveis explicativas. Neste caso, o efeito marginal de 2w sobre z, ceteris paribus, é medido por 342 22 ww z w z αα += ∆ ∆ = ∂ ∂ , que depende do valor de 3w (obtém-se um efeito marginal para cada valor fixado pa- ra 3w ). 4) Seja a relação linear nas variáveis, 33221 wαwααz ++= , onde z e 3w são variáveis contínuas, e 2w é uma variável discreta. Suponha-se, para fixar ideias, que a variável discreta 2w é uma variável de contagem (por exemplo, o número de dias de falta ao trabalho de determinado trabalhador). Para medir as variações de z quando 2w se al- tera, não se pode calcular a derivada parcial. Neste caso, quando 2w varia para 22 ww ∆+ , z passa para 332221 )( wαwwααzz +∆++=∆+ . Facilmente se verifica que 22 wαz ∆=∆ ou 2 2 α= ∆ ∆ w z . Pode dizer-se que 2α mede a variação de z quando 2w varia de uma unidade (por exemplo, 2α mede o efeito parcial sobre z de mais uma falta ao trabalho). Capítulo 1 – Introdução 14 Suponha-se, agora, que a variável z ainda é quantitativa (contínua ou discreta), e que existe um factor qualitativo explicativo do comportamento de z. Se este factor cor- responde à realização ou não de determinado acontecimento, ele pode ser representado por uma variável binária, jw , que assume apenas os valores 1 ou 0. Tem-se: 1=jw , quando se realiza o acontecimento; 0=jw , no caso contrário. No exemplo 1.4, supõe-se que o género é um factor qualitativo explicativo dos salários dos trabalhadores. A variá- vel binária respectiva, mulher, é igual a 1 quando o trabalhador é do género feminino (igual a 0, quando é um homem). Nestes casos, o efeito parcial de jw sobre z é medido comparando os valores assumidos por z para os dois valores possíveis de jw (no caso do exemplo 1.4, quando se comparam homens com mulheres). Este tópico vai ser aprofundado no capítulo 2, na secção dedicada ao estudo das variáveis artificiais (ver secção 2.11). Considerem-se os seguintes exemplos: 1) Seja a relação linear nas variáveis, 33221 wαwααz ++= , onde z e 3w são variáveis contínuas, e 2w é uma variável binária. O efeito parcial de 2w sobre z é calculado fazendo a diferença dos valores de z que correspondem aos dois valores possíveis de 2w : para 02 =w , tem-se 3310 wααz += ; para 12 =w , vem 33211 wαααz ++= . Então, quando 2w passa de 0 para 1, a variação de z é 201 αzzz =−=∆ . 2) Nas mesmas condições de 1), seja a relação 32433221 wwαwαwααz +++= , onde exis- te um termo de interacção entre a variável contínua, 3w , e a variável binária, 2w . O efeito marginal pontual de 3w sobre z, 243 3 w w z αα += ∂ ∂ , depende de 2w . Há um efeito marginal para cada valor de 2w : 3α , quando 02 =w ; 43 αα + , para 12 =w . Para medir as variações de z quando 2w passa de 0 para 1, começa-se por calcular os respectivos 1z e0z : 3433211 wαwαααz +++= e 3310 wααz += . Então, 34201 wααzzz +=−=∆ depende de 3w . Elasticidades Admita-se que as variáveis z e jw são quantitativas (contínuas ou discretas). Quando os valores de jw e z passam, respectivamente, para jj ww ∆+ e zz ∆+ , verifi- cam-se as seguintes variações relativas: j j w w∆ e z z∆ . Multiplicando por 100 as variações relativas, obtêm-se as respectivas variações percentuais (variações em pontos percentuais) ou taxas de variação, que se represen- tam com os seguintes símbolos: Capítulo 1 – Introdução 15 j j j w w w ∆ =∆ 100% e z zz ∆=∆ 100% . A elasticidade de z em relação a jw é dada por (1.5) z w w z w z ww zzwz j jjjj j ∆ ∆ = ∆ ∆ = ∆ ∆ = % % / /);(EL . Esta elasticidade mede, ceteris paribus, a variação percentual de z quando jw varia de um ponto percentual. Obviamente, este efeito pode depender de pwww ,,, 21 K , e dos parâmetros. O logaritmo pode ser utilizado para fazer várias aproximações. Uma delas, es- tabelece que xx ≈+ )1ln( , para 0≈x . A qualidade da aproximação diminui à medida que x se afasta de zero. Por exemplo, para x igual a 0.015, 0.15 e 0.6 tem-se, respectiva- mente, 0149.0)015.1ln( = , 1398.0)15.1ln( = e 47.0)6.1ln( = . Outra aproximação importante que envolve logaritmos é dada por x xx ∆≈∆ )ln( , para 0>x e pequenas variações relativas. Por exemplo, se 600=x e 606=∆+ xx , tem-se 01.0/ =∆ xx e 00995.0)ln()ln()ln( =−∆+=∆ xxxx . No entanto, se 600=x e 720=∆+ xx , resulta 2.0/ =∆ xx e 1823.0)ln( =∆ x (a qualidade da aproximação pio- ra). Suponha-se que 0>z e 0>jw . Para pequenas variações relativas, podem esta- belecer-se as seguintes aproximações: )ln(100% jj ww ∆≈∆ e )ln(100% zz ∆≈∆ . Facilmente se conclui que )ln( )ln();(EL j j w zwz ∆ ∆ ≈ . No caso particular em que as variáveis z e jw são contínuas, e a função h é de- rivável (pelo menos em relação a jw ), a elasticidade de z em relação a jw pode ser de- finida para uma variação infinitesimal de jw . Neste caso, a elasticidade pontual de z em relação a jw é dada por (1.6) z w w z z w w z ww zzwz j j j jwjjw j jj ∂ ∂ = ∆ ∆ = ∆ ∆ = →∆→∆ ∗ 00 lim/ /lim);(EL . Facilmente se verifica que );(ELlim);(EL 0 jwj wzwz j →∆ ∗ = . Para 0≈∆ jw , tem-se );(EL);(EL jj wzwz ≈∗ . Quando 0>z e 0>jw , pode também demonstrar-se que Capítulo 1 – Introdução 16 )ln( )ln();(EL j j w zwz ∂ ∂ =∗ . Com efeito, notando que )}exp{ln( jj ww = e que j w j w j j wewd ed wd wd j j === )ln( )ln( )ln()ln( , aplicando duas vezes a regra da derivada da função composta, obtém-se );(EL1)ln( )ln( )ln( )ln( j j j j jj j jj wzw z z w ww z zwd wd w z zd zd w z ∗= ∂ ∂ = ∂ ∂ = ∂ ∂ = ∂ ∂ . Considerem-se os seguintes exemplos: 1) Seja a relação linear nas variáveis, wααz 21 += , onde z e w são variáveis contínuas. Dada a variação w∆ , tem-se )(21 wwααzz ∆++=∆+ . A elasticidade de z em relação a w é dada por w w z w w zwz 21 2);(EL ααα +=∆ ∆ = , que depende de w. Conclui-se imediatamente que );(EL);(EL wzwz =∗ . 2) Seja 221 wααz += , relação quadrática entre z e w (variáveis contínuas). Dada a va- riação w∆ , vem })(2{)( 2221221 wwwwααwwααzz ∆+∆++=∆++=∆+ . A elastici- dade de z em relação a w é 2 21 2 )2();(EL w wwwz w w zwz αα α + ∆+= ∆ ∆ = . Facilmente se verifica que 2 21 22);(EL w wwz w wd zdwz αα α + ==∗ . Para 0→∆w , tem-se );(EL);(EL wzwz ∗→ . 3) Suponha-se que a relação (não linear) entre z, 2w e 3w (variáveis contínuas) é dada por 32433221 wwαwαwααz +++= (a quarta parcela é termo de interacção entre 2w e 3w ). Dado 2w∆ , obtém-se 3224332221 )()( wwwαwαwwααzz ∆+++∆++=∆+ . Então, );(EL)();(EL 2 32433221 2 342 2 2 2 wzwwαwαwαα wwz w w zwz ∗= +++ += ∆ ∆ = αα . Semi-elasticidades Suponha-se que as variáveis z e jw são quantitativas (contínuas ou discretas). A semi-elasticidade de z em relação a jw é dada por (1.7) zw z w z w zzwz jjj j 1 100 %/);SEL( ∆ ∆ = ∆ ∆ = ∆ ∆ = . Capítulo 1 – Introdução 17 A semi-elasticidade mede, ceteris paribus, a variação relativa de z quando jw varia de uma unidade. Obviamente, este efeito pode depender de pwww ,,, 21 K , e dos parâmetros. Facilmente se verifica que j j w zwz ∆ ∆ =× %);SEL(100 mede, ceteris paribus, a variação percentual de z quando jw varia de uma unidade. Quando 0>z , e para pequenas variações relativas, tem-se j j w zwz ∆ ∆ ≈ )ln();SEL( . Quando as variáveis z e jw são contínuas, e a função h é derivável (pelo me- nos em relação a jw ), a semi-elasticidade z em relação a jw pode ser definida para uma variação infinitesimal de jw . Neste caso, a semi-elasticidade pontual z em relação a jw é dada por (1.8) zw z zw z w zzwz jjwjw j jj 11lim/lim);(SEL 00 ∂ ∂ = ∆ ∆ = ∆ ∆ = →∆→∆ ∗ . Resulta imediatamente que );SEL(lim);(SEL 0 jwj wzwz j →∆ ∗ = . Para 0≈∆ jw , tem-se );SEL();(SEL jj wzwz ≈∗ . Quando 0>z , vem j j w zwz ∂ ∂ =∗ )ln();(SEL . Considerem-se os seguintes exemplos: 1) Seja wααz 21 += , onde z e w são variáveis contínuas. A semi-elasticidade de z em re- lação a w é dada por );(SEL1);SEL( 21 2 wzwzw zwz ∗= + = ∆ ∆ = αα α , que depende de w. 2) Considere-se 221 wααz += , onde z e w são variáveis contínuas. A semi-elasticidade de z em relação a w é 2 21 2 )2(1);SEL( w ww zw zwz αα α + ∆+ = ∆ ∆ = . A respectiva semi-elasticidade pontual é dada por 2 21 221);(SEL w w zwd zdwz αα α + ==∗ . Para 0→∆w , tem-se );(SEL);SEL( wzwz ∗→ . Capítulo 1 – Introdução 18 3) Considere-se a relação 32433221 wwαwαwααz +++= entre variáveis contínuas. Vem );(SEL1);SEL( 2 32433221 342 2 2 wzwwαwαwαα w zw zwz ∗= +++ + = ∆ ∆ = αα . 1.5 - Algumas relações linearizáveis Existe uma grande variedade de relações que se podem estudar sob a capa das relações lineares. Com o objectivo de aprofundar esta questão, vão apresentar-se alguns tipos de relações funcionais muito utilizados na prática. Por simplicidade de exposição, estas relações consideram apenas uma variável explicativa, mas podem ser imediata- mente generalizadas para duas ou mais variáveis. a) A relação log-log. Considere-se a função potência (ver figura 1.1) (1.9) αwγz = )0;0( >> γw . Esta função verifica uma propriedade muito importante: a elasticidade pontual de z em relação a w é constante (igual a α ). Com efeito, (1.10) α==∗ z w wd zdwz );(EL . Por esta razão, é também designada por função de elasticidade constante. 0 1 2 Fig. 1.1 – Função potência. Linearizando (1.9), obtém-se a especificação log-log, (1.11) )ln()ln( 21 wββz += , onde )(ln1 γβ = e αβ =2 . Capítulo 1 – Introdução 19 Então, w z w/w /zz w z wd zdβ ∆ ∆ = ∆ ∆ ≈ ∆ ∆ == % % ln ln )ln( )ln( 2 , ou seja, 2β é, aproximadamente, o quociente entre a variação relativa de z e a variação relativa de w (variação percentual de z quando w varia de um ponto percentual). Pode, também, escrever-se wz ∆≈∆ %% 2β . O valor exacto de z∆% pode ser calculado sem dificuldade. Suponha-se que o valor de w passa para ww ∆+ . Atendendo a (1.9), tem-se αγ )( wwzz ∆+=∆+ . Então, 111}){( − ∆+=− ∆+= −∆+ = ∆ αα α αα γ γ w w w ww w www z z . Multiplicando ambos os membros por 100, obtém-se − ∆+×=∆ 11100% α w wz . Então, (1.12) w w w w w zwz ∆ − ∆ + = ∆ ∆ = 11 % %);(EL α . O grau de aproximação entre (1.12) e (1.10) é ilustrado a seguir. Por exemplo, suponha-se que 33.0wz = . O quadro seguinte apresenta os desvios entre 33.02 ==αβ e wz ∆∆ %% : w w∆ w∆% z∆% );(EL wz α=∗ );(EL wz Desvios 600 6 1 0.3289 0.3289 0.33 – 0.0011 600 60 10 3.1952 0.3195 0.33 – 0.0105 600 120 20 6.2013 0.3101 0.33 – 0.0199 600 180 30 9.0439 0.3015 0.33 – 0.0285 b) A relação log-lin. Considere-se a função exponencial (ver figura 1.2) (1.13) wαγz = )0;0( >> γα . Logaritmizando,obtém-se a relação semi-logarítmica ou log-lin, (1.14) wββz 21)ln( += , onde )ln(1 γβ = e )ln(2 αβ = . A semi-elasticidade pontual de z em relação a w é constante (igual a 2β ). De facto, Capítulo 1 – Introdução 20 (1.15) 2 )ln(1);(SEL βwd zd zwd zdwz ===∗ . A função dada por (1.13) também é conhecida pela designação de função de se- mi-elasticidade constante. -2 -1 0 1 2 Fig. 1.2 – Função exponencial. Tem-se w z w z w zz w z wd zd ∆ ∆ ≈⇔ ∆ ∆ = ∆ ∆ ≈ ∆ ∆ == %100100 %/)ln()ln( 22 ββ , ou seja, 2β é, aproximadamente, o quociente entre a variação relativa de z e a variação absoluta de w (se w varia de 1 unidade, z varia, aproximadamente, de %100 2β ). Pode, também, escrever-se wz ∆≈∆ 2100% β . O valor exacto de z∆% pode ser determinado sem dificuldade. Suponha-se que o valor de w passa para ww ∆+ . Atendendo a (1.13) ou (1.14), tem-se )}(exp{ 21 wwzz ww ∆++==∆+ ∆+ ββαγ . Então, 11)( −=−=−=∆ ∆ ∆+∆+ w w ww w www z z α α α αγ ααγ ou 1}exp{ 2 −∆= ∆ wz z β . Multiplicando ambos os membros de qualquer destas igualdades por 100, vem )1}(exp{100)1(100% 2 −∆×=−×=∆ ∆ wz w βα . Então, (1.16) w w ww zz w zwz w ∆ −∆ = ∆ − = ∆ ∆ = ∆ ∆ = ∆ 1}exp{1/ 100 %);(SEL 2βα . Capítulo 1 – Introdução 21 A aproximação entre (1.16) e (1.15) é ilustrada a seguir. Por exemplo, supondo que 094.02 =β , o quadro seguinte mostra os desvios entre 2β e )100(% wz ∆×∆ : w∆ z∆% );(SEL wz 2);(SEL β= ∗ wz Desvios 0.1 0.9444 0.0944 0.094 0.0004 0.5 4.8122 0.0962 0.094 0.0022 1.0 9.8560 0.0986 0.094 0.0046 5.0 59.9994 0.1200 0.094 0.0260 10.0 155.9981 0.1560 0.094 0.0620 20.0 555.3505 0.2777 0.094 0.1837 A relação log-lin é particularmente interessante quando a variável explicativa é o tempo (considerada variável contínua): tw = . Neste caso, tem-se tββzeγzαγz tβt 21)ln(2 +=⇔=⇔= , onde )ln(1 γβ = e )ln(2 αβ = . Diz-se, então, que z tem tendência exponencial, e )ln(z tem tendência linear. Verifica-se que t z t z t z ztd zd td zd ∆ ∆ ≈⇔ ∆ ∆ ≈ ∆ ∆ === %100100 %)ln(1)ln( 22 ββ , é a taxa instantânea de variação de z no momento t. Se o tempo for considerado de forma discreta, a variável z é observada nos mo- mentos KK ,,,2,1,0 t , e 1=∆ t . Pode fazer-se tt gz )(1+= γ , onde g é a taxa média de variação de z no período t (entre o momento 0 e o momento t) Com efeito, basta consi- derar que: para 0=t , tem-se γ=0z ; para 1=t , vem )1(1 gz += γ ; quando 2=t , resulta 2 2 )1( gz += γ ; em geral, tem-se tt gz )(1+= γ . Omitindo o índice t da variável z, pode escrever-se tgz )(1+= γ onde g+=1α , e, portanto, )1ln(2 gβ += . Como tgz )1ln()ln()ln( ++= γ e 1=∆ t , vem ggz ≈+=∆ )1ln()ln( , para g pequeno. Assim, nestas condições, a variação de )ln(z (a taxa instantânea de va- riação de z) é aproximadamente igual à taxa média de variação de z. c) A relação lin-log é outro tipo de relação semi-logarítmica, mas onde os papéis das variáveis estão trocados, isto é, a variável explicada é especificada em níveis, e a variá- vel explicativa, em logaritmos. Tem-se, então (ver figura 1.3), (1.17) )ln(21 wββz += )0( >w . Esta relação verifica a propriedade Capítulo 1 – Introdução 22 (1.18) 2)ln( β=wd zd . Como wwd zd 2β= e wwwd wd wd zd wd zd 2 )ln()ln( β == , também se conclui que wwd zd =2β . A partir de (1.18), vem w z w z w/w z w z wd zd ∆ ∆ ≈⇔ ∆ ∆ = ∆ ∆ ≈ ∆ ∆ == %100% 100 )ln()ln( 2 2 ββ . ou seja, 2β é, aproximadamente, o quociente entre a variação absoluta de z e a varia- ção relativa de w. Também se pode dizer que 100/2β é, aproximadamente, o quociente entre a variação absoluta de z e a variação percentual de w (variação absoluta de z quan- do w varia de um ponto percentual). Assim, wz ∆≈∆ %100 2β . 0 1 2 Fig. 1.3 – Função logarítmica. Por exemplo, supondo que 4.422 =β , o quadro seguinte mostra os desvios entre 2β e wz ∆∆× %)100( [note-se que )}ln(){ln(2 wwwz −∆+=∆ β ]: w w∆ w∆% z∆ wz ∆∆× %)100( 2β Desvios 600 6 1 0.4219 42.1894 42.4 – 0.2106 600 60 10 4.0412 40.4115 42.4 – 1.9885 600 120 20 7.7304 38.6522 42.4 – 3.7478 600 180 30 11.1242 37.0808 42.4 – 5.3192 Capítulo 1 – Introdução 23 Esta relação é utilizada quando pretende estudar-se o efeito da variação relativa de uma variável (por exemplo, a taxa de crescimento da oferta de moeda, m) sobre a va- riação absoluta de outra variável (por exemplo, o nível do PIB): )ln(21 mpib ββ += . d) A relação inversa é dada pela função (ver figura 1.4), (1.19) w ββz 121 += )0( ≠w . Como 2 2 w β wd zd −= e 3 2 2 2 2 w β wd zd = , e supondo 0>w (que corresponde à situação mais habitual para as variáveis económi- cas), verifica-se facilmente que: se 02 >β , a função é decrescente e convexa, com uma assíntota horizontal igual a 1β ; se 02 <β , a função é crescente e côncava, com uma assíntota horizontal igual a 1β . Fig. 1.4 – Função hiperbólica com 0>w e 02 >β . e) A relação polinomial, (1.20) ppwδwδwδz ++++= L 2 210δ , é uma relação linear (nos parâmetros) em que as variáveis jx são as sucessivas potên- cias de w. Por exemplo, quando 2=p (relação quadrática na variável w), os efeitos marginais w sobre z são crescentes ou decrescentes conforme o sinal de 2δ . Quando tw = , a variável z tem tendência (linear, quando 1=p ; quadrática, quando 2=p ; etc.). Capítulo 1 – Introdução 24 f) A relação logística (ver figura 1.5) é intrinsecamente não linear, (1.21) }exp{1 wαβ γz −+ = , onde 0>γ , 0>β e 0>α são os parâmetros. O estudo desta função mostra que se trata de uma função crescente, convexa en- tre ∞− e αβ /)ln( , côncava a partir deste ponto, e com uma assíntota horizontal igual a γ . Fig. 1.5 – Função logística )1( =β . 1.6 - O valor esperado condicionado estrutural Embora algumas questões sobre a análise empírica dos modelos, e sobre a natu- reza dos dados, sejam abordadas mais adiante (ver secções 1.7 e 1.8), é importante, des- de já, chamar a atenção para duas questões. A primeira questão tem a ver com o modo como os dados podem ser obtidos ou gerados. Assim: a) Nas Ciências da Natureza (Física, Biologia, etc.), sobretudo em ambientes laborato- riais, os dados resultam, muitas vezes, de uma situação controlada pelo investigador. Neste caso, os dados dizem-se experimentais. b) Em Economia (e, em geral, nas Ciências Sociais) os dados decorrem, quase sempre, de um fenómeno passivamente observado pelo investigador. Nesta situação, os dados são não experimentais. Esta distinção é crucial para a Econometria, porque põe a questão da natureza estocástica das variáveis do modelo, bem como das respectivas observações. Pode, então, estabelecer-se a premissa básica da Econometria: Capítulo 1 – Introdução 25 Premissa básica da Econometria Devido à natureza não experimental dos dados, as variáveis explicadas e as variáveis explicativas do modelo – e as respectivas observações – são consideradas variáveis aleatórias. Esta premissa abrange o caso de as observações de algumas variáveis explicati- vas serem determinísticas; estas observações são consideradas, então, variáveis aleató- rias degeneradas. Porventura, é esta premissa básica que pode justificar que a Econometria tenha evoluído como uma disciplina científica autónoma (separada da estatística clássica, que teve a sua génese no tratamento e análise de dados predominantemente experimen- tais). A Econometria impôs-se como uma disciplina própria a partir do momento em que se acumularam desenvolvimentos metodológicos que não existiam na estatística clássi- ca. Por exemplo, embora o modelo de regressão linear (a apresentar nos capítulos se- guintes) seja muito estudado na estatística clássica, ele tem a sua interpretação própria na Econometria; os econometristas desenvolveram novas técnicas e métodos para estu- dar este modelo que têm em conta as suas aplicações (por exemplo, testar as previsõesdas teorias económicas) e as complexidades dos dados económicos. A segunda questão diz respeito à flexibilidade relacional do modelo teórico que vai ser submetido à análise econométrica. Quando se considera a relação (1.1), )(whz = , está subentendido que os únicos factores explicativos de z são pwww ,,, 21 K . Contudo, é de esperar (sobretudo, quando se procura caracterizar fenómenos de natureza social ou económica), que existam mui- tos outros factores explicativos de z que não estão explicitados (no exemplo 1.4, o loga- ritmo dos salários dos trabalhadores não é explicado apenas pelos factores explicitados – educ, exper, empc, mulher, aptid –, mas também por muitos outros, como os referidos no mesmo exemplo). Deste modo, (1.1) não é operacional porque estabelece uma rela- ção rígida entre as variáveis do modelo. A flexibilidade relacional pretendida pode obter-se introduzindo uma variável adicional, u, que abrange todos os factores que não foram considerados, mas que podem afectar o comportamento da variável explicada. Em especial, aqueles factores podem incluir variáveis não observáveis, variáveis omitidas observáveis e erros de medida. Se u for incorporado de forma aditiva, o modelo teórico passa a ser (1.22) uwhz += )( . A variável u não é observável, chama-se variável residual (erro ou termo per- turbador), e desempenha um papel fundamental na relação (1.22), como vai ver-se nos capítulos subsequentes. Desta forma, a variável explicada, z, é decomposta em duas componentes aditivas: a componente sistemática ou sinal, )(wh ; a componente resi- dual ou ruído, u. Como vai ver-se, esta especificação é muito útil para fazer um trata- mento unificado das propriedades estatísticas de vários métodos econométricos. Do mesmo modo, quando a relação é linear pode escrever-se [ver (1.2)] Capítulo 1 – Introdução 26 (1.23) uxuxβxβxβy kk +=++++= βL2211 . Para aligeirar as notações é habitual fazer-se em Econometria a seguinte conven- ção: Convenção Vai utilizar-se o mesmo símbolo para representar as variáveis aleatórias e os res- pectivos valores concretamente observados. O modelo (1.22) é formado apenas por uma equação que representa uma relação de causalidade. Nestas condições, diz-se que (1.22) é uma equação estrutural, e os respectivos parâmetros, jα , chamam-se parâmetros estruturais. Muitas vezes, estes parâmetros são estimáveis exclusivamente apenas tendo por base a equação estrutural. Diz-se, então, que a equação estrutural é directamente estimável. Outras vezes, tal não acontece, sendo necessário combinar hipóteses adicionais sobre outras variáveis com manipulações algébricas para obter uma equação estimável. Neste caso, é de esperar que esta equação permita estimar alguns parâmetros estruturais (ou mesmo todos). Além disso, pode haver motivos para estimar equações não estruturais, que pode ser, nalguns casos, um passo preliminar para estimar uma equação estrutural. Muitas vezes, supõe-se que (1.24) )()|()( wwzEwh µ== , ou seja, a componente sistemática do modelo é o valor esperado de z condicionado por w. Daqui resulta que 0)|( =wuE , isto é, o valor esperado da componente residual con- dicionado por w é nulo. Neste caso, tem-se que )()|( wzwzEzu µ−=−= , ou seja, a variável residual não é mais do que o desvio entre z e o seu valor esperado condicionado por w. Quando se verifica (1.24), o valor esperado condicionado passa a desempenhar um papel primordial na análise econométrica, uma vez que )|( wzE coincide com a componente sistemática do modelo. De facto, uma parte substancial dos desenvolvimen- tos metodológicos em Econometria tem a ver com métodos de estimação de valores es- perados condicionados. Neste contexto, é fundamental apresentar a seguinte definição: Definição 1.1 – Valor esperado condicionado estrutural. Considere-se a relação (1.22). Se )()|( whwzE = , então a função ℜ→ℜ pw :)(µ dada por (1.25) )|()( wzEw =µ designa-se por valor esperado condicionado estrutural. A função )(wµ tem esta designação porque supõe-se que representa o compor- tamento médio da variável z (normalmente associada a um certo tipo de agentes eco- nómicos, ou outros), quando variam as componentes do vector w. Capítulo 1 – Introdução 27 Considere-se a relação na forma (1.22), admitindo que )(wh é o valor esperado condicionado estrutural: uwz += )(µ . Quando se pretende analisar o efeito parcial de jw sobre z, o conjunto dos factores fixos ou das variáveis de controlo é formado pelas outras variáveis explicativas. Para facilitar a exposição, vai utilizar-se o símbolo c para designar o vector-linha das variáveis de controlo; tem-se ),( cww j= . A análise ceteris paribus pretende medir a resposta média ou esperada – como é habitual em muitas si- tuações –, estimando o valor esperado de z condicionado por w, )()( z|wEw =µ . Todas as considerações feitas nas secções 1.4 e 1.5 – a propósito de efeitos par- ciais, de elasticidades, de semi-elasticidades e de relações linearizáveis – são aplicáveis neste contexto, desde que se considere a função )(wµ . Por exemplo: 1) Se jw e z são variáveis aleatórias quantitativas, é usual focar a atenção no efeito marginal médio de jw sobre z, dado por (1.26) jj w z|wE w w ∆ ∆ = ∆ ∆ )()(µ . 2) Se as variáveis aleatórias jw e z são contínuas, e a função )(wµ é derivável em rela- ção a jw , pode obter-se o respectivo efeito marginal pontual médio resultante de uma variação infinitesimal de jw . Tem-se (1.27) jj w z|wE w w ∂ ∂ = ∂ ∂ )()(µ . 3) A elasticidade pontual média de z em relação a jw é dada por (1.28) )( )( )( )(};)({EL z|wE w w z|wE w w w www j j j j j ∂ ∂ = ∂ ∂ =∗ µ µµ . 4) Se 0)( >wµ e 0>w (como acontece muitas vezes), tem-se (1.29) )ln( )}(ln{ )ln( )}(ln{};)({EL jj j w z|wE w www ∂ ∂ = ∂ ∂ =∗ µµ . 5) Se jw é variável binária, os efeitos parciais médios são calculados comparando )(wµ para os dois valores possíveis de jw : 0=jw e 1=jw . Quando o modelo tem a forma uwgz += )()ln( , onde g é uma função de w e 0)|( =wuE , é natural definir a elasticidade pontual média de )ln(z em relação a jw da seguinte maneira: (1.30) )ln( }){ln( jw w|zE ∂ ∂ . Como se pode comparar (1.30) com (1.29)? Como )}(ln{}){ln( z|wEw|zE ≠ , as duas elasticidades são diferentes. Contudo, se w e u são independentes, a igualdade é verificada. Com efeito, notando que }exp{)}(exp{})(exp{ uwguwgz =+= , vem )}(exp{)|}exp{)}((exp{)|( wgwuwgEwzE δ== , Capítulo 1 – Introdução 28 onde })(exp{)|}(exp{ uEwuE ==δ , uma vez que }exp{u e w também são independen- tes. Então, )(}|)({}){ln( wgwuwgEw|zE =+= e )()ln()}(ln{ wgz|wE += δ têm derivadas iguais em relação a )ln(w . Por exemplo, se uwwz +++= 22121 )ln()ln( βββ , e se u tem valor esperado nulo e é independente de ),( 21 ww , a elasticidade de z em rela- ção a 1w é 2β , usando qualquer das duas definições. Se 0)|( =wuE , mas w e u não são independentes, as duas definições dão resul- tados diferentes, embora, em muitas situações, as diferenças não sejam significativas, desde que 0>z . Contudo, a primeira definição é mais geral porque pode utilizar-se em casos em que não existe )ln(z [mas existe )}(ln{ z|wE ]. Escolher a lista adequada de variáveis de controlo nem sempre é fácil; a utiliza- ção de listas diferentes pode conduzir a conclusões diferentes sobre a relação de causali- dade entre z e jw . É por esta razão que estabelecer causalidades pode ser complicado, pois depende dos factores que se supõem constantes. Admitindo que se conhece a lista de variáveis de controlo, e supondo que estas variáveis são observáveis, não é complicado, em geral, estimar o efeito parcial pretendi- do. Infelizmente, em Economia (nas Ciências Sociais) muitas das variáveis de controlo não são observáveis. Podem, ainda, surgir outros problemas que interferem na estimação de relações de causalidade. Para exemplificar, vão referir-se duas situações: a) Errosde medida nas variáveis. Mesmo que a lista de variáveis de controlo esteja correctamente especificada, pode acontecer que não seja possível dispor de medidas suficientemente rigorosas de jw ou de z; b) Simultaneidade. As variáveis jw e z são simultaneamente determinadas, e as únicas observações disponíveis são valores de equilíbrio (como pode acontecer nos casos dos exemplos 1.7, 1.9 e 1.10). Em situações como estas, tem-se 0)|( ≠wuE ou )()( wwh µ≠ , isto é, a compo- nente sistemática do modelo não é um valor esperado condicionado estrutural. No entanto, embora continue a existir )(wµ , o econometrista não está condições de obter dados para o estimar. O estudo de situações deste tipo vai ser feito em capítulos poste- riores. Exemplo 1.15 – Considere-se as seguintes situações: a) Retome-se o exemplo 1.4, e suponha-se que procura detectar-se uma relação de cau- salidade de educ sobre lsalar, em que as variáveis de controlo são exper, empc, mu- lher e aptid. Embora aptid não seja observável, admita-se que uaptidmulherempcexpereduclsalar ++++++= 654321 ββββββ . Fazendo ),|(),( ceduclsalarEceduc =µ , com =c [ aptidmulherempcexper ], su- põe-se que o comportamento médio do logaritmo do salário é dado por Capítulo 1 – Introdução 29 aptidmulherempcexpereducceduc 654321),( ββββββµ +++++= , ou seja, a componente sistemática do modelo é o valor esperado condicionado estru- tural. Tem-se educ ceduc educ ceduclsalarE ∂ ∂ = ∂ ∂ = ),(),|( 2 µβ . Assim, 2β mede o efeito parcial de educ sobre o valor esperado do logaritmo do sa- lário condicionado por educ e pelas variáveis de controlo. Este efeito não é estimá- vel, uma vez que a variável de controlo aptid não é observável. A semi-elasticidade (pontual) média de salar em relação a educ é, então, ),( 1),( ceduceduc ceduc µ µ × ∂ ∂ . É óbvio que esta semi-elasticidade também não é estimável. Desprezando a variável não observável, aptid, esta passa a estar incluída na variável residual, u. Como é de esperar que haja correlação entre aptid e educ, verifica-se que 0)( ≠× aptideducE . Então, 0),|( ≠ceducuE , onde o vector das variáveis de controlo é, agora, =c [ mulherempcexper ]. Neste caso, ),|(),|( 54321 ceducuEmulherempcexpereducceduclsalarE +++++= βββββ , e a componente sistemática do modelo não é um valor esperado condicionado estru- tural. b) Suponha-se que pretende estabelecer-se uma relação de causalidade de assid sobre nest (ver exemplo 1.5). Seja umistaeassidhnest += ),,( . Suponha-se que ),(),(),|( cassidhcassidcassidnestE == µ , onde =c [ mistae ] é composto por variáveis observáveis. Embora já se saiba que estas variáveis são medidas gerais da capacidade e dos hábitos de estudo dos alunos, pode pôr-se a dúvida sobre a sua adequação para controlar a relação de causalidade, porque não entram em linha de conta com a aptidão específica e o interesse do aluno para estudar Estatística. A inclusão em c de uma variável deste tipo pode ser impor- tante, embora não seja observável. O efeito parcial de assid sobre ),|( cassidnestE é medido por assid cassid assid cassidnestE ∂ ∂ = ∂ ∂ ),(),|( µ . ∇ Para terminar esta secção vão apresentar-se algumas propriedades gerais dos va- lores esperados condicionados (médias, variâncias e covariâncias), envolvendo variá- veis aleatórias e vectores aleatórios. Capítulo 1 – Introdução 30 Propriedades dos valores esperados condicionados Seja a variável aleatória z, e os vectores aleatório x, w e v. Tem-se: a) Regra do valor esperado total: )}|({)( wzEEzE = . b) Regra do valor esperado iterado: }|)|({)|( wxzEEwzE = , onde w é função de x, )(xgw = . c) Caso especial da regra do valor esperado iterado: }|),|({)|( wvwzEEwzE = . d) Linearidade do valor esperado condicionado: Considerem-se as funções de w, )(wai ),,1( mi K= e )(wb , e as variáveis aleatórias mzz ,,1 K . Então, )()|()()|()(}|)()()({ 1111 wbwzEwawzEwawwbzwazwaE mmmm +++=+++ LL , desde que +∞<|)(| izE , +∞<|))((| ii zwaE e +∞<|))((| wbE . e) Se )|( wzEzu −= , então 0=})({ uwhE , onde )(wh é uma função (vectorial) de w, desde que +∞<|))((| uwhE i [os )(whi são as componentes de )(wh ] e +∞<|)(| uE . Em particular, 0)( =uE e 0),( =uwCov j [os jw são as componentes de w]. f) Desigualdade de Jensen para valores esperados condicionados: se ℜ→ℜ:g é uma função convexa com domínio ℜ , e +∞<|)(| zE , então }|)({)}|({ wzgEwzEg ≤ . g) Considerem-se as funções de w, )(wa e )(wb . Então, )|(Var)}({}|)()({Var 2 wzwawwbzwa =+ . h) Tem-se: )}|({Var)}|(Var{)(Var wzEwzEz += . i) Tem-se: }|),|({Var}|),|(Var{)|(Var wvwzEwvwzEwz += . j) Se 1z e 2z são variáveis aleatórias, vem )}|(),|({Cov)}|,(Cov{),(Cov 212121 wzEwzEwzzEzz += . Considerando dois vectores aleatórios w e z quaisquer, vem: k) )}|({Cov)}|(Cov{)(Cov wzEwzEz += , onde: o símbolo )(Cov ⋅ representa a matriz das covariâncias de um vector aleatório; o símbolo )(⋅E refere-se ao valor esperado de uma matriz aleatória ou de um vector aleatório. Podem fazer-se os seguintes comentários a estas propriedades: − Em muitos casos, o cálculo directo de )(zE pode ser complicado. No entanto, se for conhecido (ou se for relativamente fácil de calcular) )()|( wwzE µ= , a proprie- dade a) permite determinar )(zE , calculando o valor esperado de )(wµ . Deste mo- Capítulo 1 – Introdução 31 do, o problema difícil [o cálculo directo de )(zE ] pode ser resolvido mediante a re- solução de dois problemas mais simples: o conhecimento ou a determinação da fun- ção )(wµ ; o cálculo do respectivo valor esperado. Apresentam-se dois exemplos simples: 1. Se awzE =)|( (constante) então .)( azE = Com efeito, aaEwzEEzE === )()}|({)( Contudo, azE =)( não implica awzE =)|( . 2. Seja w é um vector aleatório discreto que assume os valores mccc ••• ,,, 21 K com probabilidades mppp ,,, 21 K , respectivamente. Então, )|()|()|()( 2211 mm cwzEpcwzEpcwzEpzE ••• =++=+== L , isto é, o valor esperado de z é a média ponderada dos )|( icwzE •= , onde os pesos são as respectivas probabilidades ip . − A propriedade b) é a versão mais geral que vai considerar-se da regra do valor espe- rado iterado. Recordando que )(xgw = , a propriedade é dada por )}(|)|({)}(|{ xgxzEExgzE = . Se se fizer )|()(1 xzEx =µ e )|()(2 wzEw =µ , a propriedade b) estabelece que }|)({)( 12 wxEw µµ = . Assim, pode determinar-se )(2 wµ , calculando o valor esperado de )(1 xµ condiciona- do por w. Há outra propriedade que parece semelhante à anterior, mas é muito mais simples de verificar. Trata-se de )|)}(|{()}(|{ xxgzEExgzE = , ou }|)({)(}|)|({)|( 22 xwEwxwzEEwzE µµ =⇔= , onde se trocaram as posições de w e x. Com efeito, como w é função de x, conhecer x implica conhecer w; como )|()(2 wzEw =µ , o valor esperado de )(2 wµ , dado x, é, obviamente, )(2 wµ . Estas duas propriedades podem resumir-se com a seguinte frase: “o conjunto de in- formação menor é sempre dominante”. Dito de outro modo: “menos informação do- mina mais informação”. Aqui, w representa menos informação do que x, uma vez que conhecer x implica conhecer w (mas não inversamente). − A propriedade c) é um caso especial da lei do valor esperado iterado. Neste caso, tem-se ),( vwx = [como x é o par ),( vw , obviamente w é função de x]. Fazendo ),|(),(1 vwzEvw =µ [função de w e v] e )|()(2 wzEw =µ [função de w], tem-se }|),({)( 12 wvwEw µµ = , onde o valor esperado do segundo membro, )|( wE ⋅ , é calculado em relação a v. − Vai fazer-se uma interpretação muito interessante da propriedade c). Suponha-se que num determinado estudo econométrico se admite que as variáveis explicativas Capítulo 1 – Introdução 32 importantes de z são w e v, o que significa que o interesse da análise incida sobre o valor esperado condicionado estrutural ),|(),(1 vwzEvw =µ , que é função de w e v. Se o vector v não é observável, não pode estimar-se ),(1 vwµ directamente. No entan- to, se w e z são observáveispode estimar-se )|()(2 wzEw =µ , que é função apenas de w. Em geral, a obtenção de )|()(2 wzEw =µ à custa de ),|(),(1 vwzEvw =µ é muito complicada. Contudo, em muitas situações, a forma de ),(1 vwµ é suficientemente simples para que o problema tenha uma resolução fácil, desde que se introduzam al- gumas hipóteses adicionais. Por exemplo, suponha-se que se começa com o modelo vwvwwvwwzEvww 1432211021211 ),,|(),,( βββββµ ++++== , onde v não é observável. As propriedades c) e d) permite estabelecer que .),|(),|( ),|( },|),,|({),|(),( 211421322110 2114322110 212121212 wwvEwwwvEww wwvwvwwE wwvwwzEEwwzEww βββββ βββββ µ ++++= ++++= == O cálculo de ),|( 21 wwvE é, em geral, uma tarefa muito complicada, uma vez que exige o conhecimento da distribuição de v condicionada por 1w e 2w . Contudo, ad- mitindo a hipótese adicional, 2211021 ),|( wwwwvE δδδ ++= , obtém-se 214 2 132211021212 ),|(),( wwwwwwwzEww αααααµ ++++== , onde = = += ++= += .244 143 2322 041311 0300 δβα δβα δββα δβδββα δββα − A regra do valor esperado iterado [propriedade b)] tem outra implicação importan- te. Suponha-se que para alguma função vectorial, )(xg , e para alguma função (esca- lar), h, tem-se )}({)|( xghxzE = . Então, )}({)|()}(|{ xghxzExgzE == . Com efeito, de acordo com a propriedade b), tem-se )|()}({)}(|)}({{)}(|)|({)}(|{ xzExghxgxghExgxzEExgzE ==== . Este resultado pode ser apresentado de outro modo. Com efeito, fazendo )(xgw = , vem )()|( whwzE = . Pode concluir-se que: se o valor esperado de z condicionado por x é uma função de x, é redundante condicioná-lo por )(xg ; basta condicioná-lo por x. Por exemplo, suponha-se que Capítulo 1 – Introdução 33 = 21 2 2 2 1 21 ),( xx x x x xxg , e que 214223221102121 )},({),|( xxxxxxxghxxzE βββββ ++++== . Então, 214 2 232211021 2 221 ),,,|( xxxxxxxxxxzE βββββ ++++= . Assim, se o valor esperado condicionado por 1x e 2x é função destas variáveis, é re- dundante condicioná-lo, também, por 22x e por 21xx . Este exemplo pode ser enquadrado numa formalização mais geral. Suponha-se que )|( xzE é linear relativamente aos parâmetros, )()()()|( 2211 xgxgxgxzE kkβββ +++= L , onde )(xg j ( kj ,,2,1 K= ) são funções de x. Fazendo )(xgw jj = , tem-se kkk wwwwwwzE βββ +++= LK 221121 ),,,|( . Assim, qualquer valor esperado condicionado linear relativamente aos parâmetros pode considerar-se, também, como linear relativamente a certas variáveis condicio- nantes. Quando se considera explicitamente a variável residual u, pode escrever-se uwwwz kk ++++= βββ L2211 . Supondo que 0)|( =xuE , e como )(xgw jj = , pode concluir-se que u não está corre- lacionado com qualquer jw (e com qualquer função dos jw ). − A propósito da regra do valor esperado iterado, pode enunciar-se uma outra pro- priedade muito importante: − Sejam u, x e w três vectores aleatórios. Se ( xu, ) é independente do vector w, en- tão ),|()|( wxuExuE = . − Para justificar a propriedade d), basta invocar que nos valores esperados condicio- nados por w, as funções de w são consideradas constantes. − Para provar a propriedade e), começa-se por notar que 0)|( =wuE . Então, devido à propriedade a), tem-se 0=== )}|()({})|)({(})({ wuEwhEwuwhEEuwhE . Fica ao cuidado do leitor verificar que 0)( =uE e que 0),(Cov =uwj . − Pode referir-se dois casos particulares importantes da propriedade f): − )|()}|({ 22 wzEwzE ≤ ; − Se 0>z , então }|)ln({)}|(ln{ wzEwzE −≤− , ou )}|(ln{}|){ln( wzEwzE ≤ . − As propriedades h) e j) são passíveis de comentário semelhante ao da propriedade a): o problema do cálculo directo de )(Var z ou de ),(Cov 21 zz é decomposto em ou- tros problemas mais simples. Por exemplo, para determinar ),(Cov 21 zz , primeiro de- termina-se )|,(Cov)( 2112 wzzwσ = , )|()( 11 wzEw =µ e )|()( 22 wzEw =µ . Em segui- da, calcula-se )}({ 12 wE σ e )}(),({Cov 21 ww µµ . − Como consequência da propriedade i), pode provar-se que Capítulo 1 – Introdução 34 (1.31) )},|(Var{)}|(Var{ vwzEwzE ≥ . Com efeito, atendendo à propriedade i), }|),|(Var{)|(Var wvwzEwz ≥ , porquanto 0}|),|({Var ≥wvwzE . Então, devido à propriedade a), tem-se )},|(Var{})|),|(Var{()}|(Var{ vwzEwvwzEEwzE =≥ . O resultado (1.31) pode ser interpretado da seguinte maneira: em média, a dispersão de z condicionada por certas variáveis não aumenta quando se acrescentam variáveis condicionantes. Em particular, quando )|(Var wz e ),|(Var vwz são constantes, vem ),|(Var)}|(Var vwzwz ≥ . − A propriedade k), que generaliza as propriedades h) e j), vai ser analisada com de- talhe. Considerando o vector aleatório = mz z z z M 2 1 , a respectiva matriz das covariâncias é dada por = )(Var),(Cov),(Cov ),(Cov)(Var),(Cov ),(Cov),(Cov)(Var )Cov( 21 2212 1211 mmm m m zzzzz zzzzz zzzzz z L MMM L L . Do mesmo modo, tem-se = )|(Var)|,(Cov)|,(Cov )|,(Cov)|(Var)|,(Cov )|,(Cov)|,(Cov)|(Var )|Cov( 21 2212 1211 wzwzzwzz wzzwzwzz wzzwzzwz wz mmm m m L MMM L L , ou , )()()( )()()( )()()( )|Cov( 21 22221 11211 = www www www wz mmmm m m σσσ σσσ σσσ L MMM L L onde )|,(Cov)( wzzw jiij =σ , para mji ,,2,1, K= . Então, = )}({)}({)}({ )}({)}({)}({ )}({)}({)}({ )}|Cov({ 21 22221 11211 wEwEwE wEwEwE wEwEwE wzE mmmm m m σσσ σσσ σσσ L MMM L L . Capítulo 1 – Introdução 35 Também se tem = = )( )( )( )|( )|( )|( )|( 2 1 2 1 w w w wzE wzE wzE wzE mm µ µ µ MM , onde )|()( wzEw ii =µ , para mi ,,2,1 K= . Então, = )}({Var)}(),({Cov)}(),({Cov )}(),({Cov)}({Var)}(),({Cov )}(),({Cov)}(),({Cov)}({Var )}|({Cov 21 2212 1211 wwwww wwwww wwwww wzE mmm m m µµµµµ µµµµµ µµµµµ L MMM L L . Por exemplo, verifica-se imediatamente que )}.(),({Cov)}({ )}|(),|({Cov)}|,(Cov{),(Cov 4224 424242 wwwE wzEwzEwzzEzz µµσ += += Suponha-se que se pretende analisar os efeitos parciais das variáveis explicati- vas observáveis (as componentes do vector w) sobre a variável explicada, z, consideran- do explicitamente factores não observáveis. Seja, então, o valor esperado condicionado estrutural, ),|(),(1 vwzEvw =µ , onde v representa o vector dos factores não observáveis (designado por heterogeneidade não observada). Para simplificar a exposição vai su- por-se que v é um escalar (a análise é imediatamente generalizável quando v é um vec- tor). A análise vai ser feita para o caso em que jw (componente genérica de w) e z são variáveis aleatórias contínuas e )(1 ⋅µ é derivável pelo menos em relação a jw [fica ao cuidado do leitor proceder a análise semelhante quando estas variáveis são quantitativas, mas não necessariamente contínuas; quando jw é binária, os efeitos parciais são obtidos determinando as diferenças de )(1 ⋅µ para os dois valores de jw ]. Para o caso em estudo, e para uma variação infinitesimal de jw , o efeito parcial médio de jw sobre z é jj j w vw w vwzEvw ∂ ∂ = ∂ ∂ = ),(),|(),( 1µθ . Como, em geral, este efeito parcial depende de v, não é possível estimá-lo. Con- tudo, em certas condições, é possível determinar o valor esperado de ),( vwjθ , a partir da distribuição de v. Este valor esperado avaliado em 0w (valor assumido por w) é dado por )},({)( 00 vwEw jvj θδ = . Supondo que v é contínua, com densidade vf , vem ∫ℜ= dvvfvww vjj )(),()( 00 θδ . Capítulo 1 – Introdução 36 Note-se que: ),( vwjθ é o efeito parcial de jw sobre o comportamento médio de z; )( 0wjδ é a média ou o valor esperado deste efeito (em relação a v). É possível estimar )( 0wjδ a partir de um valor esperado condicionado que de- penda apenas de variáveis condicionantes observáveis? Em geral, a resposta é não. Con-tudo, estabelecendo hipóteses sobre a relação entre v e w, é possível estimar )( 0wjδ . As hipóteses são as seguintes: 1) Independência condicional. Os factores explicativos v e w são condicionalmente independentes em relação a um vector q de variáveis observáveis, )|()|()|,( qwFqvFqwvF wv= , onde F é a função de distribuição conjunta, e vF e wF são as respectivas funções de distribuição marginais. Em muitos casos, o vector q pode ser considerado como um vector de variáveis proxy. Quando q é vazio, a independência condicional reduz-se à independência entre v e w. 2) O vector q é redundante ou ignorável no valor esperado condicionado estrutural, ou seja, ),|(),,|( vwzEqvwzE = . Pode provar-se que ∂ ∂ = j qj w qwzEEw ),|()( 0 0δ . Com efeito, fazendo ),|(),(2 qwzEqw =µ , tem-se ∫ℜ=== dvqvfvwqwvwEqwqvwzEEqw )|(),(},|),({},|),,|({),( 112 µµµ , onde: a primeira igualdade decorre a lei do valor esperado iterado; a segunda, resulta da hipótese da redundância; a terceira, é consequência da independência condicional. Deri- vando parcialmente, e supondo que a derivada parcial é permutável com o integral, vem ∫ℜ=∂ ∂ dvqvfvww qw j j )|(),(),(2 θµ . Para 0ww = , o segundo membro desta igualdade é }|),({ 0 qvwE jθ . Então, )(})|),({(),( 00 0 2 wqvwEEw qwE jj j q δθ µ == ∂ ∂ . A utilidade deste resultado é a seguinte: a heterogeneidade não observada, v, de- sapareceu totalmente, e ),|(),(2 qwzEqw =µ pode ser estimado porque ),,( qwz é ob- servável. Dispondo desta estimativa quando 0ww = , ),(ˆ 02 qwµ , a estimação do efeito parcial médio para 0ww = consiste em determinar a média amostral de jw qw ∂ ∂ ),(ˆ 02µ . Capítulo 1 – Introdução 37 1.7 - Análise empírica Proposto um modelo teórico para explicar as relações entre as variáveis em estu- do, é indispensável avaliar a sua adequação à realidade, por meio da estimação dos pa- râmetros desconhecidos, nomeadamente para explicar ou prever a evolução do fenó- meno. Então, torna-se necessário dispor de um modelo econométrico que permita proce- der a uma análise empírica das relações propostas [por exemplo, estimar as funções re- feridas nos exemplos 1.1 a 1.10 e fazer a respectiva inferência estatística (construir in- tervalos de confiança; efectuar testes de hipóteses) sobre os respectivos parâmetros]. Como é fácil de compreender, o modelo teórico não está preparado para a análi- se empírica. Para dar operacionalidade ao modelo teórico é necessário ter em conta, entre outros, os seguintes aspectos: 1) Especificar as relações funcionais do modelo (propor as respectivas expressões analíticas), e estabelecer, se for caso disso, restrições sobre os parâmetros. 2) Estabelecer hipóteses sobre o comportamento probabilístico das variáveis, dan- do especial atenção às variáveis não observáveis. 3) Conhecer ou delimitar a população subjacente ao modelo. Como o modelo diz res- peito à população em estudo, pode dizer-se que as variáveis consideradas represen- tam a respectiva população. 4) Adoptar um processo de amostragem (processo para obtenção dos dados), ou esta- belecer hipóteses sobre o processo de amostragem subjacente ao fenómeno em estu- do. 5) Dispor de observações das variáveis, que são os dados ou a amostra do modelo. 6) Utilizar os métodos adequados para obter estimativas dos parâmetros. 7) Dispor de técnicas que permitam efectuar inferências estatísticas. O tópico 1) já foi abordado, ainda que de forma pouco sistemática. No entanto, nas secções 1.3 e 1.5 deu-se particular relevo a um tipo particular de especificação das relações funcionais: as relações lineares ou linearizáveis. Também nos exemplos tem havido, embora parcialmente, este tipo de preocupações [no exemplo 1.4 é proposta uma especificação para a relação explicativa de lsalar, mas o mesmo não acontece no exemplo 1.5 a propósito da relação que explica a variável nest; no exemplo 1.1 referiu- se que o parâmetro 2α deveria obedecer à condição 10 2 <<α ; etc.]. Como o tópico 2) tem a ver com as hipóteses que, em cada caso, se propõem so- bre o comportamento probabilístico das variáveis, é óbvio que, em termos gerais, pouco há a dizer; o assunto vai ser sistematicamente retomado nos capítulos que se seguem. Os tópicos 3), 4) e 5) são comentados na próxima secção, a propósito da nature- za dos dados. Esta abordagem preliminar deve servir para reforçar a ideia de que as questões relacionadas com a população e com a amostra devem ser uma preocupação permanente nos desenvolvimentos teóricos dos capítulos seguintes, e nas aplicações práticas. Os tópicos 6) e 7) dizem respeito aos métodos econométricos, e serão estudados aprofundadamente nos restantes capítulos. Capítulo 1 – Introdução 38 Os comentários anteriores permitem ter uma noção aproximada das caracterís- ticas que deve ter um modelo econométrico. Pode apresentar-se uma definição preli- minar, uma vez que está esclarecido o alcance e o sentido da premissa básica da Econo- metria (as variáveis observáveis, e as respectivas observações, são variáveis aleatórias). Definição 1.2 – Modelo econométrico Um modelo econométrico é uma família de distribuições conjuntas das observações das variáveis explicadas e das variáveis explicativas, a verificar um conjunto de restrições ou hipóteses. 1.8 - Estruturas de dados As duas categorias básicas de dados são as seguintes: a) Dados seccionais. Os dados são seccionais quando as observações se referem a de- terminadas entidades (unidades seccionais) em certa data (momento ou período de tempo). Por exemplo: as quantidades produzidas e as quantidades de factores de produção utilizados nas empresas de uma certa indústria num determinado ano; as despesas em bens de consumo e as receitas das famílias em determinado mês. Este tipo de dados pode ser apresentado num quadro onde a chave identificadora é o nome da unidade seccional (US). Como é habitual, tz ),,2,1( nt K= representa a observação genérica de z, e tjw ),,2,1;,,2,1( pjnt KK == é a observação genérica da variável explicativa jw (ver quadro 1.1). Quadro 1.1 Dados seccionais N.º US z 1w 2w … pw 1 1US 1z 11w 12w … pw1 2 2US 2z 21w 22w … pw2 M M M M M M n nUS nz 1nw 2nw … npw Nalguns casos, pode acontecer que os dados não correspondam exactamente, para todas as entidades observadas, à mesma data. No entanto, se os dados se referem a datas relativamente próximas, pode considerar-se que fazem parte do mesmo con- junto de dados seccionais. Por exemplo, se há observações de despesas e de recei- tas de certas famílias realizadas num certo mês, e há observações de outras famílias feitas no mês seguinte, é lícito, em muitos casos (depende dos meses!), supor que esta pequena variação temporal não afecta significativamente a análise empírica. Uma característica fundamental dos dados seccionais é que a ordem das observa- ções é irrelevante (pouco importa qual é a primeira família observada ou a vigési- ma quinta!). Capítulo 1 – Introdução 39 Os dados seccionais são muito utilizados em Economia (e noutras Ciências Sociais), e, em especial, em certos ramos da microeconomia aplicada (economia do traba- lho, finanças públicas locais, economia regional e urbana, demografia, economia da saúde, economia da educação, etc.). b) Dados temporais. Os dados são temporais ou cronológicos quando as observações se referem a uma mesma entidade, para várias datas (momentos ou períodos de tem- po). Por exemplo: as quantidades produzidas por ano e as quantidades de factores de produção utilizados anualmente numa determinada indústria; o consumo e o rendi- mento disponível trimestrais num determinado país. Quando os dados são numéricos, e se pretende descrever a evolução no tempo dos valores observados, os dados devem, como é evidente, conservar-se associados à da- ta em que ocorreram, e apresentarem-se sob a forma de série temporal, dando ori- gem
Compartilhar