Baixe o app para aproveitar ainda mais
Prévia do material em texto
No final da monitoria da última sexta-feira, dia 19 de março, nosso último exercício no Stata envolveu a quebra do procedimento tradicional de estimação dos parâmetros do modelo em duas etapas, cada uma destas duas menos custosas computacionalmente quando feitas individualmente. Apesar da implementação no Stata ter sido feita corretamente, o esquema que desenhei na lousa para explicar o que estava acontecendo de um ponto de vista mais intuitivo deve ter gerado alguma confusão por causa de um erro, inclusive porque um aluno me chamou a atenção para isso. Portanto, a seguir, na seção 1 (chamada Partialling Out), repetirei a explicação intuitiva e esquemática do procedimento, com a correção necessária em relação ao que expus durante a monitoria. Em seguida, na seção 2, farei comentários breves sobre o comando count do Stata, sobre o qual também surgiu uma dúvida. ___________________________________________________ 1) Partialling Out Talvez pensar que são três etapas, e não duas, seja melhor. Seja o modelo que queremos estimar dado por Podemos estimar todos os parâmetros simultaneamente ou pelo procedimento de três etapas. Este procedimento de três etapas, uma vez finalizado, terá nos fornecido a estimativa de apenas um dos parâmetros de interesse. Assim sendo, vamos supor que o parâmetro de interesse para um pesquisador seja o , e que ele tenha incluído a variável no modelo apenas para evitar o problema da omissão de variável relevante (que vimos no exercício sobre cigarros, renda familiar e saúde da criança ao nascer). Então, o pesquisador segue os seguintes passos: ETAPA 1: regredir a variável ligada ao parâmetro de interesse (no caso, ) contra todas as outras variáveis explicativas do modelo (no caso, só há uma, que é ), e salvar os resíduos desta regressão. Em notação matemática, trata-se de regredir e salvar os resíduos . ETAPA 2: regredir a variável dependente (no caso, ) contra todas as variáveis explicativas exceto a variável ligada ao parâmetro de interesse (no caso, só há uma, que é ), e salvar os resíduos desta regressão. Em notação matemática, trata-se de regredir e salvar os resíduos . ETAPA 3: regredir os resíduos da segunda regressão contra os resíduos da primeira regressão. Em notação matemática: onde faz o papel do termo de erro aleatório de sempre. No final destas etapas, teremos em mãos a estimativa , que é idêntica à estimativa que obteríamos se tivéssemos regredido o modelo original numa etapa só, como estamos acostumados a fazer. Ou seja, necessariamente. Cabem algumas observações importantes sobre este procedimento de três etapas. Obs. 1: o procedimento funcionaria igualmente se omitíssemos a etapa 2 e regredíssemos onde faz o papel do termo de erro aleatório de sempre. Neste caso teríamos que , também necessariamente. Na verdade, a explicação que o Wooldridge faz sobre este tópico é sem a etapa 2. Em álgebra matricial esta equivalência é relativamente fácil de mostrar. Obs. 2: Os outros parâmetros do modelo original, isto é, e , podem ser recuperados através de fórmulas matemáticas apropriadas a partir da estimativa . Obs. 3 : O esquema que desenhei na lousa com flechas durante a monitoria foi para comunicar a idéia de regredir contra e contra . Mas na verdade, por essa lógica o parâmetro de interesse seria o . Como toda a explicação que fiz, tanto neste texto quanto na monitoria, foi citando o , então o esquema de setas deveria ter sido Este procedimento em etapas é explicado brevemente pelo Wooldridge numa das seções do capítulo 3, chamada A "Partialling Out" Interpretation of Multiple Regression, que está na página 76 da 2a edição do livro. Para quem já tiver facilidade com econometria em notação matricial e estiver interessado em saber mais deste procedimento, pode consultar o livro do Greene, Econometric Analysis, que no capítulo 3 tem uma das seções explicando tal procedimento, chamado de Frisch-Waugh Theorem no Greene. ________________________________________________________ 2) Comando count do Stata O comando count foi usado na monitoria para contar o número de observações do banco de dados que atendia alguma característica. Por exemplo count if age<40 contaria o número de observações cuja idade é estritamente menor que 40. Para adicionar mais condições basta usar o símbolo "&". Por exemplo count if age<40 & salary>100 contaria o número de observações com idade estritamente menor que quarenta mas que, ao mesmo tempo, tivesse salário estritamente acima de 100 mil dólares. Também podemos pedir para o Stata contar o número de observações que atenda uma ou outra condição. Por exemplo count if age<40 | salary>100 contaria o número de observações com idade estritamente menor que 40 ou salário estritamente maior que 100 mil dólares, ou ambos simultaneamente. Para saber mais sobre qualquer comando que usamos, vocês podem usar o help do Stata. Para isso, basta digitar, na janela de comando help comando Por exemplo, help summarize, help count, help predict, e assim por diante. O help do Stata é um pouco incômodo de usar porque ele usa uma linguagem (não no sentido computacional) própria para descrever e explicar os comandos. Sugiro que antes de dar o help para qualquer comando, vocês digitem help language pois assim será aberto o help explicando a linguagem usada pelo programa para explicar seus comandos das próximas vezes que vocês usarem o comando help. Um site bem legal para consolidar os conhecimentos iniciais em Stata é um da University of California Los Angeles (UCLA): http://www.ats.ucla.edu/stat/stata/ _1330597496.unknown _1330597990.unknown _1330599881.unknown _1330600086.unknown _1330600117.unknown _1330600131.unknown _1330600102.unknown _1330598353.unknown _1330598227.unknown _1330598263.unknown _1330597803.unknown _1330597905.unknown _1330597775.unknown _1330597781.unknown _1330597537.unknown _1330596945.unknown _1330597067.unknown _1330597124.unknown _1330596953.unknown _1330596738.unknown _1330596830.unknown _1330596820.unknown _1330596566.unknown _1330596599.unknown
Compartilhar