Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESPECIFICAÇÃO Natureza Consequência Como é detectada? Medidas Corretivas Como é feita a estimativa? É possível usar MQO? Explique Multicolinearidade Originalmente, siginificava a existência de uma relação linear "perfeita" ou exata entre algumas ou todas as variáveis explicativas. Hoje, o termo multicolinearidade é usado em um sentido mais amplo, para incluir o caso de multicolinearidade perfeita, bem como o caso de em que as variáveis X estão intercorrelacionadas, mas não perfeitamente. Se a multicolinearidade for perfeita, os coeficientes de regressão das variáveis X serão indeterminados e seus erros padrão, infinitos. Se a multicolinearidade for menos que perfeita, os coeficientes de regressão, embora determinados, possuirão grandes erros padrão (em relação aos próprios coeficientes), o que signifca que os coeficientes não podem ser estimados com grande exatidão Covâriancia e Variância Regras práticas: Descreva cada uma. Não Fazer nada. Sim. Ter uma informação a priori. É tratado o exemplo sobre consumo (Y) sendo afetado por riqueza (X2) e renda (X3). Ora, se temos a informação de que há um forte grau entre as variáveis X2 e X3, porque manter as duas no modelo, basta rodar o modelo apenas com uma. Embora sejam os melhores estimadores lineares não visados, os estimadores de MQO têm grandes variâncias covariâncias, tornando díficil umas estimação precisa. Não temos um método único para detectá - la ou para medir sua força. O que temos são regras práticas; algumas informais e outras formais, mas, ainda sim são regras práticas. 1. R² alto, mas poucas razões t significativas. 2. Altas corelações entre pares de regressores. 3. Exame de correlações parciais. 4. Regressões aixiliares. 5. Autovalores e índice condicional. 6. Tolerância e valor de inflação da variância. 7. Diagrama de dispersão. A muticolineariedade é de vontade dívina (algo foge ao nosso controle). Blachard diz que a multicolinearidade é um problema de deficiência dos dados e as vezes não temos escolha sobre os dados disponíveis para análise empírica. Intervalo de Confiânça e Razão t Fazer alguns procedimentos: Descreva cada um deles. Dados os erros padrão grandes, os intervalos de confiança tendem a ser maiores, levando a aceitação da hipótese nula igual a zero. Como os erros padrão aumentam, torna os valores t menores e tende a ser estatisticamente insignificante. Podemos tentar seguir algumas regras práticas para devolver o problema da multicolineariedade; o sucesso dependerá da gravidade do problema da colinearidedade. 1. Uma informação a priori. 2. Combinando dados de corte transversal e de séries temporais. 3. Exclusão de variável(is) e viés de especificação. 4. Transformação de variáveis. 5. Dados adicionais ou novos. 6. Reduzindo a colinearidade em regressões polinominais. 7. Outros métodos de remediar a multicolineariedade. Técnicas estatísticas multivariadas como a análise de fator e componentes principais ou técnicas como regressão ridge são empregadas com frequência para "resolver" o problema de multicolineariedade. Ocorre devido a alguns fatores: R² 1.O método de coleta de dados empregado (ex: amostragem de uma faixa limitada de valores pelos regressores da população) 2. Restrições ao modelo ou à população que está sendo amostrada (ex: regressão de consumo de eletricidade contra renda e o tamanho da casa, há uma restrição no sentido de que famílias com rendas mais altas em geral têm casas maiores que as com rendas mais baixas.) 3. Especificação do modelo 4. Um modelo sobredeterminado - isto acontece quando o modelo tem mais variáveis explanatórias que o número de observações. R² tem alto valor , muito próximo de 1 porque temos variáveis altamente correlacionadas. Micronumeriosidade Análise baseada em uma amostra de tamanho pequeno ou zero. Heterocedasticidade Razões para as variâncias de ui poderem ser variáveis MQO admitindo-se a Heterocedasticidade Métodos informais Quando sigma² é conhecido: Não. O que mantém o modelo aderente ao MELNT é a variância constante 𝜎2, Para verificar isso temos que analisar os resultados para dois aspectos um considerando a tendenciosidade e outro considerando a eficiência do modelo. O fato de ser homocedástica ou heterocedástica não influencia na tendenciosidade do estimador 𝛽2 onde 𝐸 𝛽2 = 𝛽2 , onde mesmo na presença de heterocedasticidade, em amostras grandes o estimador continua consistente, e portanto, não tendencioso. Porém a eficiência é algo que não pode ser mantido. Pois dada a presença de heterocedasticidade ele deixa de apresentar a variância mínima, ou seja, ele deixa de ser MELNT. Isso porque: 𝑣𝑎𝑟 𝛽2 = 𝑥𝑖 2 𝜎𝑖 2 𝑥𝑖 2 2 Aumenta conforme 𝜎𝑖 2 Pelo fato de o estimador MQO deixar de ser MELNT temos que encontrar uma forma de tornar o estimador MELNT, para tanto, é utilizado o Método do Mínimos Quadrados Generalizados (MQG). Basicamente tal método incorpora pesos ou importâncias que ajudam a explicar o comportamento da variância, ou seja, considerar o seu efeito na hora do cálculo do estimador 1. Seguindo os modelos de erro-aprendizagem, à medida que as pessoas aprendem, oa erros diminuem ou o número de erros tornam-se mais consistentes. (ex.: Expectativas adaptativas e horas de digitação e erros). 2. À medida que a renda aumenta, as pessoas têm mais recursos à sua disposição e, portanto, mais opções para escolher como aplicarão a sua renda. Por isso, é provável que ..... aumente com a renda. Do mesmo modo, se espera que as empresas com lucros maiores mostrem maior variabilidade em suas políticas de dividendos que aquelas com lucros mais baixos. 3. À medida que as técnicas de coletas de dados se aprimoram, é provável que ...... diminua. Dessa forma, instituições que contam com ferramentas mais sofisticadas de precessamento de dados tendem a disponibilizar informações mais precisas (com menos erros) para os seus clientes ou órgâos interessados do que instituições que não contem com essas ferramentas. 4. A heterocedasticidade também pode ser resultado da presença de dados discrepantes (outliers), Uma observação discrepante difere muito (muito menor ou muito maior) em relação às observações da amostra. A exclusão ou inclusão de uma observação discrepante pode alterar consideravelmente os resultados da análise de regressão. 5. O modelo está especificado de forma incorreta, ou seja, a violação da hipótese 9 do modelo de regressão linear clássico. Muitas vezes, algumas variáveis importantes são omitidas do modelo de regressão e isso nos dá a impressão de tratar-se de heterocedasticidade. 6. Assimetria na distribuição de um ou mais regressores incluídos no modelo. Exemplos são variáveis econômicas como renda, riqueza e educação. À título de exemplo, sabe-se que a distribuição de renda e riqueza na Brasil é desigual, sendo maior parcela da renda e riqueza do país detida por uma parcela mínima da população. 7. A heterocedasticidade também pode surgir em virtude de: Transformação incorreta de dados (ex.: transformações proporcionais ou de primeira diferença); e Forma funcional incorreta (ex.: modelos lineares versus log-lineares). Dada a presença de heterocedasticidade ele(MQO) deixa de apresentar a variância mínima, ou seja, ele deixa de ser MELNT. Pelo fato de o estimador MQO deixar de ser MELNT temos que encontrar uma forma de tornar o estimador MELNT, para tanto, é utilizado o MQG. Basicamente tal método incorpora pesos ou importâncias que ajudam a explicar o comportamento da variância, ou seja, considerar o seu efeito na hora do cálculo do estimador. Natureza do problema Com muita frequência, a natureza do problema em consideração sugere a probabilidade de encontrarmos heterocedasticidade.Nas verdade, em dados de corte transversal envolvendo unidade heterogêneas, a heterocedasticidade pode ser a regra e não a exceção. Método gráfico Na prática, pode-se fazer a análise de regressão suponho-se que não há heterocedasticidade e então fazer um exame post mortem dos resíduos elevados ao quadrado û²i para ver se exivem um padrão sistemático. 𝝈𝒊 𝟐 Conhecido: uso dos Mínimos Quadrados Ponderados ou Generalizados. Quando aplicamos o MQP corrigimos a heterocedasticidade, tornando os estimadores MELNT. Diferença entre MQO e MQG MQO desconsiderando a Heterocedasticidade Métodos formais Quando sigma² não é conhecido: O método dos MQO não "usa" as informações contidas na variabilidade desigual da variável dependente Y. Ele atribui pesos ou importâncias iguais a cada observação. Contudo, um método de estimação conhecido como mínimos quadrados generalizados (MQG), leva tais informações em consideração explicitamente e, portanto, é capaz de produzir estimadores MELNT. O procedimento de transformar as variáveis originais de forma que tais tranformações satisfaçam do modeli clássico, e então aplicar os MQO a elas é conhecido como o método de MQG. Em síntese, os MQG são os MQO nas variáveis tranformadas que satisfazem as hipóteses padrão de mínimos quadrados. Os estimadores assim obtidos são conhecidos como estimadores MQG e eles são MELNT. O fato de ser homocedástica ou heterocedástica não influencia na tendenciosidade do estimador 𝛽2 (ver apêndice 3A do capítulo 3), onde 𝐸 𝛽2 = 𝛽2 , onde mesmo na presença de heterocedasticidade, em amostras grandes o estimador continua consistente, e portanto, não tendencioso. Porém, com a heterocedasticidade, a eficiência é algo que não pode ser mantido. Tratam-se dos testes para verificação da existência ou não da heterocedasticidade. São testes que são realizados com base nos resíduos da regressão. A grande maioria parte do pressuposto que na regressão existe homocedasticidade, portanto, a hipótese nula do teste consiste em: 𝐻0: 𝐻𝑜𝑚𝑜𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑐𝑖𝑑𝑎𝑑𝑒 𝐻1: 𝐻𝑒𝑡𝑒𝑟𝑜𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑐𝑖𝑑𝑎𝑑𝑒 Uma vez que os verdadeiros sigma²i raramente são conhecidos, haverá uma forma de obter estimativas consistentes (no sentido estatístico) das variâncias covariâncias dos estimadores de MQO, mesmo quando há heterocedasticidade. Variâncias e erros padrão consistes para heterocedasticidade de White. Hipótese plausíveis sobre o padrão de heterocedasticidade: Hipóttese 1: Avariância do erro é proporcional à X²i; Hipótese 2: A variância do erro é proporcional à Xi; Hipótese 3: A variância do erro é proporcional ao quadrado do valor médio de Y; Hipótese 4: Uma tranformação logarítmica muito frequente reduz a heterocedasticidade. Teste de correlação por ordem de Spearman Teste geral de heterocedasticidade de White Em casos que o teste estatístico de White é estatisticamente significante, a heterocedasticidade pode não ser necessariamente a causa, mas os erros de especificação. O teste de White pode ser um teste de heterocedasticidade (pura) ou de erro de especificação ou ambos. Já afirmamos que, se não houver termos de produtos cruzados, ele será um teste de heterocedasticidade pura. Se tais termos estão presentes, trata-se de um teste tanto de heterocedasticidade quanto de viés de especificação. Autocorrelação Razões de ocorrer correlação serial. Descreva cada uma MQO considerando a autocorrelação Método gráfico Especificação equivocada do modelo versus autocorrelação pura Não. No caso desse estimador MQO podemos verificar que sua variância é determinada pela existência ou não da autocorrelação. Se p for diferente de zero então teremos uma variância que não será mínima. Com isso, não podemos concluir que o estimador seja EFICIÊNTE, apesar de ainda ser linear e não tendencioso. Porém, assim como o ocorrido com a heterocedasticidade, é possível encontrar, quando conhecemos a variância, o estimador de MQG, que por sua vez, será mais eficiente. Autocorrelação Inércia – Uma das principais características das séries temporais econômicas é a inércia ou lentidão. Como sabemos, séries temporais como o PNB, índices de preços, a produção, o emprego e o desemprego registram ciclos (econômicos). Partindo do fundo da recessão, quando tem início a recuperação econômica, a maioria dessas séries começam a mover-se em um sentido ascendente. Nesse movimento, o valor da série em um ponto do tempo é maior que o anterior. Há um impulso embutido nele que continua até que algo aconteça (um aumento nas taxas de juros, nos impostos ou em ambos) para desacelerá- lo. Portanto, em regressões que envolvem séries temporais, as observações sucessivas tendem a ser interdependentes. Autocorrelação Viés de especificação – podemos iniciar com um modelo de regressão que pode não ser o mais “adequado”. Depois de averiguarmos se tal modelo atendem ou não nossas expectativas, caso não atenda devemos verificar se a falta de alguma variável está influenciando nos resíduos ao ponto de causar os padrões que indicam a autocorrelação. Esse é o caso do VIÉS DE ESPECIFICAÇÃO DA VARIÁVEL EXCLUÍDA. Muitas vezes a inclusão de tais variáveis elimina o padrão de correlação observado entre os resíduos. Autocorrelação Viés de especificação: forma funcional incorreta – Já foi verificado em outras situações como a forma funcional pode afetar os resíduos, permitindo que seus resultados se afastem da reta de regressão. O mesmo fenômeno pode também gerar autocorrelação em nossa regressão. Autocorrelação O fenômeno da teia de aranha - Esse aspecto está relacionado a influência que o comportamento de uma variável defasada causa e o tempo em que as alterações provenientes desse impacto levam para afetar a variável dependente. Um exemplo a ser verificado é o impacto dos preços sobre os produtos agrícolas. Autocorrelação Defasagens – Em uma regressão de despesas sobre a renda cujos dados são séries temporais, verificamos frequentemente que as despesas do período atual dependem, dentre outras coisas, das despesas do período anterior. Isto é, 𝐶𝑜𝑛𝑠𝑢𝑚𝑜𝑡 = 𝛽1 + 𝛽2 𝑟𝑒𝑛𝑑𝑎𝑖 + 𝛽3 𝐶𝑜𝑛𝑠𝑢𝑚𝑜𝑡−1 + 𝑢 𝑡 Uma regressão desse tipo é conhecida como autorregressão ou modelo autorregresivo. Isso porque, uma das variáveis explanatórias é o valor defasado da VARIÁVEL DEPENDENTE. A lógica destes modelos é simples, pois os consumidores não alteram facilmente os seus hábitos de consumo por motivos psicológicos, tecnológicos ou institucionais. Autocorrelação Manipulação e transformação dos dados – A manipulação de dados em séries temporais surgirá da necessidade de se preencher buracos nas séries. Por exemplo, se quisermos analisar o censo demográfico do Brasil temos eles apenas para os anos de 1970, 80, 90, 2000 e 2010. E os anos entre esses períodos, como analisa-los. Já no que se refere a transformação, devemos usar algumas técnicas para permitir que as séries temporais se tornem estacionárias ao logo do tempo. Assim como na heterocedasticidade, os estimadores de MQO ainda são lineares e não tendenciosos, porém tornam-se ineficientes.Vamos então verificar as consequências de se forçar a estimação dos betas ignorando o fenômeno da autocorrelação. Já verificamos que na presença da autocorrelação o estimador de MQG é o mais adequado, tendo em vista que esse estimador incorpora a influência que a autocorrelação estabelece nos erros. Lembre-se de que a hipótese da ausência da autocorrelação do modelo clássico refere-se aos termos de erro da população, ût. Muitas vezes um exame visual dos ût dá algumas pistas sobre a provável presença de autocorrelação. Na verdade, um exame visual de ût ou ût² pode fornecer informações úteis não apenas quanto à autocorrelação, mas também quanto à heterocedasticidade ou aos vieses de especificação. Com base no teste d, podemos concluir que há uma relação positivano termo de U, geralmente os dados que embasam a regressão são séries temporais, é bem possível que apresentem TENDÊNCIAS. Incluir a variável T (tempo ou tendência) para ver a relação sem as tendências das duas variáveis. Talvez o valor d ainda fique muito baixo, sugerindo que apresenta autocorrelação pura. É a especificação correta? Para isso fazer a regressão de Y contra X e X2, para demonstrar uma relação não linear com Y. Os resultados possivelmente tornara os coeficientes altamente significativos do ponto de vista estático e os valores P extremamente pequenos. O termo quadrático negativo sugere autocorrelação positiva dos resíduos. Concluindo assim que a análise de regressão é afetada por uma autocorrelação pura.MQO não considerando a autocorrelação O teste das carreiras Correção da autocorrelação (pura): o método dos mínimos quadrados generalizados (MQG) A situação torna-se potencialmente muito grave se, além de não utilizarmos ^B2, também continuamos a usar var (^B2)= sigma² / somatorio de x²t, que ignora por completo o problema da autocorrelação. Em outras palavras, se acreditarmos erroneamente que as hipóteses habituais do modelo clássico mantêm-se válidas. Quando fazemos uma estimação por meio de MQO não considerando a autocorrelação, os testes comuns de significância t e F deixam de ser válidos e, se aplicados, provavelmete nos levarão a conclusões extremamente equivocadas sobre a significância estatística dos coeficientes de regressão estimados. O teste de carreiras, também conhecido como teste de Geary ou teste de Wald-Wolfowitz é um teste de aleatoriedade, e será aplicado aos resíduos do modelo. Ele se baseia nos sinais dos resíduos da regressão. Lembrando que os resíduos tem media zero, e assim, o que o teste verifica é se os padrões dos resíduos acima e abaixo da média(zero) são aleatórios. O teste pode ser estendido com médias diferentes de zero, basta aplicar o teste à série com a média subtraída. Uma das consequências da autocorrelação é a falta de eficiência dos estimadores de MQO, pode ser necessário corrigi-los. A correção depende do conhecimento da estrutura da autocorrelação Geralmente o MQG se enquadra no termo de erro AR ( Auto regressão de primeira ordem). Verificar se o rô é conhecido ou rô é desconhecido. Para rô conhecido para resolve-lo: Se for verdadeiro no período t, também será verdadeiro no período t-1. Se rô for desconhecido: Aplica-se o método da primeira diferença, supondo que rô esta entre 0 e+- 1; rô=0 não ha correlação serial ( de primeira ordem); rô= +- 1 há perfeita correlação.Maddala sugeriu de forma grosseira a regra prática: Empregue a forma da primeira diferença sempre que d > R2. O modelo de primeira diferença não tem, intercepto, e permite testar uma variável de tendência no modelo original. A transformação em primeira diferença atende ao duplo sentido de livrar a autocorrelação ( de primeira ordem) e de tornar a série temporal estacionária. Novamente, a transformação em primeira diferença pode ser adequada se rô for alto e d baixo. Em termos rigorosos, a transformação de primeira ordem só é válida se rô = 1. O teste d de Durbin-Watson O método de Newey-West O teste mais famoso para a detecção serial é o desenvolvido pelos estatísticos Durbin e Watson. Popularmente conhecido como estatística d de Durbin-Watson, ele é definido como: (fórmula d) que é apenas a razão da soma das diferenças, elevadas ao quadrado, entre resíduos sucessivos e a SQR. Note que, no numerador da estatística\textit{d}, o número de observações é n - 1, porque perde-se uma observação no cálculo das diferenças sucessivas. Exemplo: tabela 12.4 Em amostras grandes, podemos usar o método Newey- West para obter os erros padrão dos estimadores de MQO que estão corrigidos para a autocorrelação. Esse método na verdade é uma extensão do de erros padrão consistentes para heterocedasticidade de White Um teste geral de autocorrelação: o teste de Breusch– Godfrey (BG) MQO versus MQGF e CHA Nesse método é utilizada a variável defasada, se todos os valores de rô forem iguais a zero, o erro é de igual valor. Nesse teste é usado o ruido Branco que sempre tem média zero e variância constante. O ET(EPSILONT) é o termo de erro do ruído branco. O teste indica que se a for hipótese nula não há correlação serial de qualquer ordem. Lembrando o uso do teste serve apenas para séries temporais. O teste qui-quadrado indica se todos os parametros são simultaneamente diferentes de zero, sempre que trabalhar com qui-quadrado. Se o teste for estatisticamente significativo indica que erros passados estão influenciando valores presentes. O Método de Newey-West para corrigir os erros padrão do MQO. Em vez de utilizarmos o MQG, podemos corrigir os erros- padrão para autocorrelação por um procedimento desenvolvido por Newey e West. Essa técnica é nada mais nada menos que uma extensão dos erros-padrão consistentes de White. Esses erros corrigidos são conhecidos como erros padrão consistentes para heterocedasticidade e autocorrelação (CHA), ou simplesmente erros-padrão de Newey-West. Tal teste é válido apenas para grandes amostras e pode não ser adequado para pequenas amostras.
Compartilhar