Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

<p>See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/308700023</p><p>(CANDEA, 2016) - Econometria Cross-Section: Análise para fins educacionais</p><p>do tipo Cross-Country dos indicadores de WDI do Banco Mundial</p><p>Preprint · August 2016</p><p>DOI: 10.13140/RG.2.2.36367.23204</p><p>CITATIONS</p><p>0</p><p>READS</p><p>835</p><p>1 author:</p><p>Some of the authors of this publication are also working on these related projects:</p><p>(ECONOMETRICS) - Undergraduate Econometrics View project</p><p>(INNOVATION ECONOMICS) - Inovação e Empreendedorismo em Ouro Preto e Região View project</p><p>Bruno Rodrigues Candea</p><p>PwC</p><p>22 PUBLICATIONS   0 CITATIONS</p><p>SEE PROFILE</p><p>All content following this page was uploaded by Bruno Rodrigues Candea on 28 September 2016.</p><p>The user has requested enhancement of the downloaded file.</p><p>https://www.researchgate.net/publication/308700023_CANDEA_2016_-_Econometria_Cross-Section_Analise_para_fins_educacionais_do_tipo_Cross-Country_dos_indicadores_de_WDI_do_Banco_Mundial?enrichId=rgreq-3caf65947ec4900bbc38ded79330e922-XXX&enrichSource=Y292ZXJQYWdlOzMwODcwMDAyMztBUzo0MTEzNTA3NDEzNDAxNjBAMTQ3NTA4NTA2NzEyNQ%3D%3D&el=1_x_2&_esc=publicationCoverPdf</p><p>https://www.researchgate.net/publication/308700023_CANDEA_2016_-_Econometria_Cross-Section_Analise_para_fins_educacionais_do_tipo_Cross-Country_dos_indicadores_de_WDI_do_Banco_Mundial?enrichId=rgreq-3caf65947ec4900bbc38ded79330e922-XXX&enrichSource=Y292ZXJQYWdlOzMwODcwMDAyMztBUzo0MTEzNTA3NDEzNDAxNjBAMTQ3NTA4NTA2NzEyNQ%3D%3D&el=1_x_3&_esc=publicationCoverPdf</p><p>https://www.researchgate.net/project/ECONOMETRICS-Undergraduate-Econometrics?enrichId=rgreq-3caf65947ec4900bbc38ded79330e922-XXX&enrichSource=Y292ZXJQYWdlOzMwODcwMDAyMztBUzo0MTEzNTA3NDEzNDAxNjBAMTQ3NTA4NTA2NzEyNQ%3D%3D&el=1_x_9&_esc=publicationCoverPdf</p><p>https://www.researchgate.net/project/INNOVATION-ECONOMICS-Inovacao-e-Empreendedorismo-em-Ouro-Preto-e-Regiao?enrichId=rgreq-3caf65947ec4900bbc38ded79330e922-XXX&enrichSource=Y292ZXJQYWdlOzMwODcwMDAyMztBUzo0MTEzNTA3NDEzNDAxNjBAMTQ3NTA4NTA2NzEyNQ%3D%3D&el=1_x_9&_esc=publicationCoverPdf</p><p>https://www.researchgate.net/?enrichId=rgreq-3caf65947ec4900bbc38ded79330e922-XXX&enrichSource=Y292ZXJQYWdlOzMwODcwMDAyMztBUzo0MTEzNTA3NDEzNDAxNjBAMTQ3NTA4NTA2NzEyNQ%3D%3D&el=1_x_1&_esc=publicationCoverPdf</p><p>https://www.researchgate.net/profile/Bruno-Candea?enrichId=rgreq-3caf65947ec4900bbc38ded79330e922-XXX&enrichSource=Y292ZXJQYWdlOzMwODcwMDAyMztBUzo0MTEzNTA3NDEzNDAxNjBAMTQ3NTA4NTA2NzEyNQ%3D%3D&el=1_x_4&_esc=publicationCoverPdf</p><p>https://www.researchgate.net/profile/Bruno-Candea?enrichId=rgreq-3caf65947ec4900bbc38ded79330e922-XXX&enrichSource=Y292ZXJQYWdlOzMwODcwMDAyMztBUzo0MTEzNTA3NDEzNDAxNjBAMTQ3NTA4NTA2NzEyNQ%3D%3D&el=1_x_5&_esc=publicationCoverPdf</p><p>https://www.researchgate.net/profile/Bruno-Candea?enrichId=rgreq-3caf65947ec4900bbc38ded79330e922-XXX&enrichSource=Y292ZXJQYWdlOzMwODcwMDAyMztBUzo0MTEzNTA3NDEzNDAxNjBAMTQ3NTA4NTA2NzEyNQ%3D%3D&el=1_x_7&_esc=publicationCoverPdf</p><p>https://www.researchgate.net/profile/Bruno-Candea?enrichId=rgreq-3caf65947ec4900bbc38ded79330e922-XXX&enrichSource=Y292ZXJQYWdlOzMwODcwMDAyMztBUzo0MTEzNTA3NDEzNDAxNjBAMTQ3NTA4NTA2NzEyNQ%3D%3D&el=1_x_10&_esc=publicationCoverPdf</p><p>2016</p><p>ECONOMETRIA CROSS-SECTION:</p><p>UMA ANÁLISE CROSS-COUNTRY</p><p>DOS INDICADORES DE</p><p>INVESTIMENTO DO WDI</p><p>BRUNO CANDEA</p><p>BARBARA WERNER</p><p>TIAGO TEUBER</p><p>THALES GAZOLA</p><p>Banco de dados e script publicados em 09 de agosto de 2016 em:</p><p>https://data.mendeley.com/datasets/gmfc38cdfj/1</p><p>Sumário</p><p>Introdução .........................................................................................................................................................3</p><p>Econometria Cross-Section, análise Cross-Country. .......................................................................3</p><p>Abordando um tema real: Millenium Goals e WDI .........................................................................3</p><p>Especificação dos dados ..........................................................................................................................5</p><p>Especificações técnicas .............................................................................................................................5</p><p>Sistemas operacionais utilizados .......................................................................................................5</p><p>Softwares utilizados ...............................................................................................................................6</p><p>Ferramentas importantes.....................................................................................................................6</p><p>Pacotes utilizados no R ........................................................................................................................6</p><p>Testes e Modelos Iniciais ..............................................................................................................................6</p><p>Especificação do modelo ............................................................................................................................. 7</p><p>Especificação Matemática do modelo de regressão múltipla com testes iniciais ................8</p><p>Testando o modelo criado ........................................................................................................................ 10</p><p>Normalidade dos dados ......................................................................................................................... 10</p><p>Shapiro-Wilk .......................................................................................................................................... 10</p><p>Jarque-Bera ............................................................................................................................................ 10</p><p>Normalidade dos Resíduos ................................................................................................................... 11</p><p>Shapiro-Wilk .......................................................................................................................................... 11</p><p>Jarque-Bera ............................................................................................................................................ 11</p><p>Presença de Outliers ................................................................................................................................ 12</p><p>p-value de Bonferroni ......................................................................................................................... 12</p><p>Análise gráfica dos resíduos ............................................................................................................. 13</p><p>Métrica de Cook ................................................................................................................................... 14</p><p>Heterocedasticidade .............................................................................................................................. 15</p><p>Inspeções gráficas dos resíduos ...................................................................................................... 16</p><p>Breusch-Pagan ...................................................................................................................................... 16</p><p>Goldfeld-Quandt .................................................................................................................................. 17</p><p>Correções da heterocedasticidade ................................................................................................. 17</p><p>Multicolinearidade.................................................................................................................................... 18</p><p>VIF (Variance Inflator Factor) ............................................................................................................ 19</p><p>Correlação (Não-Serial) ..........................................................................................................................</p><p>19</p><p>2</p><p>MQG - Mínimos Quadrados Generalizados ....................................................................................... 20</p><p>MQGF - Mínimos Quadrados Generalizados Factíveis .................................................................... 21</p><p>Comparações finais e escolha do modelo .......................................................................................... 22</p><p>Demonstração da capacidade de estimação do modelo .............................................................. 24</p><p>Filtragens de dados ..................................................................................................................................... 25</p><p>Primeira filtragem de dados ................................................................................................................ 25</p><p>Segunda filtragem de dados ............................................................................................................... 25</p><p>Terceira filtragem de dados ................................................................................................................. 25</p><p>Quarta filtragem de dados ................................................................................................................... 25</p><p>Quinta filtragem de dados ................................................................................................................... 25</p><p>Bibliografia ..................................................................................................................................................... 26</p><p>3</p><p>INTRODUÇÃO</p><p>Em Econometria, podemos destacar três tipos principais de estruturas de dados: Cross-Sections,</p><p>ou cortes no tempo, que relacionam variáveis explicativas a uma variável dependente, em um ponto único</p><p>no tempo, com diversos “itens” (países, cidades, empresas, indivíduos, etc). A seguir, temos as séries</p><p>temporais, estruturas interessantes que fazem esta mesma relação, porém com relação a um “item” de</p><p>cada vez, e ao longo do tempo, e, além destas, temos a análise longitudinal, ou de painéis, que relaciona</p><p>variáveis explicativas a variáveis dependentes, ao longo do tempo e para diversos “itens”.</p><p>Neste trabalho, procuraremos relacionar algumas das características econométricas de uma análise</p><p>Cross-Section, aplicada a um tema real, do tipo Cross-Country (análise de um conjunto de países),</p><p>construção e testes de hipóteses, e modelagem de um fenômeno econômico.</p><p>ECONOMETRIA CROSS-SECTION, ANÁLISE</p><p>CROSS-COUNTRY.</p><p>Uma análise cross-country pode ser</p><p>considerada aquela que relaciona uma estrutura</p><p>de dados de países, compondo um dado banco</p><p>de dados. Pode ser interessante como forma de</p><p>análise de variáveis macroeconômica mais</p><p>generalizadas, que usam, por exemplo, o PIB,</p><p>produto interno bruto (em inglês, GDP, Gross</p><p>Domestic Product) ou o PNB, produto nacional</p><p>bruto (em inglês, GNI, Gross National Income),</p><p>como formas de mensurar o quanto um país</p><p>produz.</p><p>Em alguns casos, de análises de</p><p>regressões lineares espaciais, geograficamente</p><p>ponderadas, ou de dados mais específicos, este</p><p>tipo de análise pode não ser o mais recomendado,</p><p>pois não leva em consideração diversos fatores de</p><p>maior peculiaridade que podem influenciar nos</p><p>resultados da regressão, ou de previsões, se for</p><p>este o objeto pretendido pela análise de</p><p>regressão.</p><p>Um exemplo disto é que, ao analisarmos</p><p>renda, consumo e investimento por meio de uma</p><p>Cross-Country, por exemplo, teríamos limitações</p><p>pelo fato de que diferentes países podem ter</p><p>hábitos de consumo diferentes, para diferentes</p><p>níveis de renda. O consumo pode ser</p><p>determinado por hábitos culturais, ou religiosos,</p><p>por exemplo. O investimento e até mesmo a</p><p>renda podem, da mesma forma, ser influenciados</p><p>por questões similares, e isto tudo torna a análise</p><p>mais complexa.</p><p>No caso deste trabalho, no entanto,</p><p>tomamos o cuidado de utilizar somente variáveis</p><p>previamente estudadas acerca de metodologia de</p><p>coleta, e buscamos apenas aquelas que tenham</p><p>sido verificadas, e analisadas anteriormente pelo</p><p>Banco Mundial e/ou órgãos acreditados.</p><p>Recomenda-se ter este cuidado sempre, para que</p><p>a análise possa ser a mais limpa possível de</p><p>interferência por meio de amostragem indevida,</p><p>i.e., que não tenha sido gerada através de um</p><p>processo aleatório, estatisticamente válido.</p><p>ABORDANDO UM TEMA REAL: MILLENIUM</p><p>GOALS E WDI</p><p>Ao realizar um estudo econométrico,</p><p>devemos nos preocupar em colher dados</p><p>confiáveis e bem trabalhados, como mencionado</p><p>antes, e também em tratar de um assunto real,</p><p>que envolva uma teoria por trás, e que possamos</p><p>analisar. Desta forma, abordemos agora o tema</p><p>que motivou este estudo econométrico breve:</p><p>No ano 2000, a Organização das Nações</p><p>Unidas, ONU, oficializou os esforços por melhorar</p><p>as condições de vida a nível mundial, com a</p><p>criação do United Nations Millenium Goals</p><p>Declaration, documento assinado pelos 189 países</p><p>membros da organização na época, e por mais de</p><p>20 parcerias, de outras organizações mundiais.</p><p>Esta declaração tinha como objetivo coordenar</p><p>quais seriam os objetivos mais importantes, seu</p><p>prazo e como seriam atingidos. Inicialmente, os</p><p>4</p><p>oito Millenium Goals foram1 estes demonstrados</p><p>na imagem abaixo desta página.</p><p>Visando a importância deste tema, o</p><p>Banco Mundial, uma das principais parcerias da</p><p>ONU, e referência em dados estatísticos de nível</p><p>global, fez um levantamento de indicadores que</p><p>mensurassem itens contidos na descrição do</p><p>plano da ONU para cada um destes Millenium</p><p>Goals. Este levantamento de dados deu origem a</p><p>um dos seus principais e mais acessados bancos</p><p>de dados, denominado World Development</p><p>Indicators.</p><p>Em seu report oficial de 20162 sobre estes</p><p>indicadores de desenvolvimento mundiais, o</p><p>Banco Mundial ressalta a importância de</p><p>investimentos em educação e infraestrutura, e</p><p>sobretudo com parcerias que incluam o setor</p><p>privado, como forma de gerar e consolidar</p><p>crescimento econômico, afirmação que despertou</p><p>o interesse que levou a este trabalho.</p><p>Uma análise prévia dos dados refletia a</p><p>relevância de mensurar estatísticas sólidas que</p><p>tem impacto principalmente em dois dos oito</p><p>objetivos estabelecidos nos Millenium Goals da</p><p>ONU:</p><p>O primeiro objetivo a levarmos em</p><p>consideração é o de atingir educação primária</p><p>universal (MG2). Estima-se que cerca de 91% das</p><p>crianças em idade de educação primária hoje</p><p>1 Para mais detalhes:</p><p>http://www.unmillenniumproject.org/goals/gti.htm</p><p>estejam na escola. O objetivo era atingir a</p><p>educação plena até 2015, mas uma redução nos</p><p>investimentos em educação após 2008, é</p><p>apontada como fator decisivo para este objetivo</p><p>não ter sido completo. Dentro deste tema,</p><p>coletamos dados sobre os investimentos feitos em</p><p>educação pelo Estado, em relação ao PIB.</p><p>O segundo, é atingir parcerias globais</p><p>pelo desenvolvimento (MG 8). Em 2005, em uma</p><p>reunião com ministros das finanças dos países</p><p>membros do G-8, cerca de US$ 40 bilhões foram</p><p>concedidos para que as 48 economias menos</p><p>desenvolvidas do mundo pudessem ter quase</p><p>toda sua dívida externa quitada, gerando</p><p>oportunidade de investimento que levassem</p><p>desenvolvimento. Dentro deste tema, por sua vez,</p><p>coletamos dados sobre os investimentos feitos em</p><p>Telecomunicações, Energia, Transporte e Água e</p><p>Saneamento, com participação do setor privado,</p><p>em relação ao PIB (% do PIB). Dados adicionais</p><p>para outras análises também foram coletados,</p><p>como PNB, população, número de pessoas com</p><p>acesso à internet, e classificamos os países de</p><p>acordo com seu nível de renda per capita. Por</p><p>último, criamos também uma dummy, que</p><p>assume valor 1 se o país é membro da OECD</p><p>(Organização para a Cooperação e</p><p>Desenvolvimento Econômico) e 0 se não.</p><p>2 Para mais detalhes: http://data.worldbank.org/data-catalog/world-</p><p>development-indicators</p><p>5</p><p>Sendo assim, após</p><p>a leitura dos reports</p><p>oficiais das bases de dados do Banco Mundial</p><p>WDI – World Development Indicators, do ano</p><p>2012 a 2016, e do report disponibilizado pelo</p><p>órgão sobre os dados coletados, metodologia, e</p><p>relevância, decidimos por separar, para testes</p><p>iniciais, os indicadores que serão detalhados na</p><p>seção seguinte.</p><p>Para efeito de constatação, este trabalho</p><p>testará, portanto, o papel de cada um destes</p><p>dados coletados no produto do país, ou seja, o</p><p>efeito de variações unitárias (e percentuais, como</p><p>será mostrado mais adiante) das variáveis</p><p>explicativas sobre o PIB, nossa variável</p><p>dependente.</p><p>ESPECIFICAÇÃO DOS DADOS</p><p>Os dados foram originalmente coletados</p><p>na página oficial do Banco Mundial referente à</p><p>base de dados World Development Indicators,</p><p>descritos no documento World Development</p><p>Indicators 2016, um report oficial do órgão</p><p>descrito na bibliografia deste trabalho. Após a</p><p>coleta, todos os dados foram tratados, no</p><p>Microsoft Excel, com transformações de</p><p>porcentagem para valores correntes, e depois</p><p>para valores per capita, tal qual descrito com mais</p><p>detalhes na seção sobre filtragem de dados e</p><p>testes iniciais.</p><p>Os dados iniciais coletados foram:</p><p>Despesas do governo com educação, em</p><p>% do PIB (SE.XPD.TOTL.GD. ZS); Despesas totais</p><p>do governo, em % do PIB (GC.XPN.TOTL.GD. ZS);</p><p>Crédito doméstico ao setor privado, em % do PIB</p><p>(FS.AST.PRVT.GD.ZS); Investimentos em</p><p>Telecomunicações com participação do setor</p><p>privado, em dólares correntes, e em % do PIB</p><p>(IE.PPI.TELE.CD); Investimentos em Energia com</p><p>participação do setor privado, em dólares</p><p>correntes, e em % do PIB (IE.PPI.ENGY.CD);</p><p>Investimentos em Transporte com participação do</p><p>setor privado, em dólares correntes, e em % do</p><p>PIB (IE.PPI.TRAN.CD); Investimentos em Água e</p><p>Saneamento com participação do setor privado,</p><p>em dólares correntes, e em % do PIB</p><p>(IE.PPI.WATR.CD) e número de pessoas com acesso</p><p>à internet por 100 pessoas (IT.NET.USER.P2).</p><p>Além destes dados, foram coletados o PIB,</p><p>em dólares correntes, o PNB, também em dólares</p><p>correntes, e a população de cada país. A partir</p><p>destes dados, foi possível criar uma planilha que</p><p>contém todas estas informações, e que é capaz de</p><p>realizar as devidas conversões.</p><p>A planilha que criamos, nomeada como</p><p>excel_wdi.xls, foi publicada no site de referências</p><p>bibliográficas e dados Mendeley Data, com licença</p><p>de uso do tipo GNU, aberta para pesquisa,</p><p>modificações e republicações, no artigo intitulado</p><p>World Bank WDI: Investments in Education and</p><p>Infrastructure with Participation of State and</p><p>Private Sector, juntamente do script que criamos,</p><p>nomeado rscript_wdi.r e utilizado neste trabalho.</p><p>O link é permanente, e qualquer pessoa pode</p><p>fazer o download tanto da planilha quanto do</p><p>script no seguinte endereço:</p><p>https://data.mendeley.com/datasets/gmfc38cdfj/1.</p><p>ESPECIFICAÇÕES TÉCNICAS</p><p>Toda análise econométrica tem por</p><p>objetivo estudar fenômenos econômicos reais, da</p><p>maneira mais robusta possível, com o objetivo de</p><p>produzir ciência, i.e., experimentos que possam</p><p>ser recriados, testados e confirmados ou</p><p>refutados, e, com vista a isto, publicamos todos os</p><p>arquivos no banco de dados online da Mendeley</p><p>Data, conforme citado na seção anterior, para</p><p>testes, pesquisas e comentários posteriores. Outro</p><p>cuidado geralmente tomado em produções</p><p>científicas, das mais básicas, como esta, às mais</p><p>avançadas, é o de documentar as especificações</p><p>técnicas usadas na realização dos experimentos:</p><p>SISTEMAS OPERACIONAIS UTILIZADOS</p><p>I. Windows 10 Home Edition, processador 64 bits,</p><p>arquitetura x86.</p><p>II. Windows 10 Professional, processador 32 bits,</p><p>arquitetura x32.</p><p>III. Windows 7 Professional, processador 32 bits,</p><p>arquitetura x32.</p><p>http://ie.ppi.tele.cd/</p><p>http://ie.ppi.engy.cd/</p><p>http://ie.ppi.tran.cd/</p><p>http://ie.ppi.watr.cd/</p><p>https://data.mendeley.com/datasets/gmfc38cdfj/1</p><p>6</p><p>SOFTWARES UTILIZADOS</p><p>I. Microsoft Excel 2016, developer edition.</p><p>II. R Software, versão 3.3.0, construção x86_64-</p><p>w64-mingw32/x64</p><p>FERRAMENTAS IMPORTANTES</p><p>I. Plotly – Ferramenta para plotar gráficos</p><p>interativos para arquivos excel e csv.</p><p>PACOTES UTILIZADOS NO R</p><p>I. corrgram – Excelente para plotagem de</p><p>correlogramas, carrega diversos outros pacotes</p><p>gráficos.</p><p>II. car – pacote estatístico com funções e testes</p><p>para regressões lineares.</p><p>III. AER – pacote estatístico com funções</p><p>avançadas de econometria aplicada.</p><p>IV. tseries – pacote estatístico com funções de</p><p>séries temporais, mas com testes que são úteis em</p><p>qualquer tipo de estrutura de dados.</p><p>TESTES E MODELOS INICIAIS</p><p>Assim que coletamos os dados</p><p>necessários, a primeira preocupação foi realizar</p><p>uma bateria de testes para decidir quais deles</p><p>melhor se encaixariam em um modelo final que</p><p>pudesse ser utilizado na predição de séries de</p><p>dados.</p><p>Uma a uma, todas as variáveis explicativas</p><p>(a variável dependente será, em todo o trabalho,</p><p>o PIB) foram testadas por meio de modelos</p><p>laterais. Algumas se mostraram estatisticamente</p><p>significativas, outras não. Nesta primeira filtragem</p><p>de dados, as variáveis was, (water and sanitation,</p><p>referente à investimentos em água e</p><p>saneamento), poderia ser retirada do resto da</p><p>análise, por falta de significância e por excessiva</p><p>falta de dados disponíveis (o R removeu 166 linhas</p><p>de dados devido a NA’s). Outra variável</p><p>descartada foi a dummy OECD, omd (de Oecd</p><p>Member Dummy), que também demonstrou</p><p>muito pouca significância estatística, e um p-value</p><p>de 0.99, o que nos fez descarta-la de nosso futuro</p><p>modelo.</p><p>As variáveis remanescentes foram edu,</p><p>que representa os investimentos em educação,</p><p>tel, que representa os investimentos em</p><p>telecomunicações, cdt, que representa o crédito</p><p>doméstico dado ao setor privado, e a variável eng,</p><p>que representa os investimentos em energia.</p><p>Doravante, mencionaremos nos testes o</p><p>nome das variáveis apenas, para facilitarmos o</p><p>entendimento e não termos um texto com muitas</p><p>repetições.</p><p>Seguem os resultados dos primeiros</p><p>testes iniciais das variáveis significativas:</p><p>PIB ~ Educação: Significativo a um p-value</p><p>extremamente baixo, com erro padrão baixo e</p><p>valores significativos nos testes t-student para</p><p>significância do parâmetro, e F, para significância</p><p>da regressão. Notamos um R² muito alto, com R</p><p>ajustado igualmente alto. Falaremos sobre isto</p><p>mais à frente, e como um valor muito alto de R²</p><p>pode na verdade ser fruto de uma correlação</p><p>entre a variável explicativa e a variável</p><p>dependente, ou ainda fruto de um processo de</p><p>retroalimentação, o que tornaria nossa análise</p><p>muito mais complexa, e fugiria do escopo deste</p><p>trabalho em si (Visualização dos resultados na</p><p>página seguinte).</p><p>PIB ~ Crédito: Significativo a um p-value</p><p>extremamente baixo, apresentando inclusive um</p><p>intercepto bastante significativo, o que não possui</p><p>uma interpretação econômica clara, mas sim</p><p>estatística. Os valores dos testes t-student e F de</p><p>Fisher-Snedecor também reportaram valores</p><p>significativos. Como o erro-padrão da variável cdt</p><p>é extremamente baixo, e os valores de R² e do R</p><p>ajustado são muito altos, suspeitamos de que o</p><p>mesmo problema anterior, da variável edu, possa</p><p>estar ocorrendo nesta regressão (Visualização dos</p><p>resultados do R também na página seguinte).</p><p>PIB ~ Telecom: Significativo a um p-value</p><p>extremamente baixo, com um valor considerado</p><p>normal de erro-padrão, dados os graus de</p><p>liberdade observados, com um R² razoável</p><p>7</p><p>acompanhado de um R ajustado que se enquadra</p><p>no ‘normal’ esperado para uma regressão simples</p><p>como esta. Com testes t-student e F Fisher-</p><p>Snedecor bons, e características que não saltam</p><p>os olhos de maneira indevida a princípio,</p><p>podemos dizer que aparentemente a regressão</p><p>possua poucos problemas, e que os processos</p><p>geradores dos dados não tenham problemas de</p><p>correlação excessiva com a variável dependente,</p><p>embora possa ocorrer alguma relação</p><p>deste tipo,</p><p>bem como problemas de retroalimentação, como</p><p>no caso das demais variáveis. Novamente, isto</p><p>fugiria ao escopo deste trabalho, e, portanto,</p><p>assumiremos que tel é uma variável legítima</p><p>(Visualização dos resultados do R abaixo).</p><p>PIB ~ Energia: Embora tenha sido a variável cuja</p><p>regressão, dentre estes modelos iniciais reportou</p><p>os menores valores de R² e R ajustado, verificamos</p><p>um F de Fisher-Snedecor relativamente alto,</p><p>aceitável a 5%, assim como o valor do teste t-</p><p>student. Tal qual a variável tel, a variável eng é</p><p>uma boa aposta para os próximos modelos de</p><p>regressão (Visualização dos resultados do R</p><p>abaixo).</p><p>De maneira geral, estas variáveis foram</p><p>consideradas aptas a passarem por outros testes.</p><p>Estes testes consistiram na segunda filtragem de</p><p>dados, onde transformamos todos os dados em</p><p>variáveis per capita afim de diminuir o nível de</p><p>variação entre os dados. Todos os testes</p><p>realizados na primeira filtragem de dados foram</p><p>refeitos, e reportaram resultados similares. Desta</p><p>forma, constatamos que as variáveis edu, cdt, tel e</p><p>eng passaram para a próxima etapa do nosso</p><p>estudo.</p><p>ESPECIFICAÇÃO DO MODELO</p><p>Após termos realizado duas baterias de</p><p>testes com nossas variáveis pré-selecionadas,</p><p>trataremos de realizar uma terceira bateria de</p><p>testes, desta vez com modelos de regressão linear</p><p>múltipla que combinem várias variáveis.</p><p>Depois de inúmeros testes, com diversos</p><p>modelos diferentes, tanto lineares quanto</p><p>logarítmicos (log-log), selecionamos um modelo</p><p>que apresentaremos agora.</p><p>Também apresentaremos uma breve</p><p>discussão acerca das formas funcionais, e de</p><p>8</p><p>como escolhemos a que representará os testes</p><p>deste trabalho como um todo.</p><p>ESPECIFICAÇÃO MATEMÁTICA DO MODELO DE</p><p>REGRESSÃO MÚLTIPLA COM TESTES INICIAIS</p><p>A escolha correta da forma funcional de</p><p>um modelo de regressão, seja linear ou não nos</p><p>parâmetros, seja ele simples ou múltiplo, de</p><p>qualquer que seja a estrutura, se cross-section ou</p><p>não, é extremamente importante. Erros na</p><p>especificação correta do modelo podem incorrer</p><p>em um viés muito comum, de especificação, e</p><p>resultar em um modelo com pouco ou nenhum</p><p>poder preditivo.</p><p>De maneira geral, temos os modelos de</p><p>regressão linear, onde os dois lados da equação</p><p>de regressão são definidos por variáveis lineares.</p><p>Neste modelo, uma variação unitária em X causa</p><p>β unidades de variação em Y.</p><p>De maneira parecida, temos os modelos</p><p>semilogarítmicos, que podem assumir as formas</p><p>lin-log ou log-lin, a depender de qual lado da</p><p>equação será logaritmizado. Nestes tipos de</p><p>modelos, temos semi-elasticidades, ou seja, uma</p><p>variação unitária em X (para o caso de um modelo</p><p>log-lin), causa β pontos percentuais em Y, ou uma</p><p>variação de um ponto percentual em X causa β</p><p>unidades de variação em Y (modelo lin-log).</p><p>Há ainda os modelos duplo-log, em que</p><p>ambos os lados da equação são logarítmicos,</p><p>modelos recíprocos, que incluem uma assíntota</p><p>ou valor limite, que a variável dependente Y</p><p>assumirá quando X aumentar indefinidamente, e</p><p>que é não linear no parâmetro X.</p><p>Além destes, há muitos outros, modelos</p><p>logísticos, logit, tobit, entre outros. Nos</p><p>concentraremos, neste trabalho, dadas as</p><p>características dos dados e do problema</p><p>estudado, em dois tipos de modelo: linear em Y e</p><p>em X, e duplo-log, ou seja, log em Y e em X.</p><p>Assim, após todos os testes realizados,</p><p>definidos na terceira bateria de testes, chegamos</p><p>a um modelo que referenciava as variáveis edu,</p><p>tel, e tra, que inclusive havia sido descartada na</p><p>segunda bateria de testes com modelos diversos.</p><p>Os resultados desta bateria de dados nos levaram</p><p>a observar mais de perto os problemas dos dados,</p><p>que estavam ainda referenciados em dólares</p><p>correntes. Suspeitamos então definimos que o</p><p>melhor modelo possível para continuarmos a</p><p>análise seria dado por:</p><p>𝑃𝐼𝐵𝑖 = 𝛽0 + 𝛽1𝑖𝑒𝑑𝑢4 + 𝛽2𝑖𝑡𝑒𝑙4 + 𝛽 3𝑖𝑒𝑛𝑔4 + 𝜀𝑖</p><p>Com variáveis já conhecidas por nós. O</p><p>valor 4 à frente das variáveis é uma referência à</p><p>quarta filtragem de dados realizada. No final deste</p><p>trabalho, há uma seção que explica brevemente</p><p>cada uma destas filtragens de dados, mas o mais</p><p>importante é que, durante as três primeiras</p><p>filtragens, foram eliminadas variáveis que</p><p>possuíam muitas observações de NA’s, que não</p><p>possuíam nenhuma significância estatística, e que</p><p>não se comportavam bem por um viés de</p><p>especificação da variável. Nesta quarta etapa de</p><p>tratamento dos dados, criamos um arquivo final,</p><p>chamado data4.csv, que contém observações</p><p>robustas para 66 países, sem NA’s, e com todos</p><p>os valores previamente convertidos para dados</p><p>per capita, afim de criar a melhor base de dados</p><p>possível para o modelo.</p><p>A esta altura, podemos agora demonstrar</p><p>os resultados do primeiro run do nosso modelo:</p><p>As variáveis edu, tel, e eng se mostraram</p><p>significativas, tanto a 2%, como o caso de eng</p><p>quanto a valores α muito baixos, no caso das</p><p>outras variáveis. O intercepto não possui</p><p>significância estatística, o que poderia causar</p><p>problemas na predição correta do PIB.</p><p>O valor da estatística F de Fisher-Snedecor</p><p>se mostrou satisfatório, reportando um p-value</p><p>extremamente baixo. Os valores dos coeficientes</p><p>de determinação R², bem como o R ajustado, se</p><p>mantiveram em patamares realistas, dentro do</p><p>esperado para um modelo sobre um fenômeno</p><p>9</p><p>tão complexo quanto o PIB, embora seu valor</p><p>ainda carregue a suspeita de correlação entre as</p><p>variáveis, problema investigado mais à frente.</p><p>Uma rápida olhada na matriz de variância</p><p>deste modelo inicial nos reforça esta ideia, mas</p><p>devemos realizar primeiro os devidos testes para</p><p>fazer qualquer tipo de afirmativa.</p><p>Ao analisarmos, por sua vez, os resíduos</p><p>desta regressão, percebemos alguns detalhes</p><p>interessantes. O primeiro destes detalhes é que</p><p>aparentemente a distribuição dos erros segue</p><p>uma distribuição aproximadamente normal com</p><p>pequena assimetria à esquerda, embora com</p><p>alguns pontos bem disformes, que saem bastante</p><p>do padrão normal, fato mostrado no terceiro plot</p><p>abaixo (Normal Q-Q). Pelos outros gráficos,</p><p>poderíamos notar também a aparente presença</p><p>de heterocedasticidade, dado o padrão de</p><p>comporta mento dos resíduos, e ainda a presença</p><p>de outliers na análise, pois todos os plots</p><p>detectaram pontos fora do comum.</p><p>Investigaremos estes problemas de</p><p>maneira mais profunda à frente. Por enquanto,</p><p>vamos apenas resgatar os valores dos coeficientes</p><p>da regressão para usarmos novamente no fim</p><p>deste trabalho quando formos testar o poder de</p><p>predição de cada um dos modelos criados.</p><p>10</p><p>TESTANDO O MODELO CRIADO</p><p>Até agora havíamos nos preocupado em</p><p>criar um modelo para trabalharmos. Vimos, por</p><p>meio de uma rápida inspeção gráfica, que</p><p>aparentemente há presença de outliers e de</p><p>heterocedasticidade.</p><p>Vamos, portanto, iniciar os testes para</p><p>verificar, empiricamente, as hipóteses de</p><p>normalidade dos dados, presença de outliers,</p><p>heterocedasticidade, multicolinearidade e</p><p>correlação não-serial, que também entra na</p><p>hipótese anterior.</p><p>NORMALIDADE DOS DADOS</p><p>A hipótese de normalidade dos dados é</p><p>importante para o processo de inferência, e não</p><p>apenas a estimação, para que possamos utilizar os</p><p>procedimentos de testes de hipóteses mais</p><p>simples possíveis.</p><p>Sendo assim, testamos a hipótese de</p><p>normalidade dos dados por meio de dois dos</p><p>principais testes existentes: Shapiro-Wilk e Jarque-</p><p>Bera. Existem muitos outros testes disponíveis,</p><p>como o Kolmogorov-Smirnov, Anderson-Darling,</p><p>Lillefors, e muitos outros, mas vamos nos ater a</p><p>estes dois dado a facilidade de implementação,</p><p>interpretação, e o fato de que são os mais usados</p><p>geralmente.</p><p>SHAPIRO-WILK</p><p>Proposto em 1965, o teste é baseado na</p><p>estatística W, calculada por:</p><p>em que xi são os valores da amostra ordenados</p><p>(x(1) é o menor). A constante b é determinada da</p><p>seguinte</p><p>forma:</p><p>em que an-i+1 são constantes geradas pelas</p><p>médias, variâncias e covariâncias das estatísticas</p><p>de ordem de uma amostra de tamanho n de uma</p><p>distribuição Normal.</p><p>Pelo teste de Shapiro-Wilk, observamos p-</p><p>values extremamente baixos para todas as</p><p>amostras coletadas, indicando que os dados não</p><p>provêm de uma distribuição normal.</p><p>JARQUE-BERA</p><p>Introduzidos por Carlos Jarque e Anil Bera,</p><p>o teste é basicamente uma medição da qualidade</p><p>de ajuste da amostra, à partir de suas</p><p>características de assimetria e curtose, para</p><p>verificar se os dados provém de uma distribuição</p><p>aproximadamente normal com (𝜇 = 0, 𝜎2 = 𝜎2).</p><p>O teste é definido pela estatística JB por:</p><p>11</p><p>Onde S é a medida da assimetria e C a</p><p>medida da curtose da amostra, por sua vez</p><p>definidos como:</p><p>Este teste relaciona as estatísticas dos</p><p>terceiro e quarto momentos centrais da amostra,</p><p>como demostrado acima, e é uma forma de</p><p>confirmação ou não da hipótese nula de</p><p>normalidade dos dados da amostra.</p><p>Ao carregarmos o teste de Jarque-Bera no</p><p>R, a partir da função jarque.bera.test(model) do</p><p>pacote tseries, chegamos à mesma conclusão dos</p><p>testes de Shapiro- Wilk, quanto a não-</p><p>normalidade dos dados da nossa amostra. Os</p><p>resultados são demonstrados a seguir:</p><p>Em geral, a presença de outliers na</p><p>amostra pode ser um fator decisivo na</p><p>normalidade dos dados.</p><p>NORMALIDADE DOS RESÍDUOS</p><p>Outra hipótese importante de testarmos é</p><p>se os resíduos do nosso modelo seguem uma</p><p>distribuição normal ou não.</p><p>Utilizamos a mesma estrutura de testes,</p><p>com Shapiro-Wilk e Jarque-Bera, para testar esta</p><p>hipótese, e descobrimos que também os resíduos</p><p>não seguem uma distribuição normal, como</p><p>demonstrados à seguir:</p><p>SHAPIRO-WILK</p><p>JARQUE-BERA</p><p>Em geral, para amostras de tamanho</p><p>razoável, como a nossa (66 observações),</p><p>tomamos o cuidado também de realizar uma</p><p>rápida verificação gráfica da distribuição dos</p><p>resíduos do modelo, e no caso deste modelo, a</p><p>hipótese de não-normalidade dos resíduos</p><p>também foi aceita, como demonstrado no</p><p>histograma dos resíduos da regressão na página</p><p>seguinte. De modo geral, sabemos que a não-</p><p>normalidade dos resíduos da regressão afeta os</p><p>valores dos testes t e F em amostras pequenas ou</p><p>finitas, como o caso da nossa.</p><p>12</p><p>PRESENÇA DE OUTLIERS</p><p>Outliers são observações que se</p><p>distanciam muito do padrão comum encontrado</p><p>no restante dos dados. Em geral, o problema que</p><p>causam é que podem criar uma falsa</p><p>heterocedasticidade no modelo.</p><p>De maneira geral, a presença de outliers</p><p>pode causar o que Zimmerman (1994, 1998, 1999)</p><p>categorizou como erros inflados, e distorções</p><p>substanciais na aferição de testes para parâmetros</p><p>ou estatísticas, usando ou não estimativas</p><p>paramétricas.</p><p>Outro fenômeno que pode ocorrer, mas</p><p>com uma frequência mais rara, é a presença de</p><p>fringeliers, apontados por Wainer (1976) como</p><p>eventos incomuns que podem acontecer mais de</p><p>uma vez, e que por estarem próximos da fronteira</p><p>de três desvios padrão da média, podem causar</p><p>uma forte influência na estimação dos parâmetros</p><p>do modelo.</p><p>Na imagem abaixo percebemos que</p><p>alguns países realmente possuem um</p><p>distanciamento das demais observações, que</p><p>pode causar problemas ao estimarmos o modelo.</p><p>Para testarmos empiricamente a presença de</p><p>outliers, usamos o teste outlierTest(model) para</p><p>verificarmos a presença deste pontos isolados na</p><p>amostra.</p><p>P-VALUE DE BONFERRONI</p><p>Um dos valores reportados pelo teste</p><p>outlierTest do pacote car é o da estatística de</p><p>Bonferroni. Esta estatística, proposta pelo</p><p>matemático italiano Carlo Emilio Bonferroni e</p><p>descrito por Olive Dunn em seus artigos de 1959</p><p>e 1961, reporta um teste que verifica o quão</p><p>prejudiciais os dados de observações muito</p><p>distantes da amostra podem ser.</p><p>De modo geral, para valores da estatística</p><p>de Bonferroni acima de 1, suspeitamos que a</p><p>observação seja um outlier, e podemos inferir que</p><p>13</p><p>possui influência na distribuição dos resíduos, e</p><p>que o verdadeiro valor dos resíduos da regressão</p><p>Studentizados é na verdade menor do que o</p><p>observado na regressão contendo outliers.</p><p>De fato, ao utilizarmos a função</p><p>outlierTest(model) no R, reportamos o seguinte</p><p>teste:</p><p>Assim, mantemos a suposição de presença</p><p>de outliers nas 16a e 36a observações, pelo menos.</p><p>ANÁLISE GRÁFICA DOS RESÍDUOS</p><p>Outra forma de verificarmos a presença de</p><p>outliers é por meio da análise gráfica de seu</p><p>comportamento. Notamos, através do gráfico QQ</p><p>Plot a seguir, como existem observações que se</p><p>dispersam muito do restante da amostra:</p><p>Da mesma forma, podemos analisar</p><p>também a distribuição dos resíduos ao quadrado,</p><p>e como eles se comportam em relação à média</p><p>zero (ideal). Vimos anteriormente que resíduos</p><p>que estejam na fronteira dos três desvios padrão</p><p>em relação à média podem ser considerados</p><p>fringeliers, como é o caso da 36a observação,</p><p>como reportado pela estatística do teste de p-</p><p>value de Bonferroni:</p><p>Outra forma de análise gráfica trata dos</p><p>leverages dos resíduos, isto é, a diagonal da</p><p>matriz chapéu H, criada no R (hatmodel) definida</p><p>por:</p><p>14</p><p>De modo geral, através dos gráficos de</p><p>leverages, supomos a presença de outliers</p><p>influentes:</p><p>MÉTRICA DE COOK</p><p>Tomando como base a diagonal principal</p><p>da matriz chapéu H que demonstramos à pouco,</p><p>e chamando cada elemento de hi, temos que a</p><p>métrica da Distância D de Cook é dada por:</p><p>A grosso modo, podemos dizer que D é</p><p>grande quando os leverages são grandes, ou seja,</p><p>quando um ponto se distancia demais das demais</p><p>observações, e que, quando D é maior que 1,</p><p>podemos considerar o ponto, ou seja, a</p><p>observação, como um ponto influente no</p><p>processo de estimação dos parâmetros.</p><p>Ao plotarmos o gráfico da Distância de</p><p>Cook para o nosso modelo, verificamos</p><p>novamente que a 36a observação da nossa</p><p>amostra se mostra muito distante das demais,</p><p>acompanhada por outras observações</p><p>aparentemente influentes:</p><p>Após testes de influência, comprovamos a</p><p>já esperada hipótese de presença de outliers no</p><p>nosso modelo.</p><p>Uma rápida inspeção gráfica de outro</p><p>gráfico de distância de Cook comprova isto:</p><p>Após a confirmação da presença de</p><p>outliers, prosseguimos com a utilização de uma</p><p>técnica conhecida como jackknife, que visa</p><p>eliminar pontos demasiadamente influentes da</p><p>amostra, e realiza uma nova regressão.</p><p>Dos resultados deste procedimento,</p><p>retiramos cinco das sessenta e seis observações</p><p>da nossa amostra. São elas os países Lao e Butão,</p><p>que realizaram grandes investimentos em Energia,</p><p>nos últimos anos, e por isto possuíam um valor</p><p>muito alto para este dado, o Chile, por ser um</p><p>outlier em Y, ou seja, possuir um PIB per capita</p><p>muito alto para os demais países da amostra</p><p>coletada, e os países Uruguai e Lituânia, que vem</p><p>realizando maciços investimentos em educação</p><p>nos últimos anos. Percebemos que todos, exceto</p><p>o Chile, eram exemplos de outliers em Y.</p><p>O procedimento a seguir foi de criar uma</p><p>nova base de dados, resultante da quinta filtragem</p><p>de dados, em que os outliers foram removidos, e</p><p>uma amostra de maior qualidade, agora com 61</p><p>observações, pode ser utilizada.</p><p>Com base nesta nova base de dados,</p><p>recriamos as variáveis, que agora passaram a se</p><p>chamar gdp5, edu5, tel5 e eng5.</p><p>15</p><p>Outro modelo foi estimado, e os testes de</p><p>normalidade foram refeitos. Os dados continuam</p><p>sendo originados por uma distribuição não-</p><p>normal, o que comprova que os outliers não</p><p>estavam influenciando na distribuição dos</p><p>resíduos, mas sim nos parâmetros.</p><p>Outro fato interessante, também sobre os</p><p>parâmetros estimados, é que o segundo modelo,</p><p>sem outliers, não possui significância para a</p><p>variável eng5, o que nos faz pensar que a</p><p>significância atribuída a ela anteriormente era</p><p>meramente fruto da influência de outliers em suas</p><p>observações, e que demonstra o que afirmamos</p><p>no início desta seção: a presença de outliers pode</p><p>afetar a estimação dos parâmetros e das</p><p>inferências dos testes, dado seu impacto também</p><p>sobre o verdadeiro erro-padrão do modelo.</p><p>HETEROCEDASTICIDADE</p><p>Um dos problemas que podem ocorrer</p><p>quando trabalhamos com regressões lineares é o</p><p>da heterocedasticidade, ou seja, os erros passam</p><p>a ter uma variância que não é mais constante.</p><p>Uma das possíveis causas deste problema</p><p>na estimação é a presença de dados discrepantes,</p><p>ou seja, observações muito diferentes das demais</p><p>observações da amostra. Como já realizamos os</p><p>testes e correções de outliers, pressupomos que</p><p>este não será um problema em nosso modelo</p><p>atual, já corrigido.</p><p>Uma outra hipótese é a de que pode ser</p><p>que o modelo não esteja corretamente</p><p>especificado, gerando um viés que possa levar a</p><p>observação de resíduos diferentes dos</p><p>verdadeiros, ou seja, aqueles que observaríamos</p><p>no caso de um modelo corretamente</p><p>especificado.</p><p>Dada esta hipótese, criamos um outro</p><p>modelo, com o qual seguiremos em paralelo</p><p>todos os próximos testes, sob a forma de duplo-</p><p>log. Utilizar o log dos dois lados da equação que</p><p>define o modelo econométrico pode ser útil, pois</p><p>uma das propriedades do log é “achatar” os</p><p>dados, deixando-os mais bem comportados no</p><p>modelo.</p><p>Uma outra causa da heterocedasticidade é</p><p>a assimetria da distribuição de um ou mais</p><p>regressores. Vimos que nossos dados não seguem</p><p>uma distribuição normal, o que, economicamente</p><p>pode ser interpretado como a desigualdade que</p><p>encontramos dentre as economias estudadas. A</p><p>natureza das variáveis que estudamos neste</p><p>trabalho são, por si só, distintas. Alguns países</p><p>possuem maior produto, outros menos. Alguns</p><p>investem mais em educação, outros têm</p><p>priorizado transportes. Ou energia, ou possuem</p><p>baixos investimentos para todos. Sabemos como</p><p>o mundo é, e de suas peculiaridades, então</p><p>esperamos que as variáveis carreguem</p><p>heterocedasticidade, principalmente por causa</p><p>deste problema.</p><p>De maneira geral, Damodar Gujarati</p><p>(2006) classifica a heterocedasticidade como um</p><p>problema que afeta mais as estruturas de corte</p><p>transversal (cross-sections) do que as séries</p><p>temporais, e de fato tínhamos a intenção de tentar</p><p>um modelo temporal, mas devido a limitações</p><p>técnicas, manteremos este trabalho sob o escopo</p><p>da estrutura previamente citada, e manteremos a</p><p>ideia de um trabalho similar mais aprofundado</p><p>para um futuro próximo.</p><p>Com relação ao processo de estimação</p><p>dos parâmetros, a heterocedasticidade não causa</p><p>um problema em si no fato dos estimadores</p><p>continuarem a ser estimadores não-tendenciosos</p><p>para o modelo. O problema que ela causa, na</p><p>16</p><p>verdade, é que os estimadores não serão mais os</p><p>melhores não-tendenciosos, visto que sua</p><p>variância mínima não é mais definida como o</p><p>usual. Com isto, deixamos de ter, no MQO, o</p><p>melhor método de estimação, e passamos a</p><p>precisar do MQG, ou Mínimos Quadrados</p><p>Generalizados, para nossa regressão.</p><p>Na verdade, pode haver a presença de</p><p>BLUE (em português, melhor estimador não-</p><p>tendencioso, ou MELNT) mesmo com</p><p>heterocedasticidade, nos MQO, como demonstra</p><p>o teorema de Kruskal (condição suficiente para</p><p>haver BLUE em MQO), mas isto, no entanto, é algo</p><p>mais raro, e de maneira geral não é caso que</p><p>temos em mãos neste trabalho.</p><p>Com isto em mente, demonstraremos os</p><p>testes e medidas corretivas tomadas em nosso</p><p>modelo.</p><p>INSPEÇÕES GRÁFICAS DOS RESÍDUOS</p><p>O primeiro teste que fizemos, informal, é</p><p>o da inspeção gráfica do comportamento dos</p><p>resíduos. Demonstramos, junto dos testes de</p><p>outliers, que os resíduos possuíamos diversos</p><p>pontos que saltavam à média das demais</p><p>observações. Verificaremos agora se, após a</p><p>correção de jackknife, houve mudanças nos</p><p>resíduos do nosso modelo:</p><p>O gráfico demonstra que o modelo linear,</p><p>mesmo após a correção de outliers, ainda</p><p>apresenta, aparentemente, um padrão</p><p>heterocedástico. Analisaremos agora o modelo</p><p>logarítmico (faremos comparações entre os</p><p>modelos a partir deste ponto):</p><p>De maneira geral, notamos um melhor</p><p>comportamento do modelo logarítmico. Ainda</p><p>assim, prosseguimos com os testes, desta vez,</p><p>utilizando procedimentos formais de testes da</p><p>hipótese de heterocedasticidade.</p><p>BREUSCH-PAGAN</p><p>O teste de Breusch-Pagan é um dos mais</p><p>utilizados para testar a presença de</p><p>heterocedasticidade. Baseando-se em modelos</p><p>da forma:</p><p>Regredimos o modelo contra o resíduo:</p><p>E aferimos a seguinte estatística:</p><p>~</p><p>Para os nossos modelos, encontramos os</p><p>seguintes resultados:</p><p>17</p><p>De acordo com o teste de Breusch-Pagan</p><p>para heterocedasticidade, o problema assola o</p><p>modelo linear, mas não o logarítmico.</p><p>GOLDFELD-QUANDT</p><p>No R, descobrimos que o teste de White é</p><p>realizado através no teste de Goldfeld-Quandt,</p><p>algo presente nas descrições técnicas dos pacotes</p><p>car e tseries. Dado isto, designamos este teste</p><p>para a segunda verificação formal da hipótese de</p><p>heterocedasticidade.</p><p>O teste de Goldfeld-Quandt é útil quando</p><p>acreditamos que a variância heterocedástica é</p><p>positivamente relacionada a uma das variáveis</p><p>explicativas do modelo de regressão.</p><p>Nesta estrutura de teste, fazemos a</p><p>ordenação das observações de acordo com os</p><p>valores de X, omitimos observações centrais,</p><p>dividindo as restantes em dois grupos distintos,</p><p>ajustamos regressões por MQO separadas para</p><p>estes dois conjuntos e estimamos a razão GQ.</p><p>No caso do nosso modelo, obtivemos as</p><p>seguintes estatísticas de teste, que confirmaram,</p><p>tal qual os testes de Breusch-Pagan, a hipótese de</p><p>heterocedasticidade no modelo linear e</p><p>homocedasticidade no modelo log.</p><p>CORREÇÕES DA HETEROCEDASTICIDADE</p><p>A primeira das medidas de visualização</p><p>dos modelos aplicadas foi a fracionalização do</p><p>modelo, como descrito em Gujarati (2006). Os</p><p>resultados após as medidas foram:</p><p>Após verificarmos que mesmo com a</p><p>fracionalização das amostras, o modelo linear</p><p>permaneceu com a presença de</p><p>heterocedasticidade, decidimos por aplicar a</p><p>medida corretiva da matriz robusta de White à</p><p>heterocedasticidade.</p><p>MATRIZ ROBUSTA DE WHITE</p><p>Percebemos uma melhoria nos erros-</p><p>padrão estimados para ambos os modelos, e ao</p><p>realizarmos uma nova bateria de testes para a</p><p>heterocedasticidade, notamos que os modelos</p><p>ficaram melhor definidos após a aplicação do</p><p>método de construção da matriz robusta de</p><p>White à heterocedasticidade.</p><p>Os resultados da nova regressão por meio</p><p>da matriz robusta geraram as seguintes</p><p>estatísticas, com destaque para o modelo log.</p><p>18</p><p>DUMMIES</p><p>Uma das medidas que podem ser</p><p>adotadas na presença persistente de</p><p>heterocedasticidade, como no caso do nosso</p><p>modelo linear, é criar dummies categóricas no</p><p>modelo. De fato, havíamos coletado informações</p><p>sobre o grupo de renda ao qual cada país</p><p>pertence. Utilizamos o R, portanto, para criar</p><p>dummies que categorizam os países segundo seu</p><p>grupo, assumindo valores 1 ou 0 para as seguintes</p><p>categorias: A se o país é de baixa renda, B se é de</p><p>renda média, C se é de renda média alta, e D se é</p><p>de renda alta, todos critérios baseados no nível de</p><p>renda per capita, que acompanham o padrão</p><p>criado na terceira filtragem de dados.</p><p>Com a criação de dummies, chegamos ao</p><p>seguinte modelo:</p><p>Após a criação de dummies, e a</p><p>construção da estimação através da matriz</p><p>robusta de White, percebemos mudanças nos</p><p>gráficos dos resíduos das regressões, embora a</p><p>regressão por meio do modelo de forma linear</p><p>continue com padrões heterocedásticos</p><p>persistentes, como demonstrado na figura</p><p>seguinte, dos resíduos ao quadrado da regressão:</p><p>Já o modelo logarítmico permanece um</p><p>pouco melhor comportado:</p><p>MULTICOLINEARIDADE</p><p>Um dos problemas mais comuns que</p><p>assolam as regressões lineares é o da</p><p>multicolinearidade, ou correlação não-serial entre</p><p>as variáveis.</p><p>Em geral, a presença de</p><p>multicolinearidade afeta as variâncias dos</p><p>estimadores de MQO, o que pode trazer</p><p>problemas aos processos de inferências</p><p>realizados nos testes de hipóteses. Com uma</p><p>variância muito alta, os intervalos de confiança</p><p>ficam mais amplos, e é mais fácil aceitar a hipótese</p><p>19</p><p>nula de que o parâmetro, ou o modelo como um</p><p>todo, não possuem significância estatística.</p><p>Se o objetivo for apenas a estimação, no</p><p>entanto, este problema não traz muitas</p><p>consequências imediatas. Os estimadores</p><p>continuarão a ser os melhores estimadores não-</p><p>tendenciosos, e a multicolinearidade só será um</p><p>problema muito grande quando for perfeita, ou</p><p>quando a amostra for muito pequena.</p><p>É um dos problemas mais fáceis de testar,</p><p>mas geralmente corrigi-lo se torna um problema,</p><p>visto que precisaríamos realizar transformações</p><p>nos dados, no caso de séries temporais, ou</p><p>inclusão de novas informações, o que</p><p>pressupomos como algo irracional visto que, se</p><p>dispuséssemos de tais informações desde o</p><p>começo, as teríamos usado em toda a</p><p>modelagem.</p><p>VIF (VARIANCE INFLATOR FACTOR)</p><p>Para testar a presença do problema da</p><p>multicolinearidade em nossos modelos, usaremos</p><p>o teste VIF (Variance Inflator Factor), um teste que</p><p>avalia o grau de influência da variância na inflação</p><p>dos resíduos do modelo.</p><p>Em geral, existem testes de</p><p>multicolinearidade que trabalham com a razão</p><p>dos autovalores da matriz de dados. Além destes,</p><p>há também aqueles que trabalham com</p><p>regressões auxiliares, comparando-as em relação</p><p>ao R². No caso do teste VIF, temos um teste que</p><p>mede o quanto o j-ésimo coeficiente da nossa</p><p>regressão está sendo inflado pela variância.</p><p>É basicamente definido por:</p><p>Valores preocupantes, que indicam a</p><p>presença de multicolinearidade no modelo são</p><p>geralmente mais altos que 10.</p><p>Nos resultados do teste VIF aplicados ao</p><p>nosso modelo, no entanto, verificamos valores</p><p>relativamente baixos para o teste, em geral bem</p><p>próximos de 1:</p><p>Logo, assumimos a hipótese nula de que</p><p>não há presença de multicolinearidade em nosso</p><p>modelo.</p><p>CORRELAÇÃO (NÃO-SERIAL)</p><p>Outra hipótese a ser verificada é a da</p><p>autocorrelação, ou correlação serial. Em geral,</p><p>dizemos da autocorrelação que é o problema que</p><p>ocorre quando os erros são correlacionados.</p><p>No caso de dados de corte transversais,</p><p>dizemos que o problema é na verdade de</p><p>correlação não-serial.</p><p>A autocorrelação é um problema que</p><p>assola as séries temporais, e depende de</p><p>inferências a respeito do processo gerador dos</p><p>dados, do grau de autoregressões (AR), da</p><p>presença ou não de estacionariedade, que é a</p><p>característica de que os principais momentos</p><p>centrais (média, variância e covariância) não</p><p>variam ao longo do tempo.</p><p>Neste caso, usaríamos os testes de</p><p>Breusch-Godfrey, ou o de Durbin-Watson para</p><p>verificarmos a presença de autocorrelação.</p><p>Como estamos trabalhando com dados</p><p>cross-section, vamos utilizar a hipótese clássica do</p><p>MQO de ausência de autocorrelação. De toda</p><p>forma, recomenda-se, sob a suspeita de presença</p><p>de correlação entre os termos de erro, construir</p><p>uma modelagem por meio da matriz robusta de</p><p>White e de Mínimos Quadrados Generalizados,</p><p>duas medidas que tomamos o cuidado de realizar.</p><p>Quanto à matriz robusta de White, demonstramos</p><p>na seção sobre heterocedasticidade, e quanto ao</p><p>método de estimação por MQG, demonstraremos</p><p>a seguir:</p><p>20</p><p>MQG - MÍNIMOS QUADRADOS</p><p>GENERALIZADOS</p><p>Dados todos os problemas que podem</p><p>surgir tanto da presença de heterocedasticidade</p><p>quanto da correlação dos resíduos, tomamos o</p><p>cuidado de criar também um terceiro par de</p><p>modelos, da forma linear e duplo-log, porém</p><p>estimados pelo método dos Mínimos Quadrados</p><p>Generalizados. Sob a hipótese de presença da</p><p>heterocedasticidade, como é o caso do nosso</p><p>modelo linear, estimar o modelo por MQG pode</p><p>ser bastante útil no que diz respeito a estimação</p><p>de BLUE, ou seja, de melhores estimadores não-</p><p>tendenciosos.</p><p>Com isto em mente, chegamos, após a</p><p>construção com base em testes que usavam pesos</p><p>normais e quadrados na estimação de uma forma</p><p>funcional que melhor pudesse descrever o</p><p>modelo. Assim chegamos a este modelo final:</p><p>Além de estimar seus parâmetros,</p><p>verificamos o comportamento de seus resíduos,</p><p>como demonstrado na imagem anterior, e</p><p>fizemos o mesmo para o modelo logarítmico:</p><p>Após nova bateria de testes, acerca de</p><p>cada uma das hipóteses previamente</p><p>mencionadas, verificamos que este modelo,</p><p>construído por meio do MQG, tem sido o melhor</p><p>até agora.</p><p>O único problema em criarmos um</p><p>modelo através de MQG é que precisamos</p><p>conhecer bem a forma funcional correta para</p><p>estima-lo, o que nem sempre é possível. Desta</p><p>forma, tomamos também o cuidado de realizar</p><p>uma estimação por MQGF, ou Mínimo Quadrados</p><p>Generalizados Factíveis.</p><p>21</p><p>MQGF - MÍNIMOS</p><p>QUADRADOS GENERALIZADOS</p><p>FACTÍVEIS</p><p>Quando não conhecemos a forma</p><p>funcional correta do modelo de estimação por</p><p>MQG, quando temos presença de</p><p>heterocedasticidade, ou quando notamos a</p><p>presença de certa correlação entre os resíduos,</p><p>geralmente nos deparamos com uma situação na</p><p>qual os estimadores de MQO podem não ser os</p><p>BLUE, ou até mesmo podem ser viesados,</p><p>podemos utilizar o método de MQG Factíveis,</p><p>onde criamos uma regressão auxiliar, que no caso</p><p>do nosso modelo é dada pela regressão</p><p>logarítmica auxiliar:</p><p>Que depois é utilizada como peso na</p><p>regressão principal, por meio de seu inverso</p><p>exponenciado, o que cria a regressão gama</p><p>definida por uma matriz identidade ponderada à</p><p>regressão principal.</p><p>Após termos estimado a regressão</p><p>auxiliar, estimamos agora a principal, cujos</p><p>resultados trataremos de mostrar:</p><p>Além de estimarmos os modelos, fizemos</p><p>também os mesmos testes de sempre.</p><p>Podemos notar, pelos plots dos resíduos e dos</p><p>quadrados dos resíduos acima que conseguimos</p><p>melhorias significativas desde o primeiro modelo.</p><p>22</p><p>COMPARAÇÕES FINAIS E</p><p>ESCOLHA DO MODELO</p><p>Levando em consideração todos os</p><p>resultados até aqui obtidos, os testes, as filtragens</p><p>de dados e todas as características de cada</p><p>modelo, e das particularidades que a temática</p><p>deste trabalho nos traz, realizamos ultimas</p><p>comparações entre os resultados obtidos.</p><p>Em relação a qualidade teórica,</p><p>deveríamos utilizar o modelo logarítmico</p><p>estimado por meio dos MQGF, pois é um modelo</p><p>abrangente, com a menor presença de</p><p>heterocedasticidade envolvida, correlações entre</p><p>os termos de erro corrigidas, e características</p><p>inerentes de BLUE.</p><p>No tocante a modelos lineares, optamos</p><p>pelo modelo criado a partir do método de MQG,</p><p>com pesos inversos, pois foi aquele que melhor</p><p>demonstrou um ajuste aos dados, características</p><p>de BLUE e que reportou os melhores índices de</p><p>qualidade em todos os testes para modelos</p><p>lineares que realizamos.</p><p>Estas decisões podem ser ilustradas por</p><p>meio da plotagem comparativa dos resíduos das</p><p>regressões lineares (série de gráficos superior,</p><p>com os quatro modelos lineares criados desde o</p><p>início), e a plotagem comparativa dos resíduos das</p><p>regressões logarítmicas (série de gráficos inferior,</p><p>com os cinco modelos criados desde o início).</p><p>Por último, tratamos de testar, por meio</p><p>do Microsoft Excel, o grau de acuidade de cada</p><p>modelo linear criado. Os testes reportaram que,</p><p>assim como citado, o modelo criado a partir do</p><p>23</p><p>MQG foi o que reportou o melhor índice de</p><p>predição, chegando até mesmo a prever com</p><p>exatidão uma amostra, e chegar a 95% de acerto</p><p>em diversas outras.</p><p>Dada a falta de significância estatística de</p><p>algumas variáveis, observamos que os erros de</p><p>estimação eram encontrados exatamente nestas</p><p>categorias. Para os países do grupo D, ou seja, de</p><p>alta renda, pudemos prever com precisão</p><p>considerável diversas observações. De maneira</p><p>geral, o que se conclui é que</p><p>os países em</p><p>desenvolvimento, pertencentes aos grupos B e C</p><p>tem realizado fortes investimentos em</p><p>infraestrutura.</p><p>A consolidação de uma rede de</p><p>telecomunicações mais robusta também se</p><p>mostrou significante, e condiz com o report do</p><p>Banco Mundial que atribui a importância de</p><p>investimentos em infraestrutura neste setor.</p><p>Uma preocupação do órgão é também no</p><p>que diz respeito a fornecimento de energia</p><p>elétrica. Em um mundo que possui uma crescente</p><p>demanda por energia, e uma matriz cada vez mais</p><p>complexa, torna-se cada vez mais necessário criar</p><p>investimentos produtivos e eficientes nesta área,</p><p>muito embora não tenhamos verificado</p><p>significância estatística para estes investimentos</p><p>em nosso modelo final.</p><p>Uma outra crescente preocupação do</p><p>Banco Mundial, muito citada no report e que</p><p>pudemos notar o motivo de maneira clara diz</p><p>respeito a capacidade dos países de gerar</p><p>estatísticas eficientes, de qualidade.</p><p>Muitos investimentos tem sido feitos nesta</p><p>área, e perpassam também os investimentos em</p><p>educação, variável estatisticamente significativa</p><p>em nosso modelo, e que a literatura econômica já</p><p>demonstrou inúmeras vezes sua relevância como</p><p>fator decisivo nos ganhos de produtividade de um</p><p>país.</p><p>Para um futuro trabalho mais</p><p>aprofundado em Econometria, ficamos com a</p><p>possibilidade bastante interessante de</p><p>aprendizado utilizando extensões da nossa base</p><p>de dados, para séries temporais (de fato nossa</p><p>preocupação nos fez criar uma base já com dados</p><p>de 10 anos para futuros trabalhos), e extensões na</p><p>teoria econométrica, o que sabemos, poderá ser</p><p>bastante proveitoso.</p><p>24</p><p>DEMONSTRAÇÃO DA</p><p>CAPACIDADE DE ESTIMAÇÃO DO</p><p>MODELO</p><p>Segue uma breve demonstração da</p><p>capacidade de predição do modelo linear</p><p>estimado por MQG:</p><p>País PIB Estimado Y - Ῠ</p><p>Albania</p><p>Algeria</p><p>Angola</p><p>Argentina</p><p>Armenia</p><p>Bangladesh</p><p>Belarus</p><p>Bolivia</p><p>Botswana</p><p>Brazil</p><p>Bulgaria</p><p>Cabo Verde</p><p>Cambodia</p><p>Cameroon</p><p>Colombia</p><p>Cote d'Ivoire</p><p>D. Republic</p><p>Ecuador</p><p>Egypt</p><p>El Salvador</p><p>Georgia</p><p>Ghana</p><p>Guatemala</p><p>Honduras</p><p>India</p><p>Indonesia</p><p>Iran</p><p>Jamaica</p><p>Kazakhstan</p><p>Kenya</p><p>Kyrgyz Rep.</p><p>Liberia</p><p>Madagascar</p><p>Malaysia</p><p>Mexico</p><p>Moldova</p><p>Morocco</p><p>4081.53</p><p>4764.58</p><p>4304.18</p><p>11205.08</p><p>3308.33</p><p>815.10</p><p>6034.09</p><p>2286.77</p><p>6384.13</p><p>10015.90</p><p>6855.17</p><p>115.91</p><p>601.87</p><p>740.48</p><p>6314.40</p><p>1291.91</p><p>5525.16</p><p>5073.68</p><p>2712.47</p><p>3712.07</p><p>3314.82</p><p>1381.25</p><p>3115.66</p><p>2157.89</p><p>1305.87</p><p>2935.36</p><p>5943.61</p><p>4999.05</p><p>10199.01</p><p>1098.24</p><p>1014.13</p><p>354.26</p><p>430.91</p><p>9300.19</p><p>9439.73</p><p>1720.41</p><p>2928.24</p><p>4110.98</p><p>4170.62</p><p>2945.66</p><p>10912.51</p><p>3288.03</p><p>677.26</p><p>7223.98</p><p>3228.72</p><p>10963.23</p><p>11628.04</p><p>7067.11</p><p>118.18</p><p>543.91</p><p>861.99</p><p>6516.64</p><p>1752.38</p><p>2467.92</p><p>4980.53</p><p>2796.48</p><p>3872.83</p><p>3107.85</p><p>2472.70</p><p>2764.95</p><p>3441.57</p><p>1232.70</p><p>2214.73</p><p>4532.76</p><p>5820.40</p><p>7151.84</p><p>1999.74</p><p>1544.27</p><p>296.72</p><p>375.43</p><p>9632.67</p><p>9456.11</p><p>3386.83</p><p>3912.82</p><p>-29.45</p><p>593.97</p><p>1358.51</p><p>292.57</p><p>20.30</p><p>137.85</p><p>-1189.88</p><p>-941.96</p><p>-4579.10</p><p>-1612.15</p><p>-211.94</p><p>-2.26</p><p>57.96</p><p>-121.51</p><p>-202.24</p><p>-460.47</p><p>3057.24</p><p>93.15</p><p>-84.01</p><p>-160.77</p><p>206.97</p><p>-1091.45</p><p>350.71</p><p>-1283.68</p><p>73.17</p><p>720.62</p><p>1410.85</p><p>-821.34</p><p>3047.17</p><p>-901.50</p><p>-530.14</p><p>57.54</p><p>55.48</p><p>-332.48</p><p>-16.39</p><p>-1666.42</p><p>-984.58</p><p>Mozambique</p><p>Nepal</p><p>Nicaragua</p><p>Pakistan</p><p>Peru</p><p>Philippines</p><p>Romania</p><p>Russia</p><p>Senegal</p><p>Serbia</p><p>Sierra Leone</p><p>South Africa</p><p>Sri Lanka</p><p>Tajikistan</p><p>Tanzania</p><p>Thailand</p><p>Togo</p><p>Turkey</p><p>Uganda</p><p>Ukraine</p><p>Vanuatu</p><p>Vietnam</p><p>Yemen, Rep.</p><p>Zambia</p><p>515.99</p><p>586.88</p><p>1664.12</p><p>1161.93</p><p>5235.51</p><p>2289.21</p><p>8678.01</p><p>11776.84</p><p>1011.74</p><p>5711.72</p><p>571.11</p><p>6625.85</p><p>2790.50</p><p>816.91</p><p>735.88</p><p>5070.51</p><p>537.73</p><p>9911.07</p><p>590.16</p><p>3101.75</p><p>2854.33</p><p>1502.58</p><p>1233.73</p><p>1469.02</p><p>688.74</p><p>586.88</p><p>2513.39</p><p>994.00</p><p>3984.44</p><p>1837.42</p><p>7613.03</p><p>10331.36</p><p>1932.46</p><p>7280.69</p><p>675.33</p><p>7819.01</p><p>1720.00</p><p>1043.90</p><p>837.35</p><p>4521.60</p><p>479.59</p><p>6638.72</p><p>612.92</p><p>4441.88</p><p>3535.22</p><p>1746.51</p><p>1302.30</p><p>1020.23</p><p>-172.74</p><p>0.00</p><p>-849.27</p><p>167.93</p><p>1251.07</p><p>451.79</p><p>1064.97</p><p>1445.48</p><p>-920.72</p><p>-1568.96</p><p>-104.23</p><p>-1193.16</p><p>1070.49</p><p>-226.99</p><p>-101.46</p><p>548.91</p><p>58.14</p><p>3272.35</p><p>-22.75</p><p>-1340.12</p><p>-680.89</p><p>-243.92</p><p>-68.57</p><p>448.79</p><p>25</p><p>FILTRAGENS DE DADOS</p><p>Ao longo do trabalho, foram citadas as</p><p>quatro filtragens de dados realizadas. São elas:</p><p>PRIMEIRA FILTRAGEM DE DADOS</p><p>Até então, contávamos com observações</p><p>diversas para todas as variáveis inicialmente</p><p>citadas, PIB e PNB, população, dummy para</p><p>OECD, grupo de renda ao qual o país pertence,</p><p>gastos do governo, gastos em educação, crédito</p><p>doméstico, investimentos em telecomunicações,</p><p>energia, transporte, água e saneamento e</p><p>usuários de internet por 100 pessoas. Tudo isto em</p><p>uma matriz com dados para 203 economias.</p><p>Verificamos, logo no começo, a</p><p>dificuldade de trabalhar com algumas delas, dado</p><p>a falta de dados, problema corriqueiro quando se</p><p>trata de dados com observações de nível mundial.</p><p>Decidimos por retirar, então, nesta primeira</p><p>filtragem, as variáveis PNB e água e saneamento,</p><p>pela dificuldade que seria converter os valores</p><p>todos para % do PNB, e pela quantidade de NA’s</p><p>na amostra, respectivamente.</p><p>SEGUNDA FILTRAGEM DE DADOS</p><p>Este processo foi, na verdade primeiro a</p><p>remoção de outras variáveis que não se</p><p>encaixaram no modelo após os testes com os</p><p>primeiros modelos lineares criados. Nesta</p><p>filtragem, removemos OECD e usuários de</p><p>internet, pela baixa significância estatística e</p><p>pouco poder teórico.</p><p>TERCEIRA FILTRAGEM DE DADOS</p><p>Neste processo, convertemos todos os</p><p>dados até então usados em dados per capita, e</p><p>remodelamos todas as regressões feitas. Aquelas</p><p>que haviam sido removidas continuaram sem</p><p>significância estatística, e permaneceram fora dos</p><p>dados finais.</p><p>QUARTA FILTRAGEM DE DADOS</p><p>Neste processo, foi criada a tabela final,</p><p>que deu origem ao arquivo data4.csv, carregado</p><p>pelo R para ser utilizado nos principais modelos</p><p>de regressão mais robustos. Basicamente,</p><p>nenhuma outra alteração importante foi feita.</p><p>QUINTA FILTRAGEM DE DADOS</p><p>Procedimento inteiramente realizado</p><p>dentro do R, onde nos preocupamos em criar uma</p><p>amostra de dados sem outliers. Removemos,</p><p>neste processo, observações provenientes de 5</p><p>países, sendo eles Butão, Chile, Lao, Lituânia e</p><p>Uruguai.</p><p>26</p><p>BIBLIOGRAFIA</p><p>World Bank, 2016. World Development Indicators</p><p>2016. DC. © World Bank. Disponível em:</p><p>https://issuu.com/world.bank.publications/docs/9</p><p>781464806834?e=0/35179276</p><p>Acessado em: 01 de julho de 2016.</p><p>World Bank. 2016. The Little Data Book 2016.</p><p>Washington, DC. © World Bank. Disponível em:</p><p>https://openknowledge.worldbank.org/handle/10</p><p>986/23968 License: CC BY 3.0 IGO.</p><p>Acessado em: 03 de julho de 2016.</p><p>GUJARATI, Damodar N. Econometria Básica.</p><p>Tradução de Maria José Cyhlar Monteiro. – Rio de</p><p>Janeiro: Elsevier, 2006 – 5a tiragem.</p><p>CRÉPON, Bruno. Econometrie Lineaire. ISBN:</p><p>9782804153236, 2005.</p><p>Diagnóstico de Homocedasticidade. Portal Action.</p><p>Disponível em:</p><p>http://www.portalaction.com.br/analise-de-</p><p>regressao/32-diagnostico-de-</p><p>homoscedasticidade</p><p>Acessado em: 05 de agosto de 2016.</p><p>Multicolinearidade. Portal Action. Disponível em:</p><p>http://www.portalaction.com.br/analise-de-</p><p>regressao/362-multicolinearidade</p><p>Acessado em: 06 de agosto de 2016.</p><p>View publication statsView publication stats</p><p>https://www.researchgate.net/publication/308700023</p>

Mais conteúdos dessa disciplina