Buscar

Apostila Econometria 2013

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 112 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 112 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 112 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Introdução à 
ECONOMETRIA 
Prof. Helio Otsuka 
 
 
 
Versão 2013 
 
 
 
 
 
 
Sumário 
 
. Capítulo 1: Introdução .............................................................................................................................. 1 
 
. Capítulo 2: Conceitos iniciais .................................................................................................................... 3 
2.1. Objetivo da econometria ..................................................................................................................... 3 
2.2. Definição de modelo ............................................................................................................................ 3 
2.3. Estrutura de um modelo econométrico ............................................................................................... 4 
 
. Capítulo 3: Análise de regressão linear simples de duas variáveis ............................................................ 6 
3.1. Expressão do modelo ........................................................................................................................... 8 
3.2. Pressupostos básicos............................................................................................................................ 8 
3.3. Estimação dos parâmetros ................................................................................................................... 9 
3.4. Equações normais (equações simultâneas) ......................................................................................... 10 
 
. Capítulo 4: Regressão linear múltipla ....................................................................................................... 22 
4.1. Introdução ............................................................................................................................................ 22 
4.2. Pressupostos do modelo ...................................................................................................................... 23 
4.2.1. Teorema de Gauss-Markov ....................................................................................................... 23 
4.3. Estimação dos parâmetros ................................................................................................................... 24 
4.4. Estimação da equação de regressão múltipla ...................................................................................... 25 
4.5. Previsão de valores com base na equação de regressão ..................................................................... 25 
4.6. Erro padrão da estimativa .................................................................................................................... 26 
4.7. Intervalos de predição (IP) ................................................................................................................... 26 
4.8. Erro padrão dos estimadores ............................................................................................................... 26 
4.9. Intervalo de confiança dos estimadores .............................................................................................. 27 
4.10. Coeficiente de determinação (poder explicativo da regressão) ........................................................ 27 
4.11. Teste de hipóteses ............................................................................................................................. 28 
 
. Capítulo 5: Correlação .............................................................................................................................. 45 
5.1. Objetivo para economia ....................................................................................................................... 45 
5.2. Conceito de correlação ........................................................................................................................ 45 
5.3. Medida de correlação .......................................................................................................................... 46 
5.4. O coeficiente de correlação r e sua interpretação ............................................................................. 46 
5.5. Imagens de r no plano cartesiano em função do seu valor ............................................................... 47 
5.6. Diferença entre correlação e regressão ............................................................................................... 48 
 
. Capítulo 6: Violação dos pressupostos básicos ......................................................................................... 54 
6.1. Heteroscedasticidade e homoscedasticidade ...................................................................................... 54 
6.2. Natureza da heteroscedasticidade ....................................................................................................... 55 
6.3. Consequências da heteroscedasticidade ............................................................................................. 57 
6.4. Detecção da heteroscedasticidade ...................................................................................................... 57 
 
. Capítulo 7: Autocorrelação ou Correlação Serial ....................................................................................... 69 
7.1. Natureza da autocorrelação ................................................................................................................. 69 
7.2. Padrões gráficos de autocorrelação ..................................................................................................... 69 
7.3. Causa da autocorrelação ...................................................................................................................... 70 
7.4. Consequências da autocorrelação ....................................................................................................... 70 
7.5. Diagnóstico (identificação) da autocorrelação .................................................................................... 71 
7.6. Medidas corretivas visando a remoção da autocorrelação ................................................................. 76 
 
 
 
 
. Capítulo 8: Utilização de variáveis especiais ............................................................................................. 82 
8.1. Variáveis dummy (dummies, binárias, artificiais, dicotômicas, etc.) ................................................... 82 
8.2. Incorporação da variável ( )d ao modelo de regressão linear ............................................................. 83 
A) Incorporação da variável ( )d pela forma aditiva .......................................................................... 83 
B) Incorporação da variável ( )d pela forma multiplicativa ............................................................... 87 
 
 
. Capítulo 9: Análise das séries temporais ................................................................................................... 92 
9.1. Introdução ............................................................................................................................................ 92 
92. Conceito de séries temporais ................................................................................................................ 92 
9.3. Análise de uma série temporal ............................................................................................................ 94 
 
. Tabelas ..................................................................................................................................................... 104 
Tabela normal .............................................................................................................................................104 
Distribuição t de Student ............................................................................................................................ 105 
Tabela da distribuição F (nível de significância 1%) .................................................................................... 106 
Tabela da distribuição F (nível de significância 5%) .................................................................................... 107 
Tabela de Durbin-Watson ........................................................................................................................... 108 
 
. Bibliografia ............................................................................................................................................... 109 
 
 
ECONOMETRIA 
(Noções Básicas) 
 
 
Capítulo 1: INTRODUÇÃO 
 
Uma imensa gama de relações teóricas existentes entre variáveis de natureza econômica podem 
ser expressas e formuladas através de modelos matemáticos. Assim, nota-se que cada vez mais 
estudiosos em economia se valem de metodologias estatísticas para estimar parâmetros 
desconhecidos, testar hipóteses, efetuar simulações sobre as mais diversas relações entre 
variáveis econômicas, visando efetuar previsões de caráter quantitativo de inúmeros eventos. É 
exatamente nesse contexto que se torna imprescindível a efetiva participação da econometria 
como ferramenta necessária na verificação, por exemplo, de teorias e políticas econômicas, 
previsão de valores de variáveis de natureza econômica, influenciando sobremaneira na tomada 
de decisões. 
 
O objetivo dessa apostila é procurar transmitir aos estudantes de economia, de forma clara e 
resumida, os principais conceitos que entendemos serem relevantes para a sua formação. 
 
Dado o número exíguo de horas/aulas disponíveis, procuramos abranger o máximo do nosso 
conteúdo programático, dando ênfase à parte prática/operacional de cada capítulo com aplicação 
de exercícios já desenvolvidos com a consequente interpretação dos seus resultados, deixando a 
parte teórica de maior profundidade, como trabalho de consulta, análise e interpretação por parte 
do aluno junto a bibliografia recomendada. Contem ainda exercícios complementares que deverão 
ser desenvolvidos no decurso das aulas 
 
Assim, entendemos que o conteúdo programático apresentado na sequencia será suficiente para 
dar uma ideia da importância do conhecimento de econometria como base na formação dos 
futuros profissionais em economia. 
 
Vale deixar aqui registrado, contudo, que a econometria, como também ocorre em outras 
ciências, apresenta suas limitações, principalmente de natureza estatística e econômica. 
 
Poderíamos citar algumas de natureza estatística, como por exemplo: 
 
− utilização de amostras pequenas, não representativas; 
 
− falhas nas observações das variáveis; 
 
− dificuldade de dar tratamento adequado a alguns modelos não lineares; 
 
− o problema da multicolinearidade, etc. 
 
Entre os de natureza econômica temos: 
 
1 
 
 
− dificuldades na classificação de variáveis em endógenas e exógenas o que tornaria tendencioso 
o efeito das mesmas; 
 
− dificuldade de incorporar nos modelos os fatores de natureza qualitativa e subjetiva como 
opiniões; expectativas; intenções; etc. 
 
− problemas de especificação da teoria e dos erros, etc. 
 
Os problemas citados já vêm sendo analisados há algum tempo por econometristas, entretanto 
alguns pontos não foram totalmente solucionados como o problema da multicolinearidade 
(intercorrelação entre variáveis explicativas) e mensuração de variáveis subjetivas. 
 
Para o aprendizado suave da matéria pressupõe-se que o alunado tenha algum conhecimento de 
estatística básica e de inferência estatística. 
 
Apresentamos abaixo, os assuntos abordados nesta apostila, acompanhados de exercícios ao fim 
de cada capitulo, procurando, na medida do possível, alinhar-se com o programa de econometria 
instituído pela Faculdade. 
 
− Conceito de econometria e o seu objetivo; 
 
− Conceito de modelo (classificação, estrutura, pressupostos básicos, etc.); 
 
− Análise da regressão linear simples de duas variáveis (estimação e interpretação dos 
parâmetros; o método dos mínimos quadrados ordinários; conceito de regressão; previsão de 
valores; erro padrão da estimativa; erro máximo de estimação; intervalo de predição; erro 
padrão dos estimadores; qualidade do ajuste e sua interpretação; teste de hipóteses aplicados 
à regressão pela distribuição “t” de Student e pela distribuição “F” de Fisher/Snedecor com a 
elaboração do quadro ANOVA (Analysis of Variance); 
 
− Análise da regressão linear múltipla, onde serão abordados todos os itens já comentados na 
análise de regressão simples; 
 
− Covariância e correlação (determinação, interpretação e verificação da sua existência); 
 
− Violação dos pressupostos básicos (heteroscedasticidade e homoscedasticidade; natureza, 
consequência e detecção da heteroscedasticidade); autocorrelação serial (causas, 
consequências e diagnóstico da autocorrelação); 
 
− Utilização de variáveis especiais como extensão dos modelos de regressão (variáveis dummy, 
binária, artificial ou dicotômica); utilização da variável tempo como variável explicativa numa 
série temporal de informações numéricas; 
 
− Modelos não lineares; 
 
− Análise de séries temporais. 
2 
 
 
Para finalizar, gostaríamos de lembrá-los de que a presente apostila não é uma receita de bolo, 
onde o estudante pensa que aprendendo o que está nela contida, já sabe tudo sobre econometria. 
Muito pelo contrário. O nosso objetivo, ao preparar a matéria dessa forma, foi com a intenção de 
facilitar e maximizar o processo de aprendizado, dando ênfase aos itens de maior relevância 
dentro do conteúdo programático adotado pela Faculdade, contendo aplicações práticas de fácil 
entendimento. 
 
Certamente um dos mais poderosos instrumentos utilizados na análise de problemas econômicos 
são as aplicações de técnicas estatísticas à economia, denominada de econometria. 
A econometria em si, é muito mais abrangente com uma diversidade de tópicos que não estão 
aqui comentados. 
 
 
Capítulo 2: CONCEITOS INICIAIS 
 
2.1. OBJETIVO DA ECONOMETRIA 
 
A econometria trata da mensuração das relações entre variáveis de natureza econômica com base 
em ferramental estatístico e tem como alguns de seus objetivos a verificação empírica das leis e 
das teorias econômicas, a avaliação das políticas econômicas, a previsão dos valores das variáveis 
de natureza econômica, etc. 
 
Alguns autores como Artur S. Goldberger, em seu livro “Econometric Theory”, define econometria 
como a ciência social no qual o ferramental estatístico, tais como inferência estatística e a 
estatística matemática, são aplicadas à análise dos fenômenos econômicos. 
 
 
2.2. DEFINIÇÃO DE MODELO 
 
Entende-se como modelo em econometria a um conjunto de hipóteses estabelecidas à priori, 
acerca do comportamento de um dado fenômeno, com base numa teoria já existente e podem ser 
classificados em teóricos e econométricos. 
 
Um modelo é teórico quando expressam leis de natureza econômica sem conter necessariamente 
tratamento estatístico; já os econométricos, contém necessariamente tratamento estatístico com 
as devidas especificações como, por exemplo: a definição das variáveis, a forma funcional, o nº de 
equações, etc. como veremos a seguir. 
 
 Exemplo de modelo teórico: 
 Função liquidez: M= L (i;x) , onde M= meios de pagamento; L=liquidez; i=taxa de juro; x = 
renda 
 
 Exemplo de modelo econométrico: 
 Função consumo: C= a+bx+e, onde C= consumo agregado; a e b = parâmetros linear e angular; 
x= renda; e= erro aleatório 
3 
 
 
Os modelos podem ainda ser classificados quanto a sua forma funcional e quanto ao número de 
equações: 
 
 Quanto a forma funcional- Lineares: quando é expressa por uma função linear 
 
ixy .21 ββ += 
 
- Não lineares: quando é expressa por uma função não linear 
 
ixy 21 ββ ⋅= , que é uma função exponencial simples 
 
 Quanto ao número de equações: 
 
- Uniequacionais: quando contêm apenas uma equação 
 
xcxbxay ++= 
 
- Pluriequacionais: quando contêm pelo menos duas equações como, por exemplo, uma função 
linear (1) e a função (2) onde x representa o resultado da diferença entre a função (1) e o 
resultado dos investimentos (w) 
 
ixy .21 ββ += (1) 
 
wyx −= (2) 
 
Onde =y despesa em função da renda, =x renda e =w resultado dos investimentos 
 
 
2.3. ESTRUTURA DE UM MODELO ECONOMÉTRICO 
 
 
Estruturalmente um modelo econométrico envolve quatro elementos básicos que são: Variáveis 
(dependente e independente), Equações, Parâmetros ou Coeficientes (intercepto e o parâmetro 
responsável pela declividade, além do termo aleatório ou perturbações). 
 
Por exemplo: na estrutura de um modelo linear encontramos a variável dependente (ou endógena 
ou explicada), a variável independente x (ou exógena ou explicativa), os parâmetros linear ou 
intercepto 1β e o angular 2β , conforme esquema a seguir, além do termo aleatório e . 
exy i ++= .21 ββ 
 
Onde: 
=y variável dependente =1β parâmetro intercepto 
4 
 
 
=ix variável independente =2β parâmetro angular 
=e termo aleatório 
 
 O que são regressores? 
 
O conjunto de variáveis exógenas ou explicativas mais o termo constante ou linear ou intercepto 
são denominados de regressores. Assim, na equação acima, os regressores seriam: 
 
1β e ix.2β 
 
Cabe lembrar que o comportamento da economia resulta da interdependência de diversos fatores 
e ao explicá-lo os economistas evitam a complexidade do mundo real através da construção de 
modelos que apesar de retratarem de forma aproximada a realidade, destacando apenas os 
elementos ou variáveis consideradas relevantes, permitem alcançar a essência do fenômeno em 
questão. Apesar do avançado estágio em que se encontra a teoria econômica, ocorrem situações 
onde a formulação das hipóteses do modelo e a identificação dos elementos relevantes é um 
tanto arbitrária, não havendo garantias de que elas sejam realistas, portanto, é preciso verificar se 
o modelo proposto é capaz de explicar o fenômeno a que se propõe. 
 
Através do confronto do modelo com as observações do mundo real é que se pode concluir ou 
não a validade do modelo. Um poderoso instrumento neste sentido são os modelos 
econométricos analisados pela econometria, uma técnica que agrega a estatística, a matemática e 
a teoria econômica. 
 
Conforme indicado na figura 1 a seguir, um modelo econométrico resulta de um processo que se 
inicia com uma análise econômica que envolve a consulta da teoria econômica e percepção da 
realidade para auxiliar na identificação das variáveis dependentes e independentes a serem 
incluídas no modelo, bem como na especificação da forma funcional que relaciona estas variáveis. 
Uma característica dos modelos econométricos é a consideração de um termo estocástico, com 
uma distribuição de probabilidade hipotética, para representar a incerteza inerente ao 
comportamento da economia e também outras variáveis, omitidas na formulação do modelo, mas 
que explicam a realidade. 
 
Uma vez especificado o modelo econométrico e estabelecidas às hipóteses pertinentes, são 
coletadas observações das variáveis dependentes e independentes, para em seguida, através da 
aplicação da inferência estatística, estimar e testar a validade do modelo econométrico. A validade 
de um modelo econométrico não será apenas julgada por técnicas de inferência estatística, mas 
também pela coerência com a teoria econômica. Caso o modelo especificado não seja o aceito 
deve ser corrigido, seja retirando ou incluindo variáveis independentes ou ainda modificando a 
forma funcional que relaciona as variáveis. 
 
Quanto à aplicação, os modelos econométricos podem ser utilizados na obtenção de evidências 
empíricas que modifiquem, refinem ou refutem as conclusões contidas na teoria econômica ou 
novas proposições teóricas e também na avaliação de políticas econômicas, sendo uma 
ferramenta muito útil para fazer previsões de alguma variável econômica ou ainda estimar 
5 
 
 
parâmetros como elasticidades, multiplicadores, coeficientes técnicos e custos marginais, 
portanto trata-se de uma valiosa ferramenta em um processo de tomada de decisão. 
 
 
 
 
Figura 1 – sugestão de roteiro para construção de modelos econométricos 
 
 
Capítulo 3: ANÁLISE DE REGRESSÃO LINEAR SIMPLES DE DUAS VARIÁVEIS 
 
O gerente de vendas de uma empresa varejista do ramo de calçados está interessado em obter 
uma equação que sintetize a relação existente entre o investimento em propaganda e o volume 
de vendas da empresa, com a finalidade de realizar projeções do volume de vendas. 
 
 
6 
 
 
Tabela 3.1 Dados de investimento em propaganda e vendas em milhares de reais da empreza Z. 
 
Investimento em Propaganda milhares de 
Reais (x) 
Venda em milhares de Reais 
(y) 
30 40 
20 34 
35 52 
40 49 
38 47 
18 21 
10 20 
15 27 
35 41 
24 48 
 
 
0
10
20
30
40
50
60
0 10 20 30 40 50
Investimento em propraganda milhares de Reais 
Ve
nd
a 
em
 m
ilh
ar
es
 d
e 
re
ai
s 
 
Figura 3.1 Dados de investimento em propaganda e vendas em milhares de reais da empreza Z. 
 
A figura 3.1 apresenta um gráfico com os valores de uma amostra levantada pelo departamento 
de vendas da empresa Z. O gráfico revela uma tendência de crescimento entre o volume de 
vendas e o investimento em propaganda, ou seja, um incremento no investimento em propaganda 
resulta em um aumento no volume de vendas. 
7 
 
 
0
10
20
30
40
50
60
0 10 20 30 40 50
Investimento em propraganda milhares de Reais 
Ve
nd
a 
em
 m
ilh
ar
es
 d
e 
re
ai
s 
 
Figura 3.2 Reta ajustada entre Volume de vendas e investimento com propaganda em milhares de 
reais. 
 
O exemplo anterior constitui uma aplicação de regressão linear simples, onde a relação existente 
entre a variável dependente ou endógena (volume de vendas) e a variável independente ou 
exógena (investimento em propaganda) é modelada através de uma reta ajustada aos dados 
amostrais, conforme mostra a Figura 3.2 
 
 
3.1. EXPRESSÃO DO MODELO: 
 
exy i ++= .21 ββ (3) 
 
O modelo é chamado de regressão linear simples porque há apenas uma variável econômica ( )x , 
no lado direito da equação. Quando houver mais de uma variável explicativa ( )x é chamada de 
regressão múltipla. É chamado de linear porque a expectativa condicional de y é uma função 
linear de x , ou seja: 
 
( ) exxyE ++= .21 ββ 
 
 
3.2. PRESSUPOSTOS BÁSICOS: 
 
O termo regressão mostra o efeito da variável explicativa x sobre a variável explicada y , através 
das estimativas dos parâmetros iβ . 
 
Num modelo de regressão linear deverão ser considerados alguns pressupostos conforme abaixo: 
 
a) O valor de y para cada valor de x é definido pela expressão acima (3), onde “ e ” é o erro ou 
termo aleatório. 
8 
 
 
b) A esperança matemática do erro aleatório é igual a zero, pois admite-se que ( ) ixyE .21 ββ += , 
donde se conclui que: ( ) 0=eE . 
 
c) A variância do erro aleatório é igual à variância de y , pois y e “ e ” diferem apenas pelo 
intercepto, que é um fator constante que não altera a variância, ( ) ( )yVeV = . Portanto, a 
variância do erro aleatório é finita e constante. 
 
d) A covariância entre qualquer par de erros aleatórios 1e e 2e é igual à covariância do par 1y e 
2y que é igual à zero, ou seja: ( ) ( ) 0;cov;cov 2121 == yyee . Assim, temos que os termos 
aleatórios são independentes. 
 
e) O Erro aleatório (e) seguedistribuição normal com média igual a zero e variância constante; 
 
 OBS: 
Significado do termo erro aleatório ou perturbação estocástica ( )e : resumidamente podemos 
conceituar como sendo o substituto ou representante de todas as variáveis omitidas ou 
desconsideradas que podem afetar a variável dependente y , mas que não estão no modelo de 
regressão ou que não puderam ser incluídos no citados modelo. 
 
 
3.3. ESTIMAÇÃO DOS PARÂMETROS 
 
O problema de regressão consiste em, dado o modelo teórico (como o linear, por exemplo), 
estimar os parâmetros desconhecidos 1β e 2β que são respectivamente os parâmetros intercepto 
e o angular, com base nas informações amostrais de um dado fenômeno como, por exemplo, 
despesas com alimentação e renda (no caso de uma regressão linear simples). 
 
Apesar de existirem vários métodos para sua obtenção (polinômios ortogonais, máxima 
verossimilhança, mínimos quadrados ordinários, etc.), o mais recomendado, por ser não 
tendencioso, consistente, eficiente, de fácil obtenção e de maior confiabilidade, é o método dos 
mínimos quadrados ordinários, que sugere como princípio que devemos obter uma reta tal que a 
soma dos quadrados das distancias verticais de cada ponto à reta seja o menor possível ou em 
outras palavras, que a soma dos quadrados das diferenças entre cada valor conhecido e ajustado 
pela função ( )yˆ seja o menor possível, isto é: 
 
( )∑
=
−
n
i
yy
1
2ˆ = mínimo (4) 
 
O valor do intercepto ( )1β e o valor do parâmetro angular ( )2β dessa reta que melhor se ajusta 
aos dados conhecidos ( )y , pelo método dos mínimos quadrados ordinários (m.q.o.) são 1b e 2b 
que são as estimativas de 1β e 2β do modelo linear simples: ixbby .21 += . 
 
9 
 
 
3.4. EQUAÇÕES NORMAIS (Equações simultâneas) 
 
Para obtermos os valores de 1b e 2b , utilizamos a forma recursiva, denominada de equações 
normais que são obtidas derivando-se parcialmente a igualdade (4) acima e igualando-a a zero, 
obtendo-se: 
 
- Forma geral 
 




+=
+=
∑∑ ∑
∑∑
2
2
2
..
..
xbxbxy
xbnby
i
i
 (5) 
 
- Forma reduzida 
 
( ) ( )( )
( ) ( )222 .
..
∑∑
∑∑∑
−
−
=
xxn
yxxyn
b (6) 
 
xbyb .21 −= (7) 
 
As fórmulas (4), (5) e (6) e (7) são denominadas de estimadores de mínimos quadrados e são 
utilizadas para estimar os parâmetros 1b e 2b da função. 
 
Na sequência daremos um exemplo com várias perguntas. O desenvolvimento, a interpretação e 
a natureza das mesmas estão explicitados no decurso das resoluções das questões. 
 
 Exemplo 1: 
A tabela abaixo mostra a evolução da poupança pessoal ( )y e renda pessoal ( )x em unidades 
monetárias (U.M.) por um período de 12 anos (Colunas (1), (2) e (3)). Pressupõe-se que a trajetória 
das variáveis assume um comportamento linear. 
 
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) 
Anos 
Poupança 
( )y 
Renda 
( )x yx. 
2x yˆ ( )2yˆy − ( )2xx − ( )2yy − ( )2ˆ yy − 
1 6 8 48 64 6,15 0,023 49 16 14,82 
2 7 8 56 64 6,15 0,723 49 9 14,82 
3 6 9 54 81 6,70 0,490 36 16 10,89 
4 8 11 88 121 7,80 0,040 16 4 4,84 
5 9 12 108 144 8,35 0,422 9 1 2,72 
6 10 13 130 169 8,90 1,210 4 0 1,21 
7 9 14 126 196 9,45 0,202 1 1 0,30 
8 9 16 144 256 10,55 2,402 1 1 0,30 
9 11 18 198 324 11,65 0,422 9 1 2,72 
10 12 20 240 400 12,75 0,002 25 4 7,56 
11 15 11 165 121 13,85 1,322 49 25 14,82 
12 18 29 522 841 17,70 0,090 196 64 59,29 
∑ 120 180 2044 3144 - 7,911 444 142 134,29 
10 
 
 
Nota: as colunas (1) a (3) são dados informados e as colunas (4) a (10) são colunas auxiliares para 
desenvolvimento das questões. 
 
Com base nas informações pede-se: 
 
1) Estimar pelo método dos mínimos quadrados ordinários a equação da poupança em função 
da renda; 
2) Calcular e interpretar o resultado dos estimadores obtidos; 
 
3) Estimar a poupança provável, se a renda pessoal num determinado ano for de 35 U.M. 
 
4) Avaliar o erro padrão de estimativa 
 
5) Obter o intervalo de predição para a poupança estimada em (3) 
 
6) Determinar o erro padrão dos estimadores; 
 
7) Obter o intervalo de confiança dos estimadores com 05,0=α e interpretá-los; 
 
8) Verificar a qualidade do ajuste e interpretá-lo; 
 
9) Determinar o intervalo de predição em função do erro máximo do valor estimado e o 
intervalo de predição dela decorrente. 
 
10) Testar a hipótese da existência de regressão entre o par x e y (por Student e por Fische 
 
 
 Desenvolvimento: 
 
1) Equação de regressão do modelo ( )xy .21 ββ += 
 
( ) ( )( )
( ) ( )222 .
..ˆ
∑∑
∑∑∑
−
−
=
xxn
yxxyn
b 
( )22 180314412
120180204412ˆ
−×
×−×
=b ∴ 55,02ˆ =b 
 
1555,010.ˆˆ 21 ×−=−= xbyb ∴ 75,11ˆ =b 
 
- Equação de regressão da poupança: 
 
xy 55,075,1ˆ += 
 
2) Interpretação de 1ˆb e 2ˆb 
11 
 
 
No contexto econômico, o valor 75,11ˆ =b , significa que mesmo que a renda x seja zero, a 
poupança pessoal y teria um crescimento de 1,75 U.M. 
 
Quanto ao estimador 2ˆb , significa aumento de 0,55 na poupança pessoal ( )y , quando a renda 
pessoal ( )x (parâmetro angular) aumentar de uma unidade monetária. 
 
3) Valor estimado da poupança quando a renda for de 35 U.M. 
Com a ajuda da equação obtida na questão (1), ou seja, xy 55,075,1ˆ += , podemos estimar o 
provável valor da poupança pessoal ( )y , bastando para tanto substituir a variável explicativa ( )x 
por 35 U.M. que é a renda conhecida, ou seja: 
 
xy 55,075,1ˆ += 
3555,075,1 ×+=esty ∴ 21=esty U.M. 
 
4) Erro padrão de estimativa 
O erro padrão da estimativa tem como uma de suas finalidades estabelecer o intervalo de 
predição (margem de desvio) para mais ou para menos do valor estimado de ( )y em função de 
( )x . Portanto, nada mais é do que a dispersão em termos absolutos dos valores residuais. Como 
se sabe, os valores residuais são aqueles valores resultantes da diferença entre os dados 
conhecidos e os ajustados por uma função qualquer. 
 
O erro padrão da estimativa, geralmente representado por xyS :ˆ é calculado pela expressão: 
 
( )
kn
yy
S xy −
−
= ∑
2
:
ˆˆ (8) 
 
Sendo: 
=y dados conhecidos (coluna 2 da tabela) 
=yˆ dados ajustados pela equação (coluna 6) 
=n tamanho da amostra ( 12=n ) 
=k número de parâmetros (intercepto + angular) 
 
 
( )
212
911,7ˆˆ
2
: −
=
−
−
= ∑
kn
yy
S xy ∴ 89,0ˆ : =xyS 
5) Intervalo de Predição (IP) para o valor estimado da poupança de 21 U.M. 
O Intervalo de Predição (IP) nada mais é do que a margem de erro do valor estimado, o que sugere 
diminuir e posteriormente somar ao valor estimado o erro padrão da estimativa, calculado na 
questão anterior, ou seja, quanto menor o seu valor, menor é a margem de erro. 
 
IP = valor estimado (VE) ± erro padrão da estimativa 
12 
 
 
IP = VE ± xyS :ˆ 
IP = (VE - xyS :ˆ ; VE + xyS :ˆ ) (9) 
IP = 21 + 0,89 
IP = (21 - 0,89 ; 21 + 0,89) 
IP = (20,11 ; 21,89) 
 
6) Erro padrão dos estimadores 1ˆb e 2ˆb 
No estudo da regressão, a determinação do erro padrão dos estimadores ( )
1
ˆ
bS tem como uma de 
suas finalidades básicas auxiliar na obtenção do intervalo de confiança dos estimadores, pois é de 
fundamental importância que os estimadores sejam não tendenciosos. 
 
No caso da regressão linear simples, vimos que os estimadores são 1ˆb e 2ˆb , assim, temos: 
 
 Cálculo do erro padrão do estimador 1ˆb : 
 
( )∑
∑
−
= 2
2
: .
.ˆˆ
1 xxn
x
SS xyb (10) 
 
 Cálculo do erro padrão do estimador 2bˆ : 
 
( )∑ −
=
2
:
ˆ
ˆ
2 xx
S
S xyb (11) 
 No exemplo em questão temos: 
 
6.1) Erro padrão do estimador 1b ( )1ˆbS 
 
( )∑
∑
−
= 2
2
: .
.ˆˆ
1 xxn
x
SS xyb (12) 
44412
3144.89,0ˆ
1 ×
=bS ∴ 68,0ˆ 1 =bS 
 
6.2) Erropadrão do estimador 2b ( )2ˆbS 
( )∑ −
=
2
:
ˆ
ˆ
2 xx
S
S xyb (13) 
444
89,0ˆ
1
=bS ∴ 042,0ˆ 2 =bS 
13 
 
 
7) Intervalo de confiança dos estimadores 
A construção de um intervalo de confiança (IC) para um estimador tem como finalidade, 
principalmente em econometria, medir o nível de precisão do citado estimador, ou seja, se há 
sintomas de tendenciosidade. 
 
Para a construção do IC, o pesquisador deverá levar em consideração algumas informações 
relevantes como, por exemplo: 
 
− Valor do erro padrão dos estimadores ( )
1
ˆ
bS , conforme mencionado no item anterior; 
− O nível de confiança α desejado na pesquisa, com base na distribuição t de Student; 
− O número de graus de liberdade ( )knlg −=.. . 
=n tamanho da amostra e =k número de parâmetros 
 
Assim, observadas as condições acima, o intervalo de confiança de um dado estimador poderá ser 
construído com base no modelo genérico a seguir: 
 
( ) ( )
ii biibi
SkntbSkntb ˆ.ˆ. −+<<−− αα β (14) 
 
7.1) Intervalo para 1ˆb 
 
( ) ( ) 68,0.21275,168,0.21275,1 05,0105,0 −+<<−− tt β 
27,323,0 1 << β 
 
O intervalo acima definido significa que existe a probabilidade 0,95 ou 95% de chance de que o 
valor de 1β esteja entre 0,23 e 3,27. 
 
7.2) Intervalo para 2ˆb 
 
042,02281,255,0042,02281,255,0 2 ×+<<×− β 
644,04564,0 2 << β 
 
O intervalo acima significa que existe a chance de 95% de que 2β esteja entre 0,4564 e 0,644. 
 
8) Avaliação da qualidade do ajuste 
A qualidade do ajuste ou poder explicativo da regressão pode ser avaliado pelo coeficiente de 
determinação ( )2R e tem como finalidade verificar em quantos por centos a variável dependente 
( )y é explicada pela variável independente ( )x . Quanto mais o valor de 2R se aproximar de 
100%, melhor é a qualidade do ajuste. 
 
14 
 
 
 Expressão para cálculo: 
 
( )
( )2
2
2 ˆ
∑
∑
−
−
=
yy
yy
R (15) 
 
Substituindo com os resultados encontrados nas colunas (9) e (10) do exemplo, 
 
142
29,1342 =R ∴ 946,02 =R ou %6,94 
 
O resultado indica que 94,6% da variável y é explicada pela variável X, que sugere uma boa 
qualidade do ajuste, pois quanto mais se aproximar de 100% ou de 1, melhor é a qualidade do 
ajuste. 
 
9) Erro máximo do valor estimado 
Para obtermos o intervalo de predição com base no erro máximo do valor estimado, devemos 
inicialmente determinar o valor do erro ( )E pela expressão: 
 
( )
( )∑ ∑−
−
++= 22
2
.
.11ˆ.
xxn
xxn
n
StE yα (16) 
 
Onde: 
=αt distribuição t de Student com ( ) ..lgkn − , com 05,0=α ou 95% ou outro nível qualquer 
=ySˆ erro padrão da estimativa 
=n tamanho da amostra e =k nº de parâmetros da função sob análise 
. As estatísticas acima são conhecidas: 
( ) ( ) 228,21005,0 ==− tkntα (tabelado) 
89,0ˆ =yS 
12=n 
=x variável explicativa utilizada na época it para estimativa de y . No exemplo em questão 
35=x U.M. 
15=x 
 
 
∑ = 31442x 
 
 
. Daí temos: 
 
( )
2
2
180314412
1535.12
12
11.89,0228,2
−×
−
++×=E 
15 
 
 
1b 2b 
5328
4800083,01.982,1 ++=E 
984,1.982,1=E ∴ 79,2±=E 
 
Obtido E , o intervalo de predição será conhecido, somando-se e subtraindo-se ao valor estimado 
o valor de E , ou seja: 
 
EVEIP ±= (17) 
( )79,221;79,221 +−=IP 
( )79,23;21,18=IP 
 
Observe que a diferença em relação ao intervalo de predição encontrado na questão 5 anterior é 
que no 2º procedimento foi introduzido o fator probabilístico (distribuição t de Student). 
 
10) Teste de hipótese da existência de regressão por t de Student e Fisher 
 
Um recurso estatístico para se verificar a existência de regressão entre variáveis de uma dada 
função é a aplicação do teste de hipóteses. 
 
Existem inúmeras formas para efetuar o teste. Serão abordados, neste caso, o de Student e o de 
Fisher/Snedecor, por serem os mais usuais. 
 
10.1) Teste t de Student 
Por este teste calculamos inicialmente o valor de ct pela função: 
 
ib
ii
c S
bt ˆ
β−
= (18) 
Onde: 
=ct t calculado 
=ib parâmetros intercepto e angular 
=iβ hipótese a ser testada 
=
ib
Sˆ erro padrão dos estimadores 
 
No exemplo são conhecidos: 
 
- A equação de regressão: xy 55,075,1 += 
 
 
- Erro padrão do estimador 2b → 042,0ˆ 2 =bS 
16 
 
 
Assim: 
042,0
055,0 −
=ct ∴ 09,13=ct 
 
Na sequência, formulamos as hipóteses: 
 
020 == βH (ausência de regressão) 
021 ≠= βH (presença de regressão) 
 
Verificamos na tabela da distribuição t o valor de ( ) ( ) 228,221205,0 =−=− tkntα . 
 
Comparamos ct com ( )knt −α . 
 
Se ct (calculado) for maior que ( )knt −α (tabelado), ou seja, diferente de zero, significa presença 
de regressão entre as variáveis x e y . 
 
No teste em questão, as decisões a serem apresentadas são: 
 
a) Decisão estatística = rejeita-se a hipótese 0H ; 
b) Decisão econômica = a população da qual foi extraída a amostra de 12 observações sobre 
poupança ( )y e renda ( )x ) sugere a existência de regressão entre elas com 95% de 
probabilidade de que a decisão tomada esteja correta. 
 
10.2) Teste F de Fisher 
Uma outra forma de verificar a existência de regressão é através do teste F com auxílio do quadro 
de análise da variância (ANOVA), cujo desenho para determinar o F calculado ( )cF é o que se 
segue: 
 
Fonte da 
variação 
Soma dos 
quadrados 
Graus de 
Liberdade ( )..lg 
Média 
Quadrática c
F 
Devido a 
regressão 
( )∑ − 2ˆ yy 1=k ( )
1
ˆ 2∑ − yy (a) 
b
aFc = Devido a 
resíduos 
( )∑ − 2yˆy 1−− kn ( )
1
ˆ 2
−−
−∑
kn
yy
 (b) 
 
No exemplo em questão já foram calculadas as estatísticas necessárias ao cálculo de cF (na tabela 
do exemplo 1). Encontrado o valor de cF , este é comparado ao ( )1−− knFα (tabelado), na 
distribuição de Fisher/Snedecor. 
 
Se o valor de cF for maior que ( )1−− knFα , rejeitamos a hipótese nula 0H , o que sugere 
presença de regressão entre as variáveis x e y , que são respectivamente a renda e a poupança. 
 
Conforme visto no teste anterior por Student, as hipóteses deverão ser formuladas como se segue: 
17 
 
 
:0H ausência de regressão 
:1H presença de regressão 
 
Finalmente, enunciamos as decisões estatística e econômica. 
 
Dessa forma, aplicando-se o teste F ao exemplo 1 temos: 
 
Elaboração do quadro ANOVA com base nas estatísticas conhecidas: 
 
Fonte da 
variação ∑ dos quadrados ( )..lg 
Média 
Quadrática c
F 
Regressão 134,29 1 134,29 75,169
79,0
29,134
= 
Resíduos 7,911 12-1-1 = 10 0,79 
 
75,169=cF ( ) ( ) 96,4101 05,0 ==−− FknFα 
 
- Formulação das hipóteses: 
:0H ausência de regressão 
:1H presença de regressão 
 
Nota-se que ( )1005,0FFc > o que sugere rejeitar a hipótese 0H , o que nos leva as seguintes 
decisões: 
 
a) Decisão estatística = rejeitar 0H 
 
b) Decisão econômica = a população da qual foram extraídas as 12 amostras sugere a existência 
de regressão entre o par de valores x e y , com 95% de probabilidade de que a decisão esteja 
correta. 
 
 
18 
 
 
 Exemplo 2: 
 
Com base nos dados de despesas com alimentação (yi) e renda mensal (xi), levantados durante 10 
periodos consecutivos (ti), desenvolver as questões 1 a 11. Os valores estão em unidades 
monetárias (U.M.) 
 
it iy ix 
1 5 10 
2 6 15 
3 8 17 
4 12 20 
5 13 25 
6 10 20 
7 12 22 
8 18 30 
9 13 25 
10 18 26 
∑ 115 210 
 
1) Estimar a equação da reta que exprime a relação entre y e x ; 
 
2) Interpretar os resultados obtidos dos estimadores no contexto do modelo econômico em 
questão; 
 
3) Estimar, com base na equação obtida em (1), a despesa com alimentação ( )y , sabendo-se 
que a renda mensal ( )x é de 30 U.M.; 
 
4)Determinar o erro padrão da estimativa; 
 
5) Determinar o intervalo de predição com base nos resultados encontrados em (3) e (4); 
 
6) Determinar o intervalo de predição com base no erro máximo do valor estimado; 
 
7) Determinar o erro padrão dos estimadores 1b e 2b ; 
 
8) Determinar o intervalo de confiança dos estimadores 1b e 2b ; 
 
9) Avaliar a qualidade do ajuste (poder explicativo da regressão), interpretando-o; 
 
10) Testar a hipótese da existência de regressão entre as variáveis x e y pela distribuição t ; 
 
11) Idem acima pela distribuição F . Elaborar o quadro ANOVA. 
 
 
19 
 
 
 Exemplo 3: 
 
O par de valores iy e ix referem-se a índice de quantidade demandada e tarifa real média, 
respectivamente, de energia elétrica. Os valores da tarifa foram deflacionados por um indicador 
adequado, tendo como base o ano t6. 
 
Anos iy ix 
t1 74 145 
t2 76 134 
t3 81 117 
t4 90 111 
t5 94 109 
t6 100 100 
t7 103 137 
t8 108 122 
t9 113 85 
t10 115 90 
 
1) Estimar a equação da demanda; 
 
2) Tendo por base a equação obtida em (1), estimar a demanda esperada em t11 se a tarifa real 
em t1 for de 98; 
 
3) Determinar o intervalo de predição do valor estimado da demanda em t11; 
 
4) Determinar o intervalo de predição com base no erro máximo do valor estimado; 
 
5) Determinar o intervalo de confiança dos estimadores 1b e 2b ; 
 
6) Avaliar a qualidade do ajuste; 
 
7) Testar a hipótese da existência de regressão entre as duas variáveis (por Student e por 
Fisher); 
 
20 
 
 
 Exemplo 4: 
 
Considere os dados amostrais de um estudo da relação entre o número de anos que os candidatos 
a empregos em um determinado banco comercial estudaram inglês na faculdade e as notas 
obtidas em um teste de proficiência nessa língua. 
Número de anos (x) Nota do teste (y) 
3 5,2 
4 7,7 
4 7,4 
2 5,3 
5 9,1 
3 6,4 
4 7,3 
5 8,6 
3 7,4 
2 4,3 
 
 
 Exemplo 5: 
Uma empresa, com a finalidade de determinar a relação entre gastos anuais com propaganda 
(X), em R$1.000,00 e lucro anual (Y), em R$1.000,00, optou por utilizar o modelo linear 
simples ii XY εβα ++= , em que Yi é o valor do lucro bruto auferidono ano i, Xi é o valor 
gasto com propaganda no ano i e ε , o erro aleatório com as respectivas hipóteses 
consideradas para a regessão linear simples (α e β são parâmetros desconhecidos). 
Considerou, para o estudo, as seguintes informações referentes às observações nos últimos 
10 anos da empresa 
∑
=
=
10
1
100
i
iY ; ∑
=
=
10
1
60
i
iX ; ∑
=
=
10
1
650
i
iiYX ; 
 
∑
=
=
10
1
2 400
i
iX ; ∑
=
=
10
1
2 1080
i
iY ; 
 
Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que,caso 
haja um gasto anual com propaganda de 80 mil reais, a previsão do lucro bruto anual, em mil 
reais será de: 
a) 84 b) 102,5 c) 121 d) 128,4 e) 158 
 
 
 Exemplo 6: 
 Utilizou-se um modelo de regressão linear para avaliar a relação entre o preço do litro da 
gasolina e o do pretróleo Brent, ambos em reais, compreendendo o período de janeiro de 2002 
a dezembro de 2006. Os resultados obtidos foram: 
( ) ( )∑ ∑
= =
=−=−
60
1
60
1
22 052,0ˆ
58
1;18
i i
iii YYYY e 478,2 −= EFsig 
21 
 
 
 
Considere o quadro a seguir: 
 ANOVA 
 Soma dos 
quadrados 
Graus de 
liberdade 
Média dos 
quadrados 
F Fsig 
Modelo 
(regressão) 
 
Residual X Y 
Total 
 
Os valores de X , Y e Z , no quadro acima, respectivamente são: 
a) 3,016 ; 0,052 e 2,78E-4; 
b)3,016; 0,052 e 288,154; 
c) 14,98; 3,016 e 288,154; 
d) 18 ; 0,052 e 2,78E-4; 
e) 18 ; 0,052 e 288,154 
 
 
Capítulo 4: REGRESSÃO LINEAR MÚLTIPLA 
 
4.1. INTRODUÇÃO 
 
Já vimos que na regressão linear simples consideramos apenas uma variável econômica, 
explicativa ou exógena, na parte direita da equação ( )exy ++= .21 ββ . 
 
Na regressão múltipla são consideradas duas ou mais variáveis explicativas ( )ix , como por 
exemplo: salário ( )1x , renda de aluguel ( )2x , renda de investimento ( )3x , etc. que influenciam a 
variável dependente iy . 
 
Trata-se, portanto, de uma extensão do modelo de regressão linear simples. 
 
Genericamente, em n observações de variáveis amostrais ( )nxxxy ,...,,, 21 , o modelo assumirá a 
forma: 
 
exxxy nn +++++= −1231211 ...... ββββ (19) 
 
Ou, sob a forma de estimadores: 
 
exbxbxbby nn +++++= −1231211 ...... (20) 
 
Se chamarmos a variável endógena y de nível de investimento, ele dependerá de fatores a ela 
agregados como, por exemplo: taxa de juros, variável de renda, etc. que são respectivamente as 
variáveis explicativas ix . 
22 
 
 
Os estimadores da equação (20) são os ib ( )nbbbb ,...,,, 321 e as estimativas desses estimadores são 
os iβ ( )nββββ ,...,,, 321 da equação (19). 
 
O erro aleatório ou resíduo ( )e apontado nas duas equações é o resultado da diferença que 
porventura venha a ocorrer entre os valores conhecidos iy e os valores esperados ou ajustados 
pelo modelo iyˆ . 
ii yye ˆ−= (resíduo) 
=iy volume real de venda 
=iyˆ volume esperado de venda 
 
Alguns outros fatores que poderiam influenciar no valor de ( )e , no caso da variável venda, são os 
comportamentos dos concorrentes, fatores meteorológicos, etc. denominadas eventos de 
natureza qualitativa, que veremos no capítulo 8. 
 
 
4.2. PRESSUPOSTOS DO MODELO 
 
Alguns pressupostos deverão ser considerados nos modelos de regressão múltipla, assim como 
foram no modelo de regressão simples, tais como: 
 
a) O valor de y para cada valor de x é definido por 123121 ...... −++++= nni xxxy ββββ 
b) A esperança do erro aleatório ( )eE é igual a zero 
c) A variância do erro aleatório ( )eV é igual a 2σ , o que significa que variância do erro aleatório 
é constante 
d) O erro aleatório e tem distribuição normal cuja média é zero, ( ) a igual variânciae ,0=eE 2σ 
finito e constante. 
e) A covariância entre qualquer par de erros aleatórios 1e e 2e é igual à covariância do par 1y e 
2y que é igual à zero, ou seja: ( ) ( ) 0;cov;cov 2121 == yyee , significando que os termos 
aleatórios são independentes. 
f) O valor esperado ou a esperança matemática da variável dependente y , ( )yE , depende dos 
valores das variáveis explicativas ix e dos parâmetros desconhecidos iβ , ou seja: 
( ) 123121 ...... −++++= nn xxxyE ββββ 
 
 
4.2.1. Teorema de Gauss-Markov 
 
Este teorema nos diz que se os estimadores de mínimos quadrados atenderem as hipóteses acima 
relacionadas (letras “a” a “f”) serão os melhores estimadores lineares não-tendenciosos dos 
parâmetros, ou seja, eles são BLUE (best linear unbiesed estimators) em um modelo de regressão 
múltipla. 
 
 
23 
 
 
4.3. ESTIMAÇÃO DOS PARÂMETROS 
 
Para a estimação dos parâmetros intercepto e angulares, podemos recorrer a dois caminhos. 
 
a) Pela aplicação do princípio dos mínimos quadrados ordinários (conhecido como equações 
normais), comentado no capítulo anterior; 
 
b) Pela forma matricial 
Geralmente recomendado para modelos com mais de três parâmetros a serem estimados. 
Conceitualmente, o modelo de n variáveis é uma extensão dos modelos de duas e três 
variáveis, objeto de abordagem do presente curso. Assim, salvo a notação matricial, poucos 
conceitos serão acrescentados, razão pela qual abordaremos apenas o primeiro 
procedimento, ou seja, pelo critério dos mínimos quadrados. 
 
A vantagem da aplicação da álgebra matricial sobre a escalar é que ela se aplica a uma, duas, 
três ou qualquer número de varáveis, mas exigirá do estudante total intimidade com a álgebra 
matricial. 
 
 
 Estimação dos parâmetros pela aplicaçãodos Mínimos Quadrados Ordinários (M.Q.O.) 
 
 Procedimentos operacionais: 
 
a) Determinar inicialmente os desvios em relação à média aritmética de cada uma das 
variáveis amostrais informadas (tanto dependentes quanto as independentes), ou seja: 
 
Para valores de YYyY iii −=⇒ 
Para valores de XXxX iii −=⇒ 
Este procedimento tem como finalidade facilitar os cálculos, pois operamos com valores 
reduzidos de iy e ix . 
 
b) Aplicar os valores reduzidos de iy e ix nos modelos abaixo: 
 
1º) Cálculo do estimador 2b 
 
( )( ) ( )( )
( )( ) ( )2212221
221
2
21
2
..
.....
∑∑∑
∑∑∑∑
−
−
=
xxxx
yxxxxyx
b (21) 
 
2º) Cálculo do estimador 3b 
 
( )( ) ( )( )
( )( ) ( )2212221
121
2
12
3
..
.....
∑∑∑
∑∑∑∑
−
−
=
xxxx
yxxxxyx
b (22) 
 
24 
 
 
3º) Cálculo do estimador 1b (intercepto) 
 
Para este cálculo utilizamos os valores já conhecidos de 2b e 3b além da média aritmética dos 
valores reais de iY e iX . 
 
23121 .. XbXbYb −−= (23) 
 
 Representação: 
 
ni XXXY ;...;;; 21 (são os dados numéricos conhecidos) 
 
21;; XXYi (são as médias dos mesmos dados) 
 
As variáveis iy e ix em letras minúsculas são os afastamentos ou desvios em relação à média 
de iY e iX , ou seja: 
 
iii YYy −= ; 111 XXx −= ; 222 XXx −= ; etc. 
 
 
4.4. ESTIMAÇÃO DA EQUAÇÃO DE REGRESSÃO MÚLTIPLA 
 
Encontrados os estimadores 1b , 2b e 3b pelas equações (21), (22) e (23) para obter a equação de 
regressão da variável dependente ( )iy em função das variáveis explicativas ( )1x e ( )2x , pelo 
método dos mínimos quadrados ordinários, basta substituir no modelo de regressão múltipla 
representado em (20) os parâmetros obtidos, ou seja: 
 
23121 ..ˆ xbxbby ++= 
 
Onde: 
 
1b obtido em (19) 
2b obtido em (17) 
3b obtido em (18) 
 
 
4.5. PREVISÃO DE VALORES COM BASE NA EQUAÇÃO DE REGRESSÃO 
 
Definida a equação de regressão acima, poderemos efetuar previsões ou estimação de valores 
com a ajuda da citada equação. 
 
25 
 
 
Se forem conhecidos os valores de 1x e de 2x , poderemos estimar yˆ . Como 1b (intercepto) é 
constante, basta multiplicar 1x e 2x por 2b e de 3b , respectivamente, e adicionar o valor constante 
de 1b para termos o yˆ estimado. 
 
 
4.6. ERRO PADRÃO DA ESTIMATIVA 
 
Conforme já visto na regressão simples, o erro padrão da estimativa na regressão múltipla tem a 
mesma finalidade, ou seja, avaliar a margem de erro (desvio padrão) do valor estimado, podendo 
ser calculado pela expressão: 
 
( )
kn
yy
S
ixy −
−
±= ∑
2
:
ˆˆ (24) 
 
Onde: 
=y dados numéricos conhecidos 
=yˆ dados ajustados pelo modelo 
=n tamanho da amostra 
=k número de parâmetros (intercepto + angulares) 
 
 
4.7. INTERVALOS DE PREDIÇÃO ( )IP 
 
Conhecido o valor estimado ( )VE , para determinarmos a margem de variação do citado valor 
basta subtrair e adicionar ao mesmo o erro padrão da estimativa ( )
ixy
S :ˆ que nada mais é do que o 
desvio padrão dos resíduos, conforme explicitado em (24). 
 
Assim: 
 
( )
ixy
SVEIP :ˆ±= (25) 
 
( )
ii xyxy
SVESVEIP :: ˆ;ˆ +−= 
 
 
4.8. ERRO PADRÃO DOS ESTIMADORES 
 
Os estimadores 2b e 3b também devem ser analisados quanto a sua variabilidade, pois quanto 
menor o erro, melhor será a qualidade do ajuste. A qualidade do ajuste, como veremos em 4.10, é 
também denominada Coeficiente de Determinação. 
 
A obtenção do erro padrão do estimador 2b é feita pela expressão: 
 
26 
 
 
( )[ ]
∑ ∑
∑−
=
2
2
2
212
1
:
.
ˆ
ˆ
2
x
xx
x
S
S xyb (26) 
 
Quanto ao estimador 3b , a expressão para cálculo é: 
 
( )[ ]
∑ ∑
∑−
=
2
1
2
212
2
:
.
ˆ
ˆ
3
x
xx
x
S
S xyb (27) 
 
 
4.9. INTERVALO DE CONFIANÇA DOS ESTIMADORES 
 
Assim como calculamos o intervalo de predição do valor estimado, podemos também determinar 
o intervalo de confiança dos estimadores com base no erro padrão e em função do nível de 
significância desejado na distribuição αt de Student e tem como finalidade avaliar o nível de 
precisão dos estimadores de fundamental importância para análise de regressão. 
 
A expressão para determinar o intervalo de confiança de um dado estimador é: 
 
( ) ( ){ }
ii biibi
SkntbSkntbP ˆ.ˆ.1 −+≤≤−−=− αα βα (28) 
 
Onde: 
=ib estimadores ( );...; 32 bb 
( ) =− kntα valor tabelado na distribuição t 
=α nível de significância ( );...05,0;01,0 
=n tamanho da amostra 
=k número de parâmetros, inclusive intercepto 
=
ib
Sˆ erro padrão do estimador ib 
 
 
4.10. COEFICIENTE DE DETERMINAÇÃO (poder explicativo da regressão) 
 
Na análise de regressão é importante para o pesquisador verificar a qualidade do ajuste, ou seja, 
uma medida que indique a proporção da variação de y que a equação de regressão consegue 
explicar. Essa medida por ser avaliada pelo coeficiente de determinação, também conhecido 
como poder explicativo da regressão, cuja expressão é: 
( )
( )∑
∑
−
−
= 2
2
2 ˆ
yy
yy
R (29) 
 
27 
 
 
O valor de 2R , por ser uma proporção, estará compreendido entre 0 e 1 e quanto mais se 
aproximar de 1, mais forte é a associação entre variáveis envolvidas na equação de regressão. 
Costuma também ser apresentado em termos percentuais e, nesse caso, o campo de definição de 
2R será de 0 a 100%, conforme já comentado no capítulo anterior. 
 
 
4.11. TESTE DE HIPÓTESES 
 
O teste de hipóteses pode ser aplicado à análise de regressão com o objetivo de verificar a 
existência de regressão entre variáveis x e y no caso de uma regressão simples, conforme já 
visto no capítulo anterior. No caso de uma regressão múltipla, o teste pode ser utilizado para 
verificar a influência das variáveis explicativas 1x e 2x sobre a explicada y . 
 
Os testes que poderão ser utilizados são de Student ( )t e o de Fisher/Snedecor ( )F . 
 
Os procedimentos operacionais para a realização dos testes seguem os mesmos critérios aos já 
explicitados para a regressão simples, o que torna desnecessária a sua repetição. Os detalhes, se 
houverem, são mínimos e de fácil entendimento. 
 
 Exemplo 6: 
 
Os dados abaixo se referem ao índice de quantidade demandada de energia elétrica ( )Y , da tarifa 
real média ( )1X e do produto real ( )2X . 
 
Y 1X 2X y 1x 2x 1.xy 2.xy 21.xx 21x 22x yˆ ( )2yˆy − ( )2yy − ( )2ˆ yy − 
69 143 84 -26 28 -11 -728 286 -308 784 121 74,46 29,81 676 421,89 
76 134 85 -19 19 -10 -361 190 -190 361 100 77,89 3,57 361 292,75 
81 117 82 -4 2 -13 -28 182 -26 4 169 78,28 
... ... ... 
90 111 86 -5 -4 -9 20 45 36 
... ... 
97,22 
94 109 93 -1 -6 -2 6 2 12 97,71 
100 100 100 5 -15 5 -75 25 -75 104,89 
103 137 104 8 22 9 176 72 198 100,89 
108 122 104 13 7 9 91 117 63 104,54 
113 85 107 18 -30 12 -540 216 -360 117,28 18,32 324 496,40 
115 92 105 21 -23 10 -483 210 -230 529 100 113,08 8,53 441 326,89 
950 1150 950 0 0 0 -1922 1345 -880 3388 906 - 173,86 2282 1924,13 
 
Desenvolver as questões: 
 
1) Estimar a equação da demanda por energia elétrica pelo MQO; 
 
2) Com base na equação da demanda obtida, estimar a demanda provável quando a tarifa real 
média ( )1x for de 87 e o produto real ( )2x for de 105; 
 
3) Obter o intervalo de predição do valor estimado da demanda; 
 
4) Calcular e interpretar o valor do coeficiente de determinação (poder explicativo da regressão); 
28 
 
 
 
5) Testar o efeito conjunto das variáveis explicativas ao nível de 5% pelo teste F, com o auxílio do 
quadro ANOVA; 
 
6) Testar, com base em Student, o efeito de cada variável explicativa ( 1x e 2x ) sobre os 
parâmetro a elas associadas ( 1b e 2b ) a nível de 5%. 
 
 
 Desenvolvimento: 
 
1) Equação da demanda (forma linear) 
 
Inicialmentecalculamos os estimadores: 
 
1.1) Estimador 2β 
 
( )( ) ( )( )
( )( ) ( )2212221
221
2
21
22
..
.....
∑∑∑
∑∑∑∑
−
−
==
xxxx
yxxxxyx
bβ 
 
( ) ( )
( ) ( ) 128.295.2
732.557
8809063388
13458809061922
22
−
=
−−×
×−−×−
=b 
 
243,02 −=b 
 
1.2) Estimador 3β 
 
( )( ) ( )( )
( )( ) ( )2212221
121
2
12
33
..
.....
∑∑∑
∑∑∑∑
−
−
==
xxxx
yxxxxyx
bβ 
 
( ) ( )
( ) ( ) 128.295.2
500.865.2
8809063388
192288033881345
23 =−−×
×−−×
=b 
 
249,13 =b 
 
1.3) Estimador 1β 
 
231211 .. xbxbyb −−==β 
 
( ) 95249,1115243,0951 ×−×−−=b 
 
29,41 =b 
29 
 
 
A equação da demanda será então: 
 
21 .249,1.243,029,4ˆ xxy +−= 
 
2) Previsão da demanda quando: 
871 =x (tarifa real média) 
1052 =x (produto real) 
 
Substituindo na equação anterior, encontramos: 
 
( ) 105249,187243,029,4ˆ ×+×−=esty 
 
( ) 3,114ˆ =esty 
 
3) Intervalo de predição 
 
3.1) Pelo critério normal 
É necessário calcular inicialmente o erro padrão da estimação 
 
( )
210
86,170ˆˆ
2
−
=
−
−
= ∑
kn
yy
S y 
 
66,4ˆ =yS 
 
O intervalo de predição será então 
 
ySVE ˆ± 
66,43,114 ± 
96,11864,109 << IP 
 
4) Coeficiente de determinação 
 
O coeficiente de determinação (Poder explicativo da regressão), tem por objetivo medir a 
qualidade do ajuste, podendo ser avaliado pela relação: 
 
( )
( )
84,0
2282
13,1924ˆ
2
2
2 ==
−
−
=
∑
∑
yy
yy
R 
 
O resultado 84,02 =R ou %84 sugere uma boa qualidade de ajuste. 
 
30 
 
 
5) Estatística F (ou teste F) 
 
Pode ser obtido pelo quadro da análise da variância (ANOVA – Analisys of Variance) 
 
A aplicação da estatística F ao problema é verificar se as variáveis explicativas 1x e 2x (tarifa real e 
produto real), respectivamente, exercem conjuntamente efeito significativo sobre a variável 
dependente y (demanda de energia elétrica). 
 
Quadro ANOVA 
Fonte de 
Variação 
Soma dos 
quadrados 
Graus de 
liberdade 
Média 
quadrática 
E 
Regressão ( )∑ − 2ˆ yy k ( )
k
yy
SR
∑ −=
2
2 ˆ 
2
2
E
R
S
SE = 
Resíduos ( )∑ − 2yˆy 1−− kn ( )
1
ˆ 22
−−
−
= ∑
kn
yy
SE 
=2RS variância explicada ou variância da regressão 
=2ES variância residual 
=k número de variáveis explicativas 
 
Retirando as estatísticas da tabela auxiliar e substituindo, encontramos: 
 
Fonte de 
Variação ∑ dos quadrados g.l. 
Média 
quadrática 
E 
Regressão 13,1924 2 07,9622 =RS 73,38
84,24
07,962
==E 
Resíduos 86,173 1210 −− 84,242 =ES 
 
Logo, 
 
73,38=cF (valor calculado de F) 
 
No caso de regressão múltipla, ou seja, duas ou mais variáveis explicativas, a formulação das 
hipóteses pode ser feita conforme abaixo: 
 
0: 320 == bbH (ausência de efeito) 
0: 321 ≠≠ bbH (presença de efeito) 
 
Se ( )1−−> knFFc α , rejeitamos 0H 
 ( )1−−< knFFc α , aceitamos 0H 
 
No exemplo em questão, ( )121005,0 −−> FFc 
 
31 
 
 
( ) 74,4705,0 =F (na distribuição F, deve-se observar que o g.l. é igual a 2 no numerador e 7 no 
denominador. 
 
Como 74,473,38 05,0 =>= FFc , devemos rejeitar a hipótese 0H , o que sugere que pelo menos 
uma das variáveis explicativas 1x ou 2x exerce influência significativa sobre a variável dependente 
y , com probabilidade de erro 5%. 
 
6) Estatística t com relação aos parâmetros 2β e 3β 
 
Sabe-se que: 
ib
ii
c S
bt ˆ
β−
= 
 
6.1) Estatística t para 02 =β 
O teste de significância para o efeito da variável explicativa 1x (tarifa real) pode ser: 
0: 20 =βH (ausência de efeito) 
0: 21 <βH (presença de efeito negativo) 
 
Sabemos que: 243,02 −=b ; 093,0ˆ 2 =bS 
 66,4ˆ =yS ; ( ) 3646,205,0 =− knt 
 
( ) ( )
093,0
906
8803388
66,4
.
ˆ
ˆ
2
2
2
2
212
1
2
=
−
−
=
−
=
∑ ∑
∑
x
xx
x
S
S yb 
 
62,2
093,0
0243,0
−=
−−
=ct 
62,2=ct 
 
Como αttc > ( )3646,262,2 > , rejeitamos 0H , o que sugere a presença de efeito negativo da 
variável x sobre y . 
 
6.2) Estatística t para 3β 
O teste t para o efeito da variável explicativa 2x (produto real) pode ser: 
 
0: 30 =βH (ausência de efeito) 
0: 31 >βH (presença de efeito positivo) 
 
Sabemos que: 249,13=b ; 179,0ˆ 3 =bS 
32 
 
 
 66,4ˆ =yS ; ( ) 3646,2705,0 =t 
 
( ) ( )
179,0
3388
880906
66,4
.
ˆ
ˆ
2
2
1
2
212
2
3
=
−
−
=
−
=
∑ ∑
∑
x
xx
x
S
S yb 
 977,6
179,0
0249,1
=
−
=ct 
Verifica-se que αttc > ( )3646,2977,6 > , o que sugere rejeitar a hipótese 0H , significando a 
presença de efeito positivo da variável explicativa 2x (produto real) sobre a demanda y . 
 
Pelo teste t, nota-se que os parâmetros 2β e 3β exercem influência sobre y , primeira 
negativamente e a segunda positivamente. 
 
 
 Exemplo 7: 
 
Considere o quadro abaixo com informações sobre investimentos ( )Y , lucro esperado ( )1X e o 
estoque de capital desejado ( )2X durante 15 anos (valores em R$ milhões). 
 
it iY 1X 2X iy 1x 2x yx .1 21.xx yx .2 
2
1x 
2
2x yˆ ( )2yˆy − ( )2ˆ yy − ( )2yy − 
1 2 60 3 -3 -9 -3 27 27 9 81 9 2,48 0,23 6,35 9 
2 2 62 3 -3 -7 -3 21 21 9 49 9 2,47 0,22 6,40 9 
3 4 65 4 -1 -4 -2 4 8 2 16 4 3,32 0,46 2,82 1 
4 6 68 5 1 -1 -1 -1 1 -1 1 1 4,16 3,39 
... 
1 
5 4 65 5 -1 -4 -1 4 4 1 16 1 4,17 0,03 1 
6 3 62 4 -2 -7 -2 14 14 4 49 4 3,32 0,10 4 
7 5 66 6 0 -3 0 0 0 0 9 0 5,01 0,01 0 
8 6 70 7 1 1 1 1 1 1 1 1 5,85 0,02 1 
9 5 68 6 0 -1 0 0 0 0 1 0 5,86 0,74 0 
10 3 65 4 -2 -4 -2 8 8 4 16 4 3,32 0,10 4 
11 4 69 5 -1 0 -1 0 0 1 0 1 4,15 0,02 1 
12 5 72 6 0 3 0 0 0 0 9 0 4,99 0,00 0 
13 6 78 8 1 9 2 9 18 2 81 4 6,68 0,46 1 
14 8 80 10 3 11 4 33 44 12 121 16 8,37 0,14 11,36 9 
15 12 85 14 7 16 8 112 128 56 256 64 11,76 0,06 45,70 49 
∑ 75 1035 90 0 0 0 232 274 100 706 118 - 5,98 84,67 90 
 
Pedidos: 
 
1) Obter a função de regressão do investimento; 
 
2) Interpretar os resultados dos parâmetros, pelo MQO; 
 
3) Estimar o investimento esperado quando o lucro esperado for 90 e o estoque de capital for 
12; 
33 
 
 
 
4) Obter o intervalo de predição ou previsão do valor estimado em (3), com base no erro padrão 
da estimativa; 
 
5) Obter o intervalo de confiança dos estimadores 2β e 3β ; 
 
6) Obter e interpretar o resultado da qualidade do ajuste (poder explicativo da regressão); 
 
7) Verificar pelo teste F se as variáveis 1X e 2X exercem conjuntamente efeito significativo 
sobre Y (dependente); 
 
8) Verificar pelo teste t se as variáveis 1X e 2X exercem separadamente efeito sobre Y . 
 
 Desenvolvimento: 
 
1) Função Investimento 
 
O modelo é: exxy +++= 23121 ..ˆ βββ , cujos estimadores são 1b , 2b e 3b . 
 
As estatísticas calculadas com base no quadro auxiliar são: 
 
5=Y 691 =X 62 =X 
232.1 =∑ yx 70621 =∑ x 
100.2 =∑ yx 11822 =∑ x 
2747. 21 =∑ xx ( ) 75076. 221 =∑ xx 
 
YYyi −= 11 XXxi −= 2,22 XXx i −= 
 
( )( ) ( )( )
( )( ) ( )2212221
221
2
21
2
..
.....
∑∑∑
∑∑∑∑
−
−
=
xxxx
yxxxxyx
b 
 
( ) ( )
( ) 003,08232
24
75076118706
100274118232
2 −=
−
=
−×
×−×
=b 
 
003,02 −=b 
 
 
( )( ) ( )( )
( )( ) ( )2212221
121
2
12
3
..
.....
∑∑∑
∑∑∑∑
−
−
=
xxxx
yxxxxyx
b 
 
34 
 
 
( ) ( )
( ) 85,08232
7032
75076118706
232274706100
3 ==−×
×−×
=b ; 85,03 =b 
 
23121 .. xbxbyb −−= 
 
( ) 685,069003,051 ×−×−−=b 
 
( ) 10,521,051 −−−=b 
 
11,01 =b 
 
21 .85,0.003,011,0ˆ xxy +−= 
 
2) Interpretação dos parâmetros 
 
2.1) O valor 0,11 do intercepto significa que se o lucroesperado ( )1X e o estoque de capital 
desejado ( )2X forem zero, o investimento seria de R$0,11. 
 
2.2) A variável explicativa 1X (lucro esperado) sendo negativa, um aumento de R$1,00 no lucro 
esperado acarreta um decréscimo de R$0,003 no investimento. 
 
2.3) A variável explicativa 2X (estoque de capital desejado) sendo positiva, significa que um 
aumento de R$1,00 nessa variável acarreta um aumento de R$0,85 no investimento. 
 
3) Investimento esperado 
 
( ) 21 .85,0.003,011,0ˆ xxy esperado +−= 
 
( ) 20,1027,011,0ˆ +−=esperadoy 
 
( ) 04,10$ˆ Ry esperado = 
 
4 ) Intervalo de predição do valor estimado 
 
( )
kn
yy
S y −
−
= ∑
2ˆˆ ySVEIP ˆ±= 
 
( ) 98,5ˆ 2 =−∑ yy ; 15=n ; 3=k 
 
71,0
315
98,5ˆ =
−
=yS 
35 
 
 
71,0ˆ =yS 
 
yy SVEIPSVEIP ˆˆ +<<−= 
 
71,004,1071,004,10 +<<− IP 
 
75,1033,9 << IP 
 
5) Intervalo de confiança dos estimadores 
 
5.1) Intervalo de 22 b=β 
Calculamos inicialmente o erro padrão de 2β 
( )
∑
∑∑ −
=
2
2
2
212
1
.
ˆ
ˆ
2
x
xx
x
S
S yβ ∑ = 70621x ; ∑ =11822x 
 
( )
085,0
118
274706
71,0ˆ
22
=
−
=βS 
 
085,0ˆ
2
=βS 
 
O intervalo de confiança de 
2
ˆ
βS baseia-se na igualdade probabilística. 
 
( )( ) ( )
ii
SkntbSkntbPP iii βαβα β ˆ.ˆ.1 −+≤≤−−=− 
 
( ) ( ) 085,0.315003,0085,0.315003,01 05,0205,0 −+−≤≤−−−=− ttP β 
 
085,01788,2003,0085,01788,2003,01 2 ×+−≤≤×−−=− βP 
 
1822,01882,095,0 2 ≤≤−= β 
 
O resultado significa que existe uma probabilidade de 0,95 de que o estimador 2β esteja entre 
1882,0− e 1822,0 . 
 
5.2) Intervalo de 3β . 
Cálculo inicial de erro padrão de 3β 
 
36 
 
 
( )
∑ ∑
∑−
=
2
1
2
212
2
.
ˆ
ˆ
3
x
xx
x
S
S yb 
 
Estatísticas: 
∑ =11822x ( ) 076.75274. 2221 ==∑ xx 
 
71,0ˆ =yS 706
2
1 =∑ x 
66,11
71,0
706
076.75118
71,0ˆ
3
=
−
=bS 
 
21,0ˆ
3
=bS 
 
Calculado o erro padrão de 
3
ˆ
bS , o intervalo de confiança baseia-se na igualdade probabilística 
 
( )( ) ( )
33
ˆ.ˆ.1 333 βαβα β SkntbSkntbPP −+≤≤−−=− 
 
Sabemos que: 
 
85,03 =β , 21,03 =βS e ( ) 1788,21205,0 =t , então teremos: 
 
1788,221,085,01788,221,085,095,0 3 ×+≤≤×−= β 
 
31,139,095,0 3 ≤≤= β 
 
O intervalo encontrado de 3β sugere que existe uma probabilidade de 0,95 de que 3β esteja 
entre 39,0 e 31,1 . 
 
6) Qualidade do ajuste 
 
O poder explicativo da regressão ou coeficiente de determinação tem por objetivo avaliar a 
qualidade do ajuste e é medido pela expressão 2R . 
 
( )
( )∑
∑
−
−
= 2
2
2 ˆ
yy
yy
R 
 
Onde: 10 2 ≤≤ R ou %1000 2 ≤≤ R 
 
Da tabela extraímos as estatísticas: 
37 
 
 
 
( ) 67,84ˆ 2 =−∑ yy ; ( ) 902∑ =− yy 
 
90
67,842 =R ∴ 94,02 =R ou %94 
 
O resultado obtido sugere uma boa qualidade de ajuste na função de regressão. 
 
 
7) Verificação pelo teste F se as variáveis explicativas 1X e 2X exercem influência conjunta sobre 
a variável dependente Y . 
 
Do quadro auxiliar de cálculos retiramos as estatísticas: 
 
( ) 67,84ˆ 2 =−∑ yy ; 15=n (amostra) 
( ) 98,5ˆ 2 =−∑ yy ; 2=k (variáveis explicativas) 
 
Utilizando ANOVA para obter cF : 
 
Fonte de 
Variação ∑ dos quadrados g.l. 
Média 
quadrática c
F 
Regressão 67,84 2 34,42 48,170
25,0
34,42
==cF Resíduos 98,5 1215 −− 25,0 
 
Hipóteses: 
 
0: 320 == bbH (ausência de efeito) 
0: 321 ≠≠ bbH (presença de efeito) 
 
Conclusão: 
 
48,170=cF ; ( ) 89,31305,0 =F 
αFFc > 
 
Como αFFc > rejeitamos a hipótese 0H , o que sugere que pelo menos uma das variáveis 
explicativas exerce efeito sobre a variável Y . Com a probabilidade de 95% de que a assertiva 
esteja correta. 
 
8) Avaliação da influência pelo teste t (Student) 
 
- Formulação das hipóteses: 
 
38 
 
 
0: 20 =bH (ausência de influência) 
0: 21 ≠bH (presença de influência) 
 
ib
ii
c S
bt ˆ
β−
= (Geral) 
- Teste para o estimador 2b (estimativa de 2β ) 
 
035,0
085,0
0003,0
ˆ
2
22 =
−
=
−
=
b
c S
bt β 
 
035,0=ct 
 
Tabela (t) = ( ) 1788,21205,0 =t 
 
Verifica-se que αttc < , o que sugere aceitar 0H , ou seja, ausência de influência. 
 
- Teste para o estimador 3b (estimativa de 3β ) 
 
04,4
21,0
085,0
=
−
=ct 
 
04,4=ct 
 
( ) 1788,21205,0 =t 
 
Verifica-se que αttc > , o que sugere rejeitar a hipótese 0H , ou seja, a variável estoque de capital 
( )2X exerce influência positiva sobre os investimentos. 
 
Nota-se pelo teste t que apenas 3β exerce influência sobre a variável y . 
 
39 
 
 
 Exemplo 8: 
 
A tabela abaixo representa as observações semanais sobre receitas ( )iY , em R$1000,00, sobre 
preço de venda ( )1X , em R$1,00, e gastos com propaganda ( )2X , em R$1000,00, durante 12 
semanas para uma cadeia de lanchonetes. 
 
it iY 1X 2X 
1 120 2,0 10 
2 122 2,0 8 
3 90 1,5 23 
4 123 2,0 11 
5 122 2,0 10 
6 108 2,5 6 
7 150 2,5 18 
8 90 1,8 19 
9 140 2,5 21 
10 125 1,2 18 
11 110 1,8 16 
12 116 2,2 20 
∑ 1416 24 180 
 
- Desenvolver: 
 
1) Obter a equação de regressão múltipla estimada da receita ( )iyˆ ; 
 
2) Obter a previsão da receita quando 30,21 =x e 222 =x , em 13t ; 
 
3) Obter o intervalo de predição da receita prevista no item anterior; 
 
4) Determinar o erro padrão de estimativa; 
 
5) Calcular o erro padrão dos estimadores 2β e 3β ; 
 
6) Obter o intervalo de confiança dos estimadores 2β e 3β ; 
 
7) Avaliar a qualidade do ajuste; 
 
8) Verificar pelo teste F se as variáveis explicativas 1x e 2x exercem influência conjunta sobre a 
variável receita ( )iY . 
 
 
 Exemplo 9: 
 
Dez pessoas sadias entre 20 e 40 anos, do sexo masculino, foram submetidas a um teste de 
avaliação física, quanto ao peso total ( )iY , peso magro ( )1X e as calorias diárias ingeridas ( )2X , 
como se segue: 
40 
 
 
iY 1X 2X 
77 52 2.000 
62 42 1.600 
65 45 1.800 
76 51 2.000 
74 45 1.800 
61 41 1.600 
64 42 1.700 
61 41 1.500 
67 47 1.600 
63 44 1.400 
 
- Considerando que a série de valores apresenta comportamento linear, obter: 
 
a) A equação de regressão múltipla; 
 
b) O peso total estimado, quando 501 =X e 450.12 =X ; 
 
c) O erro padrão da estimativa; 
 
d) O erro padrão dos estimadores 2β e 3β ; 
 
e) Analisar pelo teste F se as variáveis explicativas 1x e 2x exercem, conjuntamente, influência 
sobre o peso total y ; 
 
 
 Exemplo 10: 
 
Considere as assertivas abaixo: 
 
 A) A função consumo: C= a+bx+e, onde C= consumo agregado; x= renda e e= erro aleatório, é um 
exemplo clássico de modelo teórico; 
 
 B) O conjunto de variáveis exófenas mais o termo constante é denominado de regressor; 
 
 C) Com relação a regressão linear múltipla, a variável dependente y deve variar linearmente com 
o conjunto de variáveis xi e não com cada uma destas; 
 
 D) Se comparamos a regressão linear múltipla com a regressão linear simples, os resíduos 
daquele são sempre menores; 
 
 E) Numa análise de regressão, o termo erro aleatório ou perturbação estocástica (e), nada mais é 
do que o representante de todas as variáveis omitidas que podem eventualmente afetar a 
variável endógena, mas que não puderam ser incluídas no modelo. 
41 
 
 
 Estão corretas as afirmativas: 
 
a) A e B b) C e D c)A e E d) B eE e) A,B e E 
 
 
 Exemplo 11: 
 
 Com relação à regressão linear múltipla, assinale a afirmativa correta: 
 
 A) A representação geométrica é sempre de um plano: exxxy nn +++++= −123121 ..... ββββB) Quando comparados com a regressão linear simples, os resíduos são sempre menores; 
 
 C) A variável y dependente deve variar linearmente com o conjunto de variáveis xi e não com 
cada uma delas; 
 
 D) Funções como kxk
xx bbbay .....21 21 ⋅⋅= são sempre linearizáveis ; 
 
 E) Na aplicação de logaritmos sempre permite a lenearização, culminando na representação 
geométrica por hiperplano. 
 
 
 Exemplo 12: 
 
 Considerando o modelo de regressão linear simples, tendo x como variável aleatória e 
independente e y como variável dependente, é correto afirmar que: 
 
a) A variável x não é isenta de erro; 
 
b) A função de regressão fornece a média de x para cada y considerado; 
 
c) A variável não é isenta de erro; 
 
d) A variação residual de y é distribuída normalmente com desvio padrão constante e média 
diferente de zero; 
 
e) A variação residual de y é constante com x. 
 
 
42 
 
 
 Exemplo 13: 
 
Dentre as afirmativas abaixo, assinale a(s) correta(s) 
 
a) Quando o pesquisador encontra dificuldades para incorporar a um dado modelo e fatos de 
natureza não quantitativa, podemos dizer que está diante de umalimitação de natureza 
estatística; 
 
b) A função consumo do tipo ex ++ .21 ββ , onde y= consumo agregado; x= renda e e = erro 
aleatório , pode ser considerado um modelo econométrico, dada a necessidade de aplicar 
tratamento estatístico na sua análise; 
 
c) O conjunto de variáveis exógenas mais o termo entercepto são denominados de regressores; 
 
d) Num modelo de regressão linear deverão ser levados em consideração alguns pressupostos 
básicos, como por exemplo: “A covariância entre qualquer par de erros aleatórios e1 e e2 é 
sempre diferente da covariância do par y e y2 que é igual a unidade” 
 
 
 Exemplo 14: 
 
Uma série temporal de 15 termos foi ajustada a uma função do tipo µββ ++= xy .21 , tendo sido 
encontradas as seguintes estatísticas de avaliação: 
 
a) xy 8,15,4ˆ += 
 
b) 696,0ˆ 2 =bS 
 
c) ( )∑ =− 4,113ˆ 2yy 
 
d) ( )∑ =− 3002yy 
 
e) ( )∑ =− 6,186ˆ 2yy 
 
 
14.1. Determinando o intervalo de confiança com o estimador 2β , com 05,0=α , encontramos ... 
 
a) 0,316 283,32 ≤≤ β 
 
b) 0,307 292,32 ≤≤ β 
 
c) 0,302 983,52 ≤≤ β 
 
43 
 
 
d) 2,996 003,62 ≤≤ β 
 
e) 0,296 303,32 ≤≤ β 
 
 
14.2. Determinando o valor do poder explicativo da regressão (R2) obtemos: 
 
a) 0,608 b)0,622 c)0,378 d)0,806 e)2,645 
 
 
14.3. Testando a hipótese quanto a ausencia ou a presença de regressão da função xy 8,15,4ˆ += 
pelo teste F, com base em ANOVA, obtemos para F0(calculado) o valor de .......; e assim podemos 
concluir que ..... 
 
a) 7,9 ; sugere ausência de regressão entre x e y; 
 
b) 7,9 ; os dados são insuficientes para aplicação do teste; 
 
c) 9,1 ; sugere ausência de linearidade da função; 
 
d) 7,9 ; sugere presença de regressão entre x e y; 
 
e) N.R.A 
 
 
 Exemplo 15: 
 
Qual das afirmações abaixo faz referencia correta ao modelo de regressão linear simples? 
a) Toda regressão apresenta heterocedasticidade. 
b) Se a variância é constante, os dados são homocedásticos. 
c) O intercepto α representa a inclinação da reta de regressão. 
d) Os erros do modelo não são aleatórios, com a esperança igual a 1. 
e) A constante α é sempre positiva. 
 
 
 Exemplo 16 : 
 
Com relação à Regressão Linear Múltipla, assinale a afirmativa correta: 
a) A variável Y dependente deve variar linearmente com o conjunto de variáveis X1 e não com 
cada uma destas. 
b) A representação geométrica é sempre de um plano: y=a1+b2x1+b3x2+.......bnxn-1 +e1 . 
c) Funções como xkk
xx bbaby .....22
1
1= são sempre linearizáveis. 
d) A aplicação de logaritmos sempre permite a linearização, culminando na representação 
geométrica por hiperplano. 
e) Quando comparados com a Regressão Linear Simples, os resíduos são sempre menores. 
44 
 
 
Exemplo 17: 
 
Suponha que o custo de produção de energia por kilowatt/hora(Y) seja uma função linear do fator 
de carga (X1), em % e do custo do carvão (XZ) em centavos de dólar por milhão de Btu. Assumindo 
normalidade dos dados, um modelo de regressão linear múltipla foi adotado para uma amostra de 
tamanho 12. 
 
O modelo estimado foi: 
Y= 6,14 – 0,04X1 + 0,09X2 
 (0,91) (0,01) (0,01) 
 
Sendo os erros padrões indicados entre parênteses. 
A tabela da análise de variância, incompleta, encontra-se a seguir 
 
 TABELA ANOVA 
FV Graus de 
liberdade 
Soma dos 
quadrados 
Média dos 
quadrados 
F F de significação 
Regressão 31,15 9,02E-05 
Residuo 0,6 
Total 
 
Com base nesses dados, considere as afirmações a seguir: 
I. Para cada aumento de uma unidade na variável X1 corresponderá um decréscimo de 0,04 na 
variável Y, permanecendo inalterada a variável X2. 
II. A variância residual do modelo considerado é 0,6 (Kilowatt/hora)2. 
III. O intervalo bilateral de 95% de confiança para o custo do carvão é, aproximadamente, (0,07; 
0,11) 
 
Está correto o que se afirma em: 
 
a) II apenas b) III apenas c) I e II apenas d) I e III apenas e ) I,II e III . 
 
 
Capítulo 5: CORRELAÇÃO 
 
5.1. OBJETIVO PARA A ECONOMIA 
 
É de grande importância para a Economia explorar e verificar os inter-relacionamentos existentes 
entre as variáveis econômicas. Essa avaliação, bem como seu grau de intensidade, pode ser 
medida através do coeficiente de correlação que veremos a seguir. 
 
 
5.2. CONCEITO DE CORRELAÇÃO 
 
Correlacionar é verificar com base em técnicas especiais se existe inter-relacionamento entre 
variáveis (econômicas ou não). 
45 
 
 
Quando esta avaliação é feita entre duas variáveis como, por exemplo, consumo médio e renda 
média, é denominada correlação simples. 
 
Quando a avaliação é feita entre três ou mais variáveis é chamada de múltipla como, por exemplo, 
temperatura, umidade, índice pluviométrico, patrimônio, faturamento, vendas, etc...Os princípios 
básicos que regem os problemas da correlação múltipla são semelhantes aos da correlação 
simples. 
 
Quando é feita entre três ou mais variáveis permanecendo fixa (constante), as demais variáveis do 
conjunto observado é chamada de parcial. Dessa forma, a correlação parcial estima a relação 
funcional entre a variável dependente e outras variáveis independentes. 
No nosso curso, serão detalhadas apenas a avaliação e interpretação da correlação simples. 
 
 
5.3. MEDIDA DE CORRELAÇÃO 
 
O instrumento de medida de correlação é dado pelo coeficiente de correlação de Pearson, 
representado por r , e as expressões para o cálculo geralmente utilizadas são: 
( )( )
( ) ( )








−








−
−
=
∑ ∑∑ ∑
∑∑∑
n
y
y
n
x
x
n
yx
xy
r
2
2
2
2 .
.
 (30) 
Outra forma de cálculo: 
 
( )( )[ ]
yxn
yyxx
r
σσ ××
−−
= ∑ . (31) 
 
Onde: 
x e y = variáveis sob análise 
xσ e yσ = desvios padrão das variáveis x e y 
n = tamanho amostral 
 
 
5.4. O COEFICIENTE DE CORRELAÇÃO r E SUA INTERPRETAÇÃO 
 
O valor de r pode apresentar-se de forma positiva ou negativa. 
 
Quando r é positivo significa que as duas variáveis em estudo ( x e y ), por exemplo, crescem ou 
decrescem no mesmo sentido. 
 
Quando r é negativo significa que as duas variáveis em análise seguem sentidos inversos, ou seja, 
quando os valores de x evoluem crescentemente, os de y tendem a evoluir decrescentemente e 
vice-versa. 
46 
 
 
Genericamente, a interpretação do valor de r pode ser obtida com

Continue navegando