Buscar

Aula 1

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 54 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 54 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 54 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Econometria I
Aula 1
Introdução
Uma boa definição do que é econometria:
“a econometria pode ser definida como sendo a análise quantitativa dos fenômenos econômicos ocorridos com base no desenvolvimento paralelo da teoria e das observações e com o uso de métodos de inferência adequados”;
“o método da pesquisa econométrica visa, essencialmente, a conjugação da teoria econômica com medições concretas, usando a teoria e a técnica da inferência estatística como uma ponte”.
Introdução
Mas quais são os elementos necessários para a plena compreensão da econometria?
Teoria econômica;
Economia matemática;
Estatística econômica;
Estatística matemática.
Introdução
Metodologia Econométrica:
1. Exposição da teoria ou hipótese;
2. Especificação do modelo matemático da teoria;
3. Especificação do modelo estatístico ou econométrico;
4. Obtenção dos dados
5. Estimação dos parâmetros do modelo econométrico;
6. Testes de hipóteses;
7. Projeção ou previsão;
8. Uso do modelo para fins de controle ou de política.
Introdução
Tipos de econometria:
Teórica: 
Clássica;
Bayesiana;
Aplicada:
Clássica; 
Bayesiana; 
Estimação Econométrica: uso de softwares
R Project
A natureza da análise de regressão
Mas o que é regressão? 
A análise de regressão diz respeito ao estudo da dependência de uma variável (variável dependente), em relação a uma ou mais variáveis (variáveis explanatórias), visando estimar e/ou prever o valor médio (da população) da primeira em termos dos valores conhecidos ou fixados (em amostragens repetidas) da segunda.
Exemplos:
A natureza da análise de regressão
Relações Estatísticas vs. Determinísticas:
Toda relação estatísticas está associada a variáveis aleatórias ou estocásticas, como a relação entre o retorno de um ativo e a sua liquidez. 
As relações determinísticas são aquelas que dizem respeito a eventos certos, como o efeito da gravidade sobre os corpos.
A natureza da análise de regressão
Regressão vs. Causa-efeito
Embora a regressão estabeleça uma dependência entre variáveis, isso não garante necessariamente a relação causa-efeito.
Isso é feito em geral por relações estabelecidas na teoria econômica.
A natureza da análise de regressão
Natureza e fonte dos dados para a análise econômica
Tipos de dados:
Séries temporais
Dados em corte transversal
Dados combinados: Dados em Painel, Longitudinais ou de micropainel.
Fonte de dados: Órgãos do governo, organismos internacionais, instituições privadas, institutos de pesquisa e pessoas físicas.
Uma coisa importante: O pesquisador sempre deve ter em mente que os resultados de sua pesquisa terão a mesma qualidade dos dados coletados.
A natureza da análise de regressão
Alguns exemplos da análise empírica das estruturas econômicas:
Becker (1968): Abordagem empírica da economia do crime.
Akerlof (1970): tratamento teórico e matemático da assimetria de informações nos mercados.
Schlindwein e Kassouf (2008): Abordagem econométrica do custo de oportunidade do tempo da mulher sobre o padrão de consumo alimentar no Brasil.
Mas uma coisa que acontece sempre em econometria é boa parte das equação alternativas são derivadas das equações iniciais. Por isso muita atenção e raciocínio. 
Análise de regressão com duas variáveis: algumas ideias básicas
Nas próximas aulas serão abordados os pontos associados à regressão BIVARIADA, ou seja, somente com duas variáveis: dependente e a explanatória.
Exemplo: Vamos supor uma população de 60 famílias, em que sua renda () e despesa de consumo semanal () são dados em dólares.
As famílias foram divididas em 10 classes de renda.
Análise de regressão com duas variáveis: algumas ideias básicas
De acordo com os dados apresentados:
		Renda 									
		80	100	120	140	160	180	200	220	240	260
	Despesa Semanal	55	65	79	80	102	110	120	135	137	150
		60	70	84	93	107	115	136	137	145	152
		65	74	90	95	110	120	140	140	155	175
		70	80	94	103	116	130	144	152	165	178
		75	85	98	108	118	135	145	157	175	180
		-	88	-	113	125	140	-	160	189	185
		-	-	-	115	-	-	-	162	-	191
	Média Condicional da Despesa	65	77	89	101	113	125	137	149	161	173
Análise de regressão com duas variáveis: algumas ideias básicas
É possível observar que:
Despesa Semanal	80	100	120	140	160	180	200	220	240	260	Renda 	55	65	79	80	102	110	120	135	137	150	80	100	120	140	160	180	200	220	240	260	Renda 	60	70	84	93	107	115	136	137	145	152	80	100	120	140	160	180	200	220	240	260	Renda 	65	74	90	95	110	120	140	140	155	175	80	100	120	140	160	180	200	220	240	260	Renda 	70	80	94	103	116	130	144	152	165	178	80	100	120	140	160	180	200	220	240	260	Renda 	75	85	98	108	118	135	145	157	175	180	80	100	120	140	160	180	200	220	240	260	Renda 	0	88	0	113	125	140	0	160	189	185	80	100	120	140	160	180	200	220	240	260	Renda 	0	0	0	115	0	0	0	162	0	191	Análise de regressão com duas variáveis: algumas ideias básicas
Notar que teremos duas definições de valor esperado:
O primeiro é o valor esperado incondicional: O valor esperado incondicional das despesas é a despesa média, não levando em conta qualquer relação com o nível de renda – isso que dizer que é simplesmente a média da despesa - 
Por outro lado há o VALOR ESPERADO CONDICIONAL: é o valor esperado da despesa DADO um determinado nível de renda - 
Análise de regressão com duas variáveis: algumas ideias básicas
Nesse caso, a essência da análise de regressão é a curva de regressão, ou seja, a relação das variáveis através dos valores médios condicionais. 
A curva de regressão populacional é apenas o local geométrico das médias condicionais da variável dependente para os valores fixados da(s) variável(is) explanatória(s).
É possível observar mais claramente essa relação através do gráfico:
Análise de regressão com duas variáveis: algumas ideias básicas
Conceito de função de regressão populacional vs. amostral:
Podemos dizer que cada média condicional é uma função de . Nesse caso, temos que:
Ou seja, para cada (ou seja, classe de renda), teremos um nível de despesa:
Exemplo: para , observa-se que .
Análise de regressão com duas variáveis: algumas ideias básicas
Mas a pergunta que fica é qual é o formato de ?
Como uma forma mais simples e de fácil adaptação utiliza-se a forma de uma FUNÇÃO LINEAR:
Em que e são os coeficiente de regressão (respectivamente intercepto e coeficiente angular).
Essa função é conhecida como a função linear de regressão populacional (dica: escreveu somente com letras gregas – sem qualquer outro elemento – é populacional).
Análise de regressão com duas variáveis: algumas ideias básicas
Mas o que é questão da linearidade?
Trata-se de dois pontos:
Primeiro: Linearidade nas variáveis – é quando as variáveis explicativas estão no formato linear, e não polinomial – por exemplo: 
Segundo: Linearidade nos parâmetros – é quando a função de regressão apresenta linearidade nos parâmetros, ou seja, . Mas caso observarmos , chamamos de modelos de regressão não-linear (nos parâmetros).
Portanto a partir de agora, modelos de regressão linear serão definidos como aqueles que são lineares nos parametros.
Análise de regressão com duas variáveis: algumas ideias básicas
Especificação estocástica da Função de Regressão Populacional (FRP): 
Como podemos observar na tabela anteriormente apresentada, há famílias com rendas de 160 unidades monetárias com despesas inferiores à famílias com renda de 140 u.m.
Análise de regressão com duas variáveis: algumas ideias básicas
Especificação estocástica da Função de Regressão Populacional (FRP): 
O que podemos observar é que dado um nível de renda, as despesas SE AGRUPAM em torno de um valor – ESPERANÇA CONDICIONAL - mas mesmo assim apresenta um certo desvio.
Portanto podemos definir o desvio individual de em torno do seu valor esperado como sendo:
 ou ainda 
Análise de regressão com duas variáveis: algumas ideias básicas
Especificação estocástica da Função de Regressão Populacional (FRP): 
Definimos como sendo uma variável aleatória não-observável que assume valores positivos ou negativos. Chamamos de DISTÚRBIO ESTOCÁSTICO ou TERMO DE ERRO ESTOCÁSTICO.
Portanto, após a inclusãodo termo de erro estocástico, a FRP pode ser escrita como sendo:
 
Análise de regressão com duas variáveis: algumas ideias básicas
Especificação estocástica da Função de Regressão Populacional (FRP): 
Vale a pena notar que são observados diversos erros (pois há diversos desvios da função de regressão populacional em relação ao real valor). Nesse caso:
Análise de regressão com duas variáveis: algumas ideias básicas
Especificação estocástica da Função de Regressão Populacional (FRP): 
Notar que se tomarmos a esperança condicional em ambos os lados de:
Mas “da onde” surge o erro estocástico?
Teoria incompleta
Indisponibilidade de dados
Variáveis essenciais vs. variáveis periféricas/secundárias.
Caráter intrinsecamente aleatório do comportamento humano
Variáveis proxy pouco adequadas
Princípio da parcimômia
Forma funcional errada
Análise de regressão com duas variáveis: algumas ideias básicas
A função de regressão amostral (FRA):
Até o momento trabalhamos com a questão populacional. No entanto raramente temos acesso a dados populacionais. Assim recorremos às informações amostrais.
Vamos supor que não conhecemos os dados observados na tabela anterior. Assim recorremos aos dados amostrais, no entanto, não seremos capazes de estimar a curva populacional de forma precisa.
Análise de regressão com duas variáveis: algumas ideias básicas
A função de regressão amostral (FRA):
Assumindo duas amostras (obtidas da tabela populacional anterior):
	Amostra 1	
	Despesa (Y)	Renda (X)
	70	80
	65	100
	90	120
	95	140
	110	160
	115	180
	120	200
	140	220
	155	240
	150	260
	Amostra 2	
	Despesa (Y)	Renda (X)
	55	80
	88	100
	90	120
	80	140
	118	160
	120	180
	145	200
	135	220
	145	240
	175	260
Análise de regressão com duas variáveis: algumas ideias básicas
Isso irá garantir na prática duas funções de regressão amostral:
Amostra 1	80	100	120	140	160	180	200	220	240	260	70	65	90	95	110	115	120	140	155	150	Amostra 2	80	100	120	140	160	180	200	220	240	260	55	88	90	80	118	120	145	135	145	175	
Análise de regressão com duas variáveis: algumas ideias básicas
A função de regressão amostral (FRA):
Nesse caso, a Função de Regressão Amostral é definida como sendo: 
Em que: é o estimador de ; é o estimador de e; é o estimador de .
Note que um estimador (ou estatística amostral) é apenas uma regra, formula ou método que nos diz como estimar o parâmetro da população com base nas informações oferecidas pela amostra que temos à mão.
O valor numérico obtido pelo estimador é conhecido como estimativa.
Análise de regressão com duas variáveis: algumas ideias básicas
A função de regressão amostral (FRA):
Mas notem como podemos representar a FUNÇÃO DE REGRESSÃO AMOSTRAL de duas formas:
Quando se expressa na forma do estimador de : 
Quando se expressa na forma ESTOCÁSTICA: 
Mas o que é ? Qual é a diferença entre e ?
Análise de regressão com duas variáveis: algumas ideias básicas
A função de regressão amostral (FRA):
Mas o que é ? Qual é a diferença entre e ?
Definimos como sendo o termo residual, e ele pode ser interpretado como sendo uma estimativa de .
Portanto nosso principal objetivo na análise de regressão é estimar:
Através da FUNÇÃO DE REGRESSÃO AMOSTRAL:
Análise de regressão com duas variáveis: algumas ideias básicas
A função de regressão amostral (FRA):
Mas se a FRA é uma estimativa da FRP, como podemos obter valores para , e que façam com que a FRA seja a mais próxima de FRP?
Gráfico: FRA vs. FRP
Resíduo vs. Erro 
Erro de Estimação
Modelo de regressão de duas variáveis: o problema da estimação
Método dos Mínimos Quadrados Ordinários (MQO):
Como vimos, não podemos observar diretamente a FRP, portanto termos que obter uma ESTIMATIVA por meio da FRA.
Conforme podemos observar, cada observação pode ser reescrita como sendo:
Rearranjando: 
Modelo de regressão de duas variáveis: o problema da estimação
Método dos Mínimos Quadrados Ordinários (MQO):
O que queremos é que seja o menor possível, ou seja, que se aproxime ao máximo de .
Portanto o que faremos é adotar o critério do MÍNIMOS QUADRADOS, ou seja:
Nesse caso, o que queremos é escolher os valores de e que minimizem os quadrados dos resíduos.
Modelo de regressão de duas variáveis: o problema da estimação
Método dos Mínimos Quadrados Ordinários (MQO):
Mas como podemos obter esses valores?
Minimização: chega-se a um sistema de duas equações denominadas de EQUAÇÕES NORMAIS:
Modelo de regressão de duas variáveis: o problema da estimação
Método dos Mínimos Quadrados Ordinários (MQO):
Resolvendo essas duas equações chegamos a:
Em que , , e são as médias das variáveis.
Vamos fazer um exemplo!!
Modelo de regressão de duas variáveis: o problema da estimação
Método dos Mínimos Quadrados Ordinários (MQO):
Esses estimadores são conhecidos como estimadores de mínimos quadrados, e apresentam propriedades matemáticas e estatísticas. 
Propriedades matemáticas:
São expressos somente em termos de quantidades observáveis (amostrais) de e .
São estimadores pontuais (para cada amostra, somente um valor).
Uma vez obtidas as estimativas para os dados amostrais a linha de regressão é facilmente obtida.
Modelo de regressão de duas variáveis: o problema da estimação
Método dos Mínimos Quadrados Ordinários (MQO):
Notar que:
A linha de regressão passa pelo ponto ;
O valor médio de , ou seja, o valor médio da estimativa de , é igual a média de : .
O valor médio dos resíduos () é igual a zero: .
Como podemos demonstrar isso?
Modelo de regressão de duas variáveis: o problema da estimação
Método dos Mínimos Quadrados Ordinários (MQO):
Além das formas anteriormente presentadas de estimadores, temos ainda seus FORMATOS DE DESVIO:
Assumindo originalmente a equação a ser estimada como sendo: 
Podemos chegar na forma 
Isso facilita muito o cálculo das estimativas, pois agora 
Modelo de regressão de duas variáveis: o problema da estimação
Método dos Mínimos Quadrados Ordinários (MQO):
Os resíduos não são correlacionados ao previsto ().
Os resíduos não são correlacionados aos valores de .
Como demonstrar?
Modelo de regressão de duas variáveis: o problema da estimação
O modelo clássico de regressão linear: as hipóteses subjacentes ao método dos mínimos quadrados
Quando estimamos os valores de e por meio de e não estamos somente interessados nos valores das estimativas; estamos interessados em fazer inferências sobre os verdadeiros valores e .
Para isso, precisamos fazer alguns pressupostos acerca de como foi gerado (processo gerador da série).
Portanto recorremos às HIPÓTESES DO MODELO CLÁSSICO DE REGRESSÃO LINEAR (OU GAUSSIANO OU PADRÃO)
Modelo de regressão de duas variáveis: o problema da estimação
O modelo clássico de regressão linear: as hipóteses subjacentes ao método dos mínimos quadrados
Hipótese 1: Modelo de regressão linear: o modelo de regressão é linear NOS PARAMETROS, e não necessariamente nas variáveis.
Hipótese 2: Os valores de são independentes do termos de erro: .
Hipótese 3: O valor médio do termo de erro é zero: ou se é não estocástico, .
Modelo de regressão de duas variáveis: o problema da estimação
O modelo clássico de regressão linear: as hipóteses subjacentes ao método dos mínimos quadrados
Hipótese 4: Homocedasticidade ou variância constante de : 
Quando a variância não é constante, temos o problema que chamamos de heterocedasticia ou heterocedaticidade, em que . 
Modelo de regressão de duas variáveis: o problema da estimação
O modelo clássico de regressão linear: as hipóteses subjacentes ao método dos mínimos quadrados
Hipótese 5: Não há autocorrelação entre os termos de erro. Isso significa que: ou , em que .
Hipótese 6: O número de observações deve ser maior que o número de parâmetros a serem estimados
Hipótese 7: Variabilidade dos valores de e ausência de valores extremos (outliers).
Modelo de regressão de duas variáveis: o problema da estimação
Precisão ou erros padrão das estimativas de mínimos quadrados
Qualquer estimativa que fizermos, estaremos utilizando dados amostrais, mas como dados mudam deamostra para amostra, as estimativas mudarão. 
Portanto recorremos à medidas de confiabilidade ou PRECISÃO dos estimadores e : A precisão será medida por seu ERRO PADRÃO.
Modelo de regressão de duas variáveis: o problema da estimação
Precisão ou erros padrão das estimativas de mínimos quadrados
Medidas de precisão: Variância e erro (desvio) padrão
Em que para a estimativa dessas medidas utiliza-se o estimador da variância do erro: , sendo que é conhecido como soma dos quadrados dos resíduos (SQR).
Modelo de regressão de duas variáveis: o problema da estimação
Precisão ou erros padrão das estimativas de mínimos quadrados
A variância de é proporcional a e inversamente proporcional a .
A variância de é proporcional a e a , e inversamente proporcional a e ao tamanho da amostra.
Modelo de regressão de duas variáveis: o problema da estimação
Propriedades dos estimadores de mínimos quadrados: o teorema de Gauss-Markov
Essas propriedades estão atreladas aos pressupostos (ou hipóteses) clássicas propostas.
Isso vai implicar nas PROPRIEDADES DE MELHOR ESTIMADOR LINEAR NÃO VIESADO (OU NÃO TENDENCIOSO): MELNT ou BLUE (BEST LINEAR UNBIASED ESTIMATOR)
Modelo de regressão de duas variáveis: o problema da estimação
Propriedades dos estimadores de mínimos quadrados: o teorema de Gauss-Markov
Será considerado BLUE (ou o melhor estimador linear não viesado) as estimativas que atenderem as seguintes condições:
Será uma função linear de uma variável aleatória, como a variável dependente no modelo de regressão.
É não viesado, ou seja, 
Tem variância mínima na classe de todos os estimadores lineares não viesados: um estimador não viesado com a menor variância é conhecido como um estimador eficiente.
Modelo de regressão de duas variáveis: o problema da estimação
O coeficiente de determinação : uma medida da “qualidade do ajustamento”
O que queremos é descobrir quão “bem” uma linha de regressão amostral é adequada aos dados.
Isso será possível através do coeficiente de determinação 
Seja então , chegamos a:
Modelo de regressão de duas variáveis: o problema da estimação
O coeficiente de determinação : uma medida da “qualidade do ajustamento”
Mas o que significa ?
Definimos então a seguinte relação:
“Que a Soma Total dos Quadrados (STQ) é igual a Soma dos Quadrados da Regressão (SQR) mais a Soma dos Quadrados dos Resíduos (SQRes)”: 
Portanto vamos definir a capacidade da regressão em explicar a variável dependente como sendo:
Modelo de regressão de duas variáveis: o problema da estimação
O coeficiente de determinação : uma medida da “qualidade do ajustamento”
Portanto é possível observar que tem as seguintes propriedades:
Mede a proporção ou percentual da variação total de explicada pelo modelo de regressão
É um valor não negativo
Seus limites são 
Existem outras formas de obtenção do coeficiente de determinação, mas todas envolvem adaptações. 
Modelo de regressão de duas variáveis: o problema da estimação
O coeficiente de determinação : uma medida da “qualidade do ajustamento”
Algo relacionado com é o coeficiente de correlação linear (ou de Pearson):
Nada mais é do que , ou então;
Modelo de regressão de duas variáveis: o problema da estimação
O coeficiente de determinação : uma medida da “qualidade do ajustamento”
Algumas propriedade de :
Pode ser positivo ou negativo (dependerá de )
Se situa entre os limites 
Sua natureza é simétrica, isto é, o coeficiente de correlação entre e é o mesmo que entre e 
É independente da origem e da escala, isto é, se definirmos e (ou seja, uma mudança de escala, em que e ), teremos que 
Se e são estatisticamente independentes, então No entanto não garante independência por si só (lembrar que o coeficiente de correlação de Pearson é uma estatística que somente capta dependência linear).
Trata-se de uma medida de associação linear, e não de causalidade.
Modelo de regressão de duas variáveis: o problema da estimação
Um exemplo numérico: Relação entre o Salário Horário médio () e a Escolaridade ():
	Observações	Salário Horário Médio (Y)	Escolaridade (X)
	1	4,4567	6
	2	5,77	7
	3	5,9787	8
	4	7,3317	9
	5	7,3182	10
	6	6,5844	11
	7	7,8182	12
	8	7,8351	13
	9	11,0223	14
	10	10,6738	15
	11	10,8361	16
	12	13,615	17
	13	13,531	18
Modelo de regressão de duas variáveis: o problema da estimação
Um exemplo numérico: Relação entre o Salário Horário médio () e a Escolaridade ():
6	7	8	9	10	11	12	13	14	15	16	17	18	4.4566999999999997	5.77	5.9786999999999999	7.3316999999999997	7.3182	6.5843999999999996	7.8182	7.8350999999999997	11.0223	10.6738	10.8361	13.615	13.531000000000001

Outros materiais