Baixe o app para aproveitar ainda mais
Prévia do material em texto
Cap. 1 - Regressão Definição: A análise da regressão ocupa-se do estudo da dependência de uma variável, a variável dependente, em relação a uma ou mais variáveis, as variáveis explicativas, com o objetivo de estimar e/ou prever a média ou valor médio da dependente em termos dos valores conhecidos ou fixos (em amostragem repetida) das explicativas. O sucesso da analise de regressão se da a disponibilidade de dados apropriados. Dados série temporal: Uma série temporal é um conjunto de observações dos valores que uma variável assume em diferentes momentos. Pode ser diariamente, semanalmente, anualmente, etc. Dados de corte(cross-section): São dados de uma ou mais variáveis coletados ao mesmo tempo. Ex: censo populacional, pesquisa de opnião. Dados combinados: Nos dados combinados há elementos tanto de séries temporais como dado de corte. Dados de Painel: Nos dados de painel uma unidade cross-section é pesquisada durante um tempo. A pesquisa é periódica em um mesmo grupo, família, empresas. Cap. 2 – Analise de regressão de 2 variáveis Média condicional de Y, dado X = Y1(p) + Y2(p) + Y3(p)... onde (p) é a probabilidade condicional (Y/X). A curva de regressão, os pontos são as médias condicionais. E(Y/X) = B1 + B2 Xi Onde, B1 e B2 são os coeficientes de regressão. B1 = intercepto e B2 = coeficiente de inclinação. Termo Linear O significado de linearidade(nas variáveis) é que a expectativa condicional de Y é uma função linear de X. com isso, X² não é linear. Geometricamente, a curva de regressão é uma reta. A linearidade nos parâmetros, Bs, devem ser elevadas sempre a primeira potencia, porém, X (variável explicativa) pode variar. Especificação estocástica da FRP Taxa de desvio(ou erro), de Y: ui = Y – B1 + B2 Xi, então, Yi = B1 + B2 Xi + ui Onde ui(erro) é uma variável aleatória não observável. Significado do termo de perturbação estocástica (erro) Imprecisão da teoria: a teoria é incompleta. Indisponibilidade de dados: omitir alguns dados. Variáveis essenciais vs variáveis periféricas: pequena influencia dessas variáveis, com isso, não vale a pena coloca-las no modelo. Causalidade intrínseca no comportamento humano: há uma natureza aleatória em Y. Variáveis proxy fracas Principio da parcimônia: para deixar simples o modelo de regressão, exclui-se algumas variáveis pouco relevantes, elas entram em u. Forma funcional errada Função de regressão amostral (FRA) É a FRP estimado. Quando não se possui dados o suficiente, se faz a analise com a amostra que há disponível. A FRA é escrita: ^Yi = ^B1 + ^B2 Xi Onde, ^Yi é o estimador de E(Y/X); ^B1 = Estimador de B1; ^B2 = Estimador de B2 ^Yi = ^B1 + ^B2 Xi + ûi Cap. 3 Modelo de regressão de 2 variáveis: problema da estimativa O Método dos Mínimos Quadrados Ordinários (MQO) Ûi = Yi - ^Yi Ûi = Yi - ^B1 + ^B2 Xi Isso mostra que os Ûi (erros) são simplesmente as diferenças entre os valores de Y reais e estimados. Para determinar FRA que seja mais próxima do Y real, escolhesse a FRA que a soma dos resíduos(∑ûi = ∑(Yi -^Yi)) seja o menor possível. Para fazer isso sem prejudicar a proporção dos resíduos (se não os pesos se igualam), utiliza-se o MQO. Onde se eleva ûi ao quadrado. ∑ûi² = ∑(Yi -^Yi)² = ∑(Yi - ^B1 + ^B2 Xi)² Ao levar ao quadrado, o peso se torna proporcional ao tamanho. Equações para estimar B1 e B2 : ^B1 = ӯ - ^B2 X̅ onde X̅ e Y̅ são as médias amostrais de X e Y em que definimos xi = (Xi - X̅) e yi = (Yi - Y̅) Propriedades de MQO: Os estimadores de MQO são expressos exclusivamente em termos das quantidades (X e Y) observáveis, por isso podem ser facilmente calculados. Eles são estimadores de ponto, isto é, dada uma certa amostra, cada estimador fornecera um único valor. Após obter as estimativas de MQO a partir dos dados da amostra, pode-se obter facilmente a reta de regressão da amostra. O modelo clássico de regressão linear: As hipóteses subjacentes ao MQO O modelo clássico (ou gaussiano) de regressão linear(MCRL) formula 10 hipóteses: O modelo de regressão é linear nos parâmetros. Yi = B1 + B2 Xi + ui Os valores de X são fixados em amostragem repetida. Supõe que X seja não estocástico. O valor médio ou esperado do termo de perturbação ui é zero. Isso significa que os fatores não inclusos no modelo, incluídos em Ui, não afetam muito Y. Homoscedasticidade(igual variância) ou variância igual de Ui. As variâncias condicionais de ui são idênticas. Var(ui/Xi) = σ². Significa que as variâncias de Y e X são iguais. Nenhuma auto-correlação entre as perturbações. Covariância 0 entre ui e Xi, ou E(uiXi) = 0. Não a correlação entre u e X. O numero de observações n deve ser maior que o numero de parâmetros a serem estimados. O numero de observações n deve ser maior que o numero da variáveis explicativas. Precisamos de no mínimo dois pares de observações para estimar duas incógnitas. Variabilidade nos valores de X. Os valores de X em uma dada amostra não pode ser todas iguais. A variação tanto em X quanto em Y é essencial para a analise de regreção. O modelo de regressão está corretamente especificado. Não existe Multicolinearidade perfeita. Ou seja, não há relações lineares perfeitas entre as variáveis explicativas. Precisão ou erro padrão das estimativas por MQO As estimativas variam, com isso, precisa de uma medida de confiabilidade ou precisão dos estimadores ^B1 e ^B2. Na estatística a precisão de uma variável é medida por seu erro-padrão(ep). SQR = ∑^ui² = ∑yi² - ^B²2∑xi² Propriedades dos Estimadores de Mínimos Quadrados: O teorema de Gauss Teorema de Gauss: dadas as hipóteses do modelo clássico de regressão linear os estimadores por mínimos quadrados, na classe dos estimadores lineares não enviesados, têm mínima variância, isto é, são MELNV(melhor estimador linear não-viesado). Coeficiente de determinação r² O coeficiente de determinação r² é uma medida sintética que diz quão bem a reta de regressão da amostra se ajusta aos dados. R² se situa entre 0 e 1. SQT(soma dos quadrados totais) = SQE(soma dos quadrados explicada)+SQR(soma dos quadrados do resíduo) R² = SQE/SQT R² = 1-SQR/SQT EXERCÍCIOS Em relação as hipóteses subjacentes dos mínimos quadrados, explique: Por que os valores de x são fixados em amostragem repetida? Supõe-se que X seja não estocástico ou seja, que os valores de X são repetidos em diferentes amostras, isso indica que a analise de regressão é uma analise condicional aos valores do regressor X. Por que o modelo de regressão deve ser corretamente especificado? O modelo não pode conter erros de especificação, pois, se utilizar um modelo errado, as previsões de Y serão erradas. Quais as propriedades de MQO sob hipótese de normalidade? Explique São não-viesados Tem variância mínima. Combinado com 1, isso significa que eles são não-visados com variância mínima, ou estimadores eficientes.
Compartilhar