Baixe o app para aproveitar ainda mais
Prévia do material em texto
Análise de Variância Econometria Alexandre Gori Maia Ementa: • Soma dos Quadrados; • Coeficiente de Determinação; • Teste F para Tabela ANOVA; • Coeficiente de Determinação Ajustado; Bibliografia Básica: Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 7. Soma dos Quadrados - Conceito Y Y n i i YYSQReg 1 2)ˆ( n i i YYSTQ 1 2)( n i i iYY SQRes 1 2)ˆ( Y Quando X explica Y Quando X não explica Y Maior Soma dos Quadrados da Regressão Menor Soma dos Quadrados da Regressão X Y X Y ^ Y ^ Soma dos Quadrados Coeficiente de Determinação Teste F ANOVA R2 Ajustado 2/11 Soma dos Quadrados - Definição Soma Total dos Quadrados (STQ): Y 2 1 2 1 2)( YnyYYSTQ T n i i n i i yy Variabilidade total da variável dependente. Representa as distâncias quadráticas dos valores de Y em relação à média aritmética. Y X1 X2 Soma dos Quadrados da Regressão (SQReg): Variabilidade da variável dependente explicada pelo conjunto de variáveis independentes. Representa as distâncias quadráticas dos valores ajustados pelo modelo em relação à média aritmética. SQReg 2 1 2 ˆ)ˆ( YnYYSQReg TT n i i yXβ X1 X2 Soma dos Quadrados dos Resíduos (SQRes): Variabilidade da variável dependente não explicada pelo conjunto de variáveis independentes. Representa as distâncias quadráticas entre os valores observados de Y e seus valores ajustados pelo modelo. Y SQRes yXβyyee TTTT n i ii YYSQRes ˆˆˆ)ˆ( 1 2 X1 X2 STQ Soma dos Quadrados Coeficiente de Determinação Teste F ANOVA R2 Ajustado 3/11 Análise de Variância Regressão Resíduos Total Fonte Soma dos QuadradosGL k )1( kn 1n Quadrados Médios k SQReg )1( kn SQRes F )1( knSQRes/ SQReg/k F2ˆ YnTT yXβ yXβyy TTT ˆ 2YnT yy Soma dos Quadrados Coeficiente de Determinação Teste F ANOVA R2 Ajustado 4/11 Coeficiente de Determinação (R2): Definição: Estima a proporção da variabilidade da variável dependente (Y) que é explicada pelo conjunto das k variáveis independentes do modelo de regressão (X). 1 Escala para R2: Independência linear Relação linear exata Coeficiente de Determinação STQ SQRes STQ SQReg R 12 0 Y X1 X2 Soma dos Quadrados Coeficiente de Determinação Teste F ANOVA R2 Ajustado 5/11 Soma dos Quadrados - Exemplo Y (Renda) X1 (Anos Estudo) X2 (Idade) 4 1 20 8 4 30 10 6 40 12 7 50 Seja a relação entre renda familiar em salários mínimos (Y), anos de estudo (X1) e idade (X2) do responsável pela família: ii eXXY ii ˆ06,019,1 21 2)5,8(4 1320 180 34 06,019,1 2ˆ YnSQReg TT yXβ 8,342898,323 2YnSTQ T yy 2)5,8(4 12 10 8 4 121084 35289324 gSQSTQsSQ ReRe 2,08,3435 994,02 35 34,8 STQ SQReg R As variáveis anos de estudo e idade explicam, conjuntamente, quase a totatilidade (99,4%) da variabilidade observada para a renda familiar na amostra. Soma dos Quadrados Coeficiente de Determinação Teste F ANOVA R2 Ajustado 6/11 Teste F para ANOVA- Exemplo Seja o modelo de RLM com duas variáveis: eXXY 2211 E as hipóteses: Possíveis resultados do modelo: 0: 0: 1 210 j um menos PeloH H Y X1 X2 Y X1 X2 Y X1 X2 Y X1 X2 10 20 1=0 20 10 2=0 1=0 2=0 X1 e X2 contribuem para explicar Y. H0 deveria ser rejeitado Apenas X2 contribui para explicar Y. H0 deveria ser rejeitado Apenas X1 contribui para explicar Y. H0 deveria ser rejeitado Nenhuma variável contribui para explicar Y. H0 não deveria ser rejeitado Soma dos Quadrados Coeficiente de Determinação Teste F ANOVA R2 Ajustado 7/11 Teste F para ANOVA H0: 1=...=k =0 (não contribui) H1: Pelo menos um j 0 (contribui) 1, knnF~F F p )1( knSQRes/ SQReg/k F Rejeitar H0 significa afirmar que o modelo contribui para explicar Y, ou seja, há relação significativa entre pelo menos uma variável explicativa e a variável dependente. Seja o modelo de RLM: eXXXY kk ...2211 Para testarmos a contribuição do conjunto de k variáveis independentes do modelo, teremos as hipóteses: A estatística de teste será Considerando H0 verdadeiro, a fdp de F será... Soma dos Quadrados Coeficiente de Determinação Teste F ANOVA R2 Ajustado 8/11 Teste F para ANOVA - Exemplo Seja a relação entre renda familiar em salários mínimos (Y), anos de estudo (X1) e idade (X2) do responsável pela família: ii eXXY ii ˆ06,019,1 21 ,F~ SQRes/ SQReg/ 12 1 2 087,F 0760, Há evidências moderadas para afirmar que o modelo contribui para explicar a variabilidade da renda familiar. A probabilidade de erro ao fazermos tal afirmação é de aproximadamente 7,6%. valor p = 0,076 Soma dos Quadrados Coeficiente de Determinação Teste F ANOVA R2 Ajustado 9/11 R2 Ajustado - Definição Y X1 X2 SQReg Seja o ajuste: ii eXXY ii ˆˆˆ 2211 STQ SQReg Ry 2 12 Incorporando uma variável independente adicional (X3): ii eXXXY iii ˆˆˆˆ 332211 Y X1 X2 Poderemos ter: X3 SQReg Y X1 X2 SQReg X3 ou 2 12 2 123 yy RR 2 12 2 123 yy RR O R2 nunca diminui quando incorporamos variáveis independentes adicionais no modelo. Coeficiente de Determinação Ajustado (R2): O R2 ajustado (R2) pondera o coeficiente de determinação (R2) pelo número de variáveis explicativas e pelo número de observações da amostra. É particularmente útil quando desejamos comparar modelos de regressão múltipla que prevêem a mesma variável dependente, pois penaliza aquele modelo com maior número de variáveis independentes. Será dado por: )1( 1 )1(1 )1( )]1([ 1 22 kn n R nSTQ/ knSQRes/ R _ _ Soma dos Quadrados Coeficiente de Determinação Teste F ANOVA R2 Ajustado 10/11 R2 Ajustado - Exemplo Seja a relação entre renda familiar em salários mínimos (Y), anos de estudo (X1) e idade (X2) do responsável pela família: ii eXXY ii ˆ06,019,1 21 0,9942 R Não há mudanças expressivas no coeficiente de determinação ajustado pelo número de observações e variáveis do modelo é expressivamente inferior ao R2. Reflexo, sobretudo, do elevadíssimo valor encontrado para o R2. 0,982 )12(4 14 )994,0(11R2 Soma dos Quadrados Coeficiente de Determinação Teste F ANOVA R2 Ajustado 11/11
Compartilhar