Baixe o app para aproveitar ainda mais
Prévia do material em texto
1EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão Estatística Prof. Paulo Renato A. Firmino praf62@gmail.com Aulas 35 – 36 2EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão • Temos estudado como medir a associação entre duas variáveis a partir de modelos de regressão Por exemplo, através do modelo ŷ = f(x) = a + b·x • Os valores de a e b são provenientes de uma amostra • Os parâmetros populacionais são α e β, onde E[Y|x]=α+β·x • Estudamos as hipóteses H0: β=0 contra H1: β ≠ 0 – Se β=0 então não há associação linear entre X e Y • Continuaremos neste sentido... Reforçaremos alguns conceitos • Como temos sempre feito ... Introduziremos testes de hipóteses Modelos de Regressão X Análise de Variância - ANOVA 2n 1i i n 1i 2 i n 1i i n 1i i n 1i ii xxn yxyxn b ⎟⎟⎠ ⎞⎜⎜⎝ ⎛−⋅ ⎟⎟⎠ ⎞⎜⎜⎝ ⎛⋅⎟⎟⎠ ⎞⎜⎜⎝ ⎛−⋅⋅ = ∑∑ ∑∑∑ == === n xby xbya n 1i i n 1i i ∑∑ == ⋅− =⋅−= 3EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão Modelos de Regressão X Análise de Variância - ANOVA di=ei= mi= A ANOVA se baseia nestas três diferenças para estudar a associação entre X e Y 4EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão • ... Ocorre que di = ei + mi: • ... e que Modelos de Regressão X Análise de Variância - ANOVA )yyˆ()yˆy(yy iiii −+−=− ( ) ( ) ( )∑∑∑ === −+−=− n 1i 2 i n 1i 2 ii n 1i 2 i yyˆyˆyyy Soma de Quadrados Total (SQT) Soma de Quadrados dos Erros (SQE) Soma de Quadrados da Regressão (SQR) Veja que S2Y = SQT/ (n-1) Veja que S2e = SQE/ (n-2) 5EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão • As medidas de dispersão SQT, SQE e SQR são denominadas fontes de variação da variável resposta Y A questão central sobre o modelo ŷ = f(x) = a + b·x é 1. Quanto da variação de Y é explicada pelo modelo? • Se o modelo é bom (erra “pouco”), SQE → 0 e SQT → SQR • Se o modelo não é bom (erra “muito”), SQT → SQE – Os erros aleatórios representam as variações de Y não captadas pelo modelo (yi = f(xi) + ei) Modelos de Regressão X ANOVA Fontes de variação ( )∑ = −= n 1i 2 i yySQT ( )∑ = −= n 1i 2 ii yˆySQE ( )∑ = −= n 1i 2 i yyˆSQR SQT = SQE + SQR 6EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão • Coeficiente de explicação (determinação) do modelo Mede quanto da variação de Y, o modelo ŷ = f(x) = a + b·x é capaz de captar (explicar) R2 = 1 – SQE/SQT = SQR/SQT • 100·(R2)% da variação de Y é captada pelo modelo Modelos de Regressão X ANOVA Fontes de variação ( )∑ = −= n 1i 2 i yySQT ( )∑ = −= n 1i 2 ii yˆySQE ( )∑ = −= n 1i 2 i yyˆSQR SQT = SQE + SQR SQT = 1004.5 SQE 20%SQR 80% 7EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão • Outras formulações para SQT, SQE e SQR Modelos de Regressão X ANOVA Fontes de variação ( ) n y yyySQT 2n 1i in 1i 2 i n 1i 2 i ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ −=−= ∑∑∑ = == ( ) ∑∑∑∑ ==== ⋅⋅−⋅−=−= n 1i ii n 1i i n 1i 2 i n 1i 2 ii yxbyayyˆySQE ( ) SQESQTyyˆSQR n 1i 2 i −=−= ∑ = 2n 1i i n 1i 2 i n 1i i n 1i i n 1i ii xxn yxyxn b ⎟⎟⎠ ⎞⎜⎜⎝ ⎛−⋅ ⎟⎟⎠ ⎞⎜⎜⎝ ⎛⋅⎟⎟⎠ ⎞⎜⎜⎝ ⎛−⋅⋅ = ∑∑ ∑∑∑ == === n xby xbya n 1i i n 1i i ∑∑ == ⋅− =⋅−= 8EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão • Cada fonte de variação está associada a certo nº de graus de liberdade Aqueles mesmos graus de liberdade (gl) relacionados com as distribuições t-Student e Qui-quadrado Basicamente, tem-se n gl para SQT e SQE • Contudo, perde-se 1 gl por parâmetro estimado • Para , estima-se μY: tem-se (n-1) gl • Para , estimam-se α e β: tem-se (n-2) gl Como os gl da SQT são distribuídos na SQE e SQR, • Para , tem-se (n-1)-(n-2) = 1 gl Modelo de Regressão X ANOVA Graus de Liberdade ( )∑ = −= n 1i 2 i yySQT ( )∑ = −= n 1i 2 ii yˆySQE ( )∑ = −= n 1i 2 i yyˆSQR 9EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão • Tabela ANOVA • fobs provem de uma distribuição F-Snedecor com v1=1 gl e v2=(n-2) gl A regra de decisão recorre, agora, à FS(1, n-2) Rejeitar a hipótese nula significa considerar que o modelo de regressão é significativamente superior a uma simples média. Modelo de Regressão X ANOVA QMT = SQT/(n-1) = Sy2 n-1Total QME = SQE/(n-2)n-2Erro QMR = SQTr/11Regressão fobsQuadrado médio Soma de quadrados Graus de liberdade Fonte de variação QME QMR ( )∑ = −= n 1i 2 i yySQT ( )∑ = −= n 1i 2 ii yˆySQE ( )∑ = −= n 1i 2 i yyˆSQR anova(lm) 10EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão 1. A reta que melhor representa a associação entre a quantidade consumida de dado fruto em mg (X) e a incidência de abortos em vacas (Y), de acordo com os dados ao lado, é dada por ŷ = f(x) = 1 + 0.5·x. (a) Quanto da variação de Y, o modelo é capaz de captar? (b) O modelo é relevante, sob um nível de significância de 1%? 2. No problema acima, se para o 3º grupo, o nº de abortos fosse 2 (ao invés de 1): a. Qual seria o modelo? b. Quanto da variação de Y, o modelo seria capaz de captar? Modelos de Regressão X ANOVA Exercício 1 13151476Soma 999334 214123 241212 010101 xiyiyi2xi2 Nº de aborto (yi) Exposição em mg (xi) Grupo (i) 11EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão Modelos de Regressão X ANOVA Exercício 1 3. A seguir apresenta-se a série de precipitações de chuva de uma dada localidade, ao longo de algumas semanas, em unidades de 10 ml (xt). (a) Construa um modelo linear que permita estimar a precipitação na semana t (xt) a partir da precipitação observada na semana anterior (xt-1). Trata-se de um modelo auto-regressivo. (b) Interprete o coeficiente de determinação do seu modelo. (c) Verifique, via gráfico de pares e teste de ANOVA, se os resíduos são independentes das precipitações observadas. 17.713.210.69.56.66.76.63.66.34.1Precipitação em unidades de 10 ml (xt) 10987654321Dia (t)
Compartilhar