Baixe o app para aproveitar ainda mais
Prévia do material em texto
Tema 5: Análise de Variância da Regressão Para verificar a adequação do modelo aos dados, algumas técnicas podem ser utilizadas. A análise de variância da regressão é uma das mais usadas. Assim, podemos analisar a adequação do modelo pela ANOVA da regressão, a qual é geralmente apresentada como na Tabela 7 (Guimarães, 2015): Tabela 7 – Análise de Variância da Regressão. regSQ = soma dos quadrados devido à regressão: n reg i i SQ Y y 2 1 ˆ resSQ = soma dos quadrados devido aos erros: n res Total reg i i i SQ SQ SQ y Y 2 1 ˆ TotalSQ = soma dos quadrados totais: n Total i i SQ y y 2 1 regQM = quadrados médios da regressão: reg reg SQ QM p 1 resQM = quadrados médios dos resíduos: res res SQ QM n p p = número de variáveis do modelo n = número total de observações Segundo Rosa (2009) para testarmos a significância do parâmetro b, o que na prática significa verificar se a variável X influencia a resposta Y, testamos as hipóteses H b 0 : 0 contra H b 1 : 0 . Sob H0 , a estatística de teste dada por F tem distribuição F de Snedecor com p – 1 e n – p graus de liberdade. Assim, rejeitamos H0 se o valor calculado de F for maior que o valor de F tabelado a um nível de significância preestabelecido. Além disso, algumas premissas devem ser satisfeitas. Devemos verificar se os erros encontram-se aleatoriamente distribuídos em torno de zero, bem como se a variância dos mesmos é constante e se são independentes. A suposição de independência está intimamente relacionada com a forma como os dados foram coletados. Se o experimento foi conduzido de forma a garantir que as informações observadas em uma unidade amostral não tenham sido influenciadas pelas das outras unidades, então essa suposição é razoável. Por outro lado, o gráfico dos resíduos versus os valores preditos pelo modelo, Yˆ , bem como o gráfico dos resíduos versus os valores da variável preditora, X, auxiliam-nos a verificar se a média dos erros é zero e se a variância é constante (Rosa, 2009). Exemplo 7 (Portal Action, 2014): Realizar a análise de variância da regressão para o Exemplo 5 e interpretar os resultados obtidos. Solução: Inicialmente, devemos calcular os parâmetros necessários para a ANOVA. Nesse caso: n Total i i SQ y y 2 2 2 2 1 137 129,4 137 129,4 ... 122 129,4 706,80 regSQ 665,64 n res Total reg i i i SQ SQ SQ y Y 2 1 ˆ 706,80 665,64 41,16 reg reg SQ QM p 665,64 665,64 1 2 1 res res SQ QM n p 41,16 2,29 20 2 Assim: reg res QM F QM 665,64 291,10 2,29 Neste caso, a tabela ANOVA pode ser visualizada abaixo: Veja a seguir e veja a tabela com os limites unilaterais da distribuição F de Snedecor ao nível de 5% de probabilidade: Tabela 8 – Limites unilaterais da distribuição F de Snedecor ao nível de 5% de probabilidade. Para = 0,05, obtemos que F 0,95;1;18 4,414 . Logo, F F 0,95;1;18291,1 4,414 . Portanto, rejeitamos H0 com um nível de confiança de 95% e concluímos que a variável explicativa tem correlação com a variável resposta.
Compartilhar