Baixe o app para aproveitar ainda mais
Prévia do material em texto
José Guilherme Chaves Alberto Regressão linear múltipla – 1ª parte Conceitos iniciais Segundo Doane e Seward (2014) a regressão múltipla é uma extensão da regressão simples que inclui muitas variáveis preditoras. 𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖1 + 𝛽2𝑋𝑖2 + 𝛽3𝑋𝑖3 + ⋯ + 𝛽𝑘𝑋𝑖𝑘 + 𝜖𝑖 (1) Sendo Yi = variável resposta; 𝛽0 = intercepto; 𝛽1,𝛽2, 𝛽3, 𝛽𝑘= coeficiente angular; ϵ𝑖 = termo de erro estocástico. Cada coeficiente 𝛽𝑘indica a mudança no valor médio de Y, quando se altera uma unidade de 𝑋𝑘 - tudo mais constante. O valor estimado do modelo de regressão pelo MQO: 𝑌𝑖 = 𝑏0 + 𝑏1𝑋𝑖1 + 𝑏2𝑋𝑖2 + 𝑏3𝑋𝑖3 + ⋯ + 𝑏𝑘𝑋𝑖𝑘 + 𝑒𝑖 (2) Sendo Yi = variável resposta; 𝑏0 = estimador do intercepto; 𝑏1 , 𝑏2, 𝑏3, 𝑏𝑘 = estimador do coeficiente angular; 𝑒𝑖 = estimador de ϵ𝑖. “ ” Deve-se construir um modelo parcimonioso – um modelo que considere somente as variáveis independentes úteis. Estime o modelo de regressão múltipla. Exemplo: Nº Variável dependente (y) Variável independente (X1) Variável independente (X2) 1 38 10 19 2 48 7 23 3 30 15 17 4 26 19 18 5 20 24 15 6 12 30 12 7 30 14 17 8 35 10 18 O coeficiente de determinação ajustado (r2 ajustado) é uma medida do coeficiente de determinação (r2) estimado pelo MQO ajustado pelo número de graus de liberdade. Coeficiente de determinação ajustado (r2 ajustado) Matematicamente tem-se: 𝑟𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 2 = 1 − 𝑆𝑄𝑒𝑟𝑟𝑜 𝑛−𝐾−1 𝑆𝑄𝑡𝑜𝑡𝑎𝑙 𝑛−1 (3) Sendo:𝑟𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 2 = coeficiente de determinação ajustado; k = preditores; e n = observações. De maneira análoga a regressão linear simples é fundamental que seja analisada a significância estatística geral, por meios dos seguintes testes: Teste F (ANOVA) Teste t Significância geral do modelo e de cada um dos parâmetros no modelo de regressão múltipla O teste F testa se há alguma variável independente que é significante. Tem-se as seguintes hipóteses: 𝐻0: 𝑇𝑜𝑑𝑜𝑠 𝑜𝑠 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑖𝑟𝑜𝑠 𝑠ã𝑜 𝑧𝑒𝑟𝑜 𝐻1: 𝑃𝑒𝑙𝑜 𝑚𝑒𝑛𝑜𝑠 𝑢𝑚 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑛ã𝑜 é 𝑧𝑒𝑟𝑜 𝐹𝑐𝑎𝑙𝑐 = 𝑄𝑀𝑅𝑒𝑔 𝑄𝑀𝐸𝑟𝑟𝑜 (4) Sendo: 𝑄𝑀𝑅𝑒𝑔 = quadrado médio da regressão; 𝑄𝑀𝐸𝑟𝑟𝑜 = quadrado médio do resíduo. Fórmula para testar se a regressão é significante “ ” Como regra geral se o F de significação for menor que 0,05 (< 0,05) o modelo é estatisticamente significante. O teste t testa a significância estatística de cada parâmetro a ser considerado no modelo de regressão. Tem-se as seguintes hipóteses: 𝐻0: 𝐵0 = 0 𝐻1: 𝐵0 ≠ 0 e 𝐻0: 𝐵𝑗 = 0 𝐻1: 𝐵𝑗 ≠ 0 𝑡𝑐𝑎𝑙𝑐 = 𝑏0 𝑆𝑏0 (5) e 𝑡𝑐𝑎𝑙𝑐 = 𝑏𝑗 𝑆𝑏𝑗 (6) Sendo:𝑆𝑏0= erro-padrão do intercepto; 𝑆𝑏𝑗= erro-padrão do coeficiente angular. Fórmulas para testar se os coeficientes são significantes “ ” Como regra geral se o t do teste for menor que 0,05 (< 0,05) o parâmetro é estatisticamente significante. Com os dados estimados na Tabela 1, analise os resultados do teste F e t. Exemplo: O intervalo de confiança é estimado através do software Excel. Deve-se realizar a seguinte análise: Se o intervalo de confiança não possui o número zero o parâmetro é estatisticamente significante Intervalo de confiança para o coeficiente angular e o intercepto Com os dados estimados na Tabela 1, analise o intervalo de confiança. Exemplo: Capítulo 13 – itens 13.1, 13.2 e 13.3 - do livro DOANE, David P.; SEWARD, LORI E. Estatística aplicada à administração e economia. 4 ed. Porto Alegre: AMGH, 2014. (Livro Eletrônico). Leitura recomendada Referências bibliográficas BRUNI, Adriano Leal. Estatística Aplicada à Gestão Empresarial. 3 ed. São Paulo: Atlas, 2011. DOANE, David P.; SEWARD, LORI E. Estatística aplicada à administração e economia. 4 ed. Porto Alegre: AMGH, 2014. Referências bibliográficas - continuação GUJARATI, Damodar N. Econometria básica. 3 ed. Porto Alegre, RS: AMGH, 2000. GUJARATI, Damodar N.; PORTER, Dawn C. Econometria básica. 5 ed. Porto Alegre, RS: AMGH, 2011.
Compartilhar