Buscar

A regressão múltipla_1 parte

Prévia do material em texto

José Guilherme Chaves Alberto 
Regressão linear múltipla – 1ª parte 
Conceitos iniciais 
Segundo Doane e Seward (2014) a regressão múltipla é 
uma extensão da regressão simples que inclui muitas 
variáveis preditoras. 
 
𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖1 + 𝛽2𝑋𝑖2 + 𝛽3𝑋𝑖3 + ⋯ + 𝛽𝑘𝑋𝑖𝑘 + 𝜖𝑖 (1) 
 
Sendo Yi = variável resposta; 𝛽0 = intercepto; 𝛽1,𝛽2, 𝛽3, 𝛽𝑘= 
coeficiente angular; ϵ𝑖 = termo de erro estocástico. 
 
 
 
 
 
 
Cada coeficiente 𝛽𝑘indica a 
mudança no valor médio de Y, 
quando se altera uma unidade de 
𝑋𝑘 - tudo mais constante. 
 
 
O valor estimado do modelo de regressão pelo MQO: 
 
𝑌𝑖 = 𝑏0 + 𝑏1𝑋𝑖1 + 𝑏2𝑋𝑖2 + 𝑏3𝑋𝑖3 + ⋯ + 𝑏𝑘𝑋𝑖𝑘 + 𝑒𝑖 (2) 
 
Sendo Yi = variável resposta; 𝑏0 = estimador do intercepto; 
𝑏1 , 𝑏2, 𝑏3, 𝑏𝑘 = estimador do coeficiente angular; 𝑒𝑖 = 
estimador de ϵ𝑖. 
“ 
” 
 
Deve-se construir um modelo 
parcimonioso – um modelo que 
considere somente as variáveis 
independentes úteis. 
 
Estime o modelo de regressão múltipla. 
 
 
 
Exemplo: 
Nº 
Variável 
dependente (y) 
Variável 
independente (X1) 
Variável 
independente (X2) 
1 38 10 19 
2 48 7 23 
3 30 15 17 
4 26 19 18 
5 20 24 15 
6 12 30 12 
7 30 14 17 
8 35 10 18 
O coeficiente de determinação ajustado (r2 
ajustado) é uma medida do coeficiente de 
determinação (r2) estimado pelo MQO ajustado 
pelo número de graus de liberdade. 
 
Coeficiente de determinação ajustado (r2 ajustado) 
Matematicamente tem-se: 
 
𝑟𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜
2 = 1 − 
𝑆𝑄𝑒𝑟𝑟𝑜
𝑛−𝐾−1
𝑆𝑄𝑡𝑜𝑡𝑎𝑙
𝑛−1
 (3) 
 
Sendo:𝑟𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜
2 = coeficiente de determinação ajustado; k = 
preditores; e n = observações. 
 
 
De maneira análoga a regressão linear simples é 
fundamental que seja analisada a significância 
estatística geral, por meios dos seguintes testes: 
 
 Teste F (ANOVA) 
 Teste t 
 
Significância geral do modelo e de cada um dos 
parâmetros no modelo de regressão múltipla 
O teste F testa se há alguma variável independente que é 
significante. Tem-se as seguintes hipóteses: 
 
𝐻0: 𝑇𝑜𝑑𝑜𝑠 𝑜𝑠 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑖𝑟𝑜𝑠 𝑠ã𝑜 𝑧𝑒𝑟𝑜 
𝐻1: 𝑃𝑒𝑙𝑜 𝑚𝑒𝑛𝑜𝑠 𝑢𝑚 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑛ã𝑜 é 𝑧𝑒𝑟𝑜 
 
𝐹𝑐𝑎𝑙𝑐 = 
𝑄𝑀𝑅𝑒𝑔 
𝑄𝑀𝐸𝑟𝑟𝑜
 
(4) 
 
Sendo: 𝑄𝑀𝑅𝑒𝑔 = quadrado médio da regressão; 𝑄𝑀𝐸𝑟𝑟𝑜 = 
quadrado médio do resíduo. 
 
Fórmula para testar se a regressão é significante 
“ 
” 
 
Como regra geral se o F de 
significação for menor que 0,05 
(< 0,05) o modelo é 
estatisticamente significante. 
O teste t testa a significância estatística de cada 
parâmetro a ser considerado no modelo de regressão. 
Tem-se as seguintes hipóteses: 
𝐻0: 𝐵0 = 0 
𝐻1: 𝐵0 ≠ 0 
e 
𝐻0: 𝐵𝑗 = 0 
𝐻1: 𝐵𝑗 ≠ 0 
 
𝑡𝑐𝑎𝑙𝑐 = 
𝑏0 
𝑆𝑏0
 (5) 
e 
𝑡𝑐𝑎𝑙𝑐 = 
𝑏𝑗 
𝑆𝑏𝑗
 (6) 
 
Sendo:𝑆𝑏0= erro-padrão do intercepto; 𝑆𝑏𝑗= erro-padrão do 
coeficiente angular. 
 
Fórmulas para testar se os coeficientes são significantes 
“ 
” 
 
 
 Como regra geral se o t do 
teste for menor que 0,05 (< 0,05) 
o parâmetro é estatisticamente 
significante. 
Com os dados estimados na Tabela 1, analise 
os resultados do teste F e t. 
 
 
 
Exemplo: 
O intervalo de confiança é estimado através do 
software Excel. Deve-se realizar a seguinte análise: 
 
Se o intervalo de confiança não possui o 
número zero o parâmetro é estatisticamente 
significante 
Intervalo de confiança para o coeficiente angular e 
o intercepto 
Com os dados estimados na Tabela 1, analise o 
intervalo de confiança. 
 
 
 
Exemplo: 
Capítulo 13 – itens 13.1, 13.2 e 13.3 - do livro 
DOANE, David P.; SEWARD, LORI E. Estatística 
aplicada à administração e economia. 4 ed. Porto 
Alegre: AMGH, 2014. (Livro Eletrônico). 
Leitura recomendada 
Referências bibliográficas 
BRUNI, Adriano Leal. Estatística Aplicada à 
Gestão Empresarial. 3 ed. São Paulo: Atlas, 
2011. 
DOANE, David P.; SEWARD, LORI E. Estatística 
aplicada à administração e economia. 4 ed. 
Porto Alegre: AMGH, 2014. 
 
Referências bibliográficas - continuação 
GUJARATI, Damodar N. Econometria básica. 3 
ed. Porto Alegre, RS: AMGH, 2000. 
GUJARATI, Damodar N.; PORTER, Dawn C. 
Econometria básica. 5 ed. Porto Alegre, RS: 
AMGH, 2011.

Continue navegando