Buscar

Módulo 2 Aula 6 Regressão MMQ alunos

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 14 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 14 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 14 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

09/04/2015 
1 
Regressão Linear Simples – Revisão e 
Exercícios 
Prof. Cesar Alexandre de Souza 
 
Material desenvolvido em conjunto com a 
Profa. Adriana Backx Noronha Viana 
 
EAD0655 – Técnicas Estatísticas de Projeção 
Agenda 
• Correção da Atividade 5 
• Revisão do Método dos Mínimos Quadrados 
– Coeficientes da regressão (bo e b1) 
– Coeficiente de Determinação (R2) 
• Exercícios e Dúvidas 
• Informações sobre a Prova (dia 24/4) 
 
 
O assunto dessa aula encontra-se nas páginas 427 a 444 do livro de 
Anderson et al (2008) 
09/04/2015 
2 
Atividade 5 
Fonte- U.S. Department of Transportation - Página 480 - Texto 2 
(Anderson et al; Capítulo 12 - Regressão Linear Simples). 
Cidades
% de motoristas 
habilitados com 
menos de 21 
Acidentes fatais 
por mil CNH
1 13% 2,962
2 12% 0,708
3 8% 0,885
4 12% 1,652
5 11% 2,091
6 17% 2,627
7 18% 3,83
8 8% 0,368
9 13% 1,142
10 8% 0,645
11 9% 1,028
12 16% 2,801
13 12% 1,405
14 9% 1,433
15 10% 0,039
16 9% 0,338
17 11% 1,849
18 12% 2,246
19 14% 2,855
20 14% 2,352
21 11% 1,294
Cidades
% de motoristas 
habilitados com 
menos de 21 
Acidentes fatais 
por mil CNH
22 17% 4,1
23 8% 2,19
24 16% 3,623
25 15% 2,623
26 9% 0,835
27 8% 0,82
28 14% 2,89
29 8% 1,267
30 15% 3,224
31 10% 1,014
32 10% 0,493
33 14% 1,443
34 18% 3,614
35 10% 1,926
36 14% 1,643
37 16% 2,943
38 12% 1,913
39 15% 2,814
40 13% 2,634
41 9% 0,926
42 17% 3,256
a) O que pode-se concluir pela análise 
visual da relação entre as variáveis? 
09/04/2015 
3 
d) O que se pode concluir a partir do modelo de regressão 
obtido? 
09/04/2015 
4 
Conceito 
• Análise de Regressão Linear: técnica estatística 
utilizada para prever os valores de uma 
variável dependente, com base nos valores de 
uma variável independente (Regressão 
Simples), ou de diversas variáveis 
independentes (Regressão Múltipla). 
 
Variável 
Independente 
X Variável 
Dependente 
Y 
Variáveis 
Independentes 
X1, X2, X3, ... Xn 
Regressão 
 Simples 
Regressão 
 Múltipla 
O Modelo de Regressão Linear Simples 
• Modelo de Regressão Linear Simples 
yi = 0 + 1xi + i 
 
• Equação da Regressão Linear Simples 
E(y|x) = 0 + 1x 
 
• Equação Estimada da Regressão Linear 
Simples (reta ajustada) 
ŷ = b0 + b1x 
09/04/2015 
5 
O Modelo de Regressão Linear Simples 
Anderson et al (2008) 
Pg 430 
Ao calcular os valores de b0 e b1 pelo MMQ, estamos na verdade interessados na 
estimativa dos valores de 0 e 1 tais que E(y|x) = 0 + 1x 
Daí virá a necessidade de se estudar significância estatística dos coeficientes, que 
será apresentada na próxima aula 
QUIZ 
• A regressão linear simples permite obter: 
 Uma equação que identifica para cada x, o valor 
exato de y 
Uma equação que identifica para cada x, o valor 
esperado de y 
Uma equação que identifica para cada x, o valor 
aproximado de y 
 
 
09/04/2015 
6 
Estimação dos Parâmetros do Modelo: Método 
dos Mínimos Quadrados (MMQ) 
Y 
X x1 xn 
XbbY o . 
ˆ
1
Erros de Predição 
... 
Reta de 
melhor ajuste 
x2 xi 
y1 
... 
y2 
yi 
yn 
..
. 
Estimação dos Parâmetros do Modelo: Método 
dos Mínimos Quadrados (MMQ) 
• A minimização pelo método dos mínimos quadrados 
significa localizar os valores de bo e b1 para minimizar a 
função 
 
• Substituindo , temos que minimizar a 
seguinte função para os valores de a e b 
2
)ˆ(  ii YYSSE 2
10 )(  ii XbbYSSE ioi XbbY . ˆ 1      2102210221101 ... nn XbbYXbbYXbbYSSE 
onde: 
yi = valor observado da variável dependente para a i-ésima observação 
xi = valor observado da variável independente para a i-ésima observação 
09/04/2015 
7 
Estimação dos Parâmetros do Modelo: Método 
dos Mínimos Quadrados (MMQ) 
• Minimizar essa expressão requer igualar suas 
derivadas parciais em bo e b1 a zero 
 
 
 
0 0
1






b
SSE
b
SSE
o
SSE 
bo 
b1 
Estimação dos Parâmetros do Modelo: Método 
dos Mínimos Quadrados (MMQ) 
• Derivando-se as duas expressões é obtido um 
conjunto de duas equações simultâneas, que, 
se resolvido, gera as seguintes soluções: XbYb 10 
Eq. ii 
 
  



nxx
nyxyx
b
ii
iiii
/)(
/)(
221
Eq. iii 
09/04/2015 
8 
Estimação dos Parâmetros do Modelo: Método 
dos Mínimos Quadrados (MMQ) 
• A partir da equação (iii), é possível derivar a 
equação (i), mais simplificada para cálculos 
em planilhas 





21 )(
))((
XX
YYXX
b
i
ii
Eq. i 
Estimação dos Parâmetros do Modelo: Método 
dos Mínimos Quadrados (MMQ) 
• Também é possível demonstrar que a eq (i), 
no caso da regressão linear simples, pode ser 
convertida para uma relação entre o coef. de 
correlação de pearson e os desvios padrão das 
variáveis 
x
y
yx
i
ii
S
S
r
XX
YYXX
b ,21 )(
))((






Eq. i 
09/04/2015 
9 
Variância Total do Modelo (SST) 
200
300
400
500
600
700
800
900
0 20 40 60 80
V
e
n
d
as
 
Investimento em Propaganda 
Vendas por Investimento em Propaganda 
ŷ = y = 600 
2
)(  YYSST i
Erros em Relação à Previsão (SSE) 
200
300
400
500
600
700
800
900
0 20 40 60 80
V
e
n
d
as
 
Investimento em Propaganda 
Vendas por Investimento em Propaganda 
2
)ˆ(  ii YYSSE
ŷ = 364,3 + 5,89x 
09/04/2015 
10 
Avaliação do Modelo: Ajuste Geral 
• Coeficiente de Determinação (R2) 
–Variância Total = Variância Não Explicada + 
Variância Explicada 
–Variância Total: (SST) 
–Variância Não Explicada: (SSE) 
–Variância Explicada: (SSR) 
 
2
)ˆ(  ii YY SST
SSE
SST
SSR
R  12
Eq. iv 
2
)( YYi
2
)ˆ(  ii YY
QUIZ 
• Em relação ao coeficiente de determinação, 
qual dessas afirmações está incorreta: 
 A variância não explicada decorre dos erros de 
predição 
A variância total decorre das diferenças em 
relação à media 
A variância explicada decorre dos erros em 
relação à média 
 
 
09/04/2015 
11 
y = 0,2871x - 1,5974 
R² = 0,7046 
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
7% 9% 11% 13% 15% 17% 19%
A
ci
d
e
n
te
s 
fa
ta
is
 p
o
r 
m
il 
C
N
H
 
Porcentagem de motoristas habilitados com menos de 21 
Acidentes fatais por mil CNH 
Exercício 1 - a 
• São dadas cinco observações referentes a 
duas variáveis, x e y 
 
 
• Desenvolva o diagrama de dispersão para 
esses dados 
• O que o diagrama de dispersão indica a 
respeito da relação entre as duas variáveis? 
X 1 2 3 4 5 
Y 3 7 5 11 14 
Anderson et al (2008) 
09/04/2015 
12 
Exercício 1 - b 
• Observe a tabela desenvolvida a partir dos dados. 
 
 
 
 
 
 
 
• Obtenha a equação de regressão para os dados 
• Use a equação para prever o valor de y quando x = 4 
• Sabendo que nesse caso, calcule o 
coeficiente de determinação 
X Y 
1 3 -2 -5
2 7 -1 -1
3 5 0 -3
4 11 1 3
5 14 2 6
média 3 8
)( YYi 
)( XX i 
40,12)ˆ(
2
 ii YY
Exercício 2 
Um gerente deseja saber se existe relação entre tempo de trabalho (emprego) e 
salário. Assim, coletou os dados de cinco funcionários e obteve as informações 
apresentadas a seguir. A tabela apresenta os cálculos dos valores padronizados (x´ e y´). 
Dados Originais Dados Padronizados 
Funcion
ário 
Tempo de 
Trabalho 
(X)Salário em 
mil reais 
(Y) 
X' Y' X' * Y' 
1 1 1,1 -1,21 -1,00 1,21 
2 3 1,2 -0,76 -0,78 0,60 
3 7 1,4 0,13 -0,35 -0,05 
4 9 2 0,58 0,95 0,56 
5 12 2,1 1,26 1,17 1,47 
Média 6,4 1,56 SOMA 3,79 
Desv. 
pad 
4,45 0,46 
a) Obtenha o coeficiente de correlação de Pearson e explique o seu significado. 
b) Teste se existe correlação entre as variáveis (usar α=0,05 e α=0,01): 
09/04/2015 
13 
Exercício 2 
Exercício 3 
Dada a matriz de correlações a seguir, e considerando que os valores foram obtidos a 
partir de amostra de 8 respondentes, responda verdadeiro ou falso para cada uma das 
afirmativas: 
a) Existe uma forte correlação positiva entre renda e média de anos de estudo dos pais 
 ( ) V ( ) F 
b) Podemos afirmar que não existe correlação entre as variáveis entre poupança e média 
 de anos de estudo dos para um α=10% 
 ( ) V ( ) F 
c) A correlação entre média de anos de estudo dos pais e número de filhos indica que 
 quanto maior a média de anos de estudo dos pais, maior o número de filhos 
 ( ) V ( ) F 
d) A correlação entre poupança e número de filhos é significativa para um α = 5% 
 ( ) V ( ) F 
 Renda Poupança 
Nr. 
Filhos 
Anos de 
Estudo dos 
Pais 
Renda 1 
Poupança 0,986 1 
Nr. Filhos -0,752 -0,689 1 
Anos de Estudo dos 
Pais 0,974 0,954 -0,788 1 
09/04/2015 
14 
Prova – 24/4 
• Em sala (G5) 
• Individual e sem consulta 
• Após o início da prova, não é permitido sair da sala 
antes de terminá-la 
• Cai: 
– Correlação de Pearson e Spearman 
– Significância das correlações de Pearson e Spearman 
– Regressão Linear simples 
• Obtenção da Equação da reta ajustada 
• Coeficiente de Determinação 
• Significância dos Coeficientes (conceitual – será apresentado na próx 
aula de 17/4 – em EAD) 
• Pode usar calculadora (não smartphone), não pode 
emprestar (traga a sua, por favor)

Continue navegando