Livro Analise de regressão
402 pág.

Livro Analise de regressão


DisciplinaMatemática Financeira57.988 materiais1.516.087 seguidores
Pré-visualização50 páginas
base nos valores de renda per capita ( 1X ) e da porcentagem de analfabetos 
( 2X ) para 20 países latino-americanos em 1950, obtivemos o coeficiente de 
correlação r = \u20130,6. 
a) Esse resultado é estatisticamente significativo ao nível de 1%? 
b) Interprete o resultado do ponto de vista estatístico e econômico-social. 
3.9. São dados n pares de valores iX , iY cujo coeficiente de correlação é r. Sendo 
ii bYaZ += e ii hXkV += , demonstre que o coeficiente de correlação entre iV e 
iZ é igual a r, se bh > 0, e é igual a \u2013r, se bh < 0 (a, b, k e h são constantes). 
3.10. São dados os valores de iZ (i = 1, ..., n). Definimos 
i
i Z
aX = e 
i
i Z
bY = . 
Demonstre que, se a e b são constantes positivas, o coeficiente de correlação entre 
iX e iY é igual a 1. 
 
 
 116 
3.11. O coeficiente de correlação entre as variáveis X e Y é r = 0,60. Sabendo que 
s(X) = 1,50, s(Y) = 2,00, 10=X e 20=Y , determine a equação de regressão de Y 
em relação a X. 
3.12. Com base em uma amostra de 27 pares de valores foi obtido o coeficiente de 
correlação r = 0,40. Teste, ao nível de significância de 5%, a hipótese de que o 
coeficiente de correlação das variáveis é zero. 
3.13. O coeficiente de correlação obtido de uma amostra de n pares de valores iX , iY é 
r = 4/5. Sabendo que s(X) = 3 e s(Y) = 5, determine o coeficiente de regressão de Y 
em relação a X. 
3.14. A partir de uma amostra aleatória com n observações, foi obtida a equação de 
regressão 
 XY 28,010\u2c6 \u2212= 
Determine o coeficiente de correlação entre X e Y sabendo que 
 25
1
)(
2
2
=
\u2212
\u2211
=
n
xXs e 4
1
)(
2
2
=
\u2212
\u2211
=
n
yYs 
3.15. Para duas variáveis negativamente correlacionadas, foram obtidos: 0=X , 
12=Y , s(X) = 8, s(Y) = 10 e 64,02 =r . Determine a equação de regressão de Y 
em relação a X. 
3.16. Dados 
X Y 
0 2 
2 2 
4 4 
6 8 
a) Determine as estimativas dos parâmetros do modelo iii uXY ++= \u3b2\u3b1 . 
b) Calcule o coeficiente de determinação da regressão ( 2YXr ). 
c) Calcule os 4 valores de iY\u2c6 e determine o valor do quadrado do coeficiente de 
correlação ( 2
\u2c6YYr ) entre iY e iY\u2c6 . Verifique que esse valor é igual ao valor do 
coeficiente de determinação, calculado no item (b). 
 
 
 117 
d) Demonstre que o coeficiente de determinação de uma regressão ( 2YXr ) é sempre 
igual ao quadrado do coeficiente de correlação entre os valores observados e 
os valores estimados da variável dependente ( 2
\u2c6YYr ). 
3.17. Seja r o coeficiente de correlação entre as variáveis iX e iY em uma amostra com 
n observações. Definimos as variáveis reduzidas 
 )(Xs
x
w ii = , com XXx ii \u2212= e 1
)(
2
\u2212
\u2211
=
n
x
Xs i , e 
 )(Ys
y
z ii = , com YYy ii \u2212= e 1
)(
2
\u2212
\u2211
=
n
y
Ys i 
Seja c a estimativa do coeficiente de regressão de iz contra iw , de acordo com o 
método de mínimos quadrados. 
a) Deduza a relação entre r e c. 
b) Deduza expressões que dêem a S.Q.Total e a S.Q.Regressão da regressão de 
iz contra iw em função de r e n. 
 
RESPOSTAS 
3.1. a) r = 0,8; F = 14,22, significativo 
 b) XY 6,12,6\u2c6 +\u2212= e YX 4,05 += 
c) Para X = 4, temos 2,0\u2c6 =Y e para X = 9, temos 2,8\u2c6 =Y 
Para Y = 3, temos 2,6\u2c6 =X e para Y = 9, temos 6,8\u2c6 =X 
3.2. 8530 \u2032= o\u3b8 
3.3. a) r = \u20130,92 
 b) XY 34,104,18\u2c6 \u2212= 
 c) não se rejeita 1:0 =\u3b2H 
3.4. a) XY 5,02\u2c6 += 
 b) YX +\u2212= 1\u2c6 
 
 
 118 
 c) r = 0,7071 
 d) 5,2\u2c6 =Y 
 e) 0\u2c6 =X 
3.5. a) XY 25,010\u2c6 += 
 b) YX += 20\u2c6 
 c) r = 0,5 
 d) 25\u2c6 =Y 
 e) 50\u2c6 =X 
3.6. a) A correlação é negativa. 
 b) Tais dados não permitem estabelecer relação de \u201ccausa-e-efeito\u201d. Outras 
variáveis, como renda per capita, deveriam ser consideradas na análise. Os 
dados podem ser úteis para sugerir pesquisas médico-biológicas sobre 
possíveis relações causais entre consumo de proteína e fertilidade. 
3.7. Correlação linear igual a zero não implica ausência de relação entre as variáveis. 
3.8. a) F = 10,12 ou t = \u20133,18, significativos. 
 Renda per capita e proporção de analfabetos se mostram negativamente 
correlacionados. Esse resultado estatístico não prova a existência de uma 
relação de causa-e-efeito. No caso, sabemos que existe causação nos dois 
sentidos. Analfabetismo implica baixo nível tecnológico, baixa produtividade 
e baixa renda per capita. Pobreza, por outro lado, significa falta de recursos, 
dificultando a analfabetização. 
3.11. Y\u2c6 = 12 + 0,8X 
3.12. F = 4,76, significativo 
3.13. b= 4/3 
3.14. r = \u2013 0,7 
3.15. Y\u2c6 = 12 \u2013 X 
3.16. a) Y\u2c6 = 1 + X 
b) 6/52 =r 
3.17. a) r = c 
 
 
 119 
 b) S.Q.Total = 12 \u2212=\u2211 nzi 
 S.Q.Regr. = )1(2 \u2212nr 
 
 
 
 
 
 120 
4. REGRESSÃO LINEAR MÚLTIPLA 
4.1. O modelo estatístico de uma regressão linear múltipla 
Temos uma regressão linear múltipla quando admitimos que o valor da variável 
dependente é função linear de duas ou mais variáveis explanatórias. O modelo 
estatístico de uma regressão linear múltipla com k variáveis explanatórias é: 
 jkjkjjj uXXXY +++++= \u3b2\u3b2\u3b2\u3b1 ...2211 , j = 1, ..., n 
ou 
 j
k
i
ijij uXY ++= \u2211
=1
\u3b2\u3b1 (4.1) 
Utilizando notação matricial o modelo fica 
 uXy += \u3b2 (4.2) 
onde 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=
nY
Y
Y
M
2
1
y 
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=
knnn
k
k
XXX
XXX
XXX
K
MMMM
K
K
21
22212
12111
1
1
1
X 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=
k\u3b2
\u3b2
\u3b2
\u3b1
M
2
1\u3b2 
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=
nu
u
u
M
2
1
u 
Mantemos, com algumas modificações, as pressuposições apresentadas na seção 
2.1: 
 I) a variável dependente ( jY ) é função linear das variáveis explanatórias ( ijX , 
i = 1,..., k); 
 II) os valores das variáveis explanatórias são fixos; 
 III) 0)( =juE , ou seja, 0u =)(E , onde 0 representa um vetor de zeros; 
 IV) os erros são homocedásticos, isto é, 22 )( \u3c3=juE ; 
 
 
 121 
 V) os erros são não-correlacionados entre si, isto é, 0)( =hjuuE para j \u2260 h; 
 VI) os erros têm distribuição normal. 
Combinando as pressuposições IV e V temos 
 
2)( \u3c3Iuu =\u2032E (4.3) 
Seja p = k + 1 o número de parâmetros a serem estimados ( k\u3b2\u3b2\u3b1 ,,, 1 K ). Se 
dispomos de apenas p observações, a determinação dos parâmetros se reduz a um 
problema matemático de resolução de um sistema de p equações com p incógnitas, não 
sendo possível fazer qualquer análise estatística. Devemos, portanto, ter n > p. Além 
disso, veremos que para obter as estimativas de mínimos quadrados dos parâmetros a 
matriz XX\u2032 deve ser não-singular, isto é, sua característica deve ser igual a p. Isso 
significa que a característica de X deve ser igual a p. Nas deduções que se seguem 
admitiremos que essas condições são observadas, isto é, admitiremos que X tem 
característica p = k + 1 < n. 
Da mesma maneira que na regressão linear simples, as pressuposições I, II e III 
são necessárias para demonstrar que os estimadores de mínimos quadrados são não-
tendenciosos e as cinco primeiras pressuposições permitem demonstrar que tais 
estimadores são estimadores lineares não-tendenciosos de variância mínima (teorema de 
Gauss-Markov). A pressuposição VI é necessária para realizar testes de hipótese e para 
construir intervalos de confiança para os parâmetros. 
 
4.2. Estimativas dos parâmetros de acordo com o método dos mínimos 
quadrados 
Sejam b e e os vetores das estimativas dos parâmetros e dos desvios, 
respectivamente, isto é, 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=
kb
b
b
a
M
2
1
b e 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=
ne
e
e
M
2
1
e 
 
 
 122
Annanda
Annanda fez um comentário
salvou meu TCC! obrigada!
0 aprovações
Douglas
Douglas fez um comentário
Muito obrigado por compartilhar!
0 aprovações
Carregar mais