apostila
139 pág.

apostila


DisciplinaProbabilidade e Estatística11.872 materiais113.101 seguidores
Pré-visualização19 páginas
de \u3c72 que o valor de \u3c720,05(2) = 5, 99. Como o valor de
\u3c72calc e´ maior que o de \u3c7
2
tab, este se encontra na regia\u2dco de rejeic¸a\u2dco de H0 portanto, rejeita-se
135
Tabela 6.3: Nu´mero de alunos matriculados em dois cole´dios em relac¸a\u2dco a` classe social
dos mesmos
Classe social
cole´gio Alta Me´dia Baixa Total
A 20(31,82) 40(36,36) 40(31,82) 100
B 50(31,18) 40(43,64) 30(38,18) 120
Total 70 80 70 220
( ) Frequ¨encia esperada
a hipo´tese de independe\u2c6ncia entre os cole´gios e a classe social dos alunos. Ou seja pode-se
afirmar, ao n´\u131vel de 0,05 que a classe social e o cole´gio no qual os alunos estudam na\u2dco sa\u2dco
independentes.
Cap´\u131tulo 7
Regressa\u2dco e Correlac¸a\u2dco linear
Estimac¸a\u2dco dos para\u2c6metros do modelo de regressa\u2dco pelo me´todo dos m\u131´nimos
quadrados:
Seja o modelo:
yi = \u3b20 + \u3b21xi + ei (7.1)
em que:
yi e´ o valor observado da varia´vel resposta (dependente);
\u3b20 e´ o intercepto do modelo;
\u3b21 e´ coeficiente angular;
xi e´ o valor da varia´vel preditora e
ei e´ o erro aleato´rio associado a observac¸a\u2dco yi.
Ajustar um modelo de regressa\u2dco, via me´todo de m\u131´nimos quadrados, implica
procurar os valores (\u3b2\u2c6i) tais que os valores estimados (preditos) de yi, y\u2c6i = \u3b2\u2c60 + \u3b2\u2c61 sejam
os mais pro´ximos poss´\u131veis dos valores observados. Isto e´ os erros sejam m\u131´nimos
Partindo-se do modelo 7.1 tem-se que o erro cometido ao se estimar uma
observac¸a\u2dco e´
ei = yi \u2212 \u3b20 \u2212 \u3b21xi.
Definindo a func¸a\u2dco
136
137
S(\u3b20, \u3b21) =
n\u2211
i=1
e2i =
n\u2211
i=1
(yi \u2212 \u3b20 \u2212 \u3b21xi)2 (7.2)
Os estimadores de m\u131´nimos quadrados de \u3b20 e \u3b21, \u3b2\u2c60 e \u3b2\u2c61 sa\u2dco aqueles que
minimizam a func¸a\u2dco 7.2. Assim, estes estimadores sa\u2dco obtidos solucionando-se o sistema:
\uf8f1\uf8f2
\uf8f3
\u2202S
\u2202\u3b20
= 0
\u2202S
\u2202\u3b21
= 0\uf8f1\uf8f2
\uf8f3 2
\u2211n
i=1(yi \u2212 \u3b2\u2c60 \u2212 \u3b2\u2c61xi)(\u22121) = 0
2
\u2211n
i=1(yi \u2212 \u3b2\u2c60 \u2212 \u3b2\u2c61x1)(\u2212xi) = 0\uf8f1\uf8f2
\uf8f3
\u2211n
i=1 yi \u2212 n\u3b2\u2c60 \u2212 \u3b2\u2c61
\u2211n
i=1 x1 = 0 (a)\u2211n
i=1 yixi \u2212 \u3b2\u2c60
\u2211n
i=1 xi \u2212 \u3b2\u2c61
\u2211n
i=1 x
2
i = 0 (b)
de (a) tem-se:
\u3b2\u2c60 =
\u2211n
i=1 yi
n
\u2212 \u3b2\u2c61
\u2211n
i=1 xi
n
\u3b2\u2c60 = y¯ \u2212 \u3b2\u2c61x¯ (7.3)
de (b) tem-se:
138
\u3b2\u2c60
n\u2211
i=1
xi + \u3b2\u2c61
n\u2211
i=1
x2i =
n\u2211
i=1
xiyi
(\u2211n
i=1 yi
n
\u2212 \u3b2\u2c61
\u2211
i = 1nxi
n
) n\u2211
i=1
xi + \u3b2\u2c61
n\u2211
i=1
x2i =
n\u2211
i=1
xiyi
\u2211n
i=1 yi
\u2211n
i=1 xi
n
\u2212 \u3b2\u2c61
\u2211n
i=1 x
2
i
n
+ \u3b2\u2c61
n\u2211
i=1
x2i =
n\u2211
i=1
xiyi
\u2211n
i=1 yi
\u2211n
i=1 xi
n
+ \u3b2\u2c61
(
n\u2211
i=1
x2i \u2212
\u2211n
i=1 x
2
i
n
)
=
n\u2211
i=1
xiyi
\u3b2\u2c61
(
n\u2211
i=1
x2i \u2212
\u2211n
i=1 x
2
i
n
)
=
n\u2211
i=1
xiyi \u2212
\u2211n
i=1 yi
\u2211n
i=1 xi
n
\u3b2\u2c61 =
\u2211n
i=1 xiyi \u2212
\u2211n
i=1 yi
\u2211n
i=1 xi
n\u2211n
i=1 x
2
i \u2212
\u2211n
i=1 x
2
i
n
(7.4)
\u3b2\u2c61 =
SPXY
SQDX
Uma medida da qualidade do ajuste, do modelo obtido, aos dados e´ dada
pelo coeficiente de determinac¸a\u2dco (R2),
r2 =
SPXY 2
SQDX
SQDY
(7.5)
Exemplo: Os dados a seguir refrem-se ao nu´mero de CDs vendidos por uma
determinada gravadora, em milhares de unidades, em 10 semanas consecutivas apo´s o
lanc¸amento do mesmo. Ajustar um modelo de regressa\u2dco linear simples que descreva a
quantidade de CDs vendidos em func¸a\u2dco do tempo de lanc¸amento.
Semanas 1 2 3 4 5 6 7 8 9 10
CDs (Milunid) 5,0 6,7 6,0 8,7 6,2 8,6 11,0 11,9 10,6 10,8
Tem-se que: n = 10
\u221110
i=1Xi = 55
\u221110
i=1X
2
i = 385\u221110
i=1 Yi = 85, 5
\u221110
i=1XiYi = 529, 4
Substituindo esses valores em 7.4 tem-se:
\u3b2\u2c61 =
529,4\u2212 (55)(85,5)
10
385\u2212 552
10
= 0, 72
e em 7.3:
\u3b2\u2c60 = 8, 55\u2212 (0, 72)(5, 5) = 4, 59
139
Portanto a equac¸a\u2dco de regressa\u2dco que descreve o nu´mero de Cds vendidos em
func¸a\u2dco do nu´mero de semanas apo´s o lanc¸amento e´:
y = 4, 59 + 0, 72x
Cujo coeficiente de determinac¸a\u2dco e´:
r2 =
59,152
82,5
54,565
= 0, 77