A maior rede de estudos do Brasil

Grátis
154 pág.
apostilace003

Pré-visualização | Página 30 de 39

de Y e´ decomposta como mostrado no
Quadro I. Fazendo-se uso da decomposic¸a˜o apresentada, temos que R2 = SQReg/SQTotal.
Quadro I: Ana´lise de Variaˆncia (ANOVA) da Regressa˜o.
Fonte de Variac¸a˜o g.l. Soma de Quadrados Quadrado Me´dio
Regressa˜o p− 1 SQReg =
n∑
i=1
(ŷi − y¯)2 QMReg = SQReg(p−1)
Res´ıduos n− p SQRes =
n∑
i=1
(yi − ŷi)2 QMRes = SQRes(n−p)
Total n− 1 SQTotal =
n∑
i=1
(yi − y¯)2
p = nu´mero de paraˆmetros do modelo e n = tamanho amostral.
Para testarmos a significaˆncia do paraˆmetro β1, o que, na pra´tica, significa verificar
se a covaria´vel X influencia a resposta Y, testamos as hipo´teses H0: β1 = 0 contra H0:
β1 6= 0. A estat´ıstica de teste utilizada para esta finalidade e´ dada por:
F =
QMReg
QMRes
,
em que QMReg e QMRes sa˜o, respectivamente, os quadrados me´dios da regressa˜o e dos
res´ıduos apresentados no Quadro I. Sob H0, tal estat´ıstica tem distribuic¸a˜o F de Snedecor
6.3. Regressa˜o Linear Simples 109
com p− 1 e n− p graus de liberdade. Assim, rejeitamos H0 se o valor calculado de F for
maior que o valor de F tabelado a um n´ıvel α de significaˆncia pre´-estabelecido.
O Quadro II apresenta a ANOVA para os dados da Tabela 6.1. A partir desse quadro,
temos que R2 = 0, 589, o que nos indica que 58,9% da variac¸a˜o total do tempo de reac¸a˜o
esta´ sendo explicada pela idade. Podemos tambe´m concluir pela rejeic¸a˜o de H0: β1 = 0
ao n´ıvel de significaˆncia de 5%, visto que F = 25,897 > Ftab(1,18,5%) = 4,41. Conclu´ımos,
assim, que a covaria´vel idade realmente influencia o tempo de reac¸a˜o.
Quadro II: Ana´lise de Variaˆncia da Regressa˜o - Dados Tabela 6.1.
Fonte de Variac¸a˜o g.l. Soma de Quadrados Quadrado Me´dio F
Regressa˜o 1 SQReg = 810 QMReg = 810 25,897
Res´ıduos 18 SQRes = 563 QMRes = 31, 28
Total 19 SQTotal = 1373
Quanto a`s suposic¸o˜es, devemos verificar se os erros encontram-se aleatoriamente
distribu´ıdos em torno de zero, bem como se a variaˆncia dos mesmos e´ constante e se
sa˜o independentes. A suposic¸a˜o de independeˆncia esta´ intimamente relacionada a` forma
como os dados foram coletados. Se o experimento foi conduzido de forma a garantir que as
informac¸o˜es observadas em uma unidade amostral na˜o tenham sido influenciadas pelas das
outras unidades, enta˜o esta suposic¸a˜o e´ razoa´vel. Por outro lado, o gra´fico dos res´ıduos,
ei, versus os valores preditos pelo modelo, ŷi, bem como o gra´fico dos res´ıduos versus os
valores xi, nos auxiliam a verificar se a me´dia dos erros e´ zero e se a variaˆncia e´ constante.
Para os dados do exemplo 6.2, a Figura 6.3 mostra ambos os gra´ficos.
5 10 15 20
−
5
0
5
10
preditos
re
sí
du
os
(a)
20 25 30 35 40
−
5
0
5
10
preditos
re
sí
du
os
(b)
Figura 6.3: Ana´lise gra´fica dos res´ıduos associados ao modelo ajustado.
Note, a partir do gra´fico (a) mostrado na Figura 6.3, que os res´ıduos encontram-
se distribu´ıdos aleatoriamente em torno de zero, indicando que a me´dia dos mesmos se
encontra pro´xima de zero. No gra´fico (b), desta mesma figura, podemos observar que os
res´ıduos, em x = 20, 25, 30, 35 e 40, apresentam variabilidades semelhantes, indicando-
nos que a variaˆncia dos erros pode ser considerada constante. Para verificar a suposic¸a˜o
de que os erros seguem a distribuic¸a˜o Normal, um gra´fico dos quantis teo´ricos versus os
quantis amostrais dos res´ıduos, conhecido por QQplot, deve apresentar um comportamento
pro´ximo do linear. Para os dados do exemplo da idade e tempo de reac¸a˜o, obtivemos o
110 Correlac¸a˜o e Regressa˜o Linear Giolo, S. R.
QQplot apresentado na Figura 6.4. A partir desta figura, notamos que a suposic¸a˜o de
normalidade dos erros, e consequ¨entemente da varia´vel resposta Y , e´ razoa´vel para os
dados desse exemplo.
−2 −1 0 1 2
−
5
0
5
10
Normal Q−Q Plot
Quantis teóricos
Qu
an
tis
 a
m
os
tra
is
Figura 6.4: QQplot dos res´ıduos.
6.3.3 Interpretac¸a˜o dos paraˆmetros do modelo
Se o modelo de regressa˜o linear simples (MRLS) for considerado adequado para
descrever a relac¸a˜o linear entre Y e X, os coeficientes β0 e β1 sa˜o interpretados do seguinte
modo:
i) se a variac¸a˜o dos dados em X incluir x = 0, enta˜o o intercepto β0 e´ a resposta
esperada (me´dia) em x = 0. Caso contra´rio, β0 na˜o apresenta interpretac¸a˜o pra´tica;
ii) o paraˆmetro β1 e´ interpretado como a mudanc¸a no valor esperado de Y produzido
por uma unidade de mudanc¸a em X.
Para os dados do exemplo apresentado na Tabela 6.1, o modelo de regressa˜o linear
simples ajustado e´ dado por:
̂E(Y | x) = 80, 5 + 0, 9 x.
Como a variac¸a˜o dos dados em X na˜o inclui x = 0, na˜o ha´ interpretac¸a˜o pra´tica do
coeficiente β̂0 = 80, 5. Por outro lado, β̂1 = 0, 9 significa que a cada aumento de 1 ano
na idade das pessoas, o tempo esperado de reac¸a˜o aumenta, em me´dia, 0, 9 segundos. Por
exemplo, de 20 para 21 anos, estimamos um aumento no tempo de reac¸a˜o de, em me´dia,
0,9 segundos.
Na Figura 6.5, apresentamos os tempos de reac¸a˜o registrados para as idades obser-
vadas, bem como os tempos me´dios de reac¸a˜o em cada uma dessas idades. O modelo de
regressa˜o linear simples ajustado, que podemos visualizar nesta mesma figura, apresenta
um ajuste satisfato´rio aos tempos esperados de reac¸a˜o em func¸a˜o da idade.
De acordo com o modelo ajustado, estimamos, portanto, que o tempo de reac¸a˜o ao
est´ımulo de pessoas com idade igual a 20 anos, seja de, em me´dia, ŷ = 80,5 + (0,9)(20) =
98,5 segundos. Esse mesmo tempo para pessoas com 25 anos de idade e´ esperado ser, em
6.3. Regressa˜o Linear Simples 111
20 25 30 35 40
95
10
0
10
5
11
0
11
5
12
0
12
5
idade
te
m
po
 d
e 
re
aç
ão
tempos de reação observados
tempos médios de reação
Figura 6.5: Tempos de reac¸a˜o em func¸a˜o da idade e MRLS ajustado.
me´dia, 103 segundos. Estimativas para qualquer outra idade entre 20 e 40 anos podem
ser obtidas de forma ana´loga.
As estimativas pontuais, ŷ, obtidas por meio do modelo de regressa˜o linear simples
ajustado, claramente na˜o refletem a variac¸a˜o que certamente ocorre entre pessoas de uma
mesma idade. Uma estimativa intervalar do tempo esperado de reac¸a˜o seria, desse modo,
conveniente e recomenda´vel. Este intervalo para uma idadeX = x, a um n´ıvel de confianc¸a
de (1− α)%, pode ser obtido por:
ŷ ± tα/2,n−2
√
v̂ar(ŷ)
sendo tα/2,n−2 o quantil α/2 da distribuic¸a˜o t-Student com (n − 2) graus de liberdade, n
o tamanho amostral e var(ŷ), a variaˆncia de ŷ a qual e´ estimada por:
v̂ar(ŷ) = σ̂2
[
1
n
+
(x− x¯)2∑n
i=1(xi − x¯)2
]
em que:
σ̂2 =
∑n
i=1(yi − ŷi)2
(n− 2) .
Assim, se considerarmos pessoas com idade igual a x = 28 anos, estimamos que o
tempo de reac¸a˜o delas seja de, em me´dia, 105,7 segundos. Este tempo me´dio de reac¸a˜o, a
um n´ıvel de confianc¸a de 95%, pode variar entre 102,98 e 108,42 segundos.
Cap´ıtulo 7
Ana´lise de Variaˆncia
7.1 Introduc¸a˜o
A Ana´lise de Variaˆncia (ANOVA) e´ um procedimento utilizado para comparar treˆs
ou mais tratamentos. Existem muitas variac¸o˜es da ANOVA devido aos diferentes tipos
de experimentos que podem ser realizados. Nesse curso sera´ estudado apenas a ana´lise de
variaˆncia com um fator.
Inicialmente, sa˜o apresentados alguns conceitos utilizados em planejamento de ex-
perimentos e na ana´lise de variaˆncia.
7.2 Conceitos Ba´sicos sobre Experimentac¸a˜o
7.2.1 Tratamento
Um tratamento e´ uma condic¸a˜o imposta ou objeto que se deseja medir ou avaliar em
um experimento. Normalmente, em um experimento, e´ utilizado mais de um tratamento.
Como exemplos de tratamentos, podem-se citar: equipamentos de diferentes marcas, dife-
rentes tamanhos de pec¸as, doses de um