154 pág.

Pré-visualização | Página 30 de 39
de Y e´ decomposta como mostrado no Quadro I. Fazendo-se uso da decomposic¸a˜o apresentada, temos que R2 = SQReg/SQTotal. Quadro I: Ana´lise de Variaˆncia (ANOVA) da Regressa˜o. Fonte de Variac¸a˜o g.l. Soma de Quadrados Quadrado Me´dio Regressa˜o p− 1 SQReg = n∑ i=1 (ŷi − y¯)2 QMReg = SQReg(p−1) Res´ıduos n− p SQRes = n∑ i=1 (yi − ŷi)2 QMRes = SQRes(n−p) Total n− 1 SQTotal = n∑ i=1 (yi − y¯)2 p = nu´mero de paraˆmetros do modelo e n = tamanho amostral. Para testarmos a significaˆncia do paraˆmetro β1, o que, na pra´tica, significa verificar se a covaria´vel X influencia a resposta Y, testamos as hipo´teses H0: β1 = 0 contra H0: β1 6= 0. A estat´ıstica de teste utilizada para esta finalidade e´ dada por: F = QMReg QMRes , em que QMReg e QMRes sa˜o, respectivamente, os quadrados me´dios da regressa˜o e dos res´ıduos apresentados no Quadro I. Sob H0, tal estat´ıstica tem distribuic¸a˜o F de Snedecor 6.3. Regressa˜o Linear Simples 109 com p− 1 e n− p graus de liberdade. Assim, rejeitamos H0 se o valor calculado de F for maior que o valor de F tabelado a um n´ıvel α de significaˆncia pre´-estabelecido. O Quadro II apresenta a ANOVA para os dados da Tabela 6.1. A partir desse quadro, temos que R2 = 0, 589, o que nos indica que 58,9% da variac¸a˜o total do tempo de reac¸a˜o esta´ sendo explicada pela idade. Podemos tambe´m concluir pela rejeic¸a˜o de H0: β1 = 0 ao n´ıvel de significaˆncia de 5%, visto que F = 25,897 > Ftab(1,18,5%) = 4,41. Conclu´ımos, assim, que a covaria´vel idade realmente influencia o tempo de reac¸a˜o. Quadro II: Ana´lise de Variaˆncia da Regressa˜o - Dados Tabela 6.1. Fonte de Variac¸a˜o g.l. Soma de Quadrados Quadrado Me´dio F Regressa˜o 1 SQReg = 810 QMReg = 810 25,897 Res´ıduos 18 SQRes = 563 QMRes = 31, 28 Total 19 SQTotal = 1373 Quanto a`s suposic¸o˜es, devemos verificar se os erros encontram-se aleatoriamente distribu´ıdos em torno de zero, bem como se a variaˆncia dos mesmos e´ constante e se sa˜o independentes. A suposic¸a˜o de independeˆncia esta´ intimamente relacionada a` forma como os dados foram coletados. Se o experimento foi conduzido de forma a garantir que as informac¸o˜es observadas em uma unidade amostral na˜o tenham sido influenciadas pelas das outras unidades, enta˜o esta suposic¸a˜o e´ razoa´vel. Por outro lado, o gra´fico dos res´ıduos, ei, versus os valores preditos pelo modelo, ŷi, bem como o gra´fico dos res´ıduos versus os valores xi, nos auxiliam a verificar se a me´dia dos erros e´ zero e se a variaˆncia e´ constante. Para os dados do exemplo 6.2, a Figura 6.3 mostra ambos os gra´ficos. 5 10 15 20 − 5 0 5 10 preditos re sí du os (a) 20 25 30 35 40 − 5 0 5 10 preditos re sí du os (b) Figura 6.3: Ana´lise gra´fica dos res´ıduos associados ao modelo ajustado. Note, a partir do gra´fico (a) mostrado na Figura 6.3, que os res´ıduos encontram- se distribu´ıdos aleatoriamente em torno de zero, indicando que a me´dia dos mesmos se encontra pro´xima de zero. No gra´fico (b), desta mesma figura, podemos observar que os res´ıduos, em x = 20, 25, 30, 35 e 40, apresentam variabilidades semelhantes, indicando- nos que a variaˆncia dos erros pode ser considerada constante. Para verificar a suposic¸a˜o de que os erros seguem a distribuic¸a˜o Normal, um gra´fico dos quantis teo´ricos versus os quantis amostrais dos res´ıduos, conhecido por QQplot, deve apresentar um comportamento pro´ximo do linear. Para os dados do exemplo da idade e tempo de reac¸a˜o, obtivemos o 110 Correlac¸a˜o e Regressa˜o Linear Giolo, S. R. QQplot apresentado na Figura 6.4. A partir desta figura, notamos que a suposic¸a˜o de normalidade dos erros, e consequ¨entemente da varia´vel resposta Y , e´ razoa´vel para os dados desse exemplo. −2 −1 0 1 2 − 5 0 5 10 Normal Q−Q Plot Quantis teóricos Qu an tis a m os tra is Figura 6.4: QQplot dos res´ıduos. 6.3.3 Interpretac¸a˜o dos paraˆmetros do modelo Se o modelo de regressa˜o linear simples (MRLS) for considerado adequado para descrever a relac¸a˜o linear entre Y e X, os coeficientes β0 e β1 sa˜o interpretados do seguinte modo: i) se a variac¸a˜o dos dados em X incluir x = 0, enta˜o o intercepto β0 e´ a resposta esperada (me´dia) em x = 0. Caso contra´rio, β0 na˜o apresenta interpretac¸a˜o pra´tica; ii) o paraˆmetro β1 e´ interpretado como a mudanc¸a no valor esperado de Y produzido por uma unidade de mudanc¸a em X. Para os dados do exemplo apresentado na Tabela 6.1, o modelo de regressa˜o linear simples ajustado e´ dado por: ̂E(Y | x) = 80, 5 + 0, 9 x. Como a variac¸a˜o dos dados em X na˜o inclui x = 0, na˜o ha´ interpretac¸a˜o pra´tica do coeficiente β̂0 = 80, 5. Por outro lado, β̂1 = 0, 9 significa que a cada aumento de 1 ano na idade das pessoas, o tempo esperado de reac¸a˜o aumenta, em me´dia, 0, 9 segundos. Por exemplo, de 20 para 21 anos, estimamos um aumento no tempo de reac¸a˜o de, em me´dia, 0,9 segundos. Na Figura 6.5, apresentamos os tempos de reac¸a˜o registrados para as idades obser- vadas, bem como os tempos me´dios de reac¸a˜o em cada uma dessas idades. O modelo de regressa˜o linear simples ajustado, que podemos visualizar nesta mesma figura, apresenta um ajuste satisfato´rio aos tempos esperados de reac¸a˜o em func¸a˜o da idade. De acordo com o modelo ajustado, estimamos, portanto, que o tempo de reac¸a˜o ao est´ımulo de pessoas com idade igual a 20 anos, seja de, em me´dia, ŷ = 80,5 + (0,9)(20) = 98,5 segundos. Esse mesmo tempo para pessoas com 25 anos de idade e´ esperado ser, em 6.3. Regressa˜o Linear Simples 111 20 25 30 35 40 95 10 0 10 5 11 0 11 5 12 0 12 5 idade te m po d e re aç ão tempos de reação observados tempos médios de reação Figura 6.5: Tempos de reac¸a˜o em func¸a˜o da idade e MRLS ajustado. me´dia, 103 segundos. Estimativas para qualquer outra idade entre 20 e 40 anos podem ser obtidas de forma ana´loga. As estimativas pontuais, ŷ, obtidas por meio do modelo de regressa˜o linear simples ajustado, claramente na˜o refletem a variac¸a˜o que certamente ocorre entre pessoas de uma mesma idade. Uma estimativa intervalar do tempo esperado de reac¸a˜o seria, desse modo, conveniente e recomenda´vel. Este intervalo para uma idadeX = x, a um n´ıvel de confianc¸a de (1− α)%, pode ser obtido por: ŷ ± tα/2,n−2 √ v̂ar(ŷ) sendo tα/2,n−2 o quantil α/2 da distribuic¸a˜o t-Student com (n − 2) graus de liberdade, n o tamanho amostral e var(ŷ), a variaˆncia de ŷ a qual e´ estimada por: v̂ar(ŷ) = σ̂2 [ 1 n + (x− x¯)2∑n i=1(xi − x¯)2 ] em que: σ̂2 = ∑n i=1(yi − ŷi)2 (n− 2) . Assim, se considerarmos pessoas com idade igual a x = 28 anos, estimamos que o tempo de reac¸a˜o delas seja de, em me´dia, 105,7 segundos. Este tempo me´dio de reac¸a˜o, a um n´ıvel de confianc¸a de 95%, pode variar entre 102,98 e 108,42 segundos. Cap´ıtulo 7 Ana´lise de Variaˆncia 7.1 Introduc¸a˜o A Ana´lise de Variaˆncia (ANOVA) e´ um procedimento utilizado para comparar treˆs ou mais tratamentos. Existem muitas variac¸o˜es da ANOVA devido aos diferentes tipos de experimentos que podem ser realizados. Nesse curso sera´ estudado apenas a ana´lise de variaˆncia com um fator. Inicialmente, sa˜o apresentados alguns conceitos utilizados em planejamento de ex- perimentos e na ana´lise de variaˆncia. 7.2 Conceitos Ba´sicos sobre Experimentac¸a˜o 7.2.1 Tratamento Um tratamento e´ uma condic¸a˜o imposta ou objeto que se deseja medir ou avaliar em um experimento. Normalmente, em um experimento, e´ utilizado mais de um tratamento. Como exemplos de tratamentos, podem-se citar: equipamentos de diferentes marcas, dife- rentes tamanhos de pec¸as, doses de um