Baixe o app para aproveitar ainda mais
Prévia do material em texto
PLANEJAMENTO DE EXPERIMENTOS: CONCEITOS E APLICAC¸O˜ES CLO´VIS DE ARAU´JO PERES MARIA REGINA MADRUGA HE´LITON RIBEIRO TAVARES ii Planejamento de Experimentos: Conceitos e Aplicac¸o˜es Clovis de Arau´jo Peres1 He´liton Ribeiro Tavares2 Maria Regina Madruga Tavares3 1 Professor Titular da Universidade Federal de Sa˜o Paulo (Unifesp). e-mail: cperes@medprev.epm.br 2 Professor Adjunto do Departamento de Estat´ıstica da Universidade Federal do Para´ (UFPA). e-mail: heliton@ufpa.br 3 Professor Adjunto do Departamento de Estat´ıstica da Universidade Federal do Para´ (UFPA). e-mail: madruga@ufpa.br Peres, Tavares & Madruga iii Para Nossos filhos(as) e companheiros(as). Peres, Tavares & Madruga Apresentac¸a˜o A a´rea de Planejamento de Experimentos e´ uma das mais necessa´rias na vida cient´ıfica. Ela comporta a pro´pria fase de planejamento de um estudo, bem como a de ana´lise dos resultados nume´ricos do estudo. Conteu´do Apresentac¸a˜o v Lista de Figuras ix 1 Introduc¸a˜o 1 1.1 Enunciado do problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Escolha dos fatores e seus respectivos n´ıveis . . . . . . . . . . . . . . . . . . 2 1.3 Escolha da unidade experimental . . . . . . . . . . . . . . . . . . . . . . . . 3 1.4 Escolha das varia´veis a serem medidas . . . . . . . . . . . . . . . . . . . . . . 3 1.5 Regras de atribuic¸a˜o das unidades experimentais . . . . . . . . . . . . . . . . 4 1.6 Aleatorizac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.7 Repetic¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.8 Ana´lise estat´ıstica dos resultados . . . . . . . . . . . . . . . . . . . . . . . . . 8 2 Experimentos com um fator 9 2.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.2 Experimentos com um fator fixo . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.2.1 Modelo matema´tico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.2.2 Suposic¸o˜es associadas ao modelo . . . . . . . . . . . . . . . . . . . . . 11 2.2.3 Hipo´teses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.2.4 Partic¸a˜o da soma de quadrados total e graus de liberdade . . . . . . . 12 2.2.5 Quadrados me´dios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.2.6 Esperanc¸as dos quadrados me´dios (EQM) . . . . . . . . . . . . . . . . 14 2.2.7 Estat´ıstica e regia˜o cr´ıtica do teste . . . . . . . . . . . . . . . . . . . . 14 2.2.8 Quadro da ana´lise de variaˆncia (ANOVA) . . . . . . . . . . . . . . . . 15 2.2.9 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.2.10 Estimac¸a˜o das me´dias dos tratamentos . . . . . . . . . . . . . . . . . . 16 2.2.11 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.2.12 Comparac¸o˜es mu´ltiplas . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.2.13 Ana´lise de Res´ıduos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 2.3 Experimentos com um fator Aleato´rio . . . . . . . . . . . . . . . . . . . . . . 28 2.3.1 Modelo matema´tico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.3.2 Suposic¸o˜es do modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 viii Conteu´do 2.3.3 Hipo´teses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 2.3.4 Partic¸a˜o da soma dos quadrados total e graus de liberdade . . . . . . 32 2.3.5 Esperanc¸as dos quadrados me´dios . . . . . . . . . . . . . . . . . . . . . 32 2.3.6 Estat´ıstica e regia˜o cr´ıtica do teste . . . . . . . . . . . . . . . . . . . . 32 2.3.7 Quadro de Ana´lise de Variaˆncia . . . . . . . . . . . . . . . . . . . . . . 32 2.3.8 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 2.3.9 Estimac¸a˜o em experimentos com um fator aleato´rio . . . . . . . . . . . 33 2.3.10 Estimac¸a˜o de µ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.3.11 Estimac¸a˜o de σ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 2.3.12 Estimac¸a˜o de σ2A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 2.3.13 Estimac¸a˜o de σ 2 A σ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 2.3.14 Estimac¸a˜o de σ 2 A σ2A+σ 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 2.3.15 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3 Experimentos com Dois Fatores 39 3.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3.2 Notac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.3 Experimentos cruzados fixos . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.3.1 Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.3.2 Suposic¸o˜es associadas ao modelo . . . . . . . . . . . . . . . . . . . . . 42 3.3.3 Interpretac¸a˜o dos paraˆmetros do modelo . . . . . . . . . . . . . . . . . 43 3.3.4 Hipo´teses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 3.3.5 Partic¸a˜o da soma dos Quadrados Total . . . . . . . . . . . . . . . . . . 44 3.3.6 Esperanc¸a dos quadrados me´dios (EQM) . . . . . . . . . . . . . . . . . 45 3.3.7 Estat´ısticas e regioˆes cr´ıticas par os testes . . . . . . . . . . . . . . . . 46 3.3.8 Anova . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 3.3.9 Estimac¸a˜o dos paraˆmetros do modelo . . . . . . . . . . . . . . . . . . 47 3.3.10 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 3.4 Experimentos cruzados aleato´rios e cruzados mistos . . . . . . . . . . . . . . 51 3.5 Experimentos hiera´rquicos fixos . . . . . . . . . . . . . . . . . . . . . . . . . 52 3.5.1 Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 3.5.2 Suposic¸o˜es e restric¸o˜es associadas ao modelo . . . . . . . . . . . . . . . 53 3.5.3 Hipo´teses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 3.5.4 Partic¸a˜o da soma do Quadrado Total . . . . . . . . . . . . . . . . . . . 54 3.5.5 Esperanc¸a dos Quadrados Me´dios . . . . . . . . . . . . . . . . . . . . . 54 3.5.6 Estat´ısticas e regiuo˜es cr´ıticas pra os testes de H01 e H02 . . . . . . . 55 3.5.7 Anova . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.6 Experimentos hiera´rquicos aleato´rios e Experimentos hiera´rquicos mistos . . 55 3.6.1 Ana´lise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 3.6.2 Exemplo(SEA-8025) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 Peres, Tavares & Madruga Lista de Figuras 2.1 Ilustrac¸a˜o das suposic¸o˜es do modelo matema´tico associado a um experi- mento com um fator fixo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.2 Res´ıduos para cada grupo de gestantes (dados da Tabela 2.7) . . . . . . . . 29 2.3 Normal plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.4 Res´ıduos segundo a ordem de obtenc¸a˜o das observac¸o˜es no estudo da HbA em gestantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.1 Gra´ficos de Perfis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 3.2 Perfis de me´dias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 Cap´ıtulo 1 Introduc¸a˜o Em uma pesquisa cient´ıfica o procedimento geral e´ formular hipo´teses e verifica´-las diretamente ou por suas consequ¨eˆncias. Para isto e´ preciso um conjunto de observac¸o˜es e o planejamento de experimentos e´ enta˜o essencial para indicar o esquema sob o qual as hipo´teses possam ser verificadas. As hipo´teses sa˜o verificadas com a utilizac¸a˜o de me´todos de ana´lise estat´ıstica quedependem da maneira sob a qual as observac¸o˜es forma obtidas. Portanto, planejamento de experimentos e ana´lise dos resultados esta˜o intimamente ligados e devem ser utilizadas em sequ¨eˆncia nas pesquisas cient´ıficas das diversas a´reas do conhe- cimento. Isto pode ser visto por meio da seguinte representac¸a˜o gra´fica da circularidade do me´todo cient´ıfico: Fica bastante claro neste esquema que te´cnicas de planejamento devem ser utilizadas entre as etapas (1) e (2) e os me´todos de ana´lise estat´ıstica devem ser utilizados na etapa (3). Desenvolvendo um pouco mais esta ide´ia podemos dizer que uma pesquisa cient´ıfica estatisticamente planejada consiste nas seguintes etapas que dependem de um perfeito entendimento entre o pesquisador e o estat´ıstico: 1. Enunciado do problema com formulac¸a˜o de hipo´teses. 2. Escolha dos fatores (varia´veis independentes) que devem ser inclu´ıdos no estudo. 3. Escolha da unidade experimental e da unidade de observac¸a˜o. 4. Escolha das varia´veis que sera˜o medidas nas unidades de observac¸a˜o. 5. Determinac¸a˜o das regras e procedimentos pelos quais os diferentes tratamentos (com- binac¸a˜o de n´ıveis de fatores) sa˜o atribu´ıdos a`s unidades experimentais (ou vice-versa). 6. Ana´lise estat´ıstica dos resultados. 7. Relato´rio final contendo concluso˜es com medidas de precisa˜o das estimativas, inter- pretac¸a˜o dos resultados com poss´ıvel refereˆncia a outras pesquisas similares e uma avaliac¸a˜o dos ı´tens de 1 a 6 (desta pesquisa) com sugesto˜es para poss´ıveis alterac¸o˜es em pesquisas futuras. 2 Introduc¸a˜o A seguir ilustraremos com exemplos estas etapas. 1.1 Enunciado do problema Como vimos, uma pesquisa cient´ıfica se inicia sempre com a formulac¸a˜o de hipo´teses. Essas hipo´teses sa˜o primeiramente formuladas em termos cient´ıficos dentro da a´rea de es- tudo (hipo´tese cient´ıfica) e em seguida devem ser expressas em termos estat´ısticos (hipo´tese estat´ıstica). Deve haver uma correspondeˆncia perfeita entre as hipo´teses cient´ıfica e es- tat´ıstica para evitar ambiguidade. Portanto, no enunciado do problema, a hipo´tese cient´ıfica deve ser formulada de maneira precisa e objetiva. EXEMPLO 1.1 - Um pesquisador esta´ interessado em estudar o efeito de va´rios tipos de rac¸a˜o que diferem pela quantidade de pota´ssio no aumento do peso de determinado tipo de animal. Esse objetivo pode ser atingido se planejarmos a pesquisa com uma das seguintes fina- lidades: a) comprar as me´dias dos aumentos de peso obtidas com cada uma das rac¸o˜es (igual- dade de me´dia): b) estabelecer uma relac¸a˜o funcional entre o aumento de peso me´dio e a quantidade de pota´ssio. 1.2 Escolha dos fatores e seus respectivos n´ıveis No exemplo 1.1, a varia´vel independente “rac¸a˜o”e´ um fator e os tipos de rac¸a˜o sa˜o os n´ıveis deste fator, ou tratamentos. Assim, em um experimento para se estudar o efeito de 4 fertilizantes e 3 variedades de feija˜o na produc¸a˜o, ter´ıamos dois fatores: fertilizante, com 4 n´ıveis, e variedade, com 3 n´ıveis. Podemos tambe´m dizer que este experimento envolve 12 tratamentos correspondentes a`s combinac¸o˜es dos n´ıveis dos dois fatores. Pelo pro´prio conceito de fator, vemos que em um esperimento, a escolha dos fatores e seus respectivos n´ıveis (que fara˜o parte de um experimento) e´ basicamente um problema do pesquisador. No entanto e´ importante para o planejamento e ana´lise distingu¨irmos as duas situac¸o˜es abaixo: EXEMPLO 1.2 - Uma indu´stria de parafusos adquiriu 5 ma´quinas de uma determinada marca para produzir parafusos, e esta´ interessada em realizar um experimento para veri- ficar se as 5 ma´quinas sa˜o homogeˆneas com relac¸a˜o a resisteˆncia me´dia dos parafusos por elas produzidas. EXEMPLO 1.3 - A indu´stria das ma´quinas do Exemplo 1.2 esta´ interessada em realizar um experimento para verificar se as ma´quinas produzidas por ela sa˜o homogeˆneas com Peres, Tavares & Madruga 1.3 Escolha da unidade experimental 3 relac¸a˜o a` resisteˆncia me´dia dos parafusos que estas ma´quinas ira˜o produzir. Como a po- pulac¸a˜o de ma´quinas produzidas pela indu´stria e´ muito grande o pesquisador quer realizar o experimento com uma amostra de ma´quinas (5 por exemplo), mas as concluso˜es devem ser estendidas para a populac¸a˜o de ma´quinas. No Exemplo 1.2 dizemos que o fator “ma´quina”e´ fixo e´ no Exemplo 1.3 o fator “ma´quina”e´ aleato´rio. A diferenc¸a fundamental entre esses dois tipos de fatores e´, enta˜o , que no caso de fatores fixos, as concluso˜es se referem apenas aos n´ıveis do fator que esta˜o presentes no experimento. No caso de fatores aleato´rios as concluso˜es devem ser estendidas para a populac¸a˜o dos n´ıveis. 1.3 Escolha da unidade experimental Em um grande nu´mero de situac¸o˜es pra´ticas a unidade experimental e´ determinada pela pro´pria natureza do material experimental. Por exemplo, em experimentos com ani- mais, em geral, a unidade experimental e´ um animal. Em outras situac¸o˜es, a escolha da unidade na˜o e´ assim ta˜o evidente, exigindo do pesquisador juntamente com o estat´ıstico algum estudo no sentido escolher a unidade experimental mais adequada. Por exemplo, em experimentos com plantas, a unidade experimental pode ser a`s vezes uma planta, um conjunto de plantas ou uma a´rea. A escolha da unidade experimental, de um modo ge- ral, deve ser orientada no sentido de minimizar o erro experimental, isto e´, as unidades experimentais devem ser o mais homogeˆneas poss´ıvel, para que quando submetidas a dois tratamentos diferentes, seus efeitos sejam facilmente detectados. 1.4 Escolha das varia´veis a serem medidas As medidas realizadas nas unidades experimentais apo´s terem submetidas aos trata- mentos constituem os valores da varia´vel dependente. A varia´vel dependente, em geral, e´ pre´-determinada pelo pesquisador, isto e´, ele sabe qual a varia´vel que ele quer medir. O que constitui problema, a`s vezes, e´ a maneira como a varia´vel e´ medida, pois disto dependem a precisa˜o das observac¸o˜es, e a distribuic¸a˜o de probabilidade da varia´vel a qual e´ essencial para a escolha do me´todo de ana´lise estat´ıstica. Assim, por exemplo, se os valores de uma varia´vel sa˜o obtidos diretamente por meio de um instrumento de medida, (re´guas, paqu´ımetro, termoˆmetro, etc.) a precisa˜o de nossas observac¸o˜es vai aumentar se, quando poss´ıvel, utilizarmos como observac¸a˜o a me´dia de treˆs medidas da mesma unidade experimental. Com relac¸a˜o a` distribuic¸a˜o de probabilidade, em muitas situac¸o˜es, as ob- servac¸o˜es na˜o sa˜o obtidas diretamente, e sim por meio de expresso˜es matema´ticas que as ligam a outro valores obtidos diretamente. Neste caso, a distribuic¸a˜o de probabilidade das observac¸o˜es vai depender da distribuic¸a˜o de probabilidade da varia´vel obtida diretamente e da expressa˜o matema´tica que as relaciona. Portanto, as varia´veis necessariamente presentes em um experimento sa˜o a varia´vel Peres, Tavares & Madruga 4 Introduc¸a˜o dependente, medida nas unidades experimentais, e o conjunto de fatores (varia´veis inde- pendentes), que determinam as condic¸o˜es sob as quais os valores da varia´vel dependente sa˜o obtidos. Qualquer outra varia´vel que possa influir nos valores da varia´vel dependente deve ser mantida constante. Suponhamos, por exemplo, que o tempo necessa´rio para exe- cutar um experimento seja de 20 dias e que a temperatura ambiente tenha influeˆncia sobre a varia´vel dependente. Neste caso, a temperatura ambiente deve ser mantida constante durante a execuc¸a˜o do experimento. Se, por problemas experimentais, for imposs´ıvel mantermos a temperatura ambiente constante, enta˜o devemos, ale´m da varia´vel dependente, medir a temperatura correspondente a cada unidade experimental. Varia´veis deste tipo sa˜o consideradas no estudo como covariadas e sua informac¸a˜o e´ utilizada para reduziro erro experimental. 1.5 Regras segundo as quais os tratamentos sa˜o atribu´ıdos a`s unidades experimentais Nas discusso˜es apresentadas sobre cada um dos ı´tens anteriores, a colaborac¸a˜o da es- tat´ıstica e´ bem limitada exigindo-se a essencial colaborac¸a˜o do pesquisador. Pore´m, o assunto discutido neste ı´tem e´ o que poder´ıamos denominar planejamento estat´ıstico de experimentos. Trata-se de regras que associam as unidades experimentais aos tratamen- tos e que praticamente determinam os diferentes planos experimentais. Lembramos neste ponto que os tratamentos sa˜o cada uma das combinac¸o˜es entre os n´ıveis de todos os fatores envolvidos no experimento. Para que a metodologia estat´ıstica possa ser aplicada aos resultados de um experimento e´ necessa´rio, que em alguma fase do experimento o princ´ıpio a ser obedecido e´ a repetic¸a˜o, segundo o qual devemos ter repetic¸o˜es do experimento para que possamos produzir uma medida de variabilidade necessa´ria aos testes de presenc¸a de efeitos de tratamentos ou a` estimac¸a˜o desses efeitos. Discutiremos a seguir estes dois princ´ıpios. 1.6 Aleatorizac¸a˜o Nesta fase do planejamento de um experimento ja´ sabemos quais fatores sera˜o estuda- dos e o nu´mero de n´ıveis de cada fator que estara˜o presentes no experimento. Sabemos ainda qual a unidade experimental escolhida e a varia´vel dependente. Podemos enta˜o ima- ginar que de um lado temos um conjunto U de unidades experimentais, e de outro lado um conjunto T de tratamentos que sa˜o as combinac¸o˜es dos n´ıveis de todos os fatores envolvidos. Precisamos enta˜o estabelecer esquemas que associam subconjuntos de elemen- tos de U a cada elemento de T. Passaremos a discutir alguns destes esquemas. No que segue vamos supor que o conjunto U tem n elementos, o conjunto T tem t elementos, e o nu´mero de elementos de U submetido ao tratamento Ti e´ ni, com i = 1, 2, . . . , t, de tal modo que ∑t i=1 ni = n. O nu´mero de unidades experimentais ni para cada tratamento Ti e´ determinado a partir de informac¸o˜es sobre a variabilidade das unidades experimentais Peres, Tavares & Madruga 1.6 Aleatorizac¸a˜o 5 em termos da varia´vel dependente, custo e poder dos testes de significaˆncia (Neter, 1974 pg. 492). PLANO EXPERIMENTAL COMPLETAMENTE ALEATORIZADO Em um esquema completamente aleatorizado as unidades experimentais que va˜o ser submetidas a cada tratamento sa˜o escolhidas completamente ao acaso. Isto significa que cada unidade experimental tem igual probabilidade de receber qualquer um dos tratamen- tos, na˜o existindo restric¸a˜o alguma no crite´rio de aleatorizac¸a˜o. EXEMPLO - Um pesquisador quer realizar um experimento para estudar o efeito de um res´ıduo industrial que e´ adicionado rac¸o˜es de animais. Ele suspeita que este res´ıduo conte´m uma substaˆncia to´xica, cuja presenc¸a no organismo produz um aumento relativo de alguns o´rga˜os, como o f´ıgado por exemplo. Apo´s uma entrevista com o pesquisador conseguimos as informac¸o˜es: a) o experimento ira´ envolver um u´nico fator, rac¸a˜o, com treˆs n´ıveis: rac¸a˜o normal, sem o res´ıduo industrial (grupo controle), rac¸a˜o normal com o res´ıduo tratado, isto e´, o res´ıduo passa por um tratamento para eliminar a substaˆncia to´xica e rac¸a˜o normal com o res´ıduo na˜o tratado. Portanto o conjunto T tem treˆs tratamentos (t=3). b) Um conjunto U e´ formado por um grupo de 18 camundongos, todos rece´m-nascidos, com o mesmo peso inicial e homogeˆneos em relac¸a˜o a caracter´ısticas gene´ticas ge- rais. Por isto foi decidido distribuir completamente ao acaso 6 animais para cada tratamento. c) A varia´vel dependente e´ o peso relativo do f´ıgado apo´s 90 dias do in´ıcio do experi- mento. Uma maneira de se proceder o sorteio e´ a seguinte: – enumera-se as unidades experimentais de 1 a 18. – coloca-se os tratamentos em sequ¨eˆncia, por exemplo: T1T1T1T1T1T1, T2T2T2T2T2T2, T3T3T3T3T3T3. – sorteia-se uma sequ¨eˆncia de 18 nu´meros dentre os nu´meros de 1 a 18 em ta´bua de nu´meros aleato´rios. Pode-se obter, por exemplo, a sequ¨eˆncia: 3, 1, 11, 15, 18, 16, 4, 5, 9, 12, 8, 7, 14, 2, 6, 13, 10. Finalmente, o plano experimental e´ esquematizado conforme apresentamos na Tabela 1.1. Este plano experimental e´ mais eficiente quanto maior for o grau de homogeneidade entre unidades experimentais em termos da varia´vel dependente. Se as unidades experi- mentais sa˜o heterogeˆneas, o nu´mero n de unidades experimentais necessa´rio para uma Peres, Tavares & Madruga 6 Introduc¸a˜o Tabela 1.1 - Distribuic¸a˜o das unidades experimentais segundo os tratamentos T1 T2 T3 U3 U4 U17 U1 U5 U14 U11 U9 U2 U15 U12 U6 U18 U8 U13 U16 U7 U10 boa precisa˜o pode ser muito grande. Quando este for o caso devemos procurar outros pla- nos experimentais que reduzam o erro experimental. Algumas alterac¸o˜es no planejamento descrito, tais como a introduc¸a˜o de blocos, ou simplesmente a utilizac¸a˜o de uma varia´vel auxiliar (covariada) medida nas unidades experimentais, a qual e´ correlacionada com a varia´vel dependente, podem reduzir consideravelmente o erro experimental. OBSERVAC¸A˜O 1 - A descric¸a˜o de um plano experimental completamente aleatorizado apresentada acima na˜o depende do nu´mero de fatores envolvidos e nem da maneira pela qual os fatores sa˜o combinados, isto e´, se eles obedecem a uma classificac¸a˜o cruzada ou hiera´rquica (veja Cap´ıtulo 3). Assim, se um experimento envolve 3 fatores, um deles com dois n´ıveis, um outro com treˆs n´ıveis e o terceiro com treˆs n´ıveis, o nu´mero de tratamentos sera´ 18 (2× 3× 3) e a associac¸a˜o entre os conjuntos U e T se faz da mesma maneira. OBSERVAC¸A˜O 2 - Existem alguns fatores, que pela sua pro´pria natureza, impo˜e res- tric¸o˜es na aleatorizac¸a˜o; pore´m, para efeito de ana´lise, o experimento e´ considerado com- pletamente aleatorizado. Suponha que um grupo de 30 alunos da segunda se´rie do segundo grau, sorteados entre todos os alunos do sistema escolar de Sa˜o Paulo, sendo 15 do sexo masculino e 15 do sexo feminino, sa˜o submetidos a um determinado me´todo de ensino durante um per´ıodo de tempo. O objetivo do experimento e´ comparar, quanto ao sexo, o desempenho dos alunos em um teste aplicado apo´s o per´ıodo de aprendizado. Assim, a unidade experimental e´ o aluno da segunda se´rie do segundo grau, o fator e´ sexo com dois n´ıveis e a varia´vel dependente e´ a nota obtida no teste. Neste caso. As unidades expe- rimentais na˜o podem ser distribu´ıdas completamente ao acaso entre os dois tratamentos (sexo masculino e sexo feminino), pois a natureza do fator impo˜e uma restric¸a˜o natural na aleatorizac¸a˜o. Quando isto acontece dizemos que o fator e´ de classificac¸a˜o. Caso contra´rio dizemos que o fator e´ experimental. Para fins de ana´lise este experimento e´ equivalente ao experimento completamente aleatorizado, porque, nas duas situac¸o˜es as observac¸o˜es cons- tituem um conjunto de amostras aleato´rias independentes, sendo cada uma identificada por uma combinac¸a˜o dos n´ıveis dos fatores, sejam eles experimentais ou de classificac¸a˜o. Peres, Tavares & Madruga 1.7 Repetic¸a˜o 7 PLANO EXPERIMENTAL EM BLOCOS Quando o conjunto U de unidades experimentais for muito heterogeˆneo (em termos da varia´vel independente), o plano experimental completamente aleatorizado torna-se muito grande. Em algumas situac¸o˜es dispomos de informac¸o˜es segundo as quais, antes da rea- lizac¸a˜o do experimento, e´ poss´ıvel agruparmos as unidades experimentais em subconjuntos de t unidades experimentais mais ou menos homogeˆneas, onde t e´ o nu´mero de tratamentos envolvidos no experimento. Estes subconjuntos sa˜o denominados blocos. Assim, a maior parte da heterogeneidade interna do conjunto U e´ expressa pela heterogeneidade entre os blocos. A distribuic¸a˜o das unidades experimentais entre os tratamentos obedece a uma restric¸a˜o impostopelos blocos, isto e´, as t unidades de cada bloco sa˜o distribu´ıdas aleatoriamente entre os tratamentos. Na ana´lise de um experimento em blocos, ale´m dos fatores de interesse, deve-se levar em conta o fator de controle experimental, blocos, diminu´ıdo desta maneira o erro experi- mental. Quanto maior for a heterogeneidade entre blocos, maior e´ a eficieˆncia deste plano experimental em relac¸a˜o ao completamente aleatorizado. EXEMPLO - Um educador quer realizar um experimento com alunos da segunda se´rie do primeiro grau, para comparar treˆs me´todos de ensino. As unidades experimentais sa˜o os alunos e suponha que eles formem um conjunto de bastante heterogeˆneo com relac¸a˜o ao Q.I. Portanto uma maneira de controlar esta heterogeneidade e´ agrupar os alunos em subconjuntos de treˆs alunos de acordo com as faixas de Q.I. Suponha que o experimento vai ser realizado com 30 alunos, enta˜o, o nosso conjunto U sera´ formado por 10 blocos, cada um com 3 unidades experimentais, que sera˜o submetidas aleatoriamente, uma a cada me´todo de ensino. Para fins de ana´lise, este experimento tera´ dois fatores, me´todos de ensino com treˆs n´ıveis, e blocos com 10 n´ıveis. 1.7 Repetic¸a˜o Para que possamos entender o que significa repetir um experimento, consideremos um experimento com um fator com treˆs n´ıveis (treˆs tratamentos). Um conjunto de 3 unidades experimentais distribu´ıdos aleatoriamente, uma para cada tratamento, constituem uma repetic¸a˜o do experimento. Mais treˆs unidades distribu´ıdas aleatoriamente aos tratamen- tos constituem uma seguida repetic¸a˜o, etc. Para 4 repetic¸o˜es as observac¸o˜es podem ser colocadas na seguinte tabela: Este experimento poderia tambe´m ser realizado distribuindo-se aleatoriamente 4 unidades experimentais para cada tratamento. No primeiro plano experimental diremos que o experimento completo foi repetido quatro vezes, e no segundo diremos que cada tratamento foi repetido quatro vezes. Em geral as pro´prias condic¸o˜es de realizac¸a˜o do experimento determinam quais dos dois planos deve ser utilizado. Estes dois processos sa˜o completamente equivalentes desde que, no caso de repetic¸o˜es completas, cada unidade experimental do conjunto U tenha a mesma probabilidade de pertencer a cada re´plica e as re´plicas sejam executadas exatamente nas mesmas condic¸o˜es experimentais. Peres, Tavares & Madruga 8 Introduc¸a˜o Tratamentos T1 T2 T3 y11 y21 y31 y12 y22 y32 y13 y23 y33 y14 y24 y34 1.8 Ana´lise estat´ıstica dos resultados Vimos no in´ıcio deste cap´ıtulo que o objetivo da ana´lise estat´ıstica e´ verificar as hipo´teses formuladas no in´ıcio da pesquisa cient´ıfica. Dentro da terminologia definida no decorrer deste cap´ıtulo, estas hipo´teses va˜o sempre ser expressas em termos da relac¸a˜o en- tre a varia´vel dependente e os fatores envolvidos. Este assunto sera´ tratado nos cap´ıtulos subsequ¨entes. Peres, Tavares & Madruga Cap´ıtulo 2 Experimentos com um fator 2.1 Introduc¸a˜o Neste cap´ıtulo apresentamos a ana´lise de experimentos completamente casualizados com um fator. Contudo, na ana´lise de experimentos com um fator e´ importante considerar- mos se esse fator e´ fixo ou aleato´rio. Na Sec¸a˜o 2.2 apresentamos a ana´lise de experimentos com um fator fixo e na Sec¸a˜o 2.3 a ana´lise de experimentos com um fator aleato´rio. Antes disso vamos apresentar alguma notac¸a˜o comum a ambos os casos. Seja k o nu´mero de n´ıveis desse fator. A notac¸a˜o que vamos adotar para representar as observac¸o˜es obtidas no experimento e´ dada na Tabela 2.1 Tabela 2.1 - Observac¸o˜es referentes a um experimento com um fator com k n´ıveis Tratamento Total 1 2 · · · k y11 y21 · · · yk1 ... ... ... y1n1 y2n2 · · · yknk me´dia amostral y¯1. y¯2. · · · y¯k. y¯.. variaˆncia amostral S21. S 2 2. · · · S2k. S2.. tamanho da amostra n1 n2 · · · nk n onde, yij e´ a j-e´sima observac¸a˜o correspondente ao i-e´simo tratamento ni e´ o nu´mero de unidades experimentais submetidas ao i-e´simo tratamento n = ∑n i=1 ni e´ o nu´mero total de unidades experimentais. 10 Experimentos com um fator As me´dias amostrais por tratamento e geral sa˜o dadas, respectivamente, por y¯i. = 1 ni ni∑ j=1 yij ; y¯.. = 1 n k∑ i=1 ni∑ j=1 yij . e as variaˆncias amostrais por S2i. = 1 ni − 1 ni∑ j=1 (yij − yi.)2; S2.. = 1 n− 1 k∑ i=1 ni∑ j=1 (yij − y..)2. Tambe´m e´ frequente considerarmos a variaˆncia combinada (ou pooled), definida por S2p = 1 n− k k∑ i=1 ni∑ j=1 (yij − yi.)2. 2.2 Experimentos com um fator fixo Em experimentos completamente casualizados com um fator fixo, temos interesse em verificar a influeˆncia dos k n´ıveis desse fator em uma varia´vel dependente y em estudo. Uma forma de verificarmos a existeˆncia dessa influeˆncia e´ comparar as me´dias populacionais da varia´vel y sob efeito dos k tratamentos. No decorrer desta sec¸a˜o, apresentarmos um teste de igualdade dessas k me´dias bem como as suposic¸o˜es necessa´rias para executarmos tal teste. 2.2.1 Modelo matema´tico O modelo matema´tico associado a experimentos com um fator fixo e´ yij = µ+ Ti + eij , (2.1) ou yij = µi + eij , (2.2) onde µ e´ a me´dia comum a todas as observac¸o˜es, definidas como µ = 1 n k∑ i=1 niµi, (2.3) sendo µi a me´dia populacional de Y no i-e´simo tratamento, Ti e´ o efeito no i-e´simo n´ıvel do fator na varia´vel dependente e mede o afastamento da me´dia µi em relac¸a˜o a µ, isto e´: Peres, Tavares & Madruga 2.2 Experimentos com um fator fixo 11 Ti = µi − µ, eij e´ um erro casual na˜o observa´vel. Pelas definic¸o˜es de µ e Ti acima, temos que o modelo (2.1) possui a restric¸a˜o k∑ i=1 niTi = 0, pois, k∑ i=1 niTi = k∑ i=1 ni(µi − µ) = k∑ i=1 niµi − nµ = 0, onde a u´ltima igualdade segue de (2.3). 2.2.2 Suposic¸o˜es associadas ao modelo As suposic¸o˜es associadas aos componentes do modelo (2.1) sa˜o que os erros eij sa˜o varia´veis aleato´rias normalmente distribu´ıdas, com me´dia zero e mesma variaˆncia em todos os tratamentos, e que sa˜o independentes. Essas suposic¸o˜es normalmente sa˜o representadas por: eij ∼ N(0, σ2), indep. Como yij sa˜o func¸o˜es lineares de eij , das suposic¸o˜es sobre os erros decorre que: a) E(yij) = µ+ Ti = µi b) V ar(yij) = σ2 c) yij sa˜o normalmente distribu´ıdos e independentes. Resumidamente, vamos escrever yij ∼ N(µi, σ2), indepenedentes. 2.2.3 Hipo´teses A hipo´tese geral e´ H0 : T1 = . . . = Tk = 0, (2.4) ou seja, vamos testar a na˜o existeˆncia de efeito do fator. Peres, Tavares & Madruga 12 Experimentos com um fator Figura 2.1 Ilustrac¸a˜o das suposic¸o˜es do modelo matema´tico associado a um experimento com um fator fixo 0,00 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 -3 -2 -1 0 1 2 3 4 5 6 7 8 9 10 2.2.4 Partic¸a˜o da soma de quadrados total e graus de liberdade Consideremos a identidade yij − y¯.. = (yij − y¯i.) + (y¯i. − y¯..) (2.5) O termo yij − y¯.. mede o desvio de uma observac¸a˜o em relac¸a˜o a` me´dia amostral geral, sem levar em conta a que tratamento pertence essa observac¸a˜o. Observemos que esse desvio e´ a soma de duas componentes: (yij − y¯i.), que e´ a medida do desvio da observac¸a˜o em relac¸a˜o a` me´dia do seu grupo, e (y¯i.− y¯..), que e´ uma medida do afastamento da me´dia do i-e´simo tratamento em relac¸a˜o a` me´dia geral. Elevando ao quadrado os dois membros da identidade (3.2) e somando em relac¸a˜o aos ı´ndices i e j, e notando que os duplos produtos sa˜o nulos, obtemos: k∑ i=1 ni∑ j=1 (yij − y¯..)2 = k∑ i=1 ni∑ j=1 (yij − y¯i.)2 + k∑ i=1 ni(y¯i. − y¯..)2 A soma dos quadrados: Peres, Tavares & Madruga 2.2 Experimentos com um fator fixo 13 k∑ i=1 ni∑ j=1 (yij − y¯..)2 e´ denominada somados quadrados total e vamos denota´-la por SQT. Este termo e´ uma me´dida da variabilidade total das observac¸o˜es em relac¸a˜o a` me´dia geral. O nu´mero de graus de liberdade associado a SQT e´ n− 1, pois temos n observac¸o˜es e a restric¸a˜o k∑ i=1 ni∑ j=1 (yij − y¯..) = 0. A parcela: k∑ i=1 ni∑ j=1 (yij − y¯i.)2 e´ deniminado soma de quadrados residual (SQR), e e´ uma medida da homogeneidade interna dos tratamentos. Quanto mais pro´ximas estiverem as observac¸o˜es dentro de cada grupo, menor e´ a SQR. Notemos que a magnitude da SQR na˜o depende da diferenc¸a entre as me´dias dos tratamentos. Considerando apenas o i-e´simo tratamento, teremos que ni∑ j=1 (yij − y¯i.)2 possui ni − 1 graus de liberadade. Assim, o nu´mero de graus de liberadade associado a SQR e´ k∑ i=1 (ni − 1) = n− k. A segunda componente de SQT: k∑ i=1 ni(y¯i. − y¯..)2 mede a variabilidade entre as me´dias dos tratamentos e por isso e´ denominada soma de quadrados entre tratamentos (SQE). Quanto mais diferente entre si forem essas me´dias, maior sera´ a SQE. Desde que temos k tratamentos e a restric¸a˜o de que k∑ i=1 ni(y¯i. − y¯..) = 0 SQE possui k − 1 graus de liberdade. Adotando a notac¸a˜o que acabamos de introduzir, podemos escrever que Peres, Tavares & Madruga 14 Experimentos com um fator SQT = SQR+ SQE. 2.2.5 Quadrados me´dios Dividindo SQR e SQE pelos correspondentes graus de liberdade, obtemos, respectiva- mente o quadrado me´dio residual (QMR) e o quadrado me´dio entre tratamentos (QME), isto e´, QMR = SQR n− k e QME = SQE k − 1 Obs: As SQ podem ser escritas tambe´m como SQT = k∑ i=1 ni∑ j=1 y2ij − ny¯2.. = k∑ i=1 ni∑ j=1 y2ij − Y 2.. n SQE = k∑ i=1 y2i. − ny¯2.. = k∑ i=1 Y 2i. ni − Y 2 .. n SQR = SQT − SQE 2.2.6 Esperanc¸as dos quadrados me´dios (EQM) Mostramos Apeˆndice A que: E(QME) = σ2 + 1 k − 1 k∑ i=1 niT 2 i e E(QMR) = σ 2 Assim, temos que QME e´ um estimador na˜o viesado da variaˆncia σ2, se a hipo´tese dada pela relac¸a˜o (2.2) for verdadeira, e o QMR e´ sempre um estimador na˜o viesado de σ2. 2.2.7 Estat´ıstica e regia˜o cr´ıtica do teste A estat´ıstica para o teste e´ F0 = QME QMR As expresso˜es das EQM nos indicam que o valor observado de F0 deve ser pro´ximo de 1 se H0 ja´ verdadeira, enquanto que valores grandes dessa estat´ıstica sa˜o uma indicac¸a˜o de que H0 e´ falsa. Pelo Teorema de Cochran (Neter, 1974, pa´g.92), temos que: (i) SQE σ2 tem distribuic¸a˜o χ2 com (k − 1) graus de liberdade, sob H0: Peres, Tavares & Madruga 2.2 Experimentos com um fator fixo 15 (ii) SQR σ2 tem distribuic¸a˜o χ2 com (n− k) graus de liberdade; (iii) SQE σ2 e SQR σ2 sa˜o independentes. Portanto, a estat´ıstica F0 tem, sob H0, distribuic¸a˜o F-Snedecor com (k − 1) e (n − k) graus de liberdade. Resumidamente, indicamos: F0 ∼ Fk−1,n−k, sob H0. rejeitamos H0 ao n´ıvel de significaˆncia α se F0 > Fk−1,n−k,α. onde Fk−1,n−k,α e´ quantil de ordem (1−α) da distribuc¸a˜o F-Snedecor com (k−1) e (n−k) graus de liberdade, ou, de forma equivalente, se o p-value associado for menor que α. 2.2.8 Quadro da ana´lise de variaˆncia (ANOVA) Dispomos as expresso˜es necessa´rias ao teste de H0 na Tabela 2.2 denominada Quadro de Ana´lise de Variaˆncia (ANOVA). Tabela 2.2 - ANOVA em experimentos com um fator fonte de variac¸a˜o g.l SQ QM EQM F0 entre tratamentos k-1 SQE QME σ2 + 1k−1 ∑k i=1 niT 2 i QME QMR res´ıduo (dentro dos tratamentos) n-k SQR QMR σ2 total n-1 SQT σ2 2.2.9 Exemplo Em uma fase de um experimento efetuado para se estudar diabetes gestacional, desejava- se avaliar o comportamento da hemoglobina glicolisada (HbA) em gestantes normais (N), gestantes com toleraˆncia diminuida (TD) e gestantes diabe´ticas (D). Para isto foram es- colhidas aleatoriamente 10 gestantes de cada tipo e mediu-se suas HbA. Na Tabela 2.3 apresentamos os dados obtidos nesse experimento. Neste experimento temos um fator, Tipo de Gestante, com treˆs n´ıveis: N, TD e D. Nosso objetivo e´ verificar se as HbA me´dias dos treˆs grupos de gestantes sa˜o iguais. SQT = SQE = SQR = SQT − SQE = Peres, Tavares & Madruga 16 Experimentos com um fator Tabela 2.3 - Hemoglobina glicosilada (HbA) em gestantes normais (N), com toleraˆncia Diminu´ıda (TD) e Diabe´ticas (D) tratamento N TD D 7,86 6,20 9,67 6,38 7,82 8,08 6,90 8,50 9,25 7,78 6,50 8,20 8,17 8,09 8,64 6,26 6,90 9,67 6,30 7,82 9,23 7,86 7,45 10,43 7,42 7,75 9,97 8,63 7,43 9,59 me´dia amostral 7,36 7,45 9,27 8,03 tamanho da amostra 10 10 10 30 Tabela 2.4 - ANOVA do estudo da HbA em gestantes F.V. g.l SQ QM F0 p-value entre grupos 2 23,403 11,702 19,36 0,000 res´ıduo 27 16,316 0,604 total 29 39,719 Na Tabela 2.4 constru´ımos a ANOVA correspondente a este experimento. Pelo valor de F0 observado conclu´ımos, ao n´ıvel de significaˆncia α = 0, 05, que as HbA me´dias dos treˆs tipos de gestantes na˜o sa˜o iguais. A mesma consclusa˜o poderia ser obtida olhando-se para o p-value; caso este valor seja inferior ao n´ıvel de significaˆncia pre´-estabelecido (α) rejeitamos a hipo´tese em teste. 2.2.10 Estimac¸a˜o das me´dias dos tratamentos Os estimadores de mı´nimos quadrados dos paraˆmetros do modelo (2.1) sa˜o obtidos minimizando-se a soma dos quadrados dos res´ıduos: Peres, Tavares & Madruga 2.2 Experimentos com um fator fixo 17 k∑ i=1 ni∑ j=1 (yij − µ− Ti)2 em relac¸a˜o a µ e Ti, i = 1, . . . , k, sujeito a` restric¸a˜o: k∑ i=1 niTi = 0. Assim procedendo, obtemos que os estimadores de µ e Ti sa˜o respectivamente, dados por: µˆ = y¯.. e Tˆi = y¯i. − y¯.. O estimador de mı´nimos quadrados de µi e´: µˆi = µˆ− Tˆi = y¯i. , i = 1, . . . , k. Para constru´ırmos um intervalo de confianc¸a para a me´dia de cada tratamento, devemos notar que das siposic¸o˜es sobre a distribuic¸a˜o dos erros decorre que: yˆi. ∼ N ( µi, σ2 ni ) , Vimos que o quadrado me´dio residual (QMR) e´ um estimador na˜o viesado de σ2 e que SQR σ2 tem distribuic¸a˜o χ2 com (n − k) graus de liberdade. Pode-se tambe´m mostrar que SQR/σ2 e´ independente de y¯1., . . . , y¯k. Portanto, y¯i. − µi√ QMR ni tem distribuic¸a˜o t-student com (n−k) graus de liberdade. Um intervalo de confianc¸a para µi com coeficiente confianc¸a γ = 1− α e´, enta˜o, dado por[ y¯i. − tc √ QMR ni ; y¯i. + tc √ QMR ni ] . onde tc e´ o quantil de ordem 1− α2 da distribuic¸a˜o t-student com (n-k) graus de liberdade. 2.2.11 Exemplo Considerando o exemplo dado em 2.2.10. apresentamos na Tabela 2.5 as extimativas por ponto e por intervalo das HbA me´dias em cada grupo de gestante. Peres, Tavares & Madruga 18 Experimentos com um fator Tabela 2.5 - Estimativas por ponto e por intervalo das HbA me´dias de gestantes N, TD e D (dados na Tabela 2.3) N TD D µˆi 7,36 7,453 9,27 IC(, µi, γ = 0, 95) [6,85;7,87] [6,94;7,95] [8,76;9,78] 2.2.12 Comparac¸o˜es mu´ltiplas Se pela ANOVA constatarmos que existe efeito do fator em estudo, e´ interessante prosseguir a ana´lise a fim de localizarmos as diferenc¸as entre as me´dias nos diferentes tratamentos. A continuidade da ana´lise e´ feita de te´cnicas estat´ısticas denominadas com- parac¸o˜es mı´ltiplas que permitem testar hipo´teses do tipo: H0 : C = 0 versus H1 : C 6= 0 onde C = k∑ i=1 ciµi, (2.6) com a restric¸a˜o de que k∑ i=1 ci = 0. A func¸a˜o C definida acima e´ denominada contraste. Nesta sec¸a˜o vamos apresentar quatro me´todos de comparac¸o˜es mu´ltiplas e estabelecer as situaco˜es nas quais um desses me´todos e´ mais adequado que os demais. Antes disso, pore´m, vamos considerar o problema de estimac¸a˜o por intervalo de um contraste. Um estimador na˜o viesado de um contraste C e´: Cˆ = k∑ i=1 ciy¯i. (2.7) A variaˆnciadesse estimador e´ dada por: V ar(Cˆ) = V ar k∑ i=1 ciy¯i. = k∑ i=1 c2i V ar y¯i. = σ 2 k∑ i=1 c2i ni . Peres, Tavares & Madruga 2.2 Experimentos com um fator fixo 19 Como QMR e´ um estimador na˜o viesado de σ2, a estat´ıstica: ̂V ar(Cˆ) = QMR k∑ i=1 c2i ni (2.8) e´ um estimador na˜o viesado de V ar(Cˆ). Para obtermos um intervalo de confianc¸a para C, devemos lembrar que Cˆ e´ uma combinac¸a˜o linear da varia´veis aleato´rias independentes e normalmente distribuidas e tem, portanto, distribuic¸a˜o normal. Ale´m disso, SQRσ2 tem distribuic¸a˜o χ2 com (n − k) graus de liberdade e e´ independente de y¯i., . . . , y¯k.. Assim, a estat´ıstica: Cˆ − C√ QMR ∑k i=1 c2i ni tem distribuic¸a˜o t-student com (n−k) graus de liberdade e um intervalo de confianc¸a para um particular contraste C com coeficiente de confianc¸a γ = 1− α e´ dado por:Cˆ − tc √√√√QMR k∑ i=1 c2i ni ; Cˆ + tc √√√√QMR k∑ i=1 c2i ni (2.9) onde tc e´ o quantil de ordem 1 − α2 da distribuic¸a˜o t-stundent com (n − k) graus de liberdade. 2.2.13.b Exemplo Consideremos o estudo da HbA em gestantes normais, com toleraˆncia diminu´ıda e diabe´ticas. Conclu´ımos, atrave´s de uma ana´lise de variaˆncia, que a HbA me´dia nos treˆs grupos de gestantes na˜o e´ a mesma. Suponhammos que o pesquisador ja´ estivesse particularmente interessado, antes de realizar o experimento, na comparac¸a˜o das HbA me´dias de gestantes com toleraˆncia diminu´ıda com as diabe´ticas. Neste caso, C = µ2 − µ3 onde µ2 e´ a HbA me´dia na populac¸a˜o de gestantes com toleraˆncia dininu´ıda, e µ3 e´ a HbA me´dia na populac¸a˜o de gestantes diabe´ticas. Pela relac¸a˜o (2.4), temos que: Cˆ = 7, 45− 9, 27 = −1, 82. Por (2.6) um intervalo de confianc¸a para C com γ = 0, 95 e´ dado por: Peres, Tavares & Madruga 20 Experimentos com um fator [ −1, 82− 2, 05 √ 0, 611 ( 1 10 + 1 10 ) ;−1, 82 + 2, 05 √ 0, 611 ( 1 10 + 1 10 )] = = [−2, 54 ; −1, 10]. Como o ponto zero na˜o pertence a esse intervalo, conclu´ımos, ao n´ıvel de significaˆncia α = 0, 05, que as HbA me´dias das gestantes com toleraˆncia diminu´ıda e das diabeticas sa˜o diferentes. 2.2.13.c Me´todo de contrastes ortogonais Dizemos que dois contrastes: C1 = k∑ i=1 ci1µi e C2 = k∑ i=1 ci2µi sa˜o ortogonais se: k∑ i=1 ci1ci2 ni = 0 O me´todo de contraste ortogonais consiste em particionar a SQE em (k − 1) parcelas, cada uma com 1 grau de liberdade, correspondentes a contrastes ortogonais. Essas parcelas sa˜o dadas por: SQ(Cj) = Cˆ2j∑k i=1 C2ij ni (2.10) onde Cˆj = k∑ i=1 cij y¯i.. Estamos interessados em testar as hipo´teses: H0j : Cj = 0 vs H1j : Cj 6= 0. (2.11) A estat´ıstica: SQ(Cj) σ2 Peres, Tavares & Madruga 2.2 Experimentos com um fator fixo 21 tem, sob H0j , distribuic¸a˜o de χ2 com 1 grau de liberdade e e´ independente de SQR. Ja´ vimos que SQR/σ2 tem distribuc¸a˜o de χ2 com (n − k) graus de liberdade. Portanto as estat´ısticas: Fj = SQ(Cj) QMR (2.12) tem, sob H0j , distribuic¸a˜o F-snedecor com 1 e (n−k) graus de liberdade e sera˜o utilizadas para testar as hipo´teses (2.8). O me´todo de contrastes ortogonais possui as seguintes restric¸o˜es: i) So´ podemos testar um conjunto de (k − 1) contrastes ortogonais que nem sempre fornece ao pesquisador a informac¸a˜o de interesse a cerca do tipo de diferenc¸a existente entre as me´dias; ii) Para garantirmos o n´ıvel de significaˆncia em cada teste, os contrastes a serem testados devem ser escolhidos antes da realizac¸a˜o do experimento (Neter, 1974, pa´gina 472). Quando o fator em estudo e´ quantitativo, e´ poss´ıvel verificarmos qual o grau do po- linoˆmio que relaciona a varia´vel dependente com os n´ıveis do fator, utilizando a te´cnica de contrastes ortogonais. Ilustramos esta afirmac¸a˜o no exemplo dado em 2.2.13.d. 2.2.13.d Exemplo Um mesmo tipo de condutor ele´trico tem sido usado em linhas de transmissa˜o que possuem as mesmas caracter´ısticas, variando unicamente a altitude da regia˜o por onde essas linhas passam. O tempo de vida ativa desse condutor tem apresentado variac¸o˜es que levaram o fabricante a suspeitar que a pressa˜o atmofe´srica (e portanto a altitude) exerce influeˆncia no seu tempo de vida. Realizou-se um experimento com o objetivo de testar essa hipo´tese e de se avaliar o tipo relac¸a˜o existente entre altitude e tempo de vida. Doze condutores rece´m-sa´ıdos da fa´brica foram divididos aleatoriamente em 3 grupos com 4 condutores cada um, e utilizados nas linhas de transmissa˜o em 3 altitudes espec´ıficas que sa˜o de grande interesse do ponto de vista te´cnico: 0m; 500m; 1.000m. Apresentamos abaixo as me´dias amostrais e o quadro de ana´lise de variaˆncia constru´ıdo com os resutados obtidos neste esperimento: y¯1. = 2, 58 (0m) n1 = 4 y¯2. = 4, 10 (500m) n2 = 4 y¯3. = 6, 13 (1.000m) n3 = 4 Como F2;9;0.01 = 8, 02, rejeitamos a hipo´teses a hipo´tese de que na˜o existe efeito de altitude. Vamos proseguir a ana´lise com o objetivo de avaliar o grau do polinoˆmio que relaciona tempo de vida e altitude. Isto e´ feito construindo contrastes que permitem verificar a Peres, Tavares & Madruga 22 Experimentos com um fator F.V. g.l SQ QM F entre tratamentos 2 25, 38 12, 69 23, 07 res´ıduo 9 4, 99 0,55 total 11 30,37 existeˆncia de efeitos linear, quadra´tico, cu´bico, etc. nesta ordem. Como o nu´mero ma´ximo de contrastes e´ k − 1, no nosso exemplo podemos apenas testar a existeˆncia de efeitos linear e quadra´tico. Com esta finalidade, consideremos os contrastes: C1 = µ1 − µ3 e C2 = µ1 + µ3 2 − µ2 Esses constrastes sa˜o ortogonais pois: 3∑ i=1 ci1ci2 = 0. Vamos testar as hipo´teses: H01 : C1 = 0 vs H11 : C1 6= 0 (2.13) e H02 : C2 = 0 vs H12 : C2 6= 0 (2.14) utilizando a estat´ıstica dada pela relac¸a˜o (2.9). Por (2.7) temos que SQ(C1) = (2, 58− 6, 13)2 1/4 + 1/4 = 25, 21 SQ(C2) = [(2, 58 + 6, 13)/2− 4, 10]2 1/16 + 1/16 + 1/4 = 0, 17 Reescrevemos abaixo o quadro de ana´lise de variaˆncia deste experimento, indicando a partic¸a˜o da SQE e os valores da estat´ıstica Fj dada pela relac¸a˜o (2.9). Como F1;9;0,01 = 6, 63, rejeitamos a hipo´tese de que C1 = 0 e na˜o rejeitamos a hipo´tese de que C2 = 0. Em outras palavras, existente efeito linear e na˜o existe quadra´tico da altitude no tempo de vida me´dio dos condutores. Assim, a relac¸a˜o entre altitude e tempo de vida e´ do tipo: Peres, Tavares & Madruga 2.2 Experimentos com um fator fixo 23 ANOVA F.V. g.l SQ QM F C1 1 25,21 25,21 45,84 C2 1 0,17 0,17 0,31 entre tratamentos 2 25,38 12,69 23,07 res´ıduo 9 4, 99 0,55 total 11 30,37 Y = α + βX + ε, onde: Y e´ o tempo de vida X e´ a altitude α e β sa˜o os paraˆmentros desconhecidos, e ε e´ um erro casual. Existem va´rias propostas de testes para identificac¸a˜o das diferenc¸as, tais como Tukey, Scheffe´, Bonferrony, Duncan, Dunnett, Sidak, dentre outros. Abaixo, apresentamos os treˆs primeiros para ilustrac¸a˜o. 2.2.13.e Me´todo de Tukey para o conjunto de todas as diferenc¸as entre me´dias de dois tratamentos Este me´todo de comparac¸o˜es mu´ltiplas permite construir intervalos de confianc¸a para todos os ( k 2 ) = k(k−1)2 contrastes do tipo Cij = µi − µj , i 6= j, fixando-se um coeficeiente de confianc¸a γ = 1 − α para toda a famı´lia de intervalos. Podemos enta˜o comparar as me´dias dos tratamentos duas a duas, garantindo que o n´ıvel de significaˆncia conjunto de todos os testes e´ igual a α. Para experimentos balanceados com r observac¸o˜es em cada tratamento, o intervalo de confianc¸a para Cij e´[ (y¯i. − y¯j.)− q∗ √ QMR r ; (y¯i. − y¯j.) + q∗ √ QMR r ] (2.15) Peres, Tavares & Madruga 24 Experimentos com um fator onde q∗ e´ o quantil de ordem ( 1− α2) da distribuic¸a˜o da estat´ıstica: q(k, v) = max(y¯i. − µi)−min(y¯i. − µi.)√ QMR r Essa distribuic¸a˜o e´ denominada “studentized range”com paraˆmetros k e v que, em nosso caso, sa˜o iguais ao nu´mero de tratamentos e o nu´mero de graus de liberdade do res´ıduo, respectivamente, e esta´ tabulada, dentre outros, em Neter (1974, pa´g. 824-825). Se o experimento for na˜o balanceado, os limites de confianc¸a para Cij sa˜o obtidos de forma aproximada e sa˜o dados por: [ (y¯i. − y¯j.)− q∗√ 2 √ QMR ( 1 ni + 1 nj ) ; (y¯i. − y¯j.) + q∗√ 2 √ QMR ( 1 ni + 1 nj )] (2.16) 2.2.13.f Me´todo de Scheffe´ para o conjunto de todos os contrastes O me´todo de Scheffe´ fornece intervalos de confianc¸a para todos os contrastes C = k∑ i=1 ciµi, k∑ i=1 ci = 0. Estes intervalos sa˜o dados por [Cˆ − S √ V̂ ar(Cˆ); Cˆ + S √ V̂ ar(Cˆ)] (2.17) onde S2 = (k − 1)Fc, Fc e´ o quantil de ordem (1 − α) da distribuc¸a˜o F-Snedecor com (k − 1) e (n − k) graus de liberdade; Cˆ e V̂ ar(Cˆ) sa˜o dados, respectivamente, pelas relac¸o˜es (2.4) e (2.5). O coeficiente de confianc¸a conjunto de todos os poss´ıveis intervalos e´ γ = 1 − α. Assim, se utilizarmos esses intervalos para testar hipo´teses do tipo: H0 : C = 0, o n´ıvel de significaˆncia conjunto de todos esses testes igual a α. Observemos que o me´todo de Scheffe´ e´ exato mesmo para experimentos na˜o balanceados, ao contra´rio do me´todo de Tukey. Peres, Tavares & Madruga 2.2 Experimentos com um fator fixo 25 2.2.13.g Me´todo de Bonferroni Este me´todo de comparac¸a˜o mu´ltipla pode ser utilizado para experimentos na˜o ba- lanceados e e´ adequado quando estamos interessados em um nu´mero fixado de contrastes p. O intervalo de confianc¸a para um contraste Cj e´ dado por[ Cˆj −B √ ˆV ar Cˆj ; Cˆj +B √ ˆV ar Cˆj ] = 1, . . . , p (2.18) onde B e´ o quantil de ordem [ 1− α2p ] da distribuic¸a˜o t-Student com (n−k) graus de liberdade; Cˆj e ˆV ar Cˆj sa˜o dados, respectivamente, pelas relac¸o˜es (2.4) e (2.5). O me´todo de Bonferroni garante que a probabilidade de que os p intervalos estejam simultaneamente corretos e´ maior ou igual a γ = 1− α. 2.2.13.h Comparac¸o˜es entre os me´todos de comparac¸o˜es mu´ltiplas Sempre que os contrastes de interesse forem escolhidos antes da realizac¸a˜o do expe- rimento e pertencerema um mesmo conjunto de (k − 1) contrastes ortogonais, devemos adotar a te´cnica de contraste ortogonais para detectarmos as poss´ıveis diferenc¸as entre as me´dias dos tratamentos. O motivo dessa escolha e´ que os intervalos de confianc¸a ob- tidos por esta te´cnica teˆm amplitude menor que os fornecidos pelos outros me´todos de comparac¸o˜es mu´ltiplas apresentados nesta sec¸a˜o. Se os contrastes a serem estimados forem escolhidos a priori mas na˜o forem ortogonais entre si, a te´cnica de comparac¸o˜es mu´ltipla a ser adotada deve ser escolhida entre os metodos de Turkey, Scheffe´ ou Bonferroni. Para decidirmos qual a te´cnica a ser aplicada, devemos procurrar aquela que fornece intervalos de confianc¸a de menor amplitude para os contrastes de interesse. Observando os intervalos (2.12), (2.13) e (2.14), podemos concluir que: a) O me´todo de Turkey deve ser adotado quando tivermos interesse em todas as poss´ıveis comparac¸o˜es de me´dias dos tratamentos duas a duas. Quando o mu´mero de com- parac¸a˜o for pequeno em relac¸a˜o a k(k−1)/2, o me´todo de Bonferroni e´ mais preciso que o de Turkey. b) O me´todo de Scheffe´ deve ser adotado quando temos interesse em va´rios contrastes, com pelo menos um deles envolvendo mais de duas me´dias. Se o nu´mero de contrastes a serem estimados for pequeno, o me´todo de Bonferrone e´ prefer´ıvel ao me´todo de Scheffe´. Peres, Tavares & Madruga 26 Experimentos com um fator Se os contrastes de interessse forem determinados apo´s a realizac¸a˜o do experimento, devemos escolher entre os me´todos de Turkey ou Scheffe´. Pelas relac¸o˜es (2.12) e (2.13), conclu´ımos que: a) Se todos os contrastes a serem estimados envolverem apenas duas me´dias, o me´todo de Turkey fornece intervalos de menor amplitude que os de Scheffe´ e deve, neste caso, ser adotado. b) Se pelo menos um contraste envolver mais de duas me´dias o me´todo de Scheffe´ deve ser o escolhido. 2.2.13.i Exemplo Consideremos o estudo da HbA em gestantes normais, com toleraˆncia diminu´ıda e diabe´ticas. Na Sec¸a˜o 2.2.10 conclu´ımos, atrave´s da ANOVA, que a HbA me´dia na˜o e´ a mesma nos treˆs grupos de gestante. Vamos agora comparar duas a duas as HbA me´dias dos treˆs tratamentos, isto e´, vamos considerar os contrastes: C1 = µ1 − µ2, (2.19) C2 = µ1 − µ3, C3 = µ2 − µ3. A Tabela 2.6 fornecemos as estimativas de Cj , j = 1, 2, 3 e respectivamente intervalos de confianc¸a obtidos pelos me´todos de Turkey, Scheffe´ e Bonferroni. Tabela 2.6 - Estimativas por ponto e intervalos de confianc¸a (γ = 0, 95) para os contrastes Cj dados pelas relac¸o˜es (2.15) Cj Cˆ Intervalo de confianc¸a Tukey Scheffe´ Bonferroni C1 0,09 [-0,96;0,78] [-0,99;0,81] [-1,10;0,92] C2 -1,91 [-2,78;-1,04] [-2,81;-1,01] [-2,93;-0,90] C3 -1,82 [-2,69;-0,95] [-2,72;-0,92] [-2,84;-0,81] Adotando qualquer um dos me´todos de construc¸a˜o de intervalo de confianc¸a, a partir da Tabela 2.6 conclu´ımos que a me´dia da HbA das gestantes normais e´ igual a` das gestantes com toleraˆncia diminu´ıda (os intervalos para C1 conte´m o ponto zero) e que as gestantes diabe´ticas apresentam um comportamento diferente dos outros grupos quanto a` me´dia da HbA. O n´ıvel de significaˆncia conjunto para essas concluso˜es e´ α = 0, 05. Observamos que os intervalos de confianc¸a abtidos pelo me´todo de Turkey teˆm amplitude menor que os fornecidos pelos me´todos de Scheffe´ e Bonferroni. Peres, Tavares & Madruga 2.2 Experimentos com um fator fixo 27 2.2.13 Ana´lise de Res´ıduos O res´ıduo correspondente a uma observac¸a˜o yij e´ definido como: zij = yij − yˆij = yij − y¯i., ou seja, o res´ıduo correspondente a` parte da observac¸a˜o que na˜o foi explicada pelo mo- delo. Calculando os res´ıduos correspondente a todas as observac¸o˜es de um experimento e analisando-os descritivamente de forma apropriada, podemos saber se as suposic¸o˜es esta˜o satisfeitas, ou seja, se o modelo adotado na ana´lise foi adequado. Ale´m disso, atrave´s da ana´lise de res´ıduos, conseguimos detectar observac¸o˜es sujeitas e erros de medida ou de co- dificac¸o˜es (transcric¸a˜o), ou observac¸o˜es associadas a` indiv´ıduos que teˆm comportamento patolo´gico em relac¸a˜o a populac¸a˜o que esta´ sendo estudado (“outliers”) com o aux´ılio do pesquisador que realizou o experimento, podemos corrigir as medidas sujeitas e erro, e imcluir ou na˜o as observac¸o˜es referentes a indiv´ıduos com comportamento expu´rio. Relativamente a`s suposic¸o˜es, precisamos verificar se (i) a dsitribuic¸a˜o dos res´ıduos e´ normal; (2) se as variaˆncias sa˜o iguais nos k tratamentos e (iii) se os res´ıduos sa˜o inde- pendentes. Estas suposic¸o˜es sa˜o verificadas abaixo utilizando-se as sa´ıdas do Minitab e SPSS. Os procedimentos de ana´lise que vamos apresentar na˜o se alterarem se dividirmos todos os res´ıduos por uma mesma constante. Por convenieˆncia vamos considerar os res´ıduos divididos por √ QMR. Para exemplificar algumas te´cnicas desdritivas de ana´lise de res´ıduos, consideramos os dados do experimento descritivo na Sec¸a˜o 2.2.10 (Estudo da HbA em gestantes). A Tabela 2.7 fornece os valores dos res´ıduos desse experimento divididos por √ QMR obtida a partir da ANOVA. 2.2.14.a Homocedasticidade Na Figura 2.2 representamos graficamente os res´ıduos correspondentes a cada grupo de gestantes. Notamos que a variabilidade dos res´ıduos e´ aproximadamente igual para os treˆs grupos, o que nos indica descritivamente a suposic¸a˜o da igualdade das variaˆnciasdentro de cada tratamento. Nenhum res´ıduo e´ muito maior ou menor que os demais, o que nos garante a na˜o existeˆncia de “outliers”. 2.2.14.b Normalidade No Gra´fico 2.2.13 podemos averiguar a hipo´tese de normalidade dos res´ıduos. Os res´ıduos devem permanecer em torno de uma linha reta. 2.2.14.c Independeˆncia Para verificarmos a validade da hipo´tese de independeˆncia dos erros, constru´ımos na Figura 2.3 um gra´fico dos res´ıduos em func¸a˜o da ordem segundo a qual as respectivas observac¸o˜es foram obtidas. Notamos que os res´ıduos se distribuem Peres, Tavares & Madruga 28 Experimentos com um fator Tabela 2.5 - Res´ıduos padronizados: gestantes N, TD e D (dados na Tabela 2.3) T TD D 0,64 (7) -1,60 (2) 0,51 (25) -1,25 (12) 0,47 (15) -1,52 (29) -0,59 (3) 1,34 (28) -0,03 (30) 0,54 (11) -1,22 (9) -1,37 (21) 1,04 (10) 0,82 (8) -0,81 (16) -1,41 (16) -0,70 (18) 0,51 (1) -1,36 (27) 0,47 (17) -0,05 (5) 0,64 (20) 0,00 (24) 1,48 (14) 0,08 (22) 0,38 (23) 0,89 (13) 1,62 (26) -0,03 (19) 0,41 (4) Obs: Os nu´meros entre pareˆnteses indicam a ordem em que as respectivas observac¸o˜es forma obtidas. erraticamente em torno do eixo das abcissas, o que e´ uma indicac¸a˜o da validade da inde- pendeˆncia. 2.3 Experimentos com um fator Aleato´rio Vimos no primeiro cap´ıtulo que, quando o fator e´ aleato´rio, apenas uma amostra dos n´ıveis do fator faz parte do experimento, mas as concluso˜es devem ser estendidas a` toda a populac¸a˜o de n´ıveis da qual a amostra foi retirada. Assim, a me´dia da varia´vel dependente Y associada aos n´ıveis do fator presentes no experimento, na˜o sa˜o paraˆmetros, mas sim valores da varia´vel aleato´ria: me´dia da varia´vel Y associada a todos os poss´ıveis n´ıveis da populac¸a˜o de n´ıveis do fator “me´dia dos n´ıveis”. Portanto, quando realizamos um experimento completamente casualizado com um fator aleato´rio estamos interessados em verificar a hipo´tese da igualdade das me´dias associadas a` populac¸a˜o de n´ıveis do fator, ou seja, a hipo´tese de que a varia´vel aleato´ria “me´dia dos n´ıveis”e´ uma constante, ou ainda a hipo´tese de que a variaˆncia da varia´vel aleato´ria “me´dia dos n´ıveis”e´ igual a zero. Veremos que a formulac¸a˜o matema´tica na situac¸a˜o de fator aleato´rio e´ diferente da formulac¸a˜o com fator fixo, mas ao final o crite´rio de decisa˜o sera´ axatamente o mesmo. Isso na˜o ocorrera´ se tivermos mais de um fator envolvido no experimento. 2.3.1 Modelo matema´tico Vamos adotar o modelo; Peres, Tavares & Madruga 2.3 Experimentos com um fator Aleato´rio 29 Figura 2.2 Res´ıduos para cada grupo de gestantes (dados da Tabela 2.7) yij = µ+ Ti + eij , i = 1, . . . , k, j = 1, . . . , ni, (2.20) Este modelo e´ ana´logo ao escolhido para experimentos com um fator fixo. Entretanto, pelo fato dos n´ıveis do fator serem escolhidos aleatoriamente, as me´dias dos tratamentos µi e seus efeitos Ti sa˜o varia´veis aleato´rias. A me´dia geral µ e´ agora definida como: µ = E(µi) e Ti = µi − µ 2.3.2 Suposic¸o˜es do modelo Na ana´lise de experimentos com um fator aleato´rio, vamos fazer as seguintes suposic¸o˜es a cerca das distribuic¸o˜es das varia´veis aleato´rias Ti e eij : a) eij sa˜o v.a.i.i.d. com distribuic¸a˜o N(0, σ2); b) Ti sa˜o v.a.i.i.d. com distribuic¸a˜o N(0, σA2) c) eij e Ti sa˜o independentes. Das suposic¸o˜es acima, decorre que: a) E(Yij) = µ, ∀i , j ; Peres, Tavares & Madruga 30 Experimentos com um fator Figura 2.3 Normal plot b) V ar(Yij) = σ2A + σ 2 c) Cov(Yij , Yij′) = E[(Yij − µ)(Yij′ − µ)] = E[(Ti + eij)(Ti + eij , )] = E[T 2i + Tieij + Tieij + eijeij′ ] = E[T 2 i ] = σ 2 A e Cov(Yij , Yi′,j′) = 0, i 6= i′; d) yij sa˜o normalmente distribu´ıdos. Na Tabela 2.8 resumimos as consequeˆncias das suposic¸o˜es sobre a distribuic¸a˜o das varia´veis aleato´rias que compo˜em os modelos fixo e aleato´rio. Notemos que, devido ao fato do fator ser aleato´rio, a variaˆncia de cada observac¸a˜o tem duas componentes: σ2 e σ2A. Assim como no modelo fixo, a variaˆncia dos erros σ 2 e´ uma medida de variabilidade interna dos tratamentos e e´ constante para todos os n´ıveis do fator. Como estamos sorteando os n´ıveis do fator a serem estudados, a me´dia µi de cada tratamento e´ uma varia´vel aleato´ria com valor esperado igual a µ. A componente σ2A e´ uma medida da variabilidade de µi ao redor de µ, i = 1, . . . , k. Na Figura 2.4 esquematizamos o significado de σ2 e σ2A, considerando um fator aleato´rio com dois n´ıveis. Cabe ainda ressaltar que as observac¸o˜es de um mesmo tratamento sera˜o correlacionadas, diferentemente do que ocorria no caso de fatores fixos. Peres, Tavares & Madruga 2.3 Experimentos com um fator Aleato´rio 31 Figura 2.4 Res´ıduos segundo a ordem de obtenc¸a˜o das observac¸o˜es no estudo da HbA em gestantes Tabela 2.8 - Consequeˆncias das suposic¸o˜es feitas sobre os componentes dos modelos fixo e aleato´rio na distribuic¸a˜o da varia´vel dependente Modelo fixo Modelo aleato´rio E(yij) µi = µ+ Ti µ V ar(yij) σ2 σ2 + σ2A Cov(yij , yij , ) 0 σ2A j 6= j Cov(yij , yi,j) 0 0 i 6= i distribuic¸a˜o de yij Normal Normal 2.3.3 Hipo´teses Se σ2A=0, enta˜o as me´dias de todos os poss´ıveis n´ıveis do fator em estudo sa˜o iguais a µ. Assim, nossa hipo´tese de interesse e´ H0 : σ2A = 0. (2.21) Peres, Tavares & Madruga 32 Experimentos com um fator 2.3.4 Partic¸a˜o da soma dos quadrados total e graus de liberdade A partic¸a˜o da soma dos quadrados total e o nu´mero de graus de liberdade associado a cada fonte de variac¸a˜o sa˜o ideˆnticas ao do modelo fixo. 2.3.5 Esperanc¸as dos quadrados me´dios Em um modelo aleato´rio, pode-se mostrar que: E(QME) = σ2 + 1 k + 1 (n− 1 n k∑ i=1 n2i )σ 2 A E(QMR) = σ2 Portanto, o QMR e´ um estimador na˜o viesado de σ2. Se a hipo´tese (2.17) for verdadeira, QME tambe´m e´ um estimador na˜o viesado de σ2. 2.3.6 Estat´ıstica e regia˜o cr´ıtica do teste Se a hipo´tese (2.17) for verdadeira, devemos esperar que o valor da estat´ıstica: F0 = QME QMR seja pro´ximo de 1. Pelos mesmos argumentos utilizados no caso do modelo fixo, a estat´ıstica F0 tem, sob H0, distribuic¸a˜o F-snedecor com (k − 1) e (n− k) graus de liberdade. A regia˜o cr´ıtica do teste da Hipo´tese (2.17) e´ constitu´ıda pelos valores da estat´ıstica F0 tais que: F0 > Fk−1,n−k,α onde Fk−1,n−k,α e´ o quantil de ordem (1 − α) da distribuic¸a˜o F-snedecor com (k − 1) e (n− k) graus de liberdade. 2.3.7 Quadro de Ana´lise de Variaˆncia Na Tabela 2.9 apresentamos o quadro de ana´lise de variaˆncia correspondente a um experimento com um fator aleato´rio com k n´ıveis. 2.3.8 Exemplo Um pesquisador esta´ interessado em avaliar se a temperatura me´dia do corpo dos animais de uma espe´cie e´ constante. Como e´ imposs´ıvel a realizac¸a˜o de um experimento com todos os animais da espe´cie, ele sorteou 5 animais e fez 4 medidas de suas temperaturas de forma completamente casualizada. Apresentamos os dados obtidos na Tabela 2.10. O quadro de ana´lise de variaˆncia e´ dado na Tabela 2.11. Peres, Tavares & Madruga 2.3 Experimentos com um fator Aleato´rio 33 Tabela 2.9 - ANOVA para experimentos com um fator aleato´rio com k n´ıveis Fonte de variac¸a˜o g.l SQ QM EQM F0 entre tratamentos k-1 SQE QME σ2 + 1k+1 [ n− 1n ∑k i=1 n 2 i ] σ2A QME QMR res´ıduo n-k SQR QMR σ2 Total n-1 SQT Tabela 2.10 - Temperatura(oc)em 5 animais de uma mesma espe´cie Animais 1 2 3 4 5 Total 26 23 25 28 30 28 20 28 27 32 25 24 24 29 28 29 22 27 31 31 Total 108 89 104 115 121 537 me´dia 27, 00 22, 25 26, 00 28, 75 30,25 26, 85 tamanho da amostra 4 4 4 4 4 20 Neste experimento o fator de interesse e´ animal, cujos 5 n´ıveis constituem uma amostra de todos os animais da espe´cie estudada. Como F4;15;0;01 = 4.89, reijeitamos a hipo´tesede que a temperatura me´dia e´ constante para todos os animais da espe´cie que esta´ sendo estudada. 2.3.9 Estimac¸a˜o em experimentos com um fator aleato´rio Nesta sec¸a˜o vamos considerar a estimac¸a˜o por ponto e por intervalo de alguns paraˆmetros de interesse do modelo aleato´rio, nos restringindo a experimentos balanceados, isto e´, va- mos supor ni = n2 = . . . = nk = r Peres, Tavares & Madruga 34 Experimentos com um fator Tabela 2.11 - ANOVA do experimento executado para o estudo dos animais de uma espe´cie Fonte de variac¸a˜o g.l SQ QM F p-value entre animais 4 148,300 37,075 12,02 0,000 res´ıduo 15 46, 250 3,083 Total 19 194,550 2.3.10 Estimac¸a˜o de µ Como ja´ vimos anteriormente, o paraˆmetro µ e´ o valor esperado das me´dias µi, i = 1, . . . , k. No exemplo dado em 2.3.9, µ correspondente a` temperatura me´dia de todos os animais da espe´cie e e´ um paraˆmetro de bastante interesse em nosso estudo. Para obtermos um estimador para µ, devemos notar que a me´dia amostral de todas as observac¸a˜o de um experimento pode ser escrita em termos dos paraˆmetros do modelo da seguinte forma: y¯.. = µ+ 1 k k∑ i=1 Ti + 1 n k∑ i=1 r∑ j=1 eij . Considerando agora as suposic¸o˜es associadas ao modelo aleato´rio, temos que: E(y¯..) = µ, e, portanto, y¯.. e´ um estimador na˜o viesado de µ. Utilizando os mesmos argumentos obte- mos que a variaˆncia do estimador y¯.. e´: V ar(y¯..) = 1 k2 k∑ i=1 σ2A + 1 n2 k∑ i=1 ni∑ j=1 = σ2 + rσ2A n . Como, para experimentos balanceados E(QME) = σ2 + rσ2A, temos que um estimador na˜o viesado da varia´vel de V ar(y¯..) e´: ̂V ar(y¯..) = QME n . Utilizando-se os resutados acima, pode-se mostrar que estat´ıstica: y¯.. − µ√ QME n Peres, Tavares & Madruga 2.3 Experimentos com um fator Aleato´rio 35 tem distribuic¸a˜o t-student com (k− 1) graus de liberdade e que um intervalo de confianc¸a para µ, com coeficiente de confianc¸a γ = 1− α e´ dada por: [ y¯.. − tc √ QME n ; y¯.. + tc √ QME n ] , onde tc e´ o quantil de ordem 1− α2 da distribuic¸a˜o t-student com (k−1) graus de liberdade. 2.3.11 Estimac¸a˜o de σ2 Um estimador na˜o viesado de σ2 e´: σˆ2 = QME. Pode-se mostrar que: (n− k)QMR σ2 tem distribuic¸a˜o de χ2 com (n − k) graus de liberdade. A partir deste fato, obtemos que um intervalo de confianc¸a para σ2 com coeficiente γ = 1− α e´ dada por:[ (n− k)QMR χ2c1 ; (n− k)QMR χ2c2 ] onde χ2c1 e χ 2 c2 sa˜o respectivamente, os quantis de ordem (1− α2 ) e (α2 ) da distribuic¸a˜o χ2 com (n− k) graus de liberdade. 2.3.12 Estimac¸a˜o de σ2A Sabemos que: E(QME) = σ2 + rσ2A e E(QMR) = σ 2. Assim, um estimador na˜o viesado de σ2A e´: σˆ2A = QME −QMR r Pode ocorrer que, em um particular experimento, σˆ2A assuma um valor negativo. Como na˜o tem sentido o fato de uma variaˆncia ser negativa, devemos, em tais casos, considerar que a estimativa de σ2A e´ nula. Para a construc¸a˜o de um intervalo de confianc¸a para σ2A, necessitamos da distribuic¸a˜o de (QME-QMR). No entanto, e´ bastante dif´ıcil determinar-se a distribuic¸a˜o exata dessa estat´ıstica. Bulmer (1957) apresenta me´todos aproximados de construc¸a˜o de intervalos de confianc¸a para σ2A. Na˜o vamos, entretanto, inclu´ı-los neste texto. Peres, Tavares & Madruga 36 Experimentos com um fator 2.3.13 Estimac¸a˜o de σ2A σ2 Podemos ter interesse em estimador σ 2 A σ2 . Este quociente e´ uma medida da relac¸a˜o exis- tente entre a variac¸a˜o entre a variac¸a˜o as me´dias µi e a variac¸a˜o interna dos tratamentos. Pode ser provado (Neter, 1974) que um intervalo de confianc¸a para σ 2 A σ2 com coeficiente de confianc¸a γ = 1− α e´ dado por. [ 1 r ( QME QMR . 1 F2 − 1 ) ; 1 r ( QME QMR . 1 F1 − 1 )] onde, F1 e F2 sa˜o, respectivamente, os quantis de ordem α2 e [ 1 − α2 ] da distribuic¸a˜o F-snedecor com (k − 1) e (n− k) graus de liberdade. 2.3.14 Estimac¸a˜o de σ2A σ2A+σ 2 Esta quantidade e´, em geral, de grande interesse na ana´lise de experimentos com um fator aleato´rio, pois representa a proporc¸a˜o da variaˆncia total atribu´ıda aos tratamentos, ou seja, a proporc¸a˜o da variaˆncia total correspondente a` variac¸a˜o entre as me´dias µi. A partir do intervalo de confianc¸a para σ 2 A σ2 dado pela relac¸a˜o (2.18), obtemos que um intervalo de confianc¸a para σ2A σ2A + σ2 com coeficiente de confianc¸a γ = 1− α e´ dada por: [ Li 1 + Li ; Ls 1 + Ls ] , onde Li = 1 r ( QME QMR . 1 F2 − 1 ) e Ls = 1 r ( QME QMR . 1 F1 − 1 ) e F1 e F2, sa˜o respectivamente, os quantis de ordem (α2 ) e (1−α2 ) da distribuic¸a˜o F-snedecor com (k − 1) e (n− k) graus de liberdade. Peres, Tavares & Madruga 2.3 Experimentos com um fator Aleato´rio 37 2.3.15 Exemplo Considerando os dados apresentados na Tabela 2.10, obtemos as seguintes estimativas. Paraˆmetro Estimativa por ponto Intervalo de confianc¸a(γ = 0.95) µ 26,85 [23,07;30,63] σ2 3,08 [1,68;7,38 ] σ2A 8,50 σ2A σ2 [0,54;59,64] σ2A σ2+σ2A [0,35;0,98] Observando os resultados acima, conclu´ımos que a temperatura me´dia da espe´cie em estudo e´ 26,85oc e que a variabilidade entre as me´dias das temperaturas dos animais explica de 0,35 a 0,98 da variabilidade total. Notamos tambe´m que a variabilidade entre as temperaturas me´dias dos animais de toda a espe´cie e´ grande em relac¸a˜o a` variabilidade da temperatura de cada animal. Peres, Tavares & Madruga Cap´ıtulo 3 Experimentos com Dois Fatores 3.1 Introduc¸a˜o Neste cap´ıtulo apresentaremos a ana´lise de experimentos com dois fatores. A diferenc¸a que surge no caso de dois fatores tanto pode ser quanto ao tipo de planejamento, quanto a` poss´ıvel interfereˆncia de efeito de um fator sobre o outro. Por exemplo, duas drogas podem ter efeitos positivos com relac¸a˜o a` sau´de, mas quando combinadas podem trazer resultados negativos. Esta poss´ıvel interac¸a˜o sera´ vista mais adiante. Para melhor compreendermos os tipos de planejamento que podem ocorrer quando temos dois fatores envolvidos em um experimento, consideremos os exemplos a seguir. EXEMPLO 3.1 (Classificac¸a˜o Cruzada) - Uma companhia tem interesse em investi- gar o efeito de prec¸o de venda e tipo de companha publicita´ria nas vendas de um de seus produtos. Para isto ela vai realizar um experimento considerando treˆs prec¸os de venda (R$ 100,00, R$110,00 e R$ 120,00 ) e dois tipos de campanha publicita´ria (anu´ncio em ra´dio e anu´ncio em jornal). Temos, neste exemplo, um experimento com dois fatores: prec¸o de venda (fator A) e tipo de campanha publicita´ria (fator B) com 2 e 3 n´ıveis, respectivamente. Combinado cada n´ıvel de A com um n´ıvel de B, obtemos 6 tratamentos, descritos na Tabela 3.1. Tabela 3.1 - Experimento com 2 fatores Classificac¸a˜o cruzada Tratamento Descric¸a˜o 1 R$100,00 ra´dio 2 R$110,00 ra´dio 3 R$120,00 ra´dio 4 R$100,00 jornal 5 R$110,00 jornal 6 R$120,00 jornal EXEMPLO 3.2 (Classificac¸a˜o Hiera´rquica)- Um industrial tem treˆs ma´quinas que produzem um tipo de bacia de pla´stico. Dois operadores diferentes trabalham em uma 40 Experimentos com Dois Fatores das ma´quinas. Seu objetivo e´ avaliar o efeito de ma´quina e operador na flexibilidade do produto. Os fatores de interesse neste experimento sa˜o tipo de ma´quina (fator A) com treˆs n´ıveis e operador (fator B) com dois n´ıveis. Combinando os n´ıveis desses fatores obtemos 6 tratamentos, descritos na Tabela 3.2. Tabela 3.2 - Experimento com 2 fatores Classificac¸a˜o Hiera´rquica Tratamento Descric¸a˜o 1 Ma´quina 1 Joa˜o 2 Ma´quina 1 Carlos 3 Ma´quina 2 Raimundo 4 Ma´quina 2 Antoˆnio 5 Ma´quina 3 Jose´ 6 Ma´quina 3 Nonato Notemos que, no Exemplo 3.1 os treˆs prec¸osde vendas considerados sa˜o os mesmos para cada tipo de veiculac¸a˜o publicita´ria. Ja´ no Exemplo 3.2, os fatores se combinam de uma forma diferente, pois os operadores diferem de ma´quina para ma´quina. Em experimentos do tipo considerado no Exemplo 3.1, onde cada n´ıvel de um fator esta´ combinado com todos os n´ıveis do outro fator, dizemos que os fatores obedecem a uma classificac¸a˜o cru- zada (experimentos cruzados). Em experimentos nos quais existe uma hierarquia entre os n´ıveis dos fatores, isto e´, os n´ıveis de um fator (operador) sa˜o espec´ıficos a cada n´ıvel do outro fator (ma´quina), temos uma classificac¸a˜o hiera´rquica (experimentos hiera´rquicos). Dizemos neste caso que “operador”e´ um subfator do fator “ma´quina”. A ana´lise estat´ıstica de um experimento com dois fatores depende da forma como eles esta˜o combinados e tambe´m do fato deles serem fixos ou aleato´rios. Vamos apresentar a ana´lise de cada tipo de experimento isoladamente. Antes, pore´m, e´ necessa´rio introduzir- mos a notac¸a˜o que vai ser adotada neste cap´ıtulo. 3.2 Notac¸a˜o Adotamos neste cap´ıtulo a notac¸a˜o abaixo para quantidades e paraˆmetros. Vale ressal- tar que estamos supondo, por facilidade, que o experimentos e´ balanceado, ou seja, todos os tratamentos teˆm o mesmo nu´mero de observac¸o˜es. • a e´ o nu´mero de n´ıveis do fator A; Peres, Tavares & Madruga 3.3 Experimentos cruzados fixos 41 • b e´ o nu´mero de n´ıveis do fator B; • r e´ o nu´mero de obseervac¸o˜es a cada tratamento; • ni. = br e´ o nu´mero de observac¸o˜es no i-e´simo n´ıvel de A; • n.j = ar e´ o nu´mero de observac¸o˜es no j-e´simo n´ıvel de B; • n = abr e´ o nu´mero total de observac¸o˜es; • yijk e´ a observac¸a˜o correspondente a` k-e´sima unidade experimental submetida ao i-e´simo n´ıvel de A e j-e´simo n´ıvel de B; • µij e´ a me´dia populacional da varia´vel dependente no i-e´simo n´ıvel de A e j-e´simo n´ıvel de B; • µi. e´ a me´dia populacional da varia´vel dependente no i-e´simo n´ıvel de A; • µ.j e´ a me´dia populacional da varia´vel dependente no j-e´simo n´ıvel de B; • µ e´ a me´dia populacional da varia´vel dependente livre de qualquer tratamento. Os estimadores dos paraˆmetros de me´dias µij , µi., µ.j e µ, sa˜o dados, respectivamente, por y¯ij. = 1 n r∑ k=1 yijk y¯i.. = 1 n.j b∑ j=1 r∑ k=1 yijk y¯.j. = 1 n.j a∑ i=1 r∑ k=1 yijk y¯... = 1 n a∑ i=1 b∑ j=1 r∑ k=1 yijk 3.3 Experimentos cruzados fixos Nesta sec¸a˜o consideramos experimentos com dois fatores fixos obedecendo a uma clas- sificac¸a˜o cruzada, que e´ a Peres, Tavares & Madruga 42 Experimentos com Dois Fatores 3.3.1 Modelo O modelo associado a este tipo de experimento e´ yijk = µ+ αj. + βj + αβij + eijk (3.1) com i = 1, . . . , a; j = 1, . . . , b; k = 1, . . . , r, onde: αi e´ o efeito do i-e´simo n´ıvel do fator A, definido como: αi = µi. − µ βj e´ o efeito do j-e´simo n´ıvel do fator B, definido como: βj = µ.j − µ αβij e´ o efeito da interac¸a˜o entre o i-e´simo n´ıvel de A e o j-e´simo n´ıvel de B e e´ definido como: αβij = µij − (µ+ αi + βj) αβij = µij − µi. − µ.j + µ eijk e´ um erro casual associado a` observac¸a˜o yijk. 3.3.2 Suposic¸o˜es associadas ao modelo Vamos supor que os erros eijk sa˜o varia´veis aleato´rias independentes e identicamente distribu´ıdas com distribuic¸a˜o N(0, σ2), isto e´, eijk ∼ N(0, σ2), independentes Das definic¸o˜es dos paraˆmetros do modelo seguem-se as seguintes restric¸o˜es: a∑ i=1 αi = 0, b∑ j=1 βj = 0; a∑ i=1 αβij = 0,∀j e b∑ j=1 αβij = 0,∀i; Como consequ¨eˆncia das suposic¸o˜es feitas sobre a distribuic¸a˜o dos erros, temos que: yijk ∼ N(µ+ αi + βj , σ2), independentes. Peres, Tavares & Madruga 3.3 Experimentos cruzados fixos 43 3.3.3 Interpretac¸a˜o dos paraˆmetros do modelo Efeitos principais: os efeitos αi e βj , i = 1, . . . , a; j = 1, . . . , b sa˜o denominados efeitos principais. Observando o modelo (3.1), notamos que, se na˜o existe efeito de interac¸a˜o, yijk = µ+ αj. + βj + eijk Dizemos neste caso que os efeitos de A e B sa˜o aditivos. Em experimentos deste tipo toda a informac¸a˜o sobre o efeito dos fatores A e B na varia´vel dependente pode ser obtida fazendo-se infereˆncias apenas sobre as me´dias µj. e µ.j . Isto decorre do fato de que, em experimentos aditivos, a diferenc¸a entre as me´dias populacionais em quaisquer 2 n´ıveis de um fator a mesma qualquer que seja o n´ıvel do outro fator, isto e´: µij − µi′j = c1 i 6= i′, µij − µij′ = c2 j 6= j′, onde c1 e c2 sa˜o constantes. Em experimentos onde ocorre interac¸a˜o, essa diferenc¸a na˜o e´ constante, ou seja, o padra˜o de diferenc¸a, entre os n´ıveis de um fator depende dos n´ıveis do outro fator. Consideremos, por exemplo, um experimento com dois fatores A e B com 2 e 3 n´ıveis respectivamente. Na Figura 3.1(d) representamos graficamente a existeˆncia de interac¸a˜o e na Figura 3.1(c) a na˜o existeˆncia de interac¸a˜o desse efeito. Esses gra´ficos sa˜o conhecidos como Gra´ficos de Perfis e sa˜o extremamente u´teis em uma primeira averiguac¸a˜o vusual sobre interac¸o˜es entre fatores, podendo haver as seguintes situac¸o˜es: (a) Existe efeito de A, mas na˜o de B (b) Existe efeito de B, mas na˜o de A (c) Existe efeito de A, de B, mas na˜o de interac¸a˜o AB (d) Existe efeito de A, de B, e interac¸a˜o AB (e) Na˜o existe nenhum efeito Pela pro´pria definic¸a˜o, αβij e´ a diferenc¸a entre µij e o valor que deveria ser esperado se os fatores fossem aditivos. Em experimentos onde existe efeito de interac¸a˜o, para avali- armos os efeitos existentes na varia´vel dependente, devemos verificar o efeito de um fator dentro da cada n´ıvel do outro. Por exemplo, interac¸a˜o entre um fator Droga (com 2 n´ıveis, digamos) e o fator Sexo, indica que o efeito da droga na˜o e´ o mesmo para homens e mu- lheres; se no primeiro n´ıvel da droga a resposta me´dia for maior para o sexo masculino, no segundo n´ıvel a diferenc¸a pode aumentar ainda mais, inverter-se, ou ainda tornar-se nula. Peres, Tavares & Madruga 44 Experimentos com Dois Fatores Figura 3.1 Gra´ficos de Perfis (a) Efeito de A, mas não de B 4 4,5 5 5,5 6 6,5 7 7,5 B1 B2 B3 Níveis do Fator B M éd ia da v ar iá v el re sp o st a A1 A2 Efeito de A e B, com interação 4 6 8 10 12 14 16 B1 B2 B3 Níveis do Fator B M éd ia da v ar iá v el re sp o st a A1 A2 (c) Efeito de A e B, sem interação 4 5 6 7 8 9 10 11 12 13 B1 B2 B3 Níveis do Fator B M éd ia da v ar iá v el re sp o st a A1 A2 (b) Efeito de B, mas não de A 4 5 6 7 8 9 10 11 B1 B2 B3 Níveis do Fator B M éd ia da v ar iá v el re sp o st a A1 A2 3.3.4 Hipo´teses Nossas hipo´teses gerais sa˜o: H01 : α1 = α2 = . . . = αa = 0 (na˜o existe efeito do fator A) H02 : β1 = β2 = . . . = βb = 0 (na˜o existe efeito do fator B) H03 : αβ11 = αβ12 = . . . = αβab = 0 (na˜o existe efeito de interac¸a˜o). 3.3.5 Partic¸a˜o da soma dos Quadrados Total Consideremos a identidade: yijk − y¯.. = (y¯i.. − y¯...) + (y¯.j. − y¯...) + (y¯ij. − y¯i.. − y¯.j. + y¯...) + (yijk − y¯ij.) = αˆi + βˆj + αˆβij + eˆijk (3.2) Peres, Tavares & Madruga 3.3 Experimentos cruzados fixos 45 Elevando ao quadrado ambos os lados dessa relac¸a˜o e somando em relac¸a˜o aos ı´ndices i, j e k, obtemos: SQT = SQA+ SQB + SQR. SQT e´ denominada soma de quadrados total e e´ uma medida de variabilidade das ob- servac¸o˜es em relac¸a˜o a` me´dia geral estimada; SQA, denominada soma dos quadrados do fator A, e´ uma medida da variabilidade das me´dias amostrais dos n´ıveis de A em relac¸a˜o a y¯.... Da mesma
Compartilhar