Prévia do material em texto
MATERIAL DIDÁTICO Parte II Estatística Experimental – Medicina Veterinária Faculadade de Ciências Agrárias e Veterinárias Campus de Jaboticabal – SP Gener Tadeu Pereira 2º SEMESTRE DE 2017 ÍNDICE AULA 7 DELINEAMENTO QUADRADO LATINO (DQL). 123 7º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL 138 AULA 8 EXPERIMENTOS FATORIAIS 140 8º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL 152 AULA 9 EXPERIMENTOS FATORIAIS: ANALISANDO UM FATORIAL A X B 158 9º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL 170 AULA 10 EXPERIMENTOS EM PARCELA SUBDIVIDIDA 172 10º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL 184 AULA 11 EXPERIMENTOS EM PARCELAS SUBDIVIDIDAS - ANÁLISE DE MEDIDAS REPETIDAS NO TEMPO. 186 AULA 12 TRANSFORMAÇÃO DE DADOS 190 123 Estatística Experimental Aula 7 Delineamento Quadrado Latino (DQL). 1 Introdução No delineamento Quadrado Latino os tratamentos são designados aos blocos de duas maneiras diferentes, geralmente designados por colunas e linhas. Cada coluna e cada linha é um bloco completo de todos os tratamentos. Portanto, em um DQL, três fontes de variação explicáveis são identificáveis: linhas, colunas e tratamentos. Um particular tratamento é designado somente uma vez em cada linha e cada coluna. Geralmente um dos blocos corresponde aos animais e o outro ao período. Cada animal receberá todos os tratamentos em diferentes períodos. O número de tratamentos (k) é igual ao número de linhas e colunas. O número total de observações é igual k2. Se os tratamentos são designados por letras maiúsculas (A, B, C e D, etc.), então exemplos de Quadrados Latinos 3 x 3 e 4 x 4 são: A C B C A B A B D C C D B A B A C A B C C A B D D B A C C B A B C A B D C A B A C D D C A B A C D B Considere a seguinte situação (baseado em VIEIRA, 2006, pág. 18): Um veterinário pretende comparar o efeito de três drogas no combate a uma doença em suínos. Os animais disponíveis são, no entanto, diferentes em raças e em pesos. Para fazer o experimento, o veterinário deve, primeiro organizar blocos de animais de mesma raça (em coluna) e depois organizar em peso (em linha). Na Figura abaixo: a raça está representada pela tonalidade da cor preta e o peso pelo tamanho. Então foram construídos blocos em “colunas” e “linhas” Construído o quadrado latino, sorteiam-se os tratamentos, mas cada tratamento só deve aparecer uma vez em cada “coluna” e uma vez em cada “linha”. Assim o sorteio dos tratamentos tem duas restrições: “dentro” de linhas e dentro de “colunas” Os DQL não são comuns na prática devido às restrições do delineamento. Notem, por exemplo, que linhas, colunas e tratamentos são, necessariamente, iguais em números. Mais ainda, o nº de observações é igual ao quadrado do nº de tratamentos. Considere este outro exemplo, extraído de Rao, P.V. Statistical research methods in the life science, pg 727: Em um estudo para comparar as 124 Estatística Experimental tolerâncias de gatos a quatro substâncias cardíacas (A, B, C, D) foi conduzida utilizando-se um DQL, no qual as linhas representavam quatro combinações de dois períodos (A.M. , P.M.) e duas técnicas (I e II) e as colunas representam os dias nos quais as medidas foram feitas. A cada um dos 16 gatos foi administrada uma substância cardíaca a uma taxa fixada e a dose (taxa de infusão x tempo) na qual o efeito especificado foi observado foi anotado. Abaixo temos que mostra as respostas medidas em 10log(dose em μg). 1 2 3 4 ..iY iY I,AM ︶︵11 DY 3,26 ︶︵12 BY 4,15 ︶︵13 AY 3,02 ︶︵14 CY 3,67 1Y 14,10 1Y I,PM ︶︵21 BY 2,73 ︶︵22 DY 3,38 ︶︵23 CY 3,29 ︶︵24 AY 4,50 2Y 13,90 2Y II,AM ︶︵31 AY 3,45 ︶︵32 CY 4,09 ︶︵33 BY 2,66 ︶︵34 DY 3,51 3Y 13,71 3Y II,PM ︶︵41 CY 3,20 ︶︵42 AY 3,14 ︶︵43 DY 3,48 ︶︵44 BY 3,40 4Y 13,22 4Y jY 1Y 12,64 2Y 14,76 3Y 12,45 4Y 15,08 Y 54,93 jY 1Y 2Y 3Y 4Y Y Totais dos tratamentos: 11,1414,345,350,402,3︶︵︶︵︶︵︶︵︶︵ 42312413 AYAYAYAYAY 94,1240,366,273,215,4︶︵︶︵︶︵︶︵︶︵ 44332112 BYBYBYBYBY 25,1420,309,429,367,3︶︵︶︵︶︵︶︵︶︵ 41322314 CYCYCYCYCY 63,1348,351,338,326,3︶︵︶︵︶︵︶︵︶︵ 43342211 DYDYDYDYDY Notação: iY = soma das observações da i-ésima linha (i = 1, 2,..., k); iY = soma das observações da j-ésima coluna (j=1,2, ..., k); )( tY = soma das observações do t-ésimo tratamento Organização dos arquivos: No excel: ex1.xls No bloco de notas: ex1.txt linha coluna trat y TI_AM DIA1 D 3.26 TI_AM DIA2 B 4.15 TI_AM DIA3 A 3.02 TI_AM DIA4 C 3.67 TI_PM DIA1 B 2.73 TI_PM DIA2 D 3.38 TI_PM DIA3 C 3.29 TI_PM DIA4 A 4.50 TII_AM DIA1 A 3.45 TII_AM DIA2 C 4.09 TII_AM DIA3 B 2.66 TII_AM DIA4 D 3.51 TII_PM DIA1 C 3.20 TII_PM DIA2 A 3.14 TII_PM DIA3 D 3.48 TII_PM DIA4 B 3.40 linha coluna trat y TI_AM DIA1 D 3,26 TI_AM DIA2 B 4,15 TI_AM DIA3 A 3,02 TI_AM DIA4 C 3,67 TI_PM DIA1 B 2,73 TI_PM DIA2 D 3,38 TI_PM DIA3 C 3,29 TI_PM DIA4 A 4,50 TII_AM DIA1 A 3,45 TII_AM DIA2 C 4,09 TII_AM DIA3 B 2,66 TII_AM DIA4 D 3,51 TII_PM DIA1 C 3,20 TII_PM DIA2 A 3,14 TII_PM DIA3 D 3,48 TII_PM DIA4 B 3,40 Dias Combinações de tempo e técnicas 125 Estatística Experimental 2 Modelo matemático colunaésimajelinhaésimaina usadotratamentodoçãoidentificadeindiceoék rjeriCLY kijkjikij ,,,,,,, ︶︵︶︵ 2121 sendo: . ;, ; ; ; ; , ︶︵ ︶︵ aleatórioerrodoefeitooé etratamentoésimotdofixoefeitoé colunaésimajdaefeitoéC linhaésimaidaefeitooéL sobservaçõeastodasacomumgeralmédiaé colunaésimajnae linhaésimainatratamentoésimokorecebeuqueobservaçãoay kij t kk j j kij 0 3 Suposições do modelo Neste modelo, supõem-se que: ︶;,0︵ 2 Lj NtesindependensãoL ; ︶,0︵ 2 Cj NtesindependensãoC ︶,︵︶︵ 20 Ntesindependensãokij jikij CeL ,,︶︵ são mutuamente independentes. 4 Hipótese estatística Podemos testar 0 0 1 0 t k ostodosnemH H : ,: , ou jiparaH H ji t : ...: 1 210 Geralmente os testes de hipóteses com relação aos efeitos de linhas e colunas não são feitos por dois motivos: primeiro o interesse principal é testar os efeitos de tratamento, e o propósito usual de linhas e colunas é eliminar fontes estranhas de variação. 5 Participação da soma de quadrados Do quadro de representação das observações no DQL, podemos notar os seguintes desvios: Podemos identificar os seguintes desvios: yy kij ︶︵ , como o desvio de uma observação em relação à média geral; yy kij ︶︵ , como o desvio da média do t-ésimo tratamento em relação à média geral; yy i , como o desvio da média da i-ésimo linha em relação á média geral; yy j como o desvio da média da j-ésima coluna em relação á média geral; Então, podemos escrever a igualdade: 126 Estatística Experimental ︶︵︶︵︶︵︶︵︶︵ ︶︵︶︵ YYYYYYYYYYYYY kjikijkjikij 2 a qual representa a “ a variação de uma observação em relação à média geral amostral como uma soma da variaçãoda média da i-ésima linha em relação à média geral, com a variação da média da j-ésima coluna em relação à média geral, com a variação da média da j-ésima coluna em relação à média geral, com a variação da média do k-ésima tratamento em relação à média geral, e com a variação do erro experimental “. Elevando-se ao quadrado os dois membros da identidade acima e somando em relação aos índices i e j, obtemos: , ︶︵ ︶︵︶︵︶︵︶︵ ︶︵ ︶︵ k i k j k t kjikij k t k k j j k i i k i k j kij YYYYY YYYYYYYY 1 1 1 2 1 2 1 2 1 2 1 1 2 2 ou seja, a Soma de Quadrados do Total (SQT) é igual à Soma de Quadrados do efeito colocado nas linhas (SQL), mais a Soma de Quadrados do efeito colocado nas colunas (SQC), mais a Soma de Quadrados dos Tratamentos (SQTr), mais a Soma de Quadrados dos resíduos (SQR). Notem que existem k2 observações, então a SQT tem (k2 -1) graus de liberdade. Existe k – linhas, k – colunas e k – tratamentos, tal que cada uma das três soma de quadrados SQL, SQC e SQTr tem k-1 graus de liberdade. Finalmente, os graus de liberdade para SQR pode ser calculado pela diferença entre os graus de liberdade entre a SQT e soma dos graus de liberdade para linhas, colunas e tratamentos. ((k2-1)-(k-1)-k-1)-(k-1)=(k-1)(k-2)). Assim, os graus de liberdade associados a cada membro da equação acima fica: Total Linhas Colunas Tratamentos Resíduo ( k2 -1) = (k-1) + (k-1) + (k-1) + (k-1)(k-2) 6 Quadrados médios Dividindo a SQL, SQC, SQTr e SQR pelos correspondentes graus de liberdade, obtemos, respectivamente o Quadrado Médio das Linhas (QML), o Quadrado Médio das Colunas (QMC) , o Quadrado Médio de Tratamentos (QMTr) e o Quadrado Médio Resíduo (QMR), isto é, ︶2︶ ︵1︵11 , 1 kk SQRQMRe k SQTrQMTre k SQCQMC k SQLQML 7 Estatística e região crítica do teste A estatística para o teste é QMR QMTrFc , a qual, deve ser próximo de 1 se H0 for verdadeira, enquanto que valores grandes dessa estatística são uma indicação de que H0 é falsa. A teoria nos assegura que Fc tem, sob H0 distribuição F – Snedecor com (k -1) e (k-1)(k-2) graus de liberdade no numerador e no denominador, respectivamente. Resumidamente, indicamos: 0︶︶,2︶ ︵1︵,1︵ ,~ HsobFF kkkc . Rejeitamos H0 para o nível de significância se )),)((,( 2k1k1kc FF , 127 Estatística Experimental sendo, )),)((,( 2k1k1kF o quantil de ordem )( 1 da distribuição F-Snedecor com (k -1) e (k-1)(k-2) graus de liberdade no numerador e no denominador. 8 Quadro da análise de variância (ANOVA) Dispomos as expressões necessárias ao teste na Tabela abaixo, denominada de Quadro de Análise de Variância (ANOVA). Fonte de variação gl SQ QM F Linhas k - 1 2 2 1 2 k Y k yk i j kij ︶︵︶︵ 1k SQL Colunas k – 1 2 2 1 1 2 k Y k yk j i kij ︶︵︶︵ 1k SQC Tratamentos k - 1 2 2 1 2 k Y k yk t i kij ︶︵︶︵ 1k SQTr QMR QMTr Resíduo (k-1)(k-2) ︶︶ ︵︵ 21 kk SQR TOTAL K2 – 1 k i k J kij k YY 1 1 2 2 2 ︶︵ ︶︵ Pode-se provar que: 2QMRE )( , ou seja, QMR é um estimador não viesado da variância 2 ; k i ik rQMTrE 1 2 ︶1︵ ︶︵ , ou seja, QMTr é um estimador não viesado da variância 2 se a hipótese 0H k210 ...: é verdadeira. 9 Detalhes computacionais Apresentaremos alguns passos que facilitam os cálculos das somas de quadrados da ANOVA. Calcule a correção para a média 2 2 k yCM ︶︵ ; Calcule a Soma de Quadrados dos Totais (SQT) CMySQT k i k j kij 1 1 2 ︶︵ ; Calcule a Soma de Quadrados Entre os Tratamentos (SQTr) CM k y SQTr k t i kij 1 2 ︶︵ ; 128 Estatística Experimental Calcule a Soma de Quadrados das Linhas (SQL) CM k y SQL k i j kij 1 2 ︶︵ ; Calcule a Soma de Quadrados de Colunas (SQC) CM k y SQC k j i kij 1 1 2 ︶︵ ; Calcule a Soma de Quadrados Residual (SQR) pela diferença, isto é, SQTrSQCSQLSQTSQR ; Calcule os Quadrados Médios Entre os Tratamentos (QMTr) e o Quadrado Médio Residual (QMR) ︶2︶ ︵1︵1 , 1 , 1 kk SQRQMRe k SQTrQMTr k SQCQMC k SQLQML Calcule Fc para tratamentos, linhas e colunas, ou seja, QMR QMCFe QMR QMLF QMR QMTrF CLcTr , 10 Exemplo 1: Vamos considerar os dados do exemplo apresentado no item1. Os cálculos para montar-mos o quadro da ANOVA são: k = 4, e k2 = N =16. Então Graus de liberdade: 8242k1ks e3141kColunas3141kLinhas 3141kTrat151161N1kTotal 2 ))(())((Re , .; 5816,188 16 ︶94,54︵ 2 CM 6055,35816,1881871,192 ︶40,3︵...︶15,4︵︶26,3︵ 222 CMSQT 2331,05816,1888147,188 4 ︶63,13︵ 4 ︶25,14︵ 4 ︶94,12︵ 4 ︶11,14︵ 2222 CMSQTr 1065,05816,1886881,188 4 ︶22,13︵ 4 ︶71,13︵ 4 ︶90,13︵ 4 ︶10,14︵ 2222 CMSQL 4274,15816,1880090,190 4 ︶08,15︵ 4 ︶45,12︵ 4 ︶76,14︵ 4 ︶64,12︵ 2222 CMSQC 8384,14274,11065,02331,06055,3 SQCSQLSQTrSQTSQR 129 Estatística Experimental 3015,0 6 8094,1 4758,0 3 4274,1,0355,0 3 1065,0,0771,0 3 2331,0 QMRe QMCQMLQMTr 5530,1 3064,0 4758,0 1159,0 3016,0 0355,02899,0 3064,0 08741,0 QMR QMCF QMR QMLFe QMR QMTrF cC cLcTr Organizando estes resultados no Quadro da ANOVA, temos: Fonte de variação gl SQ QM F Linhas 3 0,1065 0,0355 Colunas 3 1,4274 0,4758 Tratamentos 3 0,2331 0,08741 0,2899 Resíduo 6 1,8384 0,3015 TOTAL 15 3,6055 Das tabelas das distribuições F, temos que 789Fe764F 0106305063 ,, ),,,(),,,( . O valor FcTr = 0,2899 é menor do que estes valores tabelados, então não rejeitamos a hipótese nula H0 para um nível %,, 5ou050 de probabilidade e concluímos que os dados não evidenciam uma diferença significativa entre as quatros drogas. Os dados também não evidenciam uma variação significativa entre os efeitos colocados nas linhas (p=0,946) e nas colunas (p=0,290). Seguindo o que alguns pesquisadores sugerem não consideraríamos os efeitos de linhas e colunas em futuros experimentos, tendo em vista que o valor do nível de significância para linhas e colunas é superior a 0,25. Script no R para a obtenção dos resultados acima # entrando com os dados pelo comando read.table( ) dados.ex1 <- read.table("ex1dql.txt",header=TRUE,dec=",") # imprimindo as 6 primeiras linhas do arquivo head(dados.ex1) # anexando o objeto dados.ex1 no caminho de procura attach(dados. ex1) # estatísticas resumo de cada nível dos tratamentos e.desc<- tapply(tx.inf,trat,summary) e.desc # gráfico Box-plot para cada nível de trat boxplot(tx.inf~trat,col=2,xlab="Tratamentos") # quadro da anova 130 Estatística Experimental tx.inf.av<-aov(tx.inf~factor(linha)+factor(coluna)+factor(trat)) summary(tx.inf) # obtendo o residuo residuo <- resid(tx.inf.av) # teste de normalidade dos resíduos shapiro.test(residuo) # teste de homogeneidade das variâncias bartlett.test(tx.inf~factor(linha)+factor(coluna)+factor(trat)) # requerendo o pacote ExpDes require(ExpDes) # quadro da anova pelo ExpDes latsd(trat,linha,coluna,tx.inf,quali=T) # retirando o objeto dados.ex1 do caminho de procura detach(dados.ex1) Exemplo 2. Com o objetivo de estudar o efeito da idade da castração no desenvolvimento e produção de suínos, foi utilizado um delineamento em quadrado latino com 4 tratamentos envolvendo a castração aos 7 dias (C); aos 21 dias(D); aos 56 dias (A) e suínos inteiros (B). A variação existente entre as leitegadas foi controlada pelas linhas do quadrado e a variação dos pesos dos leitões dentro das leitegadas foi isolada pelas colunas. Os ganhos de peso, em kg, ao final do experimento (252 dias) estão apresentados no quadro a seguir: Leitegada Classe de pesos dos leitões dentro das leitegadas 1 2 3 4 Totais 1 93,0 (A) 108,6 (B) 118,9 (C) 102 (D) 412,5 2 115,4 (B) 96,5 (D) 77,9 (A) 120,2 (C) 390,0 3 122,1 (C) 90,9 (A) 116,9 (D) 106,0 (B) 409,9 4 117,6 (D) 124,1 (C) 118,7 (B) 95,6 (A) 448,0 Totais 428,1 414,1 422,4 395,8 1660,4 Quadro da ANOVA Fonte de variação gl SQ QM F Leitegadas 3 436,55 49,65 0,72 Classe 3 148,95 145,52 2,11 Tratamentos 3 913,57 304,52 4,42 Resíduo 6 413,00 68,83 TOTAL 15 1912,07 Das tabelas das distribuições F, temos que 789Fe764F 0106305063 ,, ),,,(),,,( . O valor FcTr = 4,42 é menor do que estes valores tabelados, então não rejeitamos a hipótese nula H0 para um nível 131 Estatística Experimental %,, 5ou050 de probabilidade e concluímos que a hipótese de que os efeitos de tratamento são todos nulos não é rejeitada, ou seja, os ganhos de peso dos leitões submetidos às diferentes idades de castração são todos iguais a 103,78. Script no R para a obtenção destes resultados # leitura dos dados pelo read.table dados.ex2 <- read.table("ex2dql.txt",header=TRUE) # imprimindo as 6 linhas iniciais do arquivo head(dados.ex2) # anexando o objeto dados.ex3 no caminho de procura attach(dados.ex2) # estatísticas resumo dos dados do arquivo dados.ex2 e.desc<- tapply(peso,trat,summary) e.desc # gráfico Box-plot para cada nível de trat boxplot(peso~trat,col=2,xlab="Tratamentos") # fazendo a análise diretamente pelo ExpDes # requerendo o ExpDes require(ExpDes) # quadro da anova latsd(trat,leitegada,classe,peso,quali=T,mcomp="tukey") # retirando o objeto dados.ex2 do caminho de procura detach(dados.ex2) 11 Como contornar o problema do pequeno número de graus de liberdade do resíduo? Um problema que surge quando usamos o delineamento em quadrado latino com um número pequeno de tratamentos, é que o resíduo passa a ser estimado com um número pequeno de graus de liberdade. No quadro a seguir, apresentamos o número de graus de liberdade do resíduo no DQL para diferentes números de tratamentos: Número de tratamentos g.l. do resíduo 3 2 4 6 5 12 6 20 7 30 8 42 RESPOSTA: Planejar mais de uma repetição do quadrado latino para conseguir um número satisfatório de graus de liberdade para o resíduo. Por exemplo, se k = 4 tratamentos e queremos um número de g.l. para o resíduo superior a 12, devemos fazer pelo menos r = 2 repetições do Q.L. original. Solução 1: usar as mesmas linhas e mesmas colunas; 132 Estatística Experimental QL1 C1 C2 C3 C4 QL2 C1 C2 C3 C4 L1 A B C D L1 D A B C L2 B C D A L2 C D A B L3 C D A B L3 B C D A L4 D A B C L4 A B C D Quadro da ANOVA resultante Causas de variação gl QL r – 1 = 1 Tratamentos k – 1 = 3 Linhas k – 1 = 3 Colunas k – 1 = 3 Resíduo (k – 1)[ r (k + 1) – 3] = 21 Total r k2 – 1 = 31 Solução 2: usar as mesmas linhas com as colunas diferentes (ou mesmas colunas com linhas diferentes); QL1 C1 C2 C3 C4 QL2 C5 C6 C7 C8 L1 A B C D L1 D A B C L2 B C D A L2 C D A B L3 C D A B L3 B C D A L4 D A B C L4 A B C D Quadro da ANOVA resultante Causas de variação gl QL r – 1 = 1 Tratamentos k – 1 = 3 Linhas k – 1 = 3 Colunas (QL) r ( k – 1 ) = 6 Resíduo (k – 1)(r k – 2 )= 18 Total r k2 – 1 = 31 Solução 3: usar linhas e colunas diferentes. QL1 C1 C2 C3 C4 QL2 C5 C6 C7 C8 L1 A B C D L5 D A B C L2 B C D A L6 C D A B L3 C D A B L7 B C D A L4 D A B C L8 A B C D Quadro da ANOVA resultante Causas de variação gl QL r – 1 = 1 Tratamentos k – 1 = 3 Linhas (QL)* r ( k - 1) = 6 Colunas (QL)** r ( k - 1) = 6 Resíduo (k – 1) [ k (k – 1) –1]=15 Total r k2 – 1 = 31 (*) lê-se “Efeito de linhas dentro de quadrado latino” (**) lê-se “Efeito de colunas dentro de quadrado latino” 133 Estatística Experimental Suponha que um experimentador esteja interessado em estudar os efeitos da atividade da estimulação hormonal folicular (follicle-stimulation hormone - FSH). Em vacas é medido em bio ensaios pesando-se o ovário (mg) de ratos imaturos. Duas variáveis conhecidas que influenciam no peso de ovários de ratos são: a constituição genética e o peso corporal. Acredita-se que o peso corporal é independente das diferenças genéticas, assim o delineamento quadrado latino (DQL) é adequado. Dois quadrados latinos 4 x 4 foram usados com as linhas = ninhadas de ratos e colunas = classes de peso corporal. O pesquisador considerou a diferença nos pesos corporais nos dois quadrados para preservar os graus de liberdade do erro experimental, dado que a amplitude do peso corporal era consistente de ninhada para ninhada, ou seja, o pesquisador repetiu o experimento considerando as mesmas classes de peso corporal. (Solução 2). QL1 C1 C2 C3 C4 Totais QL2 C1 C2 C3 C4 Totais L1 (D) 44 (C) 39 (B) 52 (A) 73 208 L5 (B) 51 (C) 74 (A) 74 (D) 82 281 L2 (B) 26 (A) 45 (D) 49 (C) 58 178 L6 (D) 62 (A) 74 (C) 75 (B) 79 290 L3 (C) 67 (D) 71 (A) 81 (B) 76 295 L7 (A) 71 (D) 67 (B) 60 (C) 74 272 L4 (A) 77 (B) 74 (C) 88 (D) 100 339 L8 (C) 49 (B) 47 (D) 58 (A) 68 222 Totais 214 229 270 307 1020 233 251 267 303 1065 Totais dos tratamentos: 563 (A), 465 (B), 524 (C), 533 (D) Cálculos: 694891 32 10651020 4 222178208 SQL 2222 , )(... ; ;, )()(...)( 091819 32 10651020 8 303307233214 SQC 222 ;, )(... 59631 32 10651020 8 533563 SQTr 222 ;, )( ... 227788 32 10651020 6844SQT 2 22 ;,56382SQLSQCSQTrSQTSQR O quadro da ANOVA fica Causas de variação gl SQ QM F P QL 1 63,28 63,28 Tratamentos 3 631,59 210,53 9,91 0,0004 Linhas (QL) 6 4891,69 815,28 38,26 Colunas 3 1819,09 606,36 28,53 Resíduo 18 292 16,22 Total 31 7730 Das tabelas das distribuições F, temos que 095Fe163F 010186050183 ,, ),,,(),,,( . O valor Fctr = 9,91 é maior que estes valores tabelados, então rejeitamos a hipótese nula H0 para um nível %,, 1ou010 de probabilidade e concluímos que a hipótese de que os efeitos de tratamento são todos nulos é rejeitada, ou seja, nos pesos dos ovários de ratos imaturos (bio-ensaio para vacas) existe pelo menos dois tratamentos que diferem entre si quanto ao peso de ovários. 134 Estatística Experimental Podemos usar o teste de Tukey para compararmos as médias dos tratamentos (note que temos 4 tratamentos e cada um deles aparece 8 vezes). Então, 51,6 8 25,21 997,3... )05,0,18,4( rk QMR qsmd Drogas Peso médio* (mg) A 70,37 a D 66,63 a C 65,50 a B 58,13 b (* Médias seguidas pelas mesmas letras na coluna não diferem entre si pelo teste de Tukey a 5%). Com base nos resultados apresentados na tabela anterior pode-se afirmar que os pesos de ovários tratados com as drogas A, D e C não diferem entre si e os pesos dos ovários tratados com as drogas C e B também não diferem entre si. As diferenças nos pesos de ovários estão entre as drogas A, D e C quando comparadas, individualmente, com a droga B. Organizando o arquivo de dados no Excel e no bloco de notas Arquivo de dados .xls (peso.xls) Arquivo de dados . txt (peso.txt) ql linha coluna trat put q1 l1 c1 D 44 q1 l2 c1 B 26 q1 l3 c1 C 67 q1 l4 c1 A 77 q1 l1 c2 C 39 q1 l2 c2 A 45 q1 l3 c2 D 71 q1 l4 c2 B 74 q1 l1 c3 B 52 q1 l2 c3 D 49 q1 l3 c3 A 81 q1 l4 c3 C 88 q1 l1 c4 A 73 q1 l2 c4 C 58 q1 l3 c4 B 76 q1 l4 c4 D 100 q2 l5 c1 B 51 q2 l6 c1 D 62 q2 l7 c1 A 71 q2 l8 c1 C 49 q2 l5c2 C 74 q2 l6 c2 A 74 q2 l7 c2 D 67 q2 l8 c2 B 47 q2 l5 c3 A 74 q2 l6 c3 C 75 q2 l7 c3 B 60 q2 l8 c3 D 58 ql linha coluna trat put q1 l1 c1 D 44 q1 l2 c1 B 26 q1 l3 c1 C 67 q1 l4 c1 A 77 q1 l1 c2 C 39 q1 l2 c2 A 45 q1 l3 c2 D 71 q1 l4 c2 B 74 q1 l1 c3 B 52 q1 l2 c3 D 49 q1 l3 c3 A 81 q1 l4 c3 C 88 q1 l1 c4 A 73 q1 l2 c4 C 58 q1 l3 c4 B 76 q1 l4 c4 D 100 q2 l5 c1 B 51 q2 l6 c1 D 62 q2 l7 c1 A 71 q2 l8 c1 C 49 q2 l5 c2 C 74 q2 l6 c2 A 74 q2 l7 c2 D 67 q2 l8 c2 B 47 q2 l5 c3 A 74 q2 l6 c3 C 75 q2 l7 c3 B 60 q2 l8 c3 D 58 q2 l5 c4 D 82 q2 l6 c4 B 79 q2 l7 c4 C 74 q2 l8 c4 A 68 135 Estatística Experimental q2 l5 c4 D 82 q2 l6 c4 B 79 q2 l7 c4 C 74 q2 l8 c4 A 68 Script no R para a obgtenção dos resultados acima # leitura dos dados pelo read.table dados.ex3 <- read.table("ex2dql.txt",header=TRUE) # imprimindo as 6 linhas iniciais do arquivo head(dados.ex3) # anexando o objeto dados.ex3 no caminho de procura attach(dados.ex3) # gráfico Box-plot para cada nível de trat boxplot(peso~trat,col=2,xlab="Tratamentos") # quadro da anova put.av <-aov(put~factor(ql)+factor(linha)+factor(coluna)+factor(trat)) summary(put.av) # usando os recursos do pacote agricolae require(agricolae) put.tu <-HSD.test(put.av,"trat") # gráfico de barras com as letras do teste de Tukey bar.group(put.tu,ylim=c(0,90),density=20, col="brown", xlab="Tratamentos",ylab="Peso do Utero", main="Teste de Tukey") # retirando o objeto dados.ex3 do caminho de procura detach(dados.ex3) 12 Casualização dos tratamentos Suponha que queremos dispor os tratamentos A, B, C, e D sobre um quadrado latino 4 x 4 escolhemos aleatoriamente um dos quadrados padrões de tamanho 4. Suponha 1 2 3 4 1 A B C D 2 B C D A 3 C D A B 4 D A B C selecionemos uma das permutações de 1, 2, 3, e 4. suponha 2, 4, 1, 3. Então 136 Estatística Experimental 1 2 3 4 2 B C D A 4 D A B C 1 A B C D 3 C D A B selecionemos uma outra das permutações de 1, 2, 3, e 4. suponha 1, 3, 4, 2. Então 1 3 4 2 2 B D A C 4 D B C A 1 A C D B 3 C A B D Este é o delineamento escolhido. 13 Exemplos em qua as unidades experimentais são animais Neste tipo de experimento os próprios animais servem como um critério de classificação (linhas) e o tempo (colunas) é o outro, ou seja, medidas repetidas não aleatórias são obtidas de cada animal (pessoa) distribuídos a uma seqüência de tratamentos. Exemplo 4 O objetivo deste experimento foi testar o efeito de quatro diferentes suplementos (A, B, C, D) adicionados ao feno na engorda de novilhos. O experimento foi delineado em um experimento Quadrado Latino com quatro animais em quatro períodos de 20 dias. As ovelhas foram mantidas isoladas individualmente. Cada período consistia de 10 dias de adaptação e de 10 de medidas. Os dados apresentados abaixo são as médias de 10 dias. Novilhos Período N1 N2 N3 N4 1 10,0 (B) 10,2 (C) 8,5 (D) 11,8 (A) 2 9,0 (C) 11,3 (A) 11,2 (B) 11,4 (C) 3 11,1 (C) 11,2 (B) 12,8 (A) 11,7 (D) 4 10,8 (A) 11,0(D) 11,0 (C) 11,0 (B) Script no R para resolver este exemplo # leitura dos dados pelo read.table dados.ex4 <- read.table("ex4dql.txt",header=TRUE) # imprimindo as 6 linhas iniciais do arquivo head(dados.ex4) # anexando o objeto dados.ex4 no caminho de procura attach(dados.ex4) # estatísticas resumo dos tratamentos do arquivo dados.ex4 e.desc<- tapply(peso,trat,summary) e.desc # gráfico Box-plot para cada nível de trat 137 Estatística Experimental boxplot(peso~trat,col=2,xlab="Tratamentos") # fazendo a análise diretamente pelo ExpDes # requerendo o ExpDes require(ExpDes) # quadro da anova latsd(trat,periodo,novilho,peso,quali=T,mcomp="tukey") # retirando o objeto dados.ex4 do caminho de procura detach(dados.ex4) RESUMO: 138 Estatística Experimental 7º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL 1) Nos experimentos que tratam da produção de vacas leiteiras, a enorme variação entre os indivíduos exige um grande número de animais para a avaliação de diferenças moderadas. Qualquer esforço de aplicar vários tratamentos sucessivamente numa mesma vaca se complica pela diminuição do fluxo de leite, pela forma da curva de lactação e por uma correlação entre os erros eijk. Estas dificuldades são controladas com o uso de vários pares de quadrados latinos ortogonais onde as colunas representam as vacas e as linhas os períodos sucessivos da lactação, e os tratamentos são aplicados as vacas nos vários estágios. Num experimento procurou-se verificar o efeito de diferentes tipos de tratamentos, e é apresentado somente um quadrado latino, sem nos preocuparmos com os efeitos correlacionados. Os tratamentos (1,0 kg para cada 3,0 kg de leite produzido) foram os seguintes: A = Ração comum B = 75% de ração comum + 25% de rolão de milho. C = 50% de ração comum + 50% de rolão de milho. D = 75% de ração comum + 25% de farelo de soja. E = 25% de ração comum + 75% de farelo de soja. Os valores da tabela correspondem a produção de leite (kg) por um período de seis semanas. Linhas Colunas (Vacas) Total (Período) 1 2 3 4 5 1 B 318 E 416 A 420 C 424 D 330 1908 2 D 325 A 435 E 418 B 438 C 333 1949 3 E 342 B 441 C 395 D 418 A 380 1976 4 A 353 C 403 D 410 E 395 B 375 1936 5 C 310 D 381 B 422 A 432 E 314 1859 Total 1648 2076 2065 2107 1732 9628 a) Formule as hipóteses estatísticas para os tratamentos e monte o quadro da análise de variância de acordo com um delineamento quadrado latino e conclua b) Aplique o teste de Tukey para localizar as diferenças entre as médias dos tratamentos. Represente as diferenças com as médias (média±se), seguidas de letras. d) Teste a normalidade dos erros e a homogeneidade das variâncias dos tratamentos. e) Defina os contrastes abaixo e teste-os através da técnica de decomposição dos graus de liberdade dos tratamentos (teste F planejado) e complemente o quadro da anova do item b) com estes contrastes: c1) Existe efeito dos complementos adicionados à ração comum?; c2) Qual complemento adicionado à ração comum é melhor: rolão de milho ou farelo de soja?; c3) Qual percentual de rolão de milho é melhor ?; c4) Qual percentual de farelo de soja é melhor ?; f) Calcular e interpretar os coeficiente de variação (CV) do experimento e o de determinação R2 do experimento. g) Com base nestas observações e nos resultados do item a) a utilização do delineamento em DQL é plenamente justificada? 139 Estatística Experimental 2) Avaliação do efeito de anestésicos sobre o metabolismo animal é imprescindível ao cirurgião. Neste experimento são considerados 5 anestésicos e analisar variáveis como: frequência cardíaca,respiratória, pressão sanguínea, tempo efetivo de anestesia. Estas variáveis são muito instáveis com c.v. > 35,0 %. Existe uma reação muito diferente de animal para animal o que exigiria um número muito grande destes ( de 13 a 49 animais) para cada anestésico. Por outro lado estas respostas são de fluxo contínuo. Podemos testar todos os anestésicos, em ocasiões diferentes com intervalos de 2 a 3 dias, no mesmo animal. Se um animal recebe todos os anestésicos, em sequência controlada, todos os demais deverão também recebê-los, mas cada um dos cachorros deverá estar submetido a um anestésico diferente, de modo que, em um mesmo dia, todos os cães e todos os anestésicos estejam sendo testados. Com este procedimento, o eventual efeito de dia poderá estar controlado. A maneira mais simples de se controlar o efeito de dia de experimentação (ou período) e o efeito de cães, é o efeito de controle local (blocos). Uma solução prática que leva em conta os dois tipos de blocagem (período e animal) é o croqui do delineamento quadrado latino (DQL) onde as letras representam um anestésico específico com os seguintes resultados sobre tempo efetivo de anestesia:Período Animal I II III IV V 1 A(8,92) E(4,77) B(6,29) D(9,99) C(6,93) 2 D(4,88) B(7,53) A(12,29) C(8,95) E(8,51) 3 C(7,32) A(10,16) E(8,50) B(4,83) D(7,08) 4 E(6,67) C(5,00) D(5,40) A(11,54) B(8,62) 5 B(4,40) D(7,15) C(8,95) E(7,85) A(13,68) a) Formule as hipóteses estatísticas para os tratamentos e monte o quadro da análise de variância de acordo com um delineamento quadrado latino e conclua b) Aplique o teste de Tukey para localizar as diferenças entre as médias dos tratamentos. Represente as diferenças com as médias (média±se), seguidas de letras. d) Teste a normalidade dos erros e a homogeneidade das variâncias dos tratamentos. e) Calcular e interpretar os coeficiente de variação (CV) do experimento e o de determinação R2 do experimento. f) Com base nestas observações e nos resultados do item a) a utilização do delineamento em DQL é plenamente justificada? 140 Estatística Experimental Aula 8 Experimentos fatoriais 1 Introdução Nos experimentos mais simples comparamos tratamentos ou níveis de um único fator, considerando que todos os demais fatores que possam interferir nos resultados obtidos se mantenham constantes. Por exemplo: quando comparamos tipos de drogas em animais experimentais, os demais fatores, como raça, idade, sexo etc., se mantêm constantes, isto é, devem ser os mesmos para todas as drogas estudadas. Entretanto, existem diversos casos em que vários fatores devem ser estudados simultaneamente. Nesses casos, utilizamo-nos dos experimentos fatoriais, que “são aqueles nos quais são estudados, ao mesmo tempo, os efeitos de dois ou mais tipos de fatores ou tratamentos”. Entenda-se por fator “uma variável independente cujos valores (níveis do fator) são controlados pelo experimentador”. Cada subdivisão de um fator é denominada de nível do fator e os tratamentos nos experimentos fatoriais consistem de todas as combinações possíveis entre os diversos fatores nos seus diferentes níveis. Por exemplo: num experimento fatorial podemos combinar 2 doses de um antibiótico com 3 diferentes níveis de vitamina B12. Neste caso teremos um fatorial 2 x 3, com os fatores Antibióticos (A) e Vitamina (V), que ocorrem em 2 níveis (A1 e A2) e 3 níveis (V1, V2 e V3), respectivamente, e os 2 x 3 = 6 tratamentos são: A1V1 A1V2 A1V3 A2V1 A2V2 A2V3 Outro exemplo: num experimento fatorial 3 x 2 podemos combinar 3 Doses de uma droga (D1, D2 e D3), 2 Idades (I1 e I2) e teremos 3x2 = 6 tratamentos, que resultam de todas as combinações possíveis dos níveis dos 3 fatores, ou seja, D1I1 D1I2 D2I1 D2I2 D3I1 D3I2 Os experimentos fatoriais não constituem um delineamento experimental e sim um esquema orientado de desdobramento de graus de liberdade de tratamentos e podem ser instalados em qualquer um dos delineamentos experimentais já estudados (DIC, DBC e DQL, por exemplo). Em um experimento fatorial nos podemos estudar não somente os efeitos dos fatores individuais, mas também, se o experimento foi bem conduzido, a interação entre os fatores. Para ilustrar o conceito de interação vamos considerar os seguintes exemplos: Suponha que as médias dos 3 x 2 = 6 tratamentos deste último exemplo são apresentadas na tabela abaixo: Fator B - Idade Fator A-(Dose da Droga) I0 I1 D0 5 10 D1 10 15 D2 15 25 141 Estatística Experimental Os seguintes aspectos importantes dos dados na Tabela acima devem ser destacados: Para ambos os níveis do fator B, a diferença entre as médias para quaisquer níveis do fator A é a mesma; Para todos os níveis do fator A, a diferença entre as médias para os dois níveis de B é a mesma; Uma terceira característica é notada por meio do gráfico. Notamos que as curvas correspondentes aos diferentes níveis de um fator são todas paralelas. Quando os dados da população possuem estas três características listadas acima, dizemos que não existe interação presente entre os fatores. A presença de interação entre os fatores pode afetar as características dos dados de várias formas dependendo da natureza da interação. Vamos ilustrar o efeito de um tipo de interação modificando os dados da tabela apresentada anteriormente Fator B: Idade Fator A: Dose da Droga I0 I1 D0 5 15 D1 10 10 D2 20 5 Os seguintes aspectos importantes dos dados na Tabela acima devem ser destacados: A diferença entre as médias para qualquer dos dois níveis de A não é a mesma para ambos os níveis de B; A diferença entre as médias para ambos os níveis do fator B não é o mesmo nos níveis do fator A; As curvas dos fatores não são paralelas, como é mostrado nos gráficos abaixo; 142 Estatística Experimental Quando os dados da população exibem as características acima, dizemos que existe interação entre os dois fatores. Enfatizamos que o tipo de interação ilustrada acima é somente uma das dos muitos tipos de interação que podem ocorrer entre dois fatores. Em resumo, podemos afirmar que “existe interação entre dois fatores se uma modificação em um dos fatores produz uma modificação na resposta em um dos níveis do outro fator diferente dos produzidos nos outros níveis deste fator”. As vantagens de um experimento fatorial são: A interação dos fatores pode ser estudada; Existe uma economia de tempo e de esforço. Nos experimentos fatoriais todas as observações podem ser usadas para estudar o efeito de cada um dos fatores investigados. A alternativa, quando dois fatores são investigados, seria o de conduzir dois diferentes experimentos, cada um para estudar cada um dos dois fatores. Se isto é feito, as observações somente produzirão informações sobre um dos fatores, e o outro experimento somente fornecerá informação sobre o outro fator. Para se obter o nível de precisão dos experimentos fatoriais, mais unidades experimentais seriam necessárias se os fatores fossem estudados por meio de dois experimentos. Isto mostra que 1 experimento com dois fatores é mais econômico que 2 experimentos com 1 fator cada um. Visto que os vários fatores são combinados em um experimento, os resultados têm uma grande amplitude de aplicação. 2 Definições iniciais Vamos considerar um experimento fatorial 2x2, com os fatores Antibiótico (A) e Vitamina B12 (B) nos níveis: a0 (sem antibiótico) e a1 (com antibiótico); b0 (sem Vitamina B12) e b1 (com vitamina B12), respectivamente, adicionados a uma dieta básica e os seguintes valores médios de ganho de peso (g) para os 2x2 = 4 tratamentos: Fator B: Vitamina B12 Fator A: Dose do antibiótico b0 b1 Médias a0 14 23 18,5 a1 32 53 42,5 Médias 23,0 38,0 30,5 A representação gráfica fica: 143 Estatística Experimental Definições: Efeito simples de um fator: como a medida da variação que ocorre com a característica em estudo (ganho de peso, neste exemplo) correspondente às variações nos níveis desse fator, em cada um dos níveis do outro fator. Efeito simples do antibiótico no nível 0 de vitamina B12 : 1814320001︶︵ 0 babaA bdedentro Efeito simples do antibiótico no nível 1 de vitamina B12: 3023531011︶︵ 1 babaA bdedentro Efeito simples da vitamina B12 no nível 0 de antibiótico : 1914230010︶︵ 0 babaB adedentro Efeito simples da vitamina B12 no nível 1 de antibiótico : 2132530011︶︵ 1 babaB adedentro Efeito principal de um fator: é uma medida da variação que ocorre com a característica em estudo, correspondente às variações nos níveis desse fator, em média, de todos os níveis do outro fator. 15 2 219 2 BB BdeprincipalEfeito 24 2 3018 2 AA AdeprincipalEfeito 10 10 adedentroadedentro bdedentrobdedentro )()( )()( Efeito da interação entre os dois fatores: é uma medida da variação média que ocorre com a característica em estudo, correspondente às variações nos níveis de um fator, ao passar de um nível a outro do outro fator. ,6 2 921 2 int ,,6 2 1830 2 int ︶︵︶︵︶︵︶︵ 01 01 adedentroadedentro bdedentrobdedentro BB AxBdeeraçãodaEfeito aindaou AA BxAeraçãodaEfeito isto é, tanto faz calcular a interação A x B como a interação B x A As principais desvantagens dos experimentos fatoriais são: O número de tratamentos aumenta muito com o aumento do número de níveis e de fatores, tornando praticamente impossível distribuí-los em blocos casualizados, devido à exigência de homogeneidade das parcelas dentro de cada bloco. A análise estatística é mais trabalhosa (efeitos principais e interação de todos os fatores) e a interpretação dos resultados se torna mais difícil à medida que aumentamos o número de níveis e de fatores no experimento. 3 O modelo matemático O modelo de um experimento fatorial com dois fatores, num delineamento inteiramente casualizado com r repetições, pode ser escrito como: ijkijjiijky ︶︵ Sendo: 144 Estatística Experimental ; fatordonível ésimojoefatordonívelésimoiorecebeuquerespostaésimakaéyikj ;)(tan sobservaçõeastodasacomummédiateconsumaé ;..,., a1icomfatordonívelésimoidoefeitooéi ;...,,1 bjcomfatordonívelésimojdoefeitooéj ; int fatordonívelésimoj doefeitoocomfatordonívelésimoidoeraçãodaefeitooéij r1kcomyobservaçãoàassociadoerimentalerrooé ijkijk ...,,exp 4 Suposições do modelo As suposições associadas ao modelo; As observações de cada célula ab constituem uma amostra aleatória de tamanho r retirada de uma população definida pela particular combinação dos níveis dos dois fatores; Cada uma das ab populações é normalmente distribuída; Todas as populações têm a mesma variância; ),(~ 2ijk oN ; .0︶︵︶︵0 ︶︵, 1111 b j ij a i ij b j j a i i ijji e condiçõesassatisfazemeparâmetrosose Vale observar que “a” é o número de níveis do fator A, “b” é o número de níveis do fator B e “r” é o número de repetições de cada um dos “ab” tratamentos. No total temos “abr” unidades experimentais. 5 Hipóteses estatísticas As seguintes hipóteses podem ser testadas nos experimentos fatoriais. A hipótese de que não existe ou existe interação AB é equivalente às hipóteses b1jea1icom0Hvs0H ijAB1ijAB0 ...,,...,,)(:)(: ; De maneira análoga as hipóteses de que não existe efeito principal do fator A e B é a mesma que as hipóteses b1jcom0Hvs0H a1icom0Hvs0H jB1jB0 iA1iA0 ...,,:: ...,,:: , respectivamente. 6 Detalhes computacionais Apresentaremos alguns passos que facilitam os cálculos das somas de quadrados da ANOVA. O quadro abaixo mostra um possível arranjo dos dados de um experimento com os tratamentos em um arranjo fatorial 2 x 2 145 Estatística Experimental a1 a2 b1 b2 b1 b2 111y 121y 211y 221y 112y 122y 212y 222y . . . . . . . . . . . r11y r12y r21y r22y Pode-se montar o seguinte quadro auxiliar dos totais (r) b1 b2 Totais a1 11Y 12Y 1Y a2 21Y 22Y 2Y TOTAL 1Y 2Y Y Assim os cálculos do quadro da análise de variância são dados pelas seguintes expressões: Soma de Quadrados do Total (SQT) ;, )( , )( 2be2asendo abr Y CMsendo abr Y YSQT 22r 1k a 1i b 1j 2 ijk Soma de Quadrados do fator A, SQ(A) CMY br ASQ a i i 1 21)( ; Soma de Quadrados do fator, B SQ(B) CMY ar BSQ b j j 1 21)( ; Soma de Quadrados da interação AxB, SQ(AxB)=SQ(A,B)-SQ(A)- SQ(B) ou CMY r 1 AxBSQ a 1i b 11j 2 ij )( , sendo a SQ(A,B) a soma de quadrado conjunta, que nos fatoriais com dois fatores é igual à SQTr; Soma de Quadrados do Resíduo (SQR) SQR=SQT-SQ(A)-SQ(B)- SQ(AxB) ou r 1k 2 ij r 1k a 1i b 1j 2 ijk YYSQR 7 Quadro da anova Calculadas as SQ podemos montar o seguinte Quadro da ANOVA: Fonte de Variação g.l. SQ QM F Fator A a-1 SQ(A) QM(A)=SQ(A)/(a-1) QM(A)/QMR Fator B b-1 SQ(B) QM(B)=SQ(B)/(b-1) QM(B)/QMR Int A xB (a-1)(b-1) SQ(AxB) QM(A)=SQ(AxB)/(a-1)(b-1) QM(AxB)/QMR Tratamentos ab-1 SQTr QMTr=SQTr/(ab-1) QMTr/QMR Resíduo ab(r-1) SQR QMR+SQR/ab(r-1) TOTAL abr-1 SQT 146 Estatística Experimental 8 Estatística e região crítica do teste As estatísticas para os testes F da ANOVA são QMR AxBQM Fe QMR BQM F QMR AQM F cABcBcA )()( , )( , a qual, deve ser próximo de 1 se H0 for verdadeira, enquanto que valores grandes dessa estatística são uma indicação de que H0 é falsa. A teoria nos assegura que FcA tem, sob H0 distribuição F – Snedecor com (a -1) e ab(r-1)) graus de liberdade no numerador e no denominador, respectivamente. Resumidamente, indicamos: 01rab1acA HsobFF ,~ )),(,( . Rejeitamos H0 para o nível de significância se )),(,( 1rab1acA FF , sendo, )),(,( 1rab1aF o quantil de ordem )( 1 da distribuição F-Snedecor com (a -1) e ab(r-1) graus de liberdade no numerador e no denominador. De modo análogo temos FcB . Para a interação A x B a 01rab1b1acAB HsobFF ,~ )),(,))((( e rejeitamos H0 para o nível de significância se ,)),(,))((( 1rab1b1acAB FF , sendo, )),(,))((( 1rab1b1aF o quantil de ordem )( 1 da distribuição F- Snedecor com (a -1)(b-1) e ab(r-1) graus de liberdade no numerador e no denominador respectivamente. 9 Exemplo 1 Considere o esquema fatorial 2 x 2 ( dois níveis de antibiótico, dois níveis de vitamina B12) para estudar o aumento de peso (Kg) diário em suínos. a0 – sem antibiótico; a1 – com 40 g de antibiótico b0 – sem vitamina B12 ; b1 – com 5 mg de vitamina B12 Repetição a0 a1 b0 b1 b0 b1 1 1,30 1,26 1,05 1,52 2 1,19 1,21 1,00 1,56 3 1,08 1,19 1,05 1,55 Totais 3,57 3,66 3,10 4,63 Formato do arquivo .txt Formato no Excel anti vitb12 trat g.peso ao b0 t1 1.30 ao b0 t1 1.19 ao b0 t1 1.08 ao b1 t2 1.26 ao b1 t2 1.21 ao b1 t2 1.19 a1 b0 t3 1.05 a1 b0 t3 1.00 a1 b0 t3 1.05 a1 b1 t4 1.52 a1 b1 t4 1.56 a1 b1 t4 1.55 anti vitb12 trat g.peso ao b0 t1 1.30 ao b0 t1 1.19 ao b0 t1 1.08 ao b1 t2 1.26 ao b1 t2 1.21 ao b1 t2 1.19 a1 b0 t3 1.05 a1 b0 t3 1.00 a1 b0 t3 1.05 a1 b1 t4 1.52 a1 b1 t4 1.56 a1 b1 t4 1.55 147 Estatística Experimental Notem que neste caso o delineamento experimental foi o inteiramente casualizado com os tratamentos num esquema fatorial 2 x 2, com 3 repetições Outra forma de apresentação dos dados Trat. Repetição Totais a0b0 1,30 1,19 1,08 3,57 a0b1 1,26 1,21 1,19 3,66 a1b0 1,05 1,00 1,05 3,10 a2b2 1,52 1,56 1,55 4,63 Calculo das Soma de Quadrados: e então, podemos construir um primeiro quadro de análise de variância: Fonte de variação gl SQ QM F Tratamentos 3 0,4124 0,1398 38,13 Resíduo 8 0,0293 0,003667 TOTAL 11 0,4417 Como 597F 01083 ,).;,( podemos concluir que pelo menos duas médias de tratamentos diferem significativamente (p<0,01) entre si quanto ao ganho de peso diário de suínos. A continuação da análise pode envolver a comparação das médias dos tratamentos por meio de um dos procedimentos de comparações múltiplas conhecidos, como os testes de Tukey, Duncan, t- Student, Scheffé etc. Uma alternativa de análise mais simples e mais informativa, está baseada no esquema fatorial dos tratamentos. Utilizando o quadro com os totais das combinações dos níveis dos fatores A e B e as fórmulas apresentadas anteriormente, podemos construir um novo quadro de análise de variância que permitirá testar se existe interação entre os dois fatores e se cada um dos fatores tem efeito significativo sobre o desenvolvimento dos suínos. Quadro auxiliar com os totais das combinações dos níveis de antibióticos (a0, a1)e vitamina B12 b0 b1 Totais a0 3.57 3,66 7,23 a1 3,10 4,637,73 Totais 6,67 8,29 14,96 Assim, .1728,02187,00208,04124,0︶︵ ;2187,0 ︶3︵4 96,14 ︶3︵2 29,8 ︶3︵2 67,6 ︶︵ ;0208,0 ︶3. ︵4 96,14 ︶3. ︵2 73,7 ︶3. ︵2 23,7 ︶︵ 22 222 AxBSQ BSQ ASQ ,,,, ;, ))()(( ),(,,,, ;, ),( ))()(( ),...,( ),...,( 029304124044180SQTrSQTSQR 41240 322 9614 3 634 3 103 3 613 3 573 SQTr 44170 12 9614 322 551301 551301SQT 22222 22 22 148 Estatística Experimental Notem que SQTr = SQ(A) + SQ(B) + SQ(AxB) e que as somas de quadrados associadas ao total e ao resíduo permanecem inalteradas. O novo quadro da ANOVA fica: Fonte de variação gl SQ QM F Antibótico (A) 1 0,0208 0,0208 5,68 Vitamina B12 (B) 1 0,2187 0,2187 59,65 Int. AxB 1 0,1728 0,1728 47,13 Tratamentos (3) 0,4124 0,137 37,33 Resíduo 8 0,0293 0,00367 TOTAL 11 0,4417 Da tabela apropriada, temos F(3, 8; 0,01) = 7,59; F(1, 8, 0,05) = 5,32 ; F(1, 8 ; 0,01) = 11,26 Comparando os valores calculados das estatísticas F, podemos concluir que: o teste para a interação AxB foi significativo (p < 0,01), indicando que o efeito da vitamina B12 na presença ou ausência de antibiótico é significativamente diferente. Como a interação AxB resultou significativa (veja o gráfico apresentado acima), as interpretações da significância dos testes dos efeitos simples de Antibiótico (A) e de Vitamina B12 (B) perdem o significado. Precisamos estudar a interação fazendo os seguintes desdobramentos: a) Desdobramento da interação AxB para estudar o comportamento dos fator A dentro de cada nível de vitamina B12 (b0 e b1) : 1568,0 ︶3︵2 ︶29,8︵︶63,466,3︵3 1 ︶︵2 ︶︵ 1 ︶︵ ,0368,0 ︶3︵2 ︶67,6︵︶10,357,3︵3 1 ︶︵2 ︶︵ 1 ︶︵ 2 22 2 22 22 2 12 2 22 2 12 21 2 11 1 0 r YYY r ASQ r YYY r ASQ bdedentro bdedentro 149 Estatística Experimental Assim, monta-se a seguinte análise de variância do desdobramento dos graus de liberdade da interação A x B para se estudar o efeito do antibiótico no ganho de peso diário de suínos na ausência e na presença da vitamina B12. F.V. G.L. S.Q. Q.M. F Pr.Fc 0bdedentro A 1 0,0368 0,0368 10,04 0.0132 1bdedentro A 1 0,1568 0,1568 42,76 2e-04 Residuo 8 0,0293 0,00367 A linha do resíduo é a mesma da ANOVA anterior. Comparando os valores calculados da estatística F com o valor tabelado 311Fe325F 0108105081 ,, ),;,(),;,( , conclui-se que o efeito do fator antibiótico no peso diário de suínos no nível b0 de vitamina B12 é significativo (p<0,05) e significativo (p<0,01) no nível b1 da vitamina B12. Ou então, que: Quando se utiliza a dose b0 de vitamina B12 existe uma diferença no peso diário dos suínos. A estimativa desta diferença é dado por KgbabaA bdedentro 16,019,103,10001)( 0 , e ela é significativa pelo teste F da ANOVA do desdobramento, indicando que somente o efeito do antibiótico prejudica o peso diário dos suínos, em média de 0,16 kg. Quando se utiliza a dose b1 de vitamina B12 existe uma diferença no peso diário dos suínos. A estimativa desta diferença é dada por KgbabaA bdedentro 32,022,154,11011)( 1 é significativa pelo teste F da ANOVA do desdobramento, indicando que a combinação dos níveis a1 do antibiótico e b1 da vitamina B12, favorece em média 0,32 kg o peso diário dos suínos. b) Desdobramento da interação AxB para estudar o comportamento dos fator B dentro de cada nível de antibiótico A (a0 e a1) (como exercício preencher os espaços) 2 2 12 12 2 11adedentro 3 1 r2 Y YY r 1 BSQ 0 )( )( )( )()( 2 2 22 22 2 21adedentro 3 1 r2 Y YY r 1 BSQ 1 )( )( )( )()( Assim, monta-se a seguinte análise de variância do desdobramento dos graus de liberdade da interação A x B para se estudar o efeito da vitamina B12 no ganho de peso diário de suínos na ausência e na presença de antibiótico: F.V. G.L. S.Q. Q.M. F 0adedentro B 1 0,00135 0,00135 0,3682 1adedentro B 1 0,39015 0,39015 106,4045 Residuo 8 0,0293 0,00367 (Concluir como no desdobramento anterior) 150 Estatística Experimental Podemos comparar as médias de peso diário de suínos dos antibióticos, para cada uma dos níveis de vitamina B12, utilizando o Teste de Tukey (5%). Para tanto, calculamos: 11400 3 0,00367 263 3 QMR q r QMR qdms 05082050resíduodogla ,,),;,(),:,( Quadro auxiliar com as médias dos antibióticos para cada um dos níveis da vitamina B12, b0 b1 a0 1,19 A 1,22 A a1 1,03 B 1,54 B Obs.: médias seguidas pelas mesmas letras maiúsculas, nas colunas, não diferem entre si a 5% de probabilidade, pelo Teste de Tukey (fazer como exercício o teste de Tukey a 5%, para as linhas) Notação geral dos totais de um esquema fatorial 2 x 2 organizados em uma tabela 2x2, do tipo: (r) b0 b1 Totais a0 11Y 12Y 1Y a1 21Y 22Y 2Y TOTAL 1Y 2Y Y As fórmulas das Somas de Quadrados podem ser escritas de uma forma geral: )()()( ; ))()(( )( )()( ))()(( )( )()( ; ))()(( )( )( ))()(( )...( BSQASQSQTrBxASQ rba Y YY r2 1 BSQ rba Y YY r2 1 ASQ rba Y YYYY r 1 SQTr rba Y YYSQT 2 2 2 2 1 2 2 2 2 1 2 2 22 2 21 2 12 2 11 2 2 222 2 111 Script no r para obter os resultados acima # entrada dos dados pelo comando read.table( ) dados.ex1 <- read.table("ex1fat.txt", header=T) # imprimindo as 6 primeiras linhas do arquivo dados.ex1 head(dados.ex1) # anexando o objeto dados.ex1 no caminho de procura attach(dados.ex1) # calculo das interações - Quadros dos totais int.total <- tapply(g.peso, list(anti, vitb12), sum) int.total # calculo dos totais marginais do fator vitamina B12 total.vitb12<- tapply(g.peso,vitb12,sum) total.vitb12 151 Estatística Experimental # calculo dos totais marginais do fator antibiótico total.anti<- tapply(g.peso,anti,sum) total.anti # calculo das interações - Quadros das médias int.media <- tapply(g.peso, list(anti, vitb12), mean) int.media # calculo das médias marginais do fator vitamina B12 media.vitb12<- tapply(g.peso,vitb12,mean)# calculo das médias do fator vitamina b12ibiótico media.vitb12 # calculo das médias marginais do fator antibiótico media.anti<- tapply(g.peso,anti,mean)# calculo das médias do fator vitb12 media.anti # anova sem o desdobramento do fatorial gpeso.av <- aov(g.peso~trat) summary(gpeso.av) # quadro da anova no esquema fatorial gpesofat.av <- aov(g.peso~anti+vitb12+anti*vitb12) summary(gpesofat.av) # gráfico da interação interaction.plot(vitb12, anti, g.peso,col=2,lwd=2, ylab="médias",xlab="Vitamina B12", main="Gráfico da Interação") # requerendo o pacote ExpDes require(ExpDes) fat2.crd(anti, vitb12, g.peso, quali = c(TRUE, TRUE), mcomp = "tukey", fac.names = c("Antibiótico", "Vitamina B12")) # dms do teste de tukey para antibiótico dentro de cada nível da vitamina dms<- qtukey(0.95,2,8)*sqrt(anova(gpesofat.av)[4,3]/3) dms # retirando o objeto dados.ex1 do caminho de procura detach(dados.ex1) 152 Estatística Experimental 8º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL 1) Num experimento fatorial 22 ou 2 x 2, no delineamento inteiramente casualizado, com 6 repetições, foram estudadas as influências de 2 fatores (A: Antibiótico e B: Vitamina B12) sobre o ganho de peso diário em suínos. Os tratamentos utilizados foram: 1- a0v0 - Testemunha = sem antibiótico e sem vitamina B12 2- a1v0 - 40 g de antibiótico 3- a0v1 - 5 mg de vitamina B12 4- a1v1 - 40 g de antibiótico + 5 mg de vitamina B12. Os resultados do ganho de peso diários, em gramas, foram os seguintes: Tratamentos 1ª Rep. 2ª Rep. 3ª Rep. 4ª Rep. 5ª Rep. 6ª Rep. a0v0 590 540 491 532 545 544 a1v0 476 454 476 481 464 463 a0v1 572 549 540 558 563 562 a1v1 690 708 703 712 691 721 a) Escreva o modelo matemáticodeste experimento. Usando o programa R, pede-se: Quadro dos Totais Quadro das Médias b0 b1 Totais b0 b1 Médias a0 a0 a1 a1 Totais Médias b) Formule as hipóteses estatísticas para os fatores do fatorial e monte o quadro da análise de variância com desdobramento dos graus de liberdade dos tratamentos de acordo com o esquema fatorial 2 x 2 e preencha os espaços das fórmulas abaixo: Complete o quadro da anova abaixo: F. V. gl SQ QM F p Antibótico (A) Vitamina B12 (B) Int. AxB Tratamentos Resíduo TOTAL Conclusões: 153 Estatística Experimental Preencha as fórmulas abaixo com os seus respectivos valores 22 2 2 1i 2 j 6 1k ijk abr Y abr y CM )...()( abr y ySQT 2r 1k a 1i b 1j 2 ijk )( 222i CMybr 1 ASQ )()()( 222 ︶︵︶︵1︶︵ CMyarBSQ j 22 2 22 2 21 2 12 2 11 ...︶︵ ︶︵ 1 ︶,︵︶︵︶︵ CMyyy r SQTr sendoBSQASQSQTrBxASQ )(AxBSQSQBSQASQTSQR )1)(1( )( )(; 1 ; 1 ba AxBSQ AxBQM b SQB QMB a SQA QMA pdevalor QMR QMA F ababr SQR QMR A pdevalor QMR QMB FB pdevalor QMR AxBQM FAB )( 154 Estatística Experimental c) Caso a interação seja significativa, fazer o desdobramento da interação, estimando testando os efeitos simples dos efeitos dos antibióticos dentro de vitaminas e da vitamina dentro de antibióticos (teste da análise de variância), ou seja, preencha as fórmulas abaixo e o quadro da anova F.V. G.L. S.Q. Q.M. F p 0bdedentro A 1bdedentro A Resíduo Conclusões: Mostre como foi obtido os valores do quadro acima: Monte o quadro da anova abaixo e escreva as fórmulas para o desdobramento de Bdentro de ao e Bdentro de a1, F.V. G.L. S.Q. Q.M. F p 0adedentro B 1adedentro B Residuo Conclusões: )( )( )()( )( )( 1 )( 2 22 2 12 21 2 110 rb y yy r ASQ bdedentro )( )( )( )( )()( )( 2 2 2 22 22 2 12bdedentro 2 1 r2 y yy r 1 ASQ 155 Estatística Experimental 2 2 12 12 2 11 ︶︵︶︵ ︶︵ ︶︵ 1 ︶︵ 0 ra yyy r BSQ adedentro 2 2 22 22 2 211 1 ︶︵︶︵ ︶︵ ︶︵︶︵ ra yyy r BSQ adedentro d) Ainda com relação ao item c), dê uma estimativa dos efeitos simples de antibióticos e de vitaminas e conclua se eles são significativos. Aplique o teste de Tukey para localizar as diferenças entre as médias dos antibióticos dentro de vitaminas e das médias das vitaminas dentro de antibióticos Represente as diferenças com as médias, seguidas de letras. Tire as conclusões práticas para este ensaio. Esboce o gráfico da interação. r QMR qdms resíduodogla )05,0:,( b0 b1 Médias a0 a1 Médias Conclusões: Esboce o gráfico da interação 156 Estatística Experimental a) Dê uma estimativa dos efeitos simples de antibióticos e de vitaminas. b) Teste a normalidade dos erros e a homogeneidade das variâncias dos tratamentos. g) Calcular os coeficientes de determinação (R2) e o de variação do experimento (CV). (escrever um script no R para resolver esta questão) 2) Num experimento fatorial 2 x 4 , no delineamento em blocos casualizados, com 2 repetições (2 Blocos), foram estudadas as influências da primeira alimentação de colostro no nível de imunoglobulina em vacas leiteiras. O fator A foi a quantidade de comida (0,5 e 1,5 kg) e o fator B foi o tempo da primeira alimentação (1, 2, 6, ou 12 horas depois do nascimento). Os valores observados são unidades de “turbidimetric” relativas ao sulfato de bário padrão de 20 quando o sangue foi amostrado 48 horas após o nascimento. O colostro foi misturado para eliminar a variação entre as vacas. Tempo da 1ª alimentação Bloco Quantidade de comida (kg) 1 2 6 12 I 0,5 7,9 10,2 6,1 2,3 1,5 11,7 10,7 9,9 5,4 II 0,5 9,5 6,0 7,8 7,1 1,5 15,0 11,7 9,4 7,2 Responder aos mesmos itens do exercício 1) (Atenção este é um fatorial 2 x 3) 3) Um experimento foi realizado para estudar a influência no tempo de hemorragia do período, fator A, e um composto estrogênio, fator B , em plasma de sangue em ovelhas. Cinco ovelhas foram sorteadas para cada um dos quatros tratamentos: a1b1 – de manhã e sem estrogênio; a1b2 – de manhã com estrogênio; a2b1 – de tarde e sem estrogênio; a2b2 – de tarde com estrogênio Tratamentos Rep. 1 Rep. 2 Rep. 3 Rep. 4 Rep. 5 a0 b0 8,53 20,53 12,53 14,00 10,80 a0 b1 17,53 21,07 20,80 17,33 20,07 a1 b0 39,14 26,20 31,33 45,80 40,20 a1 b1 32,00 23,80 28,87 25,06 29,33 Responder aos mesmos itens do ecercício 1) 4) Um experimento para verificar o peso aos 180 dias de suínos com as raças Landrace e Large White, utilizou-se de 480 suínos, machos e fêmeas, sendo estes distribuídos em três suínoculturas. a) Quais os fatores que podem influenciar a resposta medida. b) Estabeleça um modelo matemático para o experimento. c) Faça um esquema da análise de variância (F.V. e g.l.) para o experimento. 157 Estatística Experimental 5) Em um experimento realizado na Fazenda Experimental Iguatemi da Fundação Universidade Estadual de Maringá, para verificar o efeito de diferentes tipos de instalações durante o inverno e verão sobre o ganho de peso e conversão alimentar de coelhos da raça Nova Zelândia, aos 40 e 70 dias de idade, foram utilizados 3 tipos de instalações, gaiolas ao ar livre, gaiolas de arame galvanizado em galpão aberto e gaiolas de arame galvanizado em galpão fechado. Utilizou-se 178 animais machos e fêmeas para a obtenção dos dados. a) Quais os fatores que podem influenciar a resposta medida. b) Estabeleça um modelo matemático para o experimento. c) Faça um esquema de análise de variância para o experimento. 158 Estatística Experimental Aula 9 Experimentos fatoriais: analisando um fatorial A x B O método de análise de um experimento fatorial 2 x 2 pode, de uma maneira geral, ser estendido a qualquer experimento fatorial A x B. A estratégia para analisar um experimento fatorial a x b é a mesma utilizada para os experimentos fatoriais 2 x 2. teste a interação entre os dois fatores. se a interação é significativa, então analisamos os efeitos simples dos dois fatores. se a interação é não significativa, então analisamos os efeitos principais de cada fator Exemplo 1 Casualização dos tratamentos de um esquema fatorial 2 x 3 em DBC com 4 repetições: Tratamentos b1 a1b1 a1 b2 a1b2 b3 a1b3 b1 a2b1 a2 b2 a2b2 b3 a2b3 Com o seguinte esquema da ANOVA Fonte de Variação g l Fator A a - 1 Fator B b - 1 Int. A x B (a – 1)(b – 1) Tratamentos ab - 1 Blocos r -1 Resíduo (ab -1)(r – 1) Total abr - 1 De uma maneira geral as somas de quadrados são dadas por: ︶︵︶︵︶︵︶,︵︶︵︶,︵︶︵ ;...︶︵ ;...︶︵ ;... ︶...︵ 2 . 22 2 2 1 222 2 2 1 222 12 2 11 2 22 111 BSQASQSQTrAxBSQouBSQASQBASQAxBSQ abr Y ar Y ar Y ar YBSQ abr Y br Y br Y br YASQ abr Y r Y r Y r YSQTr abr YYYSQT j i ab abk Como dissemos na aula passada: nos fatoriais A x B a Soma de Quadrados Conjunta SQ(A,B) é igual à Soma de Quadrados dos Tratamentos SQTr. Bloco I Bloco IIBloco III Bloco IV a2b1 a2b3 a1b2 a1b1 a1b2 a2b2 a2b1 a1b3 a2b2 a1b1 a2b2 a2b1 a2b3 a2b1 a1b3 a2b2 a1b1 a1b2 a2b3 a1b2 a1b3 a1b3 a1b1 a2b3 159 Estatística Experimental Quadro da ANOVA no DIC F.V. G.L. S.Q. Q.M. F A a-1 S.Q.(A) Q.M.(A) FA B b-1 S.Q.(B) Q.M.(B) FB Interação A x B (a-1)(b-1) S.Q.(AB) Q.M.(AB) FAB Tratamentos ab-1 S.Q. Trat. Q.M. Trat. FTr Resíduo ab (r-1) S.Q. Res. Q.M. Res. Total abr-1 S.Q. Total Exemplo 1. Fatorial 2 x 3 (com interação não significativa): O crescimento do conteúdo de água em tecidos de lesmas sob 6 diferentes condições experimentais foi avaliada. As 6 condições foram obtidas combinado-se os dois níveis de temperatura (fator A) com três níveis de umidade (fator B) com. Foram feitas 4 repetições para cada combinação de tratamento. Os resultados, em porcentagem, foram : Fator A (Temperatura ºC) Fator B – Umidade (%) 45 75 100 20 76 64 72 82 100 96 79 71 86 86 92 100 30 72 72 72 75 100 94 64 70 82 84 98 99 Formato no Excel (.xls) Formato no Bloco de notas (.txt) Temp umi trat ca 20 45 t1 76 20 45 t1 64 20 45 t1 79 20 45 t1 71 20 75 t2 72 20 75 t2 82 20 75 t2 86 20 75 t2 86 20 100 t3 100 20 100 t3 96 20 100 t3 92 20 100 t3 100 30 45 t4 72 30 45 t4 72 30 45 t4 64 30 45 t4 70 30 75 t5 72 30 75 t5 75 30 75 t5 82 30 75 t5 84 30 100 t6 100 30 100 t6 94 30 100 t6 98 30 100 t6 99 temp umi trat ca 20 45 t1 76 20 45 t1 64 20 45 t1 79 20 45 t1 71 20 75 t2 72 20 75 t2 82 20 75 t2 86 20 75 t2 86 20 100 t3 100 20 100 t3 96 20 100 t3 92 20 100 t3 100 30 45 t4 72 30 45 t4 72 30 45 t4 64 30 45 t4 70 30 75 t5 72 30 75 t5 75 30 75 t5 82 30 75 t5 84 30 100 t6 100 30 100 t6 94 30 100 t6 98 30 100 t6 99 Os totais das 4 repetições para o fatorial A x B = (2)(3)= 6 tratamentos são os seguintes: 160 Estatística Experimental (4) Níveis de A (Temperatura ºC)) Níveis de B (Umidade (%)) b1 = 45 % b2 = 75 % b3 = 100 % Total a1 = 20 ºC 290 326 388 1004 a2 = 30 ºC 278 313 391 982 Total 568 639 779 1986 Cálculos das soma de quadrados: 08,2075,288117,200,2922 ︶︵︶︵︶*︵ ;75,2881 ︶4︶ ︵3︶ ︵2︵ 1986 ︶4︶ ︵2︵ 779... ︶4︶ ︵2︵ 568 ︶︵ ;17,20 ︶4︶ ︵3︶ ︵2︵ 1986 ︶4︶ ︵3︵ 982 ︶4︶ ︵3︵ 1004 ︶︵ ;0,2922 ︶4︶ ︵3︶ ︵2︵ 1986 4 491... 4 326 4 290 5,3386 ︶4︶ ︵3︶ ︵2︵ 1986 ︶99...76︵ 222 222 2222 2 22 BSQASQSQTrBASQ BSQ ASQ SQTr SQT Quadro da anova F.V. G.L. S.Q. Q.M. F Pr>(Fc) Temperatura (A) 1 20,17 20,17 0,78ns 0.388 Umidade (B) 2 2881,75 1440,88 55,85 ** 1.91e-08 Interação A x B 2 20,08 10,04 0,39ns 0.683 Tratamentos (5) 2922,0 584,40 22,65* 3.48e-07 Resíduo 18 464,5 25,81 Total 23 3386,5 F(1, 18; 0,05) = 4,41 ; F(1, 18, 0,01)= 8,29; F(2, 18; 0,05)= 3,55; F(2, 18, 0,01)= 6,01 F(5, 18; 0,05) = 2,77; F(5, 18, 0,01)= 4,25 Do quadro acima, observamos que o teste da interação entre a temperatura e umidade não é significativa (p>0,05), e concluímos que os dados não suportam a hipótese de uma interação entre temperatura e umidade. Dado que a interação não foi significativa, a análise prossegue analisando-se os efeitos principais da temperatura e da umidade isoladamente. Isto pode ser feito analisando-se os dois tipos de diferenças: as diferenças entre os conteúdos médios da água nos tecidos nos dois níveis de A (temperatura). as diferenças entre os conteúdos médios da água nos tecidos nos três níveis de B (umidade). O teste F para o efeito principal A é não significativo (p>0,05), e portanto não existe evidências suficientes para concluir que os valores médios do conteúdo da água nos tecidos são diferentes nos dois níveis de temperatura, entretanto, o teste F para o efeito principal da umidade é altamente significativo (p<0,01), o que implica que os dados suportam a conclusão de que os valores médios do conteúdo da água nos tecidos não são os mesmos nos três níveis da umidade. Isto pode ser visualizado na tabela de médias abaixo (última linha): 161 Estatística Experimental Quadro de médias dos tratamentos (4) (Temperatura ºC)) Níveis de B ( Umidade (%) ) b1 = 45 % b2 = 75 % b3 = 100 % Médias a1 = 20 ºC 72,50 81,50 97,00 83,67 A a2 = 30 ºC 69,50 78,25 97,75 81,83 A Médias 71,00 c 79,88 b 97,38 a 82,75 Médias com a mesma letra maiúscula nas colunas não diferem entre si pelo teste de Tukey a 5% Médias com a mesma letra minúscula nas linhas não diferem entre si pelo teste de Tukey a 5% Fazendo o gráfico da interação (níveis de b no eixo x e níveis de a em y) Cálculos do teste de Tukey: para o efeito principal A (temperatura): 364 12 8125 972dms 972q A 050182 , , , ,),;,( para o efeito principal de B (Umidade): 486 8 8125 9o63dms 6093q B 050183 , , , ,),;,( Gráfico das médias dos tratamentos Interação A x B Umidade (%) M éd ia o bs er va da d o co nt eú do d a ág ua ( % ) 66 72 78 84 90 96 102 45 75 100 20 º C 30 º Média O gráfico das médias dos tratamentos fornece um conveniente método de mostrar os resultados. As linhas sólidas no gráfico da interação são 162 Estatística Experimental praticamente paralelas, isto confirma o resultado do teste F para a interação entre temperatura e umidade. Mais ainda, a proximidade das duas linhas sólidas indica que as diferenças entre as respostas médias observadas nas duas temperaturas são não significativas; esta conclusão é confirmada pelo teste F do efeito principal da temperatura. Uma checagem gráfica para presença do efeito principal da umidade é dada pela orientação da linha pontilhada. Se o efeito principal de tal efeito não estivesse presente, então a linha pontilhada deveria estar paralela ao eixo x. O gráfico mostra que não é este o caso. O teste F para o efeito principal de B (umidade) suporta esta conclusão. Outra forma de explicar a significância do fator B é por meio da regressão polinomial, ou seja, as diferenças entre as médias do fator umidade são explicadas por equação do segundo grau Gráfico das médias do fator B Equação ajustada y=82.471-0.585*x+0.007*x^2+eps Umidade (%) M éd ia s do s co nt eú do d a ág ua ( % ) 68 72 76 80 84 88 92 96 100 40 45 50 55 60 65 70 75 80 85 90 95 100 105 Script no R para obter os resultados do exemplo 1 # entrada dos dados pelo comando read.table( ) dados.ex1_9 <- read.table("ex1fat_9.txt", header=T) # imprimindo as 6 primeiras linhas do arquivo dados.ex1_9 head(dados.ex1_9) # anexando o objeto dados.ex1_9 no caminho de procura attach(dados.ex1_9) # calculo das interações - Quadros dos totais int.total <- tapply(ca, list(temp, umi), sum) int.total # calculo dos totais marginais do fator temperatura total.temp<- tapply(ca,temp,sum) total.temp # calculo dos totais marginais do fator umidade total.umi<- tapply(ca,umi,sum) total.umi # calculo das interações - Quadros das médias int.media <- tapply(ca, list(temp, umi), mean) 163 Estatística Experimental int.media # calculo das médias marginais do fator temp media.temp<- tapply(ca,temp,mean) media.temp # calculo das médias marginais do fator antibiótico media.umi<- tapply(ca,umi,mean) media.umi # anova sem o desdobramento do fatorial ca.av <- aov(ca~trat) summary(ca.av) # quadro da anova no esquema fatorial cafat.av <- aov(ca~factor(temp)+factor(umi)+factor(temp)*factor(umi)) summary(cafat.av) # gráfico da interação interaction.plot(umi, temp, ca,col=2,lwd=2, ylab="médias de ca",xlab="níveis da umidade", main="Gráfico da Interação") # requerendo o pacote ExpDes require(ExpDes) fat2.crd(factor(temp), factor(umi),log( ca+1), quali = c(TRUE, TRUE), mcomp = "tukey", fac.names = c("Temperatura", "Umidade")) # dms do teste de tukey para fator temperatura dmsa<- qtukey(0.95,2,18)*sqrt(anova(cafat.av)[4,3]/12)dmsa # dms do teste de tukey para fator umidade dmsb<- qtukey(0.95,3,18)*sqrt(anova(cafat.av)[4,3]/8) dmsb # Regressão Linear # Definição de x e y x <- c(45,75,100) ca.media <- tapply(ca,umi,mean) #c(71.0, 79.88, 97.38) ca.media #ajuste da equação linear reg.lin <- lm(ca.media~um ) reg.lin plot(um,ca.media,pch=16,xlab="umidade") abline(reg.lin,col=2,lwd=2) # análise de variância para testar se o coef angular é significativo anova(reg.lin) 164 Estatística Experimental # ajuste de uma equação quadrática reg.quad <- lm(ca.media ~ um + I(um^2)) reg.quad # desenhando a curva ajustada e adicionado ao gráfico curve(82.488636 -0.585985*x+0.007348*x*x, 40,100, lwd=2,col=4,add=T) # retirando o objeto dados.ex1_9 do caminho de procura detach(dados.ex1_9) Exemplo 2: Análise e interpretação de um experimento fatorial com três fatores Esquema fatorial 2 x 2 x 2 = 23 em um delineamento em blocos casualizados (DBC)para estudar a produção de leite de vacas holandezas arranjadas em 6 lotes com a mesma idade. idade) de classes 6 ( Blocos 6 B vitamina de mg 5 : c2 B vitamina de mg 0 : c1 milho de rolão de kg 1,0 : b2 milho de rolão de kg 0,5 : b1 B tipo ração de kg 0,5 : a2 Atipo ração de kg 0,5 : a1 :. 12 12 2222 1221 2 2122 1221 1 2 2212 1211 2 2112 1111 1 1 cbac cbac b cbac cbac b a cbac cbac b cbac cbac b a sendoTrat Dados Níveis dos fatores BLOCOS A B C I II III IV V VI Total 1 1 1 3,029 3,857 2,448 2,448 3,543 4,314 19,639 1 1 2 2,438 3,086 3,771 4,657 1,962 3,210 19,124 1 2 1 3,448 3,600 3,895 4,267 3,086 3,657 21,953 1 2 2 3,533 5,048 3,467 4,095 1,876 2,895 20,914 2 1 1 3,362 3,714 3,429 3,190 2,686 4,038 20,419 2 1 2 4,905 6,295 4,924 4,952 5,381 5,543 32,000 2 2 1 4,171 3,114 4,124 3,981 3,038 3,590 22,018 2 2 2 4,476 4,752 4,848 4,676 6,829 3,771 29,352 Total 29,362 33,466 30,906 32,266 28,401 31,018 185,419 Para calcular as somas de quadrados dos efeitos A, B e C, inicialmente devemos organizar quadros auxiliares, que relacionam os níveis dos fatores 2 a 2, o que dá 3 quadros A com B, A com C e B com C. Exemplo: Quadro I (A x B) totais de : a1b1 = a1b1c1 + a1b1c2 = 19,639 + 19,124 = 38,763 a1b2 = a1b2c1 + a1b2c2 = 21,953 + 20,914 = 42,867 a2b1 = a2b1c1 + a2b1c2 = 20,419 + 32,000 = 52,419 a2b2 = a2b2c1 + a2b2c2 = 22,018 + 29,352 = 51,370 165 Estatística Experimental Quadro I (totais da interação A x B) (12) Níveis de A (Qtde de ração) Níveis de B (Rolão de milho kg) b1 = 0,5 kg b2 = 1,0 kg Total a1 = 0,5 kg de A 38,763 42,867 81,630 a2 = 0,5 kg de B 52,419 51,370 103,789 Total 91,182 94,237 185,419 Quadro II (totais da interação A x C) (12) Níveis de A (Qtde de ração) Níveis de C (Dose de vit. B12 mg) c1 = 0,0 mg c2 = 5,0 mg Total a1 = 0,5 kg de A 41,592 40,038 81,630 a2 = 0,5 kg de B 42,437 61,352 103,789 Total 84,029 101,390 185,419 Quadro III (totais da interação B x C) (12) Níveis de B Níveis de C (Dose de vit. B12 mg) c1 = 0,0 mg c2 = 5,0 mg Total b1 = 0,5 kg 40,058 51,124 91,182 b2 = 1,0 kg 43,971 50,266 94,237 Total 84,029 101,390 185,419 Somas de quadrados da ANOVA preliminar: ;, ))()()(( , ))(( , ))(( , )( ;, ))()()(( , ))(( , ))(( , )( ;, ))()()(())(( , ))(( , )( , ;, ))()()(( , ),...,( ;, ))()()(( ,, ... , ;, ))()()(( , ),...,( 2796 6222 419185 122 390101 122 02984 CSQ 1940 6222 419185 122 23794 122 18291 BSQ 23010 6222 185419 122 789103 122 63081 ASQ 96320SQBlSQTrSQTSQR 1342 6222 419185 0183136229 8 1 SQBl 74826 6222 419185 6 35229 6 45919 SQTr 84549 6222 419185 31440293SQT 222 222 222 2 22 222 2 22 Para o cálculo das soma de quadrados das interações precisamos calcular as somas de quadrados conjuntas. Para a interação AxB, temos: 568019402301019210BSQASQBASQAxBQS 99210 6222 419185 3705176338 12 1 BASQ 2 22 ,,,,)()(),()(. , ))()()(( , ),...,(),( Para a interação AxC, temos: 166 Estatística Experimental 729,8279,6230,10238,25︶︵ 358,25 ︶6︶ ︵2︶ ︵2︶ ︵2︵ 419,185 ︶352,61...592,41︵12 1 ︶,︵ 2 22 AxCSQ CASQ Para a interação BxC, temos: 4750279619409486BxCSQ 9486 6222 419185 2665005840 12 1 CBSQ 2 22 ,,,,)( , ))()()(( , ),...,(),( 2890BxCSQAxCSQAxBSQ CSQBSQASQSQTrAxBxCSQ ,)()()( )()()()( Fonte de variação Gl S.Q. Q.M. F Ração (A) 1 10,230 10,230 17,078** Rolão (B) 1 0,194 0,194 0,324ns Vitamina B12 (C) 1 6,279 6,279 10,482 ** Int.( AxB) 1 0,568 0,568 0,948ns Int. (AxC) 1 8,729 8,729 14,573** Int. ( BxC) 1 0,475 0,475 0,793ns Int. (AxBxC) 1 0,289 0,289 0,482ns Tratamentos (7) 26,748 3,821 6,380** Blocos 5 2,134 0,427 0,713ns Resíduo 35 20,963 0,599 Total 47 48,845 F(5, 35; 0,05) = 2,49 F(3, 35; 0,01) = 3,61 F(1, 35; 0,05) = 4,13 F(1, 35; 0,01) = 7,44 Conclusões: a interação AxBxC é não significativa (p>0,05), indicando a possibilidade de independência entre os fatores conjuntamente. os testes F das interações duplas indicam que somente a interação AxC é significativa (p<0,01), ou seja, os dados suportam uma conclusão de que os tipos de rações interagem com a dose de vitamina B12 na produção de leite. Desdobramento da interação AxC: estudo dos efeitos simples do fator ração (A) nos níveis das doses de vitamina B12 (C) Cálculo da SQ do efeito da ração na ausência da vitamina B12 0300 24 02984 4374259241 12 1 ASQ 2 22 Cdentro 1 , , ),,()( Cálculo da SQ do efeito da ração na presença da vitamina B12 92918 24 390101 3526103840 12 1 ASQ 2 22 Cdedentro 2 , , ),,()( Quadro da ANOVA do desdobramento: Fonte de variação gl. SQ QM F 1Cdedentro A 1 0,030 0,030 0,0497* 2deCdentro A 1 18,929 18,929 31,601** Resíduo 35 20,963 0,599 167 Estatística Experimental Conclusão: as rações produzem efeito significativo (p<0,05) na ausência da vitamina B12, enquanto que na presença da vitamina B12 as rações têm efeito significativo (p<0,01) diferenciado. Desdobramento da interação AxC: estudo dos efeitos simples do fator vitamina (C) nos níveis das Rações (A) Cálculo da SQ do efeito da vitamina no nível a1 da ração 1026,0 24 029,84 ︶038,40592,41︵12 1 ︶︵ 2 22 1 adentroCSQ Cálculo da SQ do efeito da vitamina no nível a2 da ração 9074,14 24 789,103 ︶352,61437,42︵12 1 ︶︵ 2 22 2 adedentroCSQ Quadro da ANOVA do desdobramento: Fonte de variação gl. SQ QM F 1adedentro C 1 0,1006 0,1006 0,168 NS 2deadentro C 1 14,9074 14,9074 24,88 ** Resíduo 35 20,963 0,599 Conclusão: as vitaminas não produzem efeito significativo (p>0,05) na ração tipo A, enquanto que na ração tipo B a vitamina B12 tem efeito significativo (p<0,01) diferenciado. Exemplo 4 Análise de um fatorial 3 x 4 : experimento sobre a qualidade do ovo, em unidades Haugh, segundo 3 embalagens e 4 tempos de armazenamento de estocagem. Embalagem Tempo Blocos Ai Bj I II III IV 1 1 66 52 57 68 1 2 47 47 32 43 1 3 43 50 39 40 1 4 20 23 43 41 2 1 81 68 60 55 2 2 62 34 44 45 2 3 43 41 47 54 2 4 51 32 29 34 3 1 81 82 80 78 3 2 84 68 66 65 3 3 58 43 37 57 3 4 75 45 59 48 Quadro da anova F.V. G.L. S.Q. Q.M. F Embalagem (A) 2 3427,125 1713,562 24,586** Tempo (B) 3 5186,229 1728,748 24,803 ** Interação A x B 6 768,708 128,118 1,838ns Tratamentos (11) 9382,06 852,91 12,24** Blocos 3 829,729 276,576 3,968* Resíduo 33 2300,021 69,697 Total 47 12511,812 Conclusões: o efeito da interação A x B é não significativo (p>0,05), ou seja, existe uma independência entre os fatores. efeito do fator embalagem (A) é significativo (p<0,05). 168 Estatística Experimental efeito do fator tempo(B) é significativo (p<0,05). Teste de Tukey para o fator A 287 16 69769 493dms 493q A 050333 , , , ,),,,( Teste de Tukey para o fator B 289 12 69769 853dms 853q B 050334 , , , ,),,,( Quadro dos valores médios observados (4) B1 B2 B3 B4 iY A1 60,75 42,25 43,00 31,75 44,44 B A2 66,00 46,25 46,25 36,50 48,75 B A3 80,25 70,75 48,75 56,75 64,12 A jY 69,00 a 53,08 b 46,00 bc 41,67 c 52,44 Médias com a mesma letra minúscula nas linhas não diferem entre si pelo teste de Tukey a 5% Médias com a mesma letra maiúscula nas colunas não diferem entre si pelo teste de Tukey a 5% Exemplo 5 Em um experimento de substituição do farelo de soja pelo farelo de girassol na ração de suínos, montou-se um experimento fatorial 2x5, com os fatores Sexo (machos e fêmeas) e Ração com substituição de farelo de soja por farelo de girassol (0%, 25%, 50%, 75% e 100%), utilizando-se 30 suínos (15 machos e 15 fêmeas) castrados da raça Duroc-Jersey, num delineamento em blocos casualizados com 3 repetições, de acordo com os grupos de pesos iniciais. Os resultados de ganho de peso dos animais aos 112 dias de experimento estão apresentados na tabela a seguir: Bloco Machos Fêmeas G0 G25 G50 G75 G100 G0 G25 G50 G75 G100 1 85,0 94,5 99,5 93,0 83,0 77,9 71,5 67,5 71,5 89,5 2 86,0 96,0 98,0 96,0 80,0 83,2 73,5 63,5 70,8 91,8 3 84,0 95,8 104,0 90,5 78,5 83,5 70,5 65,0 72,5 92,9 Total 255,0 286,3 301,5 279,5 241,5 244,6 215,5 196,0 214,8 274,2 Pede-se: Montar os quadros auxiliares dos totais e das médias, da Análise de Variância e fazer um estudo do desdobramento da interação entre os fatores os testes convenientes; Construir gráficos da interação para ilustrar o comportamento das respostas médias dos fatores Sexo e Ração. 169 Estatística Experimental Quadros auxiliares Sexo Ração Total G0 G25 G50 G75 G100 1 255,0 286,3 301,5 279,5 241,5 1363,8 2 244,6 215,5 196,0 214,8 274,2 1145,1 Total 499,6 501,8 497,5 494,3 515,7 2508,9 Bloco B1 B2 B3 Total Total 832,9 838,8 837,2 2508,9 (Resolver os exemplos 4) e 5) no R) 170 Estatística Experimental 9º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL 1) Num experimento fatorial 32 = 3 x 3, com os fatores A e B, no delineamento em blocos ao acaso, com 4 repetições, para se estudar uma determinada característica, foram obtidos os seguintes resultados Tratamentos 1º Bloco 2º Bloco 3º Bloco 4º Bloco a0b0 25,3 24,2 24,3 33.0 a0 b1 31,6 29,7 30,6 32,2 a0 b2 19,7 18,2 16,0 17,0 a1 b0 24,7 34,7 28,9 27,6 a1 b1 28,4 44,4 41,1 38,4 a1 b2 30,8 42,4 33,6 35,1 a2 b0 37,2 47,6 38,6 40,6 a2 b1 42,6 45,8 38,4 43,4 a2 b2 56,0 58,8 57,0 55,0 Os resultados da análise de variância preliminar foram: FV G.L. S. Q. Q. M. F P Blocos 3 150,3 50,1 4,2 0,016 Tratamentos 8 3967,3 495,9 41,8 0,000 Resíduo 24 284,3 11,8 Total 35 4401,9 a) Checar os resultados do quadro da ANOVA acima e concluir, em seguida fazer a análise de variância com o desdobramento dos graus de liberdade de tratamentos, segundo o esquema fatorial e concluir. b) No desdobramento da interação fazer a análise de variância do desdobramento e aplicar o teste de Tukey (5%) valores médios do fator A nos níveis do fator B e vice versa. c) Calcular os coeficientes de determinação e de variação do experimento. 2) Um experimento fatorial 2 x 5, com os fatores Sexo (A) e Ração (B) , em um delineamento em blocos ao acaso, com 3 repetições, foi realizado para se estudar a “Substituição do farelo de soja pelo farelo de girassol em ração de suínos” (Kronka,1969)- BIA, n.26 pg 147-154. Os dados abaixo referem-se ao ganho de peso (kg) em 112 dias de experimento. Descrição dos fatores : Sexo a1 : Machos; a2 : Fêmeas Rações: b1 : Ração Básica (RB) + farelo de soja (100%); b2 : RB + farelo de soja (75%) + farelo de girassol (25%); b3 : RB + farelo de soja (50%) + farelo de girassol (50%); b4 : RB + farelo de soja (25%) + farelo de girassol (75%); b5 : RB + farelo de girassol (100%); Tratamentos 1º Bloco 2º Bloco 3º Bloco a1 b1 95,0 86,0 94,0 a1 b2 91.5 99,0 94,0 a1 b3 94,5 93,0 94,0 a1 b4 89,0 86,0 90,5 a1 b5 93,0 80,0 78,0 a2 b1 87,0 79,0 84,0 a2 b2 91,0 93,5 103,5 a2 b3 77,5 68,5 70,0 a2 b4 82,5 80,5 82,5 a2 b5 64,5 65,5 60,5 Resultados da anava preliminar F.V. G.L. S.Q. Q.M. F Blocos 2 60,02 30,01 1,56ns Trat. 9 2994,54 332,73 17,34** Res. 18 345,48 19,19 Total 29 3400,04 171 Estatística Experimental a) Checar os resultados do quadro da ANOVA acima e concluir, em seguida fazer a análise de variância com o desdobramento dos graus de liberdade de tratamentos, segundo o esquema fatorial e concluir. b) Fazer a análise de variância com o desdobramento dos graus de liberdade de tratamentos, segundo o esquema fatorial e teste a significância da interação entre os efeitos. Se a interação for significativa teste a diferença média dos ganhos de peso do efeito de sexo para cada ração e as diferenças entre os valores médios das rações para cada sexo. c) Calcular os coeficientes de determinação e de variação do experimento. 172 Estatística Experimental Aula 10 Experimentos em parcela subdividida 1 Introdução Nos experimentos fatoriais ou esquemas fatoriais os tratamentos gerados pelas combinações dos níveis dos fatores são designados às unidades experimentais de acordo com o procedimento de aleatorização do delineamento inteiramente casualizado (DIC), ou do delineamento em blocos casualizados (DBC), ou do delineamento em quadrado latino (DQL). Entretanto, outros tipos de aleatorização são possíveis. Uma dessas aleatorizações alternativas dá origem aos experimentos em parcelas subdivididas, os quais são um caso especial de blocos incompletos. O princípio básico deste delineamento é que parcelas principais que recebem níveis de um fator são subdivididas em subparcelas ou subunidades, as quais recebem os níveis de um outro fator. Assim cada parcela funciona como um bloco para as subparcelas. Os níveis do fator sorteado nas parcelas são denominados de tratamentos principais e os níveis do fator sorteados nas subparcelas são denominados de tratamentos secundários. O delineamento em parcela subdividida teve sua origem na experimentação agronômica, com as parcelas, quase sempre, sendo grandes áreas de solo e as subparcelas sendo áreas menores de solo dentro das grandes áreas. Os tratamentos principais são distribuídos às parcelas de acordo com um delineamento especificado (DIC, DBC, DQL etc.) e os tratamentos secundários são distribuídos aleatoriamente às subparcelas dentro de cada parcela. A seguir apresentamos um possível croqui de um experimento em parcelas subdivididas com o Fator A, com 2 níveis (tratamentos principais) aplicados às parcelas de acordo com um delineamento em blocos casualizados com 3 repetições e o Fator B, com 3 níveis (tratamentos secundários) aplicados às subparcelas. Vale notar que os níveis de A são sorteados entre as duas parcelas de cada bloco e os níveis de B são sorteados entre as três subparcelas de cada parcela. BLOCO 1 BLOCO 2 BLOCO 3 Parcelas A1 A2 A2 A1 A2 A1 Subparcelas B1 B2 B3 B2 B1 B2 B3 B3 B2 B3 B3 B3 B2 B1 B1 B1 B2 B1 Se os tratamentos estivessem num esquema fatorial, o croqui poderia ser: BLOCO 1 BLOCO 2 BLOCO 3 A1B1 A1B2 A1B3 A2B2 A1B1 A2B2 A2B3 A1B3 A2B2 A1B3 A2B3 A1B3 A2B2 A2B1 A2B1 A1B1 A1B2 A2B1 ou seja, o delineamento em parcelas subdivididas representa uma restrição à casualização completa existente em um ensaio fatorial envolvendo o mesmo número de fatores e de níveis. Na análise estatística desses experimentos, as Fontes de Variação que fazem parte da variação entre as parcelas (Fator-A e Blocos, por exemplo) são usualmente agrupadas separadamente daquelas que fazem parte da variação dentro das parcelas ou entre as subparcelas (Fator-B e interação AxB). Neste caso, temos doisresíduos distintos: um referente às parcelas e outro referente às subparcelas. 173 Estatística Experimental 2 Análise de variância No quadro a seguir, apresentaremos a partição dos graus de liberdade de um experimento em parcelas subdivididas com “a” tratamentos primários, “b” tratamentos secundários, “r” repetições em diferentes delineamentos para os tratamentos aplicados às parcelas. 3 Modelo matemático e suposições Considerando um experimento em parcelas subdivididas envolvendo “a” tratamentos primários arranjados em um DIC com “r” repetições e “b” tratamentos secundários, o modelo pode ser descrito como: b1ja1ir1k comY ijkijjikiijk ,...,;,...,;,..., ,)( ).(),(~ );)((),(~ ;)( ; ; : berro0Naleatórioerrodoefeito aerro0NAdenívelésimoiorecebendoparcelaésimakdaefeito BdenívelésimojeAdenívelésimoidoconjuntoefeitooe subparcelanaBdenívelésimojdoefeitoo principalparcelanaAdenívelésimoidoefeitoogeralmédiaa sendo 2 ijk 2 ik ij j i Um esquema de análise de variância para este modelo é Parcelas Sub-divididas no D.I.C. (“r” repetições) Fonte de Variação g.l. A (a-1) Resíduo (a) a(r-1) (Parcelas) (ar-1) B (b-1) AxB (a-1)(b-1) Resíduo (b) a(r-1)(b-1) Total abr-1 Considerando agora, um experimento em parcelas subdivididas envolvendo “a” tratamentos primários arranjados em “r” blocos casualizados e “b” tratamentos secundários, o modelo pode ser escrito como: b1ja1ir1k comY ijkijjikikijk ,...,;,...,;,..., ,)( 174 Estatística Experimental ),(~ );,(~ ; ; )(;, ,; : 2 ijk 2 ik ik k ijj i 0Naleatórioerrodoefeito 0Ne blocoésimoknoprincipalparcelanaAdenívelésimoidoconjuntoefeitoo blocoésimokdoefeitoo BdenívelésimojeAdenívelésimoi deconjuntoefeitooesubparcelanaBdenívelésimojdoefeitoo principalparcelanaAdenívelésimoidoefeitoogeralmédiaa sendo Um esquema de análise de variância para este modelo é Parcela Subdivida no D.B.C.(“r” blocos) Fonte de Variação g.l. Blocos (r-1) A (a-1) Resíduo (a) (a-1)(r-1) (Parcelas) (ar-1) B (b-1) AxB (a-1)(b-1) Resíduo (b) a(r-1)(b-1) Total abr-1 4 Hipótese estatística As seguintes hipóteses podem ser testadas nos experimentos em parcelas subdivididas. A hipótese de que não existe ou existe interação AB é equivalente às hipóteses estatísticas b1jea1icom0H 0H ij11 ij01 ...,,...,,)(: )(: e para testá-las, usamos a estatística ;);Re..;int..(~)(Re bsdolgeraçãodalg01 F bsQM QMAB F , a qual sob H0, tem distribuição F-Snedecor com graus de liberdade da interação no numerador e graus de liberdade do resíduo (b) no denominador. No DIC temos ));)(();)((( 1b1ra1b1aF , no DBC temos ));)(();)((( 1b1ra1b1aF . A hipótese de que não existe ou existe efeito principal do fator A é a1icom0H 0H i12 i02 ...,,: : , e para testá-las, usamos a estatística ;);Re..;..(~)(Re asdolgAfatordolg02 F asQM QMA F , a qual sob H0, tem distribuição F-Snedecor com graus de liberdade do fator A no numerador e graus de liberdade do resíduo (a) no denominador. 175 Estatística Experimental No DIC temos ));1();1(( raaF , no DBC temos ));1)(1();1(( raaF . as hipóteses de que não existe ou existe efeito principal do fator B é bjcomH H j j ...,,10: 0: 13 03 , e para testá-las, usamos a estatística ;);Re..;..(03 ~)(Re bsdolgBfatordolg F bsQM QMB F . que sob H0, tem distribuição F-Snedecor com graus de liberdade do fator B no numerador e graus de liberdade do resíduo (b) no denominador. No DIC temos ));)(();(( 1b1ra1bF , no DBC temos ));)((();(( 1b1ra1bF . 5 Detalhes computacionais Apresentaremos alguns passos que facilitam os cálculos das somas de quadrados da ANOVA. No DIC: Soma de Quadrados do Total (SQT) ; )( , )( abr Y Csendo abr Y YSQT 22r 1k a 1i b 1j 2 ijk Soma de Quadrados do fator A, SQ(A) CY br 1 ASQ a 1i 2 i )( ; Soma de Quadrados da Parcelas, SQ(Parc) CY b 1 ParcSQ ba ji 2 ij , , )( ; SQRes(a) = SQ(Parc) – SQ(A); Soma de Quadrados do fator B, SQ(B) CY ar 1 BSQ b 1j 2 j )( ; Soma de Quadrados da interação AxB, SQ(AxB)=SQ(A,B)-SQ(A)- SQ(B) ou CY r 1 AxBSQ a 1i b 1j 2 ij )( , sendo a SQ(A,B) a soma de quadrado conjunta, a qual nos fatoriais a x b é igual à soma de quadrados dos tratamentos (SQTr). SQRes(b) = SQ(Parc) – SQ(B)-SQ(AB); Para calcular os coeficientes de variação para as parcelas e para as subparcelas usamos, respectivamente: 100x Y asQM aCV )(Re )( 100x Y bsQM bCV )(Re )( )()()(, AxBSQBSQParcSQSQModeloquesendo100x SQT SQModelo R2 Dos testes de hipóteses sugeridos anteriormente, se ocorrer interação AxB significativa, torna-se imprescindível fazer o desdobramento )( iAdedentro BSQ , para i = 1, 2, ..., a ou )( jBdedentro ASQ , para j = 1, 2, ..., b. Para 176 Estatística Experimental testar se “as médias de B são iguais, dentro de cada nível de A” usaremos como denominador da estatística F, bE = QMRes(b), com seus a(r-1)(b-1) graus de liberdade. Comparações de duas médias de A, no mesmo ou em diferentes níveis de B, envolve o efeito principal de A e a interação AB, ou seja, elas são ambas, comparações das parcelas e das subparcelas. Neste caso é apropriado usar uma média ponderada dos erros Ea e Eb , definida como: ba EbEbsQM )1(( 1 (*)Re Para tais comparações a razão da diferença dos tratamentos pelo seu erro padrão não segue uma distribuição t-student . Uma aproximação para testar se “as médias de A são iguais, dentro de cada nível de B” usaremos como denominador da estatística t, o valor obtido de ba E1bEb 1 sQM )(((*)Re , que tem n* graus de liberdade, o qual é calculado pela Fórmula de Sattertwait: . ),(Re),(Re, )( )(* subparceladaliberdadedegrausosn eparceladaerrodoliberdadedegrausosn bsQMEasQMEsendo n E1b n E E1bE n b a ba b 2 b a 2 a 2 ba 6 Comparações múltiplas entre médias de tratamentos Após tirarmos as conclusões sobre os testes de hipóteses da Análise de Variância, poderemos estar interessados em comparar as médias dos tratamentos primários (A), dos secundários (B) ou da interação (AxB). Daí, o problema consiste em usar a estimativa da variância (2) apropriada. A seguir, apresentaremos esses problemas para os casos mais freqüentes. Aqui consideraremos a notação )(Re),(Re bsQMEasQME ba 1º Caso: entre médias do tratamento primário Para testar um contraste escolhido a priori, aa2211 cccY ... , sendo )...,,,( a21ii as médias dos tratamentos primários, ou seja, 0YH0 : , usamos a estatística )( 2 i ~ c r ˆ aEdogl i a i t E Y t , sendo )( aEdogl t o quantil de ordem ) 2 1( da distribuição t-student com graus de liberdade do Ea. Para testar um contraste entre duas médias de A, ,iiY , ou seja, 0YH0 : usamos a estatística 177 Estatística Experimental )(~ ˆ aEdogl a t br E2 Y t , sendo )( aEdogl t o quantil de ordem )( 2 1 da distribuição t-student com graus de liberdade do Res(a). Para os testes de Tukey e de Duncan usamos, respectivamente, br E qdms aEdoglaA a );( e br E zdms aEdoglaA a );( Sendo, que “q” e “z” correspondem aos valores tabelados da distribuição de Tukey e Duncan. 2o Caso: entre médias do tratamento secundário Para testar um contraste escolhido a priori, bb2211 cccY ... , sendo )...,,,( b21jj as médias dos tratamentos secundários, ou seja, 0YH0 : , usamos a estatística )( 2 i ~ c ar ˆ bEdogl i b i t E Y t , sendo )( bEdogl t o quantil de ordem )( 2 1 da distribuição t-student com grausde liberdade do Eb. Para testar um contraste entre duas médias de B, ,iiY , usamos a estatística )(~ ˆ bEdogl b t E ar 2 Y t , sendo )( bEdogl t o quantil de ordem )( 2 1 da distribuição t-student com graus de liberdade do Eb. Para os testes de Tukey e de Duncan usamos, respectivamente, ar E qdms bdoEglbB b );( ar E zdms bEglbB b );( Sendo que “q” e “z” correspondem aos valores tabelados da distribuição de Tukey e Duncan. 3o Caso: entre médias do tratamento secundário num mesmo nível de i de A Para testar um contraste escolhido a priori, ibb2i21i1 cccY ... , sendo )...,,,( b21jij as médias dos tratamentos secundários num mesmo nível “i” de A, ou seja, 0YH0 : , usamos a estatística 178 Estatística Experimental )( 2 i ~ c r ˆ bEdogl i b i t E Y t , sendo )( bEdogl t o quantil de ordem )( 2 1 da distribuição t-student com graus de liberdade do Eb. Para testar um contraste entre duas médias de B num mesmo nível de A, ,ijijY , usamos a estatística )(~ ˆ bEdogl b t r E2 Y t , sendo )( bEdogl t o quantil de ordem )( 2 1 da distribuição t-student com graus de liberdade do Eb. Para os testes de Tukey e de Duncan usamos, respectivamente r E qdms bEglb b );( r E zdms bEdoglb b );( Sendo que “q” e “z” correspondem aos valores tabelados da distribuição de Tukey e Duncan. 4o Caso: entre médias do tratamento primário num mesmo nível de B Para testar um contraste escolhido a priori, ajaj22j11l cccY ... , sendo a21iij ...,,, as médias dos tratamentos primários num mesmo nível “j” de B, usamos a estatística )( 2 i ba * * c br 1)E-(b E ˆ n i i tmenteaproximada Y t , Sendo n* os graus de liberdade calculados pela Fórmula de Sattertwait (o asterisco indica que esta razão não tem uma distribuição t-student). Para testar um contraste entre duas médias de A num mesmo nível de B, ,ijijlY , usamos a estatística aproximada * 1)E-(b E br ˆ ba * n i tmenteaproximada 2 Y t com n* os graus de liberdade calculados pela Fórmula de Sattertwait 179 Estatística Experimental Correspondentemente uma aproximação para o teste de Tukey temos: s(b) (b-1)QMReQMRes(a) br 1 qdms nb ),( * e , sendo os valores de “q” e “z” correspondem a “b” tratamentos e n* graus de liberdade para o resíduo (calculados pela Fórmula de Sattertwait) e são encontrados em tabelas próprias. EXEMPLO 1: Supor um experimento com três rações A, B e C em seis blocos casualizados, sendo cada parcela constituída de dois bovinos de corte. Em uma determinada fase do experimento, os bovinos dentro de cada parcela, passaram a receber, por sorteio, um dos dois tipos de suplementos minerais M e P. A variável dependente é o ganho de peso no final do experimento. Um possível croqui deste experimento em parcelas subdivididas no delineamento em blocos casualizados: B A C P M M P P M A C B P M M P P M B C A P M M P M P A B C M P M P P M C A B P M M P P M C B A M P M P P M 1ª letra fator ração e 2ª letra fator suplemento mineral BLOCOS I II III IV V VI BP AM BP AM CP CM BM AP BM AP CM CP AM CM CM BM AM BM AP CP CP BP AP BP CP BP AM CP BP AP CM BM AP CM BM AM Bloco I Bloco III Bloco IV Bloco V Bloco VI Bloco II 180 Estatística Experimental Esquema da análise de variância Causas da variação g.l. Blocos 5 Ração (Trat. principal) A 2 Erro (a) 10 Parcelas (17) Suplemento mineral (Trat. Secundário) B 1 Ração x Suplemento 2 Erro (b) 15 Total 35 Os ganhos individuais ao final do experimento foram: Blocos Ração A Ração B Ração C Total M P M P M P I 107 89 116 101 90 96 599 II 117 101 136 110 112 89 665 III 122 98 130 104 99 92 645 IV 111 101 122 91 105 78 608 V 90 95 117 100 110 90 602 VI 116 90 114 94 114 93 621 Total 663 574 735 600 630 538 3.740 (Veja estrutura do arquivo na última página) Quadro de Totais I Blocos ( 2 )* Ração A Ração B Ração C Total I 196 217 186 599 II 218 246 201 665 II 220 234 191 645 IV 212 213 183 608 V 185 217 200 602 VI 206 208 207 621 Total 1.237 (12) 1.335 (12) 1.168 (12) 3.740 (*) Os números entre parênteses representam o total de parcelas somadas para se obter os valores observados da tabela. Cálculos para montar o quadro da anova: 44388544 623 3740 9389107SQT 2 222 , ))()(( )...( 22582 623 3740 621665599 6 1 SQBl 2 222 , ))()(( )...( Para obtermos a soma de quadrados das parcelas usamos o quadro auxiliar I com os totais de cada parcela. Como temos duas subparcelas em cada parcela a soma de quadrados das parcelas fica 562377 623 3740 207217196 2 1 SQParcelas 2 222 , ))()(( )...( Para as demais SQ, organizamos o seguinte quadro de totais II que relaciona os níveis dos dois fatores entre si: (6) SUPLEMENTOS RAÇÃO Totais A B C M 663 735 630 2028 P 574 600 538 1712 Totais 1237 1335 1168 3740 Cálculos do quadro da ANOVA 181 Estatística Experimental 731173 623 3740 116813351237 12 1 SQRações 2 222 , ))()(( )( 6162173117322582562377 SQRaçõesSQBlSQParcelasasSQ ,,,, )(Re 782773 623 3740 17122028 18 1 SQSupl 2 22 , ))()(( )( 894057 623 3740 538574663 6 1 SRSQ 2 222 , ))()(( )...(),( 38110782773731173894057 SSQRSQSRSQRxSSQ ,,,, )()(),()( 84799 RxCSQSQSuplSQParcelasSQTbsSQ , )()(Re Quadro da anova Causas da variação g.l. S.Q. QM F Blocos 5 582,22 116,44 1,87ns Ração (Trat. Principal) A 2 1173,73 586,86 9,44** Erro (a) 10 621,61 62,16 Parcelas (17) 2377,56 Suplemento (Trat. Secundário) B 1 2773,78 2773,78 52,02** Ração x Suplemento 2 110,38 55,19 1,04ns Erro (b) 15 799,84 53,32 Total 35 6061,56 Obs. Os efeitos das rações e dos blocos são testados usando o resíduo (a). Os efeitos dos suplementos e da interação são testados usando o resíduo b. F(5,10; 0,05)=3,33 ; F(5,10; 0,01)= 5,64; F(2,10; 0,05)= 4,10; F(2,10; 0,01)= 7,56; F(1,15; 0,05)= 4,54 F(1,15; 0,01)= 8,86; F(2,15; 0,05)= 3,68; F(2,15; 0,01)= 6,36 Conclusão: como a interação não foi significativa (p>0,05) devemos interpretar as diferenças significativas dos efeitos principais da ração e do suplemento. Teste de Tukey: duas médias de A )(Re,).;..,( asQMEsendorb E2 qdms A A ElgaA a 4412 12 32124 883dmsA , , , duas médias de B )(Re,).;..,( bsQMEsendora E2 qdms b b ElgbB b 337 18 64106 013dmsB , , , 182 Estatística Experimental Quadro de médias (6) SUPLEMENTOS RAÇÃO Totais A B C M 110,5 122,5 105,0 112,7 A P 95,7 100,0 89,7 95,1 B Totais 103,1 ab 111,3 a 97,3 b 103,9 Médias seguidas pela mesma letra minúsculas na linha não diferem entre si pelo teste de Tukey a 5% Médias seguidas pela mesma letra maiúsculas na coluna não diferem entre si pelo teste de Tukey a 5% Coeficientes de variações %, , ,)(Re.. )( 59789103 1662 Y asMQ CV a %, , ,)(Re.. )( 03789103 3253 Y bsMQ CV b Script no R para obter os resultados acima # entrada dos dados pelo comando read.table( ) dados.ex1_10 <- read.table("ex1ps_10.txt", header=T) # imprimindo as 6 primeiras linhas do arquivo dados.ex1_10 head(dados.ex1_10) # anexando o objeto dados.ex1_10 no caminho de procura attach(dados.ex1_10) # calculo das interações - Quadros dos totais int.total <- tapply(gp, list(suplemento, racao), sum) int.total # calculo dos totais marginais do fator suplemento total.supl<- tapply(gp,suplemento,sum) total.supl # calculo dos totais marginais do fator racao total.racao<- tapply(gp,racao,sum) total.racao # calculo das interações - Quadros das médias int.media <- tapply(gp, list(suplemento, racao), mean)round(int.media,1) # calculo das médias marginais do fator suplemento media.supl<- tapply(gp,suplemento,mean) round(media.supl,1) # calculo das médias marginais do fator antibiótico media.racao<- tapply(gp,racao,mean) round(media.racao,1) # quadro da anova no esquema pelo comando aov() gpps.av <- aov(gp~factor(bloco)+factor(racao)+factor(suplemento)+ factor(racao):factor(suplemento)+Error(bloco/racao)) 183 Estatística Experimental summary(gpps.av) # gráfico da interação interaction.plot(racao,suplemento,gp,col=2,lwd=2, ylab="médias de ganho de peso",xlab="rações", main="Gráfico da Interação") # requerendo o pacote ExpDes require(ExpDes) split2.rbd(racao, suplemento, bloco, gp, quali = c(TRUE, TRUE), mcomp = "tukey", fac.names = c("Ração", "Suplemento")) # retirando o objeto dados.ex1_10 do caminho de procura detach(dados.ex1_10) O uso do delineamento em parcelas subdivididas é desejável quando: O experimento pode ser usado quando um fator adicional tem de ser incorporado em um experimento para aumentar a sua amplitude. Pode-se saber que as maiores diferenças podem ser esperadas de ocorrer entre os níveis de um fator do que nos níveis do outro fator. Neste caso, as combinações dos tratamentos em que as grandes diferenças são esperadas podem ser atribuídas aleatoriamente às parcelas principais simplesmente por conveniência. O experimento é usado quando grande precisão é desejada para comparações entre os níveis de um fator do que em níveis do outro fator. Em resumo, dado que nos experimentos em parcelas subdivididas a variação entre as subparcelas é esperada ser menor do que a variação entre as parcelas principais, o fator que requerer menor quantidade de material experimental, ou que é mais importante, ou que é esperado apresentar menores diferenças, ou sobre o qual é desejado maior precisão por qualquer motivo, são atribuídos ás subparcelas. 184 Estatística Experimental 10º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL Num experimento em parcelas subdivididas para se estudar o ganho de peso médio diário em suínos foram utilizados quatro tratamentos principais ( A ) e dois secundários ( B ), no delineamento em blocos casualizados com cinco repetições. Os tratamentos principais, rações A1, A2, A3, e A4 foram aplicadas as parcelas constituídas de seis suínos cada uma logo após a desmama. Decorridos trinta dias, três suínos de cada parcela passaram a receber por sorteio uma suplementação alimentar, com dois tipos de vitaminas B1 e B2 . Ao final do experimento os aumentos de peso médio dos três animais por subparcela em quilogramas estão dados na tabela abaixo: Tratamentos 1º Bloco 2º Bloco 3º Bloco 4º Bloco 5º Bloco Total A1 B1 1,30 1,35 1,28 1,25 1,32 6,50 B2 1,32 1,35 1,29 1,31 1,35 6,62 A2 B1 1,10 1,15 1,12 1,18 1,11 5,66 B2 1,20 1,21 1,15 1,18 1,20 5,94 A3 B1 1,45 1,48 1,45 1,44 1,46 7,28 B2 1,48 1,45 1,47 1,50 1,41 7,31 A4 B1 1,22 1,24 1,24 1,30 1,22 6,22 B2 1,24 1,23 1,25 1,28 1,26 6,26 Total 10,31 10,46 10,25 10,44 10,33 51,79 Obs. 4 1i 2 1j 2 ijy 67.56730 Usar 5 casas decimais para os cálculos. a) Estabelecer as hipóteses estatísticas, reproduza os resultados do quadro abaixo, o gráfico da interação, fazer a análise de variância e concluir. Caso haja interação fazer os desdobramentos necessários e os testes de comparações múltiplas. b) Calcule as médias dos tratamentos principais, os erros padrões e compare-as pelo teste de Tukey a 5% de probabilidade. c) Calcule os coeficientes de variação ( C.V. ) e de determinação ( R2 ) do experimento. Quadros auxiliares: 1) (2) I II III IV V Total A1 2,62 2,70 2,57 2,56 2,67 13,12 A2 2,30 2,36 2,27 2,36 2,31 11,60 A3 2,93 2,93 2,92 2,94 2,87 14,59 A4 2,46 2,47 2,49 2,58 2,48 12,48 Total 10,31 10,46 10,25 10,44 10,33 51,79 2) (5) A1 A1 A1 A1 Total B1 6,50 5,66 7,28 6,22 25,66 B2 6,62 5,29 7,31 6,26 26,13 Total 13,12 11,60 14,59 12,48 2) Cinco jumentos foram utilizados, dentro do manejo regular de colheita de sêmem com o qual já estavam acostumados, para testar sobre o primeiro ejaculado, três diferentes diluentes e após as diluições, três diferentes tempo de conservação do material (5ºC). A resposta medida foi a motilidade observada no sêmem em função daqueles fatores. Para cada jumento, o primeiro ejaculado foi divido em três alíquotas, diluídas cada uma em um dos diluentes e este volume novamente dividido em outras três alíquotas, uma para cada tempo de conservação. Percebe-se que a parcela é definida pelo diluente e dentro dele, as três subparcelas correspondentes aos tempos. Trata-se portanto de um delineamento em parcelas subdivididas , em que cada jumento assume o papel de um bloco, já que pela utilização de alíquotas todos os tratamentos (diluentes) provêm de um mesmo ejaculado. 185 Estatística Experimental DILUENTE A B C ANIMAL T1 T2 T3 T1 T2 T3 T1 T2 T3 1 75 73 66 214 81 75 62 218 68 61 50 179 2 65 60 61 186 69 62 51 182 60 55 50 165 3 78 83 70 231 79 76 60 215 72 68 61 201 4 68 61 51 180 76 66 51 193 61 57 53 171 5 44 43 37 124 55 51 41 147 34 24 21 79 Total 330 320 285 935 360 330 265 955 295 265 235 795 3I2I1IiLinear 3 1I 3 1j ij 3 1I 3 1j 2 ij 101Y2685Y169173Y )()()(; )( a) Checar os resultados das fórmulas acima e preencher os quadros auxiliares abaixo. b) Estabelecer as hipóteses estatísticas e fazer a análise de variância e concluir. c) No gráfico abaixo teste a significância da tendência linear dos valores médios da motilidade em cada diluente. d) Calcule os coeficientes de variação do experimento. Quadros auxiliares: 1) Jumentos (Blocos) ( ) I II III IV V Total A B C Total 2) ( ) T1 T2 T3 Média A B C Média A B C Motilidade observada em sêmem de jumentos segundo o diluidor e o tempo Tempo M ot il id ad e 44 50 56 62 68 74 6 10 14 18 22 26 30 34 38 186 Estatística Experimental Aula 11 Experimentos em parcelas subdivididas - Análise de medidas repetidas no tempo. Como nos experimentos em parcelas subdvididas, experimentos utilizando delineamentos de medidas repetidas no tempo têm estruturas que envolvem mais de um tamanho de unidade experimental. Por exemplo, um animal pode ser observado durante certo período de tempo, onde tempo é um dos fatores na estrutura de tratamentos do experimento. Tais dados são análogos aos dados de um experimento em parcela subdividida em muitos aspectos e sua análise é frequentemente conduzida tal como um experimento em parcela subdividida e denominado como parcela subdividida no tempo, ou análise de medidas repetidas no tempo. Exemplo: um experimento envolvendo 3 drogas foi conduzido para estudar cada efeito de droga no batimento cardíaco dos animais. Depois que cada droga era administrada, o batimento cardíaco era medido de 5 em 5 minutos durante 20 minutos. DA DB DC Animais T5 T10 T15 T20 T5 T10 T15 T20 T5 T10 T15 T20 1 78 86 81 77 85 86 83 80 69 73 72 74 2 71 83 88 81 82 86 80 84 66 62 67 73 3 72 82 81 75 71 78 70 75 84 90 88 87 4 72 83 83 69 83 88 79 81 80 81 77 72 5 66 79 77 66 86 85 76 76 72 72 69 70 6 74 83 84 77 85 82 83 80 65 62 65 61 7 62 73 78 70 79 83 80 81 75 69 69 68 8 69 75 76 70 83 84 78 81 71 70 65 65 Quadro auxiliar 1) Totais das parcelas Animais Total DA 322 323 310 307 288 318 283 290 2441 DB 334 332 294 331 323 330 323 326 2593 DC 288 268 349 310 283 253 281 271 2303 Total 944 923 953 948 894 901 887 887 7337 Quadro auxiliar 2) Totais dos fatores T5 T10 T15 T20 Total DA 564 644 648 585 2441 DB 654 672 629 638 2593 DC 582 579 572 570 2303 Total 1800 1895 1849 1793 7337 Cálculo das somas de quadrados do quadro da ANOVA: ))()(( )...( 843 7337 658678SQT 2 222 Do QUADRO I, temos243604 843 7337 271323322 4 1 SQ 2 222 Parcelas ,))()(( )...( 081315 843 7337 23032441 32 1 SQ 2 22 Droga ,))()(( )...( 162289081315243604DrogaQSparcelasQSSQ aErro ,,,....)( Do QUADRO II, temos 187 Estatística Experimental 61282 543 7337 179318951800 24 1 SQ 2 222 Tempo ,))()(( )...( 862128 843 7337 570644564 8 1 SQ 2 222 Conjunta ,))()(( )...( 17531 61282081315862128 SQSQSQTempoxDrogaSQ TempoDrogaConjunta , ,,, )( 474891753161282243604494907 TempoxDrogaSQSQSQSQTSQ TempoParcelasbErro ,,,,, )()( Quadro da ANOVA F.V. G.L. S.Q. Q.M. F p DROGA 2 1315,08 657,54 6,03** 0.008512 Erro(a) 21 2289,16 109,01 PARCELAS 23 3604,24 156,71 20,15** TEMPO 3 282,81 94,27 12,12** 2.315e-06 DROGA x TEMPO 6 531,17 88,53 11,39** 1.381e-08 Erro(b) 63 489,47 7,78 TOTAL 95 4907,49 F(2, 21; 0,05) = 3,47 F(2, 21; 0,01) = 5,78 F(3, 63; 0,05) = 2,76 F(3, 63; 0,01) = 4,13 F(6, 63; 0,05) = 2,25 F(6, 63; 0,01) = 3,12 Conclusão: existe uma interação tempo*droga significativa (p<0,01); então devemos comparar os tempos em cada droga e drogas em cada tempo. Script no R para os cálculos acima # entrada dos dados pelo comando read.table( ) dados.ex1_11 <- read.table("ex1mr_11.txt", header=T) # imprimindo as 6 primeiras linhas do arquivo dados.ex1_10 head(dados.ex1_11) # anexando o objeto dados.ex1_11 no caminho de procura attach(dados.ex1_11) # calculo das interações - Quadros dos totais int.total <- tapply(fc, list(droga,tempo), sum) int.total # calculo dos totais marginais do fator suplemento total.droga<- tapply(fc,droga,sum) total.droga # calculo dos totais marginais do fator racao total.tempo<- tapply(fc,tempo,sum) total.tempo # calculo das interações - Quadros das médias int.media <- tapply(fc, list(droga, tempo), mean) round(int.media,1) # calculo das médias marginais do fator suplemento 188 Estatística Experimental media.droga<- tapply(fc,droga,mean) round(media.droga,1) # calculo das médias marginais do fator antibiótico media.tempo<- tapply(fc,tempo,mean) round(media.tempo,1) # quadro da anova no esquema pelo comando aov() fc.av <- aov(fc~factor(droga)+factor(tempo)+ factor(droga):factor(tempo)+Error(droga:animal)) summary(fc.av) # gráfico da interação interaction.plot(tempo,droga,fc,col=2,lwd=2, ylab="médias da frequência cardíaca",xlab="tempo", main="Gráfico da Interação") # requerendo o pacote ExpDes require(ExpDes) split2.crd(droga, tempo, animal, fc, quali = c(TRUE, TRUE), mcomp = "tukey", fac.names = c("Droga", "Tempo")) # retirando o objeto dados.ex1_11 do caminho de procura detach(dados.ex1_11) Para comparar tempo em cada droga, o erro padrão da diferença de duas médias é 391 8 7872 r E2 YYES bilij , ),( ).(. )( .. , e o teste de tukey é dado por 734391393YYESqdms ilij050633 .),)(,().(. ..),;,( Do quadro auxiliar das médias temos, T5 T10 T15 T20 DA 70,50b 80,50ª 81,00a 73,13b DB 81,75a 84,00a 78,63a 79,75a DC 72,75b 72,38b 71,50b 71,25b Médias com a mesma letra minúscula nas linhas não diferem entre si pelo teste de Tukey a 5%. Assim do quadro auxiliar das médias temos, T5 T10 T15 T20 DA 70,50bB 80,50aA 81,00aA 73,13abB DB 81,75aA 84,00aA 78,63aA 79,75aA DC 72,75aB 72,38aB 71,50aB 71,25aB Médias com a mesma letra minúscula nas colunas não diferem entre si pelo teste de Tukey a 5%. Médias com a mesma letra maiúscula nas colunas não diferem entre si pelo teste de Tukey a 5%. Dado que os níveis do fator tempo são quantitativos e igualmente espaçados, polinômios ortogonais podem ser usados para checar a tendência linear e quadrática na resposta de cada droga 189 Estatística Experimental A tendência linear para a Droga B (DB) é definida pelo contraste 371175793637810084175813 Y3Y1Y1Y3Y 24232221Linear ,),)((),)((),)((),)(( ˆ com erro padrão do contraste dado por: 414 8 787 3113S 2222 YLinear , , ))()((ˆ A estatística t-student correspondente é 582 414 3711 S Y t LinearY Linear Calc ,, ,ˆ ˆ . , o valor tabelado é t(63; 0,05) = 2,00. Concluímos, então, que a tendência linear negativa observada no gráfico para a Droga B (DB) é significativa (p<0,05) pelo teste t-student. A tendência quadrática para a Droga a (DA) pode ser definida pelo contraste 14131211Quad 1111Y . o qual é estimado por 8717Y1Y1Y1Y1Y 14131211Quad ,ˆ com erro padrão do contraste dada por: 971 8 787 1111S 2222Yuad , , ))()(( . a estatística t-student correspondente é 079 971 8717 YES Y t Quad Quad Calc ,, , )ˆ.(. ˆ . . o valor tabelado é t(63; 0,05) = 2,00. Concluímos, então que a forte tendência quadrática observada no gráfico para a Droga A (DA) é significativa (p<0,05) pelo teste t-student. 190 Estatística Experimental Aula 12 Transformação de dados 1 Introdução Existem duas maneiras nas quais as hipóteses da ANOVA podem ser violadas. Primeiro, os dados podem consistir de medidas em uma escala ordinal ou nominal; neste caso métodos mais apropriados para dados ordinais e nominais são necessários. Segundo, os dados, embora medidos em escala contínua, podem não satisfazer pelo menos uma das três hipóteses requeridas pela análise de variância: Como vimos anteriormente, as hipóteses da análise de variância são: os termos dos erros são aleatóriamente, independentemente e normalmente distribuídos ),(~ 2ij 0Ne a variância de diferentes amostras são homogêneas; variâncias e médias de diferentes amostras não são correlacionadas; os efeitos dos tratamentos são aditivos. Nestes casos, duas opções se oferecem para analisar os dados. Uma é reduzir o intervalo dos dados para dados medidos em uma escala nominal ou ordinal apropiada e fazer uma análise para este tipo de dado. A outra possibilidade é ver se os dados podem ser transformados para satisfazer as hipóteses da ANOVA. Se tal transformação é encontrada, os dados transformados podem então serem analisados pelos métodos da ANOVA. A hipótese de variâncias iguais é essencial para a realização da análise de variância. Em muitos casos a transformação que torna as variâncias mais homogêneas, também tornam os dados mais próximos de uma distribuição normal. Considere o exemplo, no qual os pesos, em “pounds”, de animais, em um DBC, foram observados. Os tratamentos estão em um esquema fatorial 3 x 2, três espécies de animais e dois grupos, um tratado com uma nova vitamina e outro contrôle, em 4 blocos Bloco Tratamentos I II III IV mice contrôle 0.18 0.30 0.28 0.44 mice vitamina 0.32 0.40 0.42 0.46 galinha controle 2.0 3.0 1.8 2.8 galinha vitamina 2.5 3.3 2.5 3.3 ovelha controle 108.0 140.0 135.0 165.0 ovelha vitamina 127.0 153.0 148.0 176.0 O quadro da anova dos dados deste experimento mostra os seguintes resultados Df Sum Sq Mean Sq F value Pr(>F) factor(bloco) 3 984 328 2.631 0.0881 . factor(fatorA) 2 108321 54161 434.507 5.28e-14 *** factor(fatorB) 1 142 142 1.140 0.3025 factor(fatorA):factor(fatorB) 2 250 125 1.004 0.3896 Residuals 15 1870 125 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 191 Estatística Experimental A alta significância entre as espécies (fatorA) não é surpreendente para o pesquisador. O que parece estranho é que não foi detectada diferença significativa devido a vitamina(fatorB), tendo em vista que todo animal em todas as replicações que receberam vitamina mostraram um peso maior do que o correspondente animal contrôle. Parece estranho também que não foi encontrado evidências de interação entre os efeitos de vitamina e espécies, dado que a resposta aparente a vitamina é tão diferente nas diferentes espécies. Tudo que podemos concluir é que mice, galinhas e ovelhas diferem em peso. Vamos olhar estes dados com as supsições da anova em mente e ver o que podemos fazer se uma das suposições não é atendida. O gráfico de resíduos vs valores preditos mostra claramente uma heterogeneidade de variâncias e o QQ-plot mostra um comportamento dos dados que não é muito convicente da distribuição normal. A mensagem parece clara, entretanto, podemos ainda fazer testes para verificar o desvio dos pressupostos. Teste de normalidade de normalidade de Shapiro-Wilk no R # teste de normalidade shapiro.test(pesotrat.av$res) Saída fornecida pelo R: Shapiro-Wilk normality test data: pesotrat.av$res W = 0.9536, p-value = 0.3236 Este teste mostra o teste é não significativo (p=0,3236), portanto não rejeitamos ),(~: 2ij0 0NH , ou seja, os resíduos e por conseguinte os dados deste experimento suportam a suposição de normalidade. Assim, a primeira suposição é prenchida. 192 Estatística Experimental Agora vamos examinar a suposição de homogeneidade das variâncias. Vamos aplicar o teste de Bartlett usando o R. # teste da homogeneidade das variâncias dos tratamentos bartlett.test(peso~factor(trat)) Saída do teste de Bartlett no R: Bartlett test of homogeneity of variances data: peso by factor(trat) Bartlett's K-squared = 81.8698, df = 5, p-value = 3.408e-16 O teste é significativo (p=3.408e-16), rejeitamos 26 2 10H ...: , ou seja, as variâncias dos tratamentos não são homocedásticas (homogêneas). Logo, a segunda suposição não é observada nos dados deste experimento. Para tentar contornar o problema vamos usar a transformação Box-Cox, que consiste em transformar os dados de acordo com a expressão sendo um parâmetro a ser estimado dos dados. Se a equação acima se reduz a sendo ln é o logaritmo neperiano. Uma vez obtido o valor de encontramos os valores dos dados transformados conforme a equação acima e utilizamos estes dados transformados para efetuar as análises. A função boxcox() do pacote MASS calcula a verossimilhanca perfilhada deste parâmetro. Devemos escolher o valor que maximiza esta função. Nos comandos a seguir começamos carregando o pacote MASS e depois obtemos o gráfico da verossimilhanca perfilhada no R: # requerendo o pacote MASS require(MASS) boxcox(peso ~ factor(trat),plotit = T) Estes comandos fornecem o gráfico da verossimilhança perfilada Como estamos interessados no máximo da função vamos dar um zoom no gráfico com o comando 1y y ' 0 )ln(' yy 193 Estatística Experimental # zoom no gráfico par maiores detalhes do valor do parâmetro boxcox(a_peso ~ racoes, lam = seq(1,2, 1/10)) O gráfico mostra que o valor que maximiza a função é aproximadamente 0,1. Assim, próximo passo é obter os dados transformados e depois fazer as analise utilizando estes novos dados. # obtenção dos dados transformados lambda<-0.1 peso.trans <- (peso^(lambda) - 1)/lambda # fazendo a análise de variância dos dados transformados peso.avtrans <- aov(peso.trans ~ factor(trat) summary(peso.avtrans) plot(peso.avt) O quadro da anova dos dados transformados mostra o seguinte quadro da anova Df Sum Sq Mean Sq F value Pr(>F) factor(bloco) 3 0.85 0.28 18.244 2.88e-05 *** factor(fatorA) 2 237.35 118.68 7678.808 < 2e-16 *** factor(fatorB) 1 0.31 0.31 19.879 0.00046 *** factor(fatorA):factor(fatorB) 2 0.02 0.01 0.502 0.61518 Residuals 15 0.23 0.02 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Este quadro mostra um resultado mais satisfatório do que a análise dos dados sem transformação. Nesta análise, também é mostrado uma significância do fator B (p=0,00046). Mesmo assim, o resultado do teste da significância da interação (p = 0,61518) permaneceu não significativo. NOTA: No gráfico da verossimilhança perfilhada notamos que é mostrado um intervalo de confiança para e que o valor 0 está contido neste intervalo. Isto indica que podemos utilizar a transformação logaritímica dos dados e os resultados da anova serão bem próximos dos obtidos com a transformação com 10, , préviamente adotada. 194 Estatística Experimental # quadro da anova dos dados transformados pesolog.av <-aov(log(peso+1)~factor(bloco)+factor(fatorA)+factor(fatorB)+ factor(fatorA):factor(fatorB)) summary(pesolog.av) Df Sum Sq Mean Sq F value Pr(>F) factor(bloco) 3 0.22 0.07 12.85 0.000201 *** factor(fatorA) 2 96.89 48.44 8573.72 < 2e-16 *** factor(fatorB) 1 0.07 0.07 12.11 0.003361 ** factor(fatorA):factor(fatorB) 2 0.00 0.00 0.41 0.670832 Residuals 15 0.08 0.01 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Reparem que os resultados desta anova estão bem próximos dos resultados da anova dos dados originais. Teste de normalidade de Shapiro-Wilk nos resíduos dos dados transformados # teste da normalidade shapiro.test(pesolog.av$res) Shapiro-Wilk normality test data: pesofattrans.av$res W = 0.9803, p-value = 0.9014 Teste de da homogeneidade das variâncias dos tratamentos # teste de bartlett bartlett.test(log(peso+1)~factor(trat)) O resultado do teste de Bartlett para os dados transformados é Bartlett test of homogeneity of variances data: log(peso + 1) by factor(trat) Bartlett's K-squared = 5.5714, df = 5, p-value = 0.3502 Agora temos confiança de que a nova análise de variância é válida, dado que dados transformados satisfazem as duas suposições da análise de variância. Com os dados originais a homogeneidade das variâncias não era atendida.