Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Apostila de estatística experimental Escola de Medicina Veterinária da UFMG Profa. Dra. Ângela Maria Quintão Lana Escola de Medicina Veterinária e Zootecnia da UFT Prof. Dr. Luciano Fernandes Sousa 2 1 Definição de conceitos: 1.1 Unidade experimental (UE) É a menor unidade de um experimento na qual é aplicado um tratamento, em experimentos de campo as unidades experimentais são denominadas parcelas. As parcelas irão depender no número de tratamentos e o número de repetições dos tratamentos. A unidade experimental, experimentação animal é representada geralmente por um indivíduo (ser humano ou animal). Quando uma resposta for medida em grupo (mesma baia), como por exemplo, o consumo total da baia, um animal será a unidade experimental para medidas individuais de peso, mas a baia será a unidade experimental para medidas de consumo e de conversão alimentar, pois não será possível ter acesso ao consumo e conversão individuais. 1.2 Tratamento Tratamento é qualquer procedimento ou conjunto de procedimentos cujo efeito deverá ser avaliado e comparado com outros 1.3 Experimento No método científico (mais especificamente no método experimental), uma experiência científica ou experimento consiste na montagem de uma estratégia concreta a partir da qual se organizam diversas ações observáveis direta ou indiretamente, de forma a provar a plausibilidade ou falsidade de uma dada hipótese ou de forma a estabelecer relações de causa/efeito entre fenômenos. A experiência científica é uma das pedras angulares da abordagem empirista ao conhecimento humano. 1.4 Experimentador Agente que planeja, executa e analisa as informações obtidas no experimento. 1.5 Erro tipo I, erro tipo II Em testes de hipóteses, na Estatística, um erro de tipo I consiste em rejeitar uma hipótese nula que é verdadeira, por outras palavras, chegar a um resultado que tem significância estatística quando na verdade ele aconteceu por acidente. Um teste com alta especificidade terá menores erros do tipo I. O símbolo para a probabilidade de um erro de tipo I é a (alpha) e é por vezes descrito como o tamanho do teste. Já um erro de tipo II consiste em falhar na rejeição (ou seja, na aceitação) de uma hipótese nula inválida (ou seja, aceitar, como inválida, uma hipótese que na verdade é válida). O símbolo para a probabilidade de um erro de tipo II é ß (beta). O poder de um teste estatístico é definido como 1 - ß. Um teste com alta sensitividade terá menos erros do tipo II. No entanto, à medida que a probabilidade do erro de tipo II diminui, aumenta a susceptibilidade da ocorrência do erro de tipo I 1.6 Experimentos cegos e duplamente cegos Experimentos cegos - Quando as UE são objetos, plantas, animal ou material provindo de plantas ou animais – como folhas de árvores ou peças anatômicas –, é 3 importante que o pesquisador pese, meça ou observe cada unidade sem saber a que grupo pertence essa unidade. Isto evita a tendenciosidade. Nessa fase do experimento, o pesquisador ou experimentador não pode trabalhar sozinho – precisa trabalhar com outro técnico. Experimentos duplamente cegos - São os experimentos feitos com pessoas, em que se recomendam ainda outros cuidados. 1. Não se deve informar à pessoa (unidade experimental) o grupo para o qual foi designada; 2. Devem ser mantidos alheios ao resultado do sorteio a todos os profissionais envolvidos no trato dessas pessoas, para não afetar o moral delas; O pesquisador que faz as observações ou medições deve fazê- lo sem saber a que grupo pertence à pessoa que examina. 1.7 Dados discrepantes (outliers) Dados que possuem valores extremos, atípicos ou com características bastante distintas dos demais registros no experimento. Normalmente registros que contêm valores outliers são descartados da amostra, porém isto só deve ocorrer quando o dado representar um erro de observação, de medida ou algum outro problema similar. O dado deve ser cuidadosamente analisado antes da exclusão, pois embora atípico, o valor pode ser verdadeiro. Outliers podem representar, por exemplo, um comportamento não usua l, uma tendência ou ainda transações fraudulentas. Encontrar estes valores é, muitas vezes, os objetivos da obtenção de dados. 1.8 Dados binários Dados nominais com apenas duas categorias. Tais dados podem ser codificados e armazenados através da combinação (seqüencial) de dois dígitos (binário), o “0” e o “1”. Dados binários ou dicotômicos são comuns em muitas áreas das ciências, nas quais, muitas vezes, há interesse em registrar a ocorrência, ou não, de um evento particular. 1.9 Nível de significância É denotado por e indica a probabilidade de cometer um erro tipo-I. Na maioria dos softwares, a significância estatística é expressa pelo nível descritivo (p-valor). Os níveis de significância mais utilizados são 5%, 0.1%, 1% e 10%. Sendo 5% o nível recomendado para experimentação animal. 1.10 Testes paramétricos Processos estatísticos baseados em parâmetros populacionais para testar hipóteses ou estimar parâmetros. São testes que incidem explicitamente sobre um parâmetro de uma ou mais populações e a distribuição da estatística de teste pressupõe uma forma particular da(s) distribuição(ões) populacional(ais) (por exemplo, a normalidade). 1.11 Testes não paramétricos Processos estatísticos para testar hipóteses ou estimar parâmetros, quando não há suposições formuladas sobre a natureza ou a forma das distribuições populacionais; chamados também testes livres de distribuição. 4 Se os dados não satisfazem as suposições feitas pelas técnicas tradicionais (exemplo normalidade), métodos não paramétricos de inferência estatística devem ser usados. 1.12 Qual teste usar, sejam paramétricos ou não-paramétricos? 5 2 Princípios Básicos da Experimentação Os princípios básicos da experimentação são: · Repetição (n amostral) · Casualização (repetições ao acaso) · Uniformidade da unidade experimental (repetições homogêneas) · Uniformidade de meio (controle do ambiente e do tempo) · Uniformidade de aplicação do tratamento (intervenções padronizadas) 2.1 Repetição Tratamento 1 Tratamento 2 Animal 1 Animal 2 Animal 3 Média X1 X2 Variância S12 S22 A repetição (tamanho amostral) possibilita estimar: · média para cada tratamento · variância dentro do tratamento A distribuição F é a distribuição da razão de duas estimativas de variância. É usada para calcular valores de probabilidade na análise de variância. Uma amostra muito pequena reduz a significância estatística do estudo, pois o efeito observado pode ser atribuído não somente ao tratamento instituído, mas também ao acaso. 2.2 Casualização Tem o objetivo de validar a estimativa da variância dentro do grupo experimental 2.3 Uniformidade da unidade experimental A unidade experimental deve ser homogênea quanto a: · Idade · Peso · Sexo · Grau de sangue (raça) Quando uma determinada variável representa fator de variação que influi no resultado, essa influência pode interferir na variância intra tratamento. Se for necessário utilizar Variação entre tratamentos Variação intra tratamento F = 6 mais de um ambiente ou períodos diferentes, os fatores ambiente e tempo devem ser removidos através da análise estatística. Para isso, deve haver repetição de todos os tratamentos em cada ambiente ou tempo. 2.4 Uniformidade de meio O ambiente ou o tempo em que ocorre o experimento deve ser homogêneo para cada tratamento que será comparado. 2.5 Uniformidade da aplicação do tratamentoQuando o tratamento é aplicado de forma injetável, o placebo também deve ser injetado de forma a uniformizar o fator estressante. 7 3 Estatística comparativa (contraste) 3.1 Comparação de pares (teste t) No caso de amostras dependentes ou pareadas, quando a mesma amostra é submetida a dois tratamentos diferentes, são comparadas as médias obtidas entre as amostras (ou alíquotas, ou réplicas). Exemplo: O sangue coletado de animais pode ser dividido em 2 alíquotas que serão submetidas a tratamentos diferentes, os quais serão comparados. Nesse caso, o pareamento é muito eficiente, pois as alíquotas são derivadas dos mesmos animais. Quando o pareamento é possível, há uma eficiência do experimento muito alta. Quando trabalha-se com animais diferentes, por mais bem controlada seja a escolha dos pares, a eficiência é perdida, e este estudo é considerado amostra independente para efeito de utilização de testes estatísticos. Os testes estatísticos são feitos para avaliar a variabilidade entre- indivíduos e não intra- indivíduos. Univitelinos, lotes, antes e depois (quando o tempo não for suficiente para influir na resposta) são considerados pareamentos. Exemplo: Dosagem de Anticorpos Þ soro de 11 bovinos inoculados com a mesma carga patogênica A hipótese é substituir o título in vivo pelo ensaio (ELISA). ANIMAL ELISA Título in vivo Diferença 1 230,00 300,00 -70,00 2 300,00 550,00 -250,00 3 550,00 700,00 -150,00 4 320,00 300,00 20,00 5 1.300,00 1.100,00 200,00 6 1.550,00 1.100,00 450,00 7 510,00 500,00 10,00 8 800,00 520,00 280,00 9 620,00 480,00 140,00 10 2.600,00 2.400,00 200,00 11 400,00 380,00 20,00 Médias 834,55 757,27 77,2727 2727,77 11 850 11 === ådifdif 8 ( ) n S tdifIC difgl ´±= ,a Para obter o desvio-padrão dos indivíduos (da diferença) ( ) ( ) ( )( ) ( ) 8182,561.40 10 11 850 2025070 1 2 222 2 2 2 = ú û ù ê ë é - --++ = - ú ú û ù ê ê ë é - = å å n n dif dif S i i dif 3996,2018182,561.40 ==S Para determinar o intervalo de confiança da média da diferença na amostra: 11 3996,201 2727,77 10%,5 ´±= tIC (na tabela, t = 2,228) 2937,1352727,77 ±=IC IC Þ de -58,02 a 212,57 à Se o IC inclui o ZERO, significa que a média da diferença pode ser ZERO. Se a diferença entre os dois testes pode ser ZERO, então os métodos não diferem, isto é, podem ser IGUAIS. Þ H0 à t1 – t2 = 0 t1 = t2 CONCLUSÃO: Os dois métodos (ELISA e in vivo) não diferem (p>0,05) t > Þ é a não diferença t < Þ é a diferença Há prejuízo na confiabilidade porque a variância da amostra é grande e porque o valor de t para o erro (a) e gl é grande. DMS Þ DIFERENÇA MÍNIMA SIGNIFICATIVA (Teste-t) O valor da variação do intervalo de confiança é a diferença mínima significativa (dms), ou teste t. É o valor que o desvio tem que superar para ser significativo. A importância do dms é saber, com antecedência, o valor abaixo do qual as médias obtidas seriam consideradas não significativamente diferentes quando comparam-se mais de dois grupos. Þ Se o módulo da média for maior que o dms (? ) à o IC não inclui o ZERO Pareamento dms ( ? ) 9 Nos casos de pareamento, os desvios internos são calculados (diferença para cada repetição) e o controle de variância é maior. O pareamento apresenta alta eficiência. Comparação de grupos experimentais quando o pareamento não é possível. Quando não é possível fazer o pareamento, deve-se procurar controlar as variáveis de forma que as amostras sejam as mais homogêneas o quanto possível. No caso de amostras independentes, seria calculada a média para cada grupo e o desvio entre as médias externas é que seria verificado. (Quando são realizados mais de 3 tratamentos, a comparação de pares pode ser realizada. Utilizando-se o teste t, há uma perda, pois, no caso de 10 animais, a comparação é feita par a par. Assim, os pares teriam, cada um, 20 observações. Se os três tratamentos forem comparados simultaneamente (com ANOVA, por exemplo), ganha-se com o aumento para 30 respostas.) Exemplo: Transplante isolado de rim e duplo rim + pâncreas. Avaliação de um ano após em relação a triglicérides (indivíduos do sexo masculino, com 35 a 50 anos, 15 pacientes por grupo). repetição isolado duplo Desvio 1 46,00 78,00 2 92,00 109,00 3 137,00 269,00 4 95,00 89,00 5 64,00 95,00 6 65,00 117,00 7 80,00 199,00 8 280,00 214,00 9 62,00 102,00 10 92,00 256,00 11 137,00 115,00 12 95,00 136,00 13 64,00 83,00 14 80,00 239,00 15 62,00 90,00 Média 96,73 146,07 49,3333 Variância 3255,50 4721,21 S 57,06 68,71 Razão entre as variâncias (a maior sobre a menor) Þ deve ser menor que 7 para ser homogênea 1,45022775 2 2 2 1 2 1 , n S n S tXXIC glID +´±-= a 10 15 21,4721 15 49,3255 73,9607,146 28%,5 +´±-= tIC (t = 2,048) IC = 49,44 ± 47,23 Þ 2,11 a 96,57 mg/dl dmsXX ID >- Þ há diferença estatística entre os grupos (p<0,05) Conclusão: O IC não inclui o ZERO. Logo, o transplante duplo não apresenta taxa de triglicérides semelhante ao (é diferente do) isolado (p< 0,05). Foi significativo, embora o IC seja muito amplo, sugerindo que a amostra foi insuficiente (n=15). Entretanto, o resultado sendo significativo poderia ser publicado sem problemas pois, mesmo com o erro superestimado, a diferença entre as médias não foi mascarada. O problema seria se o resultado fosse não significativo com uma amostra pequena. Poderia significar que seria possível a diferença existir mas ter sido mascarada pela super-estimativa do erro. Precisão do experimento A precisão do experimento é dada pelo coeficiente de variação da amostra (deve envolver os 30 resultados): Do exemplo anterior: Grupo isolado Grupo duplo Médias (geral) Média 96,73 146,07 121,40 Variância 3255,50 4721,21 3988,3526 S 57,06 68,71 63,1534 CV 52,01 01,52100 40,121 1534,63 100 =´=´= geralX S CV % ( ) 40,121 2 07,14673,96 = + =geralX ( ) 3526,3988 2 2 2 2 12 = + = SS S média à ou usando o S, já que ambas amostras apresentam o mesmo n Þ ( ) 1534,632 21 = + = SS S média Þ O CV alto encontrado pode ser devido a uma amostra inadequada. Como houve diferença significativa, pode-se confiar, mesmo tendo encontrado CV alto. Uma adequação amostral e conseqüente redução no CV aumentariam a capacidade do teste, comprovando uma diferença ainda maior. dms 11 Se não tivesse sido encontrada a diferença, nesse caso poderia-se pensar na possibilidade do resultado ser diferente se o CV fosse menor. Calcular o tamanho amostral com erros de 5% e de 10% da média. n S tX gl ´± ,a erro de 5% da média (121,4 × 5/100) = 6,07 Þ variação à ? n S t gl ´=D ,a n 1534,63 048,207,6 ´= pessoasnn 45431,21 07,6 3382,129 =\== para erro de 10% da média (121,4 × 10/100) Þ ? = 12,14 à n = 114 pessoas ANOVA Consiste em pegar um conjunto de dados de um experimentos (por exemplo, 30 indivíduos dos dois grupos – obs. exemplo anterior) e calcular a variância total e fazer uma partição da mesma. O total de variação pode ser atribuído à variação de grupos experimentais e ao erro, considerando que não há outra fonte de variação. Nesse caso, as variáveis sexo, idade e outras são uniformes. Em outros estudos pode haver outras fontes de variação: tratamentos, sexo, idade, peso, linhagem, galpão utilizado, etc. ( ) gl n X X S i i total 2 2 2 åå- = Toda fonte de variação não percebida e não descontada na variação total, vai ser atribuída ao erro. O erro sendo superestimado, fica mais difícil estabelecer as diferenças entre os grupos. ? 30 pacientes à grupos à erro 12 DELINEAMENTO INTEIRAMENTE CASUALIZADO ( ) gl n X X S i i total 2 2 2 åå - = QUADRO DA ANÁLISE DE VARIÂNCIA Fonte de Variação gl Soma de Quadrados Quadrado médio (variância do erro experimental) Total (n-1) 29 ( ) n X XSQt ii 2 2 åå -= Grupos (g-1) (variação entre grupos) 1 ( ) n X r g SQg ii 22 åå -= Erro (Total – Grupos) (variação intra-grupo) 28 SQe = SQt – SQg (Obtido por diferença) gl SQeQMe = ( ) n X XSQ iitotal 2 2 åå -= ( ) n X r g SQ iigrupos 22 åå -= Para o exemplo anterior dos transplantes simples e duplos: ( ) 30 90239...9246 90239...9246 2 2222 ++++-++++=totalSQ 23,927.129=totalSQ ( ) 30 90...9246 1515 222 +++ -+= duploisoladogrupos gg SQ 33,253.18=gruposSQ SQe = SQt – SQg Þ SQe = 111.673,90 gl SQe QMe = Þ QMe = 3.988,35 (QMe à quadrado médio do erro) QUADRO DA ANÁLISE DE VARIÂNCIA Fonte de Variação gl Soma de Quadrados Quadrado médio (variância do erro experimental) Total (n-1) 29 129.927,23 Grupos (g-1) (variação entre grupos) 1 18.253,33 Erro (glt – glg) (variação intra-grupo) 28 111.673,90 3.988,35 21 28%,5 r QMe r QMe tdms +´= FC = G2/n G: total geral n: tamanho da amostra Fator de correção 13 Nesse caso, como os QMe e r também são coincidentes, pode ser simplificado como abaixo: 23,47 15 35,39882048,2 =´´=dms 34,49=- ID XX Þ o módulo da diferença das médias > dms O IC não inclui o ZERO. As médias apresentam diferença significativa (p<0,05). O teste t foi utilizado, em vez do F, pois é muito sensível. Porém, t só deve ser utilizado quando é recomendado. O teste t só pode ser utilizado até para 5 grupos e se a estabilidade é alta. Se há instabilidade, deve ser utilizado outro teste. Situação experimental Tratamentos: a) Ração tradicional à base de milho e soja b) 95% da ração tradicional + 5% de farelo de trigo c) 95% da ração tradicional + 5% de farelo de cacau Linhagem das aves: mesma linhagem Resposta: produção de ovos em % (ovos produzidos por total de galinhas) Þ numérica contínua de fluxo descontinuado (se a avaliação for longa; mas se for avaliada, como nesse caso, em períodos curtos pode ser classificada como continuada); estabilidade não conhecida mas na avicultura as respostas são muito instáveis; distribuição normal. O total de ovos produzido no galinheiro a cada dia é dividido pelo total de galinhas do galinheiro ×100. Unidade experimental: galinheiro com 40 galinhas, 15 galinheiros no mesmo galpão Cada galinheiro é uma unidade experimental. Três grupos (trataemtnos) com 5 galinheiros cada. Início do ensaio: 32 semanas + 8 semanas de adaptação Tempo de avaliação: durante um mês (contagem diária) Repetições: 5 repetições / tratamento Delineamento: inteiramente casualizado Desenho do estudo r A B C 1 72,4 71,8 66,8 2 74,8 67,8 64,2 3 70,1 72,1 67,2 4 75,5 70,1 62,7 5 68,1 66,6 68,9 Total 360,9 348,4 329,8 média 72,18 69,68 65,96 14 Só há variação entre os grupos (hipótese do estudo) e entre os indivíduos dentro dos grupos (intra-grupo). Nesse caso será feito o sorteio dos tratamentos entre os grupos. Pré-Requisitos para fazer ANOVA: · Grupos homogêneos · Distribuição normal Fontes de variação: tratamentos e erro experimental Vantagens desse delineamento: à delineamento simples àse houver perda de unidade experimental (parecela perdida), a média dos grupos não seria alterada. Média de 5 galinheiros é o mesmo que média de 4 galinheiros. Desvantagem desse delineamento: àa não percepção de fonte de variação superestima o erro experimental. Esse delineamento é o que mais sofre esse efeito. Para evitar a superestimação, as fontes de variação devem ser detectadas e o ambiente deve ser blocado. QUADRO DA ANÁLISE DE VARIÂNCIA Fonte de Variação gl Soma de Quadrados Quadrado médio (variância do erro experimental) Total (n-1) 14 185,029 Grupos (g-1) (variação entre grupos) 2 97,96 Erro (glt – glg) (variação intra-grupo) 12 87,069 7,2558 TOTAL ( ) 15 9,68...8,744,72 9,687,62...8,744,72 2 2222 +++-++++=totalSQ 029,185=totalSQ GRUPOS ( ) 15 9,68...4,72 5 8,329 5 4,348 5 9,360 555 2222222 ++ -++=-++= FC ggg SQ CBAgrupos 96,97=gruposSQ ERRO SQgSQtSQerro -= Þ SQe = 185,029 – 97,96 = 87,069 15 QMe = 87,069/12 = 7,2558 DMS à como a comparação é sempre entre 2 médias, o dms é calculado com 2QMe/5. Se os 3 grupos tivessem r diferentes, teria que voltar à fórmula original ( 21 , r QMe r QMe tdms gl +´= a ) e calcular o dms para cada um dos 3 pares de médias. 5 2 %,5 QMetdms gl ´= 41,3 5 2558,72179,2 =´´=dms =- BA XX 2,5 à menor que dms Þ IC inclui ZERO, A = B =- CB XX 3,72 à maior que dms Þ IC não inclui ZERO, B ? C =- CA XX 6,22 à maior que dms Þ IC não inclui ZERO, A ? C Tratamento Médias A 72,18 A B 69,68 A C 65,96 B Médias seguidas de letras distintas diferem pelo teste t (p<0,05) Se, por exemplo B fosse igual a C e, ao mesmo tempo igual a A enquanto C é diferente de A, seria acrescentada outra letra no tratamento B para mostrar essa relação. Ficaria assim: Trat Médias Comparação A AX A B BX AB C CX B Conclusão: Þ Do ponto de vista da produtividade, não vale a pena utilizar 5% de farelo de cacau misturado à ração tradicional, pois a média de produção de ovos é menor com o farelo de cacau, com diferença significativa em relação às outras duas formulações (tradicional puro e acrescido de 5% de trigo). Não há diferença significativa em se utilizar as formulações do farelo tradicional ou acrescido de 5% de trigo sobre a produtividade de ovos. Consideradas iguais 16 4 DELINEAMENTO EM BLOCOS CASUALIZADOS Situação experimental Tratamento: 4 dietas com diferentes níveis de proteína Resposta: ganho de peso em kg aos 90 dias Cálculo amostral: 5 repetições para cada grupo experimental (para cada tratamento) Local: os grupos serão tratados no mesmo local Animal: suínos machos desmamados com peso uniforme Granja fornece: à 10 animais na 1a. entrega de animais à 8 animais, 15 dias após a primeira entrega à 8 animais 15 dias após a segunda entrega Classificação da variável: numérica (quantitativa), contínua, fluxo descontinuado (por que a idade foi definida), instabilidade não é muito alta. Podem ser feitos: ANOVA (teste de média), análise de regressão. Desenho do estudo: 1a. entrada: 8 animais (escolher, pois não é possível usar 10)à 2 animais por dieta (sortear) 2a. entrada: 8 animais à 2 animais por dieta (sortear) 3a. entrada: 8 animais (poderia usar 4, pelo cálculo amostral) à 2 animais por dieta (sortear) FORMAÇÃO DOS BLOCOS Fornecimento / Entradas D1 D2 D3 D4 1 2 3 4 1a Entrada Þ 10 animais à escolher 8 (a escolha tem o objetivo de formar um grupo mais uniforme) 5 6 7 8 9 10 11 12 2a Entrada Þ 8 animais à usar 8 13 14 15 16 17 18 19 20 3a Entrada Þ 8 animais (4 seriam suficientes para completar n)à usar 8 21 22 23 24 Este experimento será classificado como: Delineamento em blocos casualizados. Cada entrada é um estrato, sendo que os animais foram sorteados por dieta em cada bloco, sendo portanto 3 sorteios. Cada estrato (bloco) recebe todos os tratamentos. Cada entradatem condição ambiental diferente, mas essa diferença ambiental afetará igualmente todos os tratamentos, pois todos os tratamentos são distribuídos com igual chance para os animais de cada bloco. São testadas as diferenças entre as médias dos pesos obtidos por cada dieta, através de todos os blocos. BLOCO 1 BLOCO 2 BLOCO 3 17 Quando o desenho é de delineamento em blocos casualizados, há o efeito das entradas (blocos) no quadro da ANOVA, mesmo que supostamente haja a mesma condição de efeito. Isso, porque foi feito um sorteio para cada bloco. A realização de 3 sorteios implica na forma condução do experimento. Nesse caso exemplificado, o experimento foi realizado em cada bloco em intervalos curtos, sendo possível que assim não haja efeito da condição ambiental (clima, tempo, estação do ano). Ao realizar a ANOVA, os efeitos das entradas devem ser retirados. Há casos em que se observa que não há efeito de bloco (variação não significativa), faz-se a ANOVA com delineamento inteiramente casualizado, retirando-se do quadro da ANOVA as entradas dos blocos. Porém isso não pode ser feito por que, quando o desenho é em blocos casualizados, o sorteio é realizado o número de vezes correspondente ao número de blocos. E isso tem impicação no numero de restrições do modelo para gerar aqueles resultados. As entradas, mesmo não significativas, devem ser mantidas no quadro da ANOVA. Quando o ambiente pode não ser uniforme como, por exemplo, um galpão com 3 áreas não uniformes. Esses blocos formados devem ser considerados na ANOVA. No caso de entradas no tempo, é imprevisível. Pode-se observar que em 30 dias, por exemplo, não houve diferença, porém devem ser bolcados. Com relação a local, um galpão, por exemplo, áreas diferentes devem ser blocadas de forma que cada área receba animais com todos os tratamentos realizados. Se um bloco for perdido (água contaminada, por exemplo) ele pode ser repetido caso o fator tempo não acarrete uma influência no resultado. Se um animal for perdido durante o tratamento, deve ser analisado a causa da perda. Se a perda (morte, por exemplo) for efeito do tratamento, não é parcela perdida, mas sim resultado e deve ser discutido, pois pode ser um fato muito importante. Se a causa da perda for outra, deve-se estimar a parcela perdida. Por exemplo, se determinada entrada for favorável ao ganho de peso. Se num dos grupos de dieta morre um animal proveniente daquela entrada que favorecia o ganho de peso, a média para essa dieta ficará prejudicada em relação às demais. Assim a parcela perdida deve ser estimada e esse valor utilizado. Há dois casos de blocagem: tempo e espaço físico. Mas há casos em que pode- se blocar o animal. Exemplo Tratamento: 3 diluentes Material: sêmen Resposta: % de motilidade Þ quantitativa (pode ser qualitativa em alguns casos em que a avaliação é subjetiva) Þ instável 18 No caso de respostas instáveis, é desejável blocar o animal. Por exemplo: motilidade de sêmen do mesmo animal, divididos em 3 alíquotas para testar 3 diferentes diluentes e seu efeito sobre a motilidade. Alíquotas iguais de uma mesma coleta de cada animal são sorteadas para cada tratamento. Pode-se assim reduzir o número de animais necessários para o experimento. Dessa forma, o animal é controlado, pois tira-se uma repetição para cada tratamento, por exemplo, com 5 animais poderia-se concluir o experimento com 15 repetições. Não podem ser retiradas 2 amostras de um mesmo animal e dividi-la em outras 3 alíquotas, pois isso seria uma réplica. Teria que pegar outro animal. Mesmo ejaculados diferentes de um mesmo animal não é indicado, pois a estatística é para indivíduos diferentes. Embora nesse caso em que a resposta é muito instável pode ser considerada a possibilidade de utilizar 2 ejaculados de um mesmo animal. Na possibilidade de usar vários ejaculados de cada animal, pode-se fazer a média das alíquotas de cada tratamento para representar cada animal. Mas não justifica pegar 2 amostras por animal, pois seria feita a média das duas (para as alíquotas de cada tratamento). Como animal já está sendo controlado e o CV seria muito baixo, pois há alta precisão experimental com apenas 1 amostra por animal (variação do indivíduo seria controlada e a comparação dos 3 diluentes seria feita em alíquotas homogêneas), não há porque pegar 2 amostras. Da mesma forma, poderiam ser blocados leite, queijo, produtos de supermercado dos quais seriam retiradas alíquotas. De volta ao experimento de 4 dietas em 24 porcos desmamados: QUADRO DE ANÁLISE DE VARIÂNCIA Fonte de Variação gl Total (n-1) 23 Entrada 2 Dieta 3 Erro (variação intra-grupo) 18 O método é encontrar uma soma de quadrados (variação total dos 20 animais) e fazer a partição. Foram usados 24 animais (mais 4 animais fora aproveitados), sendo 6 repetições para cada dieta. As fontes de variação são: a entrada (gl = 2), a dieta (gl = 3) e o erro experimental (gl = diferençaà 23 – 5 = 18). Þ O valor do gl do erro não deve ser inferior a 10, senão o valor tabelado aumenta muito. Na condução do experimento deve-se ter habilidade para controlar os fatores, ajustar a amostra para levar a uma precisão experimental mais alta. Experimento: Amostra: Sêmen resfriado a 4º C mantidos por 36 horas, em 4 alíquotas para cada um de 5 animais Tratamentos: gema, leite, coco e citrato Resposta: % de motilidade 19 DESENHO DO ESTUDO Jumento gema leite coco citrato TOTAL 1 80 76 77 65 298 2 72 65 60 50 247 3 63 55 53 48 219 4 83 75 73 64 295 5 76 70 69 57 272 TOTAL 374 341 332 284 1331 Bloco: todos os 4 tratamentos passam por cada bloco Casualizado: os tratamentos são sorteados dentro de cada bloco Se fosse inteiramente casualizado, o sorteio dos tratamentos seria realizado para as 20 amostras. A realização de um único sorteio, um único animal poderia ficar com 2 tratamentos diferentes. Quando o sorteio é feito por bloco, cada tratamento tem uma repetição num determinado animal. Nesse caso não pode haver 2 repetições dentro de um mesmo bloco, pois o bloco é o animal. Se houvesse mais de uma repetição no mesmo bloco seria réplica. Quando o espaço físico é blocado, é possível ter mais de uma repetição por bloco. Quando o indivíduo (pessoa ou animal) é blocado e o tratamento é o tempo, não há como sortear o tempo, pois é seqüencial. Mesmo assim e um delineamento em blocos casualizados. Desenhos com tratamentos dependentes de tempo será discutido em “parcela subdividida”. O que caracteriza o delineamento em bloco não é o sorteio, mas o fato de cada estrato receber todos os tipos de tratamento. Uma pessoa sendo analisada sobre perda de peso aos 7, 14 e 21 dias é um bloco, pois ela tem uma informação de cada tratamento (tempo) [no caso de bloco por espaço físico pode ser mais de uma informação, mas deve ser em igual número]. QUADRO DE ANÁLISE DE VARIÂNCIA Fonte de Variação gl Soma de Quadrados Quadrado médio (variância do erro experimental) Total (n-1) 19 1.992,95 Animal 4 1.117,70 Diluente 3 829,35 Erro (variação intra-grupo) 12 45,90 3,825 SQ TOTAL (o método baseia-se em partir essa variação total) ( ) 20 1331 57...80 2 22 -++=totalSQ 95,992.105,578.88571.90 =-=totalSQ 20 SQ ANIMAL ( ) 20 1331 4 272 4 295 4 219 4 247 4 298 44444 2222222 5 2 4 2 3 2 2 2 1 -++++=-++++= FC aaaaa SQanimal 70,117.105,578.8875,695.89 =-=animalSQ a motilidade é uma resposta muito instável: de uma variação total de 1.992,95, 1.117,70 é atribuída ao animal. Indica que é conveniente blocar o animal, senão, toda essa variação do animal seria atribuída ao erro, ficando muito difícil assim mostrar as diferenças entre as médias. SQ DILUENTE ( ) 20 1331 5284 5 332 5 341 5 374 5555 222222 4 2 3 2 2 2 1 -+++=-+++= FCddddSQdiluente 35,82905,578.8840,407.89 =-=diluenteSQ SQ ERRO Obtido pela diferença: SQe = SQt – SQa – SQd = 45,90 QMe (S2) 825,3 12 9,45 === gl SQeQMe CV 94,2100 55,66 825,3 100 =´=´= geralX S CV Þ tamanho do erro experimental (muito bom, abaixo de 5%) A média geral pode ser a média das médias dos quatro tratamentos ou 1.331/20. A variável apresenta grande instabilidade, porém o delineamento em bloco utilizando alíquotas permitiu que o ensaio obtivesse uma alta precisão experimental (CV = 2,94). A comparação será feita com alta confiança. Se o resultado for igual é porque é igual mesmo. Se o CV fosse alto, um resultado de igualdade não teria confiança, pois a estimativa seria feita com o erro superestimado. CV muito baixo, deveria adotar o teste de Tuckey, portanto vamos usar o t para seguir uma seqüência didática até o tópico “escolha de testes”. DMS (teste t) r QMetdms 212%,5 ´= 21 %70,2 5 825,32179,2 =´´=dms Þ diferença menor que 2,7% não é significativa. Uma diferença entre duas médias que seja menor que a dms é considerada uma diferença casual, aleatória. Uma diferença superior indica que há um efeito significativo do diluente na motilidade do sêmen. Colocar as médias em ordem facilita a comparação. QUADRO DE COMPARAÇÃO diluente média Classif. Gema 74,8 A Leite 68,4 B Coco 66,4 B Citrato 56,8 C Médias seguidas de letras distintas diferem pelo teste t (p < 0,05). Þ quando é diferente, p< Não cabe a um programa recomendar delineamentos. Há duas questões: escolha do teste e escolha do delineamento. Há dois critérios para escolher o teste: o número de tratamentos utilizado e a instabilidade da resposta (CV). Quanto menor o erro (QMe), deve-se utilizar testes mais rigorosos. Quanto maior o erro, usa-se um teste menos rigoroso, mais sensível, que evidencia o efeito. Para o delineamento, depende da forma de comparação das variáveis. É circunstancial e ligado ao controle local e de tempo. 22 5 DELINEAMENTO EM QUADRADO LATINO Situação experimental: Resposta: quantidade de aflatoxina em cinco produtos à base de milho Tratamentos: cinco métodos de detecção de aflotoxina · Há 7 laboratoristas · Cada laboratorista faz um exame por dia Nesse caso, vamos escolher o método que detecta maior quantidade de aflotoxina. QUADRADO LATINO (5X5) Prod 1 Prod 2 Prod 3 Prod 4 Prod 5 Lab 1 M2 M3 M4 M5 M1 Lab 2 M3 M4 M2 M1 M5 Lab 3 M1 M2 M5 M4 M3 Lab 4 M5 M1 M3 M2 M4 Lab 5 M4 M5 M1 M3 M2 Blocos foram formados nas linhas e colunas. O sorteio dos métodos pode ser feito com sorteio sistematizado, de forma que não haja repetição de métodos por laboratorista ou produto. Sorteio sistematizado O sorteio sistematizado é realizado em três etapas: distribuição de métodos, de linhas e de colunas. As letras correspondem ao método. O preenchimento começa com a letra A e cada linha subseqüente começa uma coluna deslocada à direita (em negrito). As colunas à esquerda, deixadas em branco são completadas na seqüência (em vermelho) Distribuição de métodos C1 C2 C3 C4 C5 L1 A B C D E L2 E A B C D L3 D E A B C L4 C D E A B L5 B C D E A Quadrado latino 5 X 5 Þ 25 unidades experimentais 23 Sorteio de linhas (L4, L3, L2, L1, L5) P1 P2 P3 P4 P5 L4 C D E A B L3 D E A B C L2 E A B C D L1 A B C D E L5 B C D E A Sorteio de colunas (P2, P3, P5, P1, P4) Croquis final do ensaio P2 P3 P5 P1 P4 L4 D E B C A L3 E A C D B L2 A B D E C L1 B C E A D L5 C D A B E QUADRO DE ANÁLISE DE VARIÂNCIA Fonte de Variação gl Total (n-1) 24 laboratorista 4 produto 4 método 4 Erro (variação intra-grupo) 12 Se um laboratorista faltasse um dia, poderia-se estimar a parcela perdida, mas com o inconveniente de perder em gl do erro e aumento de variância. Uma melhor alternativa seria adiar de forma que todos os laboratoristas pudessem fazer o exame num outro dia. VARIAÇÕES NO DELINEAMENTO E se fosse possível que o laboratorista pudesse fazer mais de um teste por dia? Dois exames por dia, por exemplo? QUADRADO LATINO 5 × 5 C1 C2 C3 C4 C5 L1 A B C D E L1 E A B C D L2 D E A B C L2 C D E A B L3 B C D E A Daria para usar apenas 3 laboratoristas, ganhando nos gl. 24 QUADRO DE ANÁLISE DE VARIÂNCIA Fonte de Variação gl Total (n-1) 24 laboratorista 2 produto 4 método 4 Erro (variação intra-grupo) 14 Se fossem 4 métodos a serem testados, usaríamos 4 laboratoristas QUADRADO LATINO 4 X 4 C1 C2 C3 C4 L1 A B C D L2 D A B C L3 C D A B L4 B C D A Þ 16 unidades experimentais QUADRO DE ANÁLISE DE VARIÂNCIA Fonte de Variação gl Total (n-1) 15 laboratorista 3 produto 3 método 3 Erro (variação intra-grupo) 6 Nesse caso, o número de gl é extremamente baixo, fazendo com que a confiabilidade seja perdida e impossibilitando a condução do experimento. Para solucionar esse problema, de forma a viabilizar a realização do experimento poderia-se fazer 2 quadrados latinos 4 × 4, resulatando em 32 unidades experimentais. Porém com o cuidado de não utilizar réplicas. Usar amostras diferentes, podendo usar os mesmos laboratoristas, não sendo assim considerado réplica porque a medida não é avaliada neles. No total seriam 8 produtos sendo analisados. Faz-se um segundo quadrado latino após o encerramento do primeiro. Com a execução de dois quadrados latinos aparece uma nova fonte de variação. Entre um quadrado e outro há variação. QUADRO DE ANÁLISE DE VARIÂNCIA (para 2 quadrados latinos 4 × 4) Fonte de Variação gl Total (n-1) 31 Quadrado Latino 1 laboratorista 3 produto (4-1)+(4-1) 6 método 3 Erro (variação intra-grupo) 18 25 Agora esse experimento pode ser realizado com confiabilidade aceitável. Poderiam ser utilizados novos 4 laboratoristas, mas se os mesmos 4 laboratoristas puderem fazer o segundo quadrado latino é melhor para gl. Com 4 novos laboratoristas haveria 6 gl para laboratorista e 15 gl para o erro, ainda confiável. Os sorteios do primeiro e do segundo quadrados são independentes, pois se houve alguma tendência, mesmo que casual, no primeiro sorteio, sendo o segundo sorteio realizado de forma independente, dá-se a chance dessa tendência não se manifestar. Situação Experimental Ensaio de competição de 5 variedades de cana-de-açúcar (variação de fertilidade no terreno em declive) Resposta: produção em quilos por parcela Repetições: 5 variedades A (CO-290); B (CO-421); C (CO-419); D (POJ-2878); E (CP-36-13) Terreno foi dividido em 25 lotes (5 × 5) Colunas: bloco Linhas: bloco QUADRADO LATINO 5 × 5 C1 C2 C3 C4 C5 Total Total de cada variedade (nome da variedade em parênteses) L1 D 432 A 518 B 458 C 583 E 331 2.322 L2 C 724 E 478 A 524 B 550 D 400 2.676 L3 E 489 B 384 C 556 D 297 A 420 2.146 L4 B 494 D 500 E 313 A 486 C 501 2.294 L5 A 515 C 660 D 438 E 394 B 318 2.325 A (CO-290) = 518+524+420+486+515=2.463 B (CO-421) = 458+550+384+494+318=2.204 C (CO-419) = 583+724+556+501+660=3.024 D (POJ-2878) = 432+400+297+500+438=2.067 E (CP-36-13) = 331+478+489+313+394=2.005 2.654 2.540 2.289 2.310 1.970 Total Geral 11.763 QUADRO DE ANÁLISE DE VARIÂNCIA Fonte de Variação gl SQ QM Total (n-1) 24 257,724 Linha 4 30,48 Coluna 4 55,64 Variedades 4 137,49 Erro (variação intra- grupo) 12 34,12 2,84 kg2 Os meus resultados foram iguais aos apresentados na aula (anotados acima), porém × 1.000 Declive 26É possível afirmar que a variação entre as colunas é maior do entre as linhas. Significa que o solo varia mais no sentido “horizontal” do que no “vertical”, considerando o esquema do quadrado latino. A variação entre linhas ou entre colunas também poderia ser verificada da mesma forma em que é verificada para as variedades, mas nesse estudo, o objetivo não é esse. No caso de um galpão onde são realizados vários experimentos pode ser interessante verificar a variação dos locais em seu interior. Nesse experimento, mesmo que não seja encontrada diferenças entre colunas e/ou linhas, a estrutura de quadrado latino deve ser seguida, pois o sorteio já foi realizado de forma que alterar o delineamento posteriormente ao sorteio implica em alteração dos resultados. SQ total (obs. resultados 1000 vezes maior que os apresentados na aula) ( ) 24,724.25776,726.534.5451.792.5 25 763.11 318...432 2 22 =-=-++=totalSQ SQ linha (obs. resultados 1000 vezes maior que os apresentados na aula) FCSQlinha -++++= 5 325.2 5 294.2 5 146.2 5 676.2 5 322.2 22222 64,480.3076,726.534.540,207.565.5 =-=linhaSQ SQ coluna (obs. resultados 1000 vezes maior que os apresentados na aula) FCSQcoluna -++++= 5 970.1 5 310.2 5 289.2 5 540.2 5 654.2 22222 64,640.5576,726.534.540,367.590.5 =-=colunaSQ SQ variedade (obs. resultados 1000 vezes maior que os apresentados na aula) FCSQ iedade -++++= 5 005.2 5 067.2 5 024.3 5 204.2 5 463.2 22222 var 24,488.13776,726.534.5215.672.5var =-=iedadeSQ SQ erro (obs. resultados 1000 vezes maior que os apresentados na aula) SQe = SQt – SQl – SQc – SQv = 34.114,72 QMe (S2, erro experimental) (obs. resultados 1000 vezes maior que os apresentados na aula) 893,842.2 12 72,114.34 === gl SQeQMe CV %332,11100 52,470 893,842.2 100 =´=´= geralX S CV (na aula o valor encontrado foi 0,36%) Þ extremamente confiável, tornando o teste muito sensível para detectar igualdade entre médias. 27 O quadrado latino é um delineamento que apresenta um alto controle de variação. São pré-requisitos, para realização do quadro da ANOVA: a distribuição normal, variâncias homogêneas, num modelo aditivo, no qual cada repetição é a soma do efeito médio geral, mais o da sua coluna, mais o da sua linha, mais o da sua variedade mais o erro aleatório. Os efeitos têm que ser somados, e não multiplicados. Se os efeitos são multiplicados, pode-se notar pela perda da homogeneidade e da conformidade. Nesse caso, uma transformação logarítmica pode resolver tornando os efeitos aditivos. Comparação das 5 médias, que é o objetivo do ensaio: DMS (teste t) 32,2 5 84,22 179,2 5 84,22 12%,5 = ´ ´= ´ ´= tdms Þ resultado apresentado na aula 480,7372,33179,2 5 787,685.5179,2 5 893,842.22 12%,5 =´=´= ´´= tdms QUADRO DE COMPARAÇÃO variedades média Classif. Classif. (aula) C 604,8 A A A 492,6 B B B 440,8 BC C D 413,4 C D E 401,0 C E Médias seguidas de letras distintas diferem pelo teste t (p < 0,05). (diferenças menores do que dms são atribuídas ao erro aleatório) Se gl for menor que 10, não há confiabilidade. O experimento deve ser criticado e sugere-se Exemplo: situação experimental à quadrado latino 4 × 4 Resposta: quantidade de aflatoxina em produtos à base de milho Tratamentos: 4 métodos de detecção de aflatoxina · Há 10 laboratoristas · Cada laboratorista faz 2 exames por dia Nesse caso, vamos escolher o método que detecta maior quantidade de aflotoxina. Detalhes do experimento: Devem ser blocados os laboratoristas e os produtos. Os métodos são o objetivo do experimento. 28 Laboratorista: Às vezes não é necessário usar todas as pessoas disponíveis. Usar 4 laboratoristas fazendo 2 exames por dia (3 gl) é mais eficiente do que 8, pois aumenta gl (6 gl) para os laboratoristas, reduzindo assim os gl do erro. Métodos: sorteio sistematizado. Produto à base de milho: O produto é um lote. Só podem ser retiradas 4 alíquotas de cada produto (lote), uma repetição para cada método. Não podem ser usadas réplicas. Deve usar 4 produtos num quadrado e 4 em outro. P1 à saco de 50kg de farinha P2 à saco de 50 kg de fubá P3 à saco de 50 kg de farinha de milho P4 à saco de 50 kg de fubá de marca ou lote diferente DOIS QUADRADOS LATINOS 4 × 4 primeiro quadrado latino 4 x 4 para aflatoxina segundo quadrado latino 4 x 4 para aflatoxina Dia 1 Dia 2 Dia 3 Dia 4 P1 P2 P3 P4 P5 P6 P7 P8 L1 M2 M3 M4 M1 L1 L2 M1 M2 M3 M4 L2 Outro sorteio sistematizado L3 M3 M4 L3 L4 M4 M1 L4 O sorteio sistematizado deve ser feito novamente para o segundo quadrado latino. Sempre que possível, o sorteio deve ser independente. O objetivo do delineamento é controlar as fontes de variação. No caso de usar só um laboratorista não haveria o fator de variação do laboratorista, mas ele teria qua fazer 4 experimentos em um único dia. Se ele fizesse 2 exames por dia, o dia já seria um fator de variação que teria que ser blocado. Na necessidade de blocar o dia, é necessário que todos os experimentos sejam realizados num dia. A estratégia de blocar apresenta vantagem, pois é muito mais confiável blocar uma possível fonte de variação do que supor que a variação não existe ao confiar num teste de concordância. A variação interexaminadores (a maior variação existente) é anulada pelo delineamento. DOIS QUADRADOS LATINOS 4 X 4 PARA AFLATOXINA P1 P2 P3 P4 TOTAL L1 C 288 B 288 A 276 D 300 1152 L2 D 272 C 256 B 284 A 272 1084 L3 A 240 D 296 C 236 B 300 1072 L4 B 272 A 264 D 292 C 264 1092 1072 1104 1088 1136 4400 P5 P6 P7 P8 TOTAL L1 D 271 A 264 B 284 C 264 1083 L2 A 252 B 288 C 234 D 302 1076 L3 B 283 C 255 D 290 A 275 1103 L4 C 288 D 296 A 269 B 303 1156 1094 1103 1077 1144 4418 Total Geral 8818 Sorteio sistematizado 29 Observa-se variação entre os laboratoristas, entre produtos e entre os quadrados. QUADRO DE ANÁLISE DE VARIÂNCIA Fonte de Variação gl SQ QM Total (n-1) 31 11.331,87 Quadrados Latinos 1 10,125 Laboratoristas 3 709,125 Produtos [(4-1)+(4-1)] 6 1.167,25 Métodos 3 5.681,625 Erro (variação intra-grupo) 18 3.763,75 209,0972 A soma de quadrados total é realizada para o ensaio como um todo. No livro, aparece para Produtos gl = 7, mas não aparece 1 gl para Quadrados latinos. É preferível listar separadamente para não confundir, pois laboratoristas e produtos fazer parte da fonte de variação do delineamento, mas o delineamento é repetido, surgindo a nova fonte de variação que é a repetição do delineamento. Métodos são o objeto de estudo. SQ Total ( ) ( ) ( ) ( ) ( ) 87,331.11 32 818.8 303269...288288 2 2222 =-++++=totalSQ SQ Quadrado Latino ( ) ( ) ( ) 125,10 32 818.8 16 418.4400.4 222 =- + =QLSQ SQ Laboratóristas Totais de Laboratoristas 1 = 1152+1083 2 = 1084+1076 3 = 1072+1103 4 = 1092+1156 ( ) ( ) ( ) 125,709 8 11561092 ... 8 10761084 8 10831152 222 =- + ++ + + + = FCSQ olaboratóri SQ Produto Os produtos que estão no primeiro quadrado latino não são os mesmos dos que estão no segundo quadrado. ( ) ( ) ( ) ( ) 25,167.1 4 144.1 4 077.1 ... 4 104.1 4 072.1 2222 =-++++= FCSQproduto Repetição do delineamento delineamento 30 SQ Método Métodos: A = 276+272+240+264+264+252+275+269 = 2.112 B = 2.302 C = 2.085 D = 2.319 ( ) ( ) 625,681.5 8 319.2...112.2 22 =- ++ = FCSQmétodoSQ ERRO SQe = SQt – SQa – SQd = 3.763,75 QMe (S2) 0972,209 18 75,763.3 === gl SQe QMe CV %25,5100 5625,275 0972,209 100 =´=´= geralX S CV CV baixo indica alta precisão. Intervalo de confiança estreito e é fácil detectar diferenças. Se o resultado mostrar igualdade entre métodos é porque eles realmente o são. Comparação dos métodos DMS (teste t) 19,15 8 0972,2092 18%,5 = ´ ´= tdms Þ r no denominador é o número sobre o qual foram calculadas as médias as serem comparadas. QUADRO DE COMPARAÇÃO MÉTODO média MÉTODO média Classif. 1 264,00 4 289,875 a 2 287,75 2 287,75 a 3 260,625 1 264,00 b 4 289,875 3 260,625 b Médias seguidas de letras distintas diferem pelo teste t (p < 0,05). [a = 0,05 é o mesmo que (p < 0,05)] 31 INTERAÇÃO ENTRE FATORES Até agora estudamos tratamentos com apenas um fator. Porém na experimentação muitas vezes vários fatores são estudados ao mesmo tempo. Por exemplo, no estudo de dietas, pode ser interessante estudar o efeito de níveis diferentes de proteína combinado a diferentes níveis calóricos, definindo qual é a melhor combinação. O mais comum é estudar a interação entre 2, 3 ou até 4 fatores. A interação de mais fatores tornam a interpretação mais complexa. Arranjo Fatorial Situação experimental: Estudo: dieta com 3 níveis de proteína e com 2 níveis de energia (caloria). Resposta: ganho de peso Repetições: 6 repetições por tratamento à 30 unidades experimentais A interação entre os níveis de proteína com os de energia resultam num fatorial 3 × 2. No caso desse experimento, será denominado “arranjo fatorial”. Cada nível de proteína será combinado com cada um dos níveis de energia, gerando 6 tratamentos. O arranjo do tratamento não tem nada a ver com delineamento. O delineamento vai depender do local e dos animais utilizados (fontes de variação a serem controladas). O arranjo fatorial é a forma de combinar os tratamentos analisados e compreender o efeito de cada combinação sobre o resultado medido. Esse tipo de estudo é muito vantajoso pois tem uma quantidade de informação muito maior: o efeito de cada um dos fatores e o da combinação entre eles. ARRANJO FATORIAL 3 × 2 E1 P1 E2 E1 P2 E2 E1 P3 E2 6 tratamentos QUADRO DE ANÁLISE DE VARIÂNCIA Fonte de Variação gl gl (adequado à interação) SQ QM Total (n-1) 29 29 Proteína (P) à 2 (P – 1) Energia (E) à 1 (E – 1) tratamento 5 P × E à 2 (P – 1) × (E – 1) Erro 24 24 Os graus de liberdade do tratamento são divididos. A interação é o produto dos graus de liberdade dos fatores isolados (P × E). Os fatores isolados são estudados quando a interação é não-significativa. Em alguns casos, o resultado mostra que só justifica utilizar um fator se este for combinado com o outro, ou seja, isoladamente esse fator não tem efeito significativo. 32 Exemplo: situação experimental Qualidade de ovos em relação ao armazenamento em 2 temperaturas (4oC e 18oC) combinado à utilização de 2 tipos de embalagem (papelão e filme PVC) e medida nos tempos de estocagem de 5, 10, 15, 20 dias. Arranjo fatorial Þ 2 × 2 × 4 = 16 tratamentos Se fosse usar o modelo de ANOVA sem partição dos tratamentos: QUADRO DE ANÁLISE DE VARIÂNCIA Fonte de Variação gl Total (n-1) tratamento 15 Erro Dividindo os graus de liberdade pelos tratamentos: QUADRO DE ANÁLISE DE VARIÂNCIA Fonte de Variação gl Total (n-1) Temperatura (T) 1 Embalagem (E) 1 Estocagem (Es) 3 T×E 1 T×Es 3 E×Es 3 T×E×Es 3 Erro Os gl do tratamento foram divididos. Com o cálculo das somas de quadrado separadas para cada um dos fatores e suas combinações, é possível verificar qual fator exerce maior influência no resultado. Quando o número de tratamentos é aumentado, isso permite diminuir o número de repetições. Supondo um delineamento inteiramente casualizado, para conseguir 10 gl para o erro, 2 repetições seriam suficientes, ficando n=32 e gl do erro = 17. Há duas coisas a serem consideradas na experimentação: a estimativa do erro experimental e o cálculo da média. A estimativa do erro experimental, que deve ser igual à populacional (a verdadeira) e isso teoricamente é garantido se há um grande número de respostas sendo 10 gl suficientes. O cálculo da média é outro aspecto que às vezes fica esquecido, pois a média deve ser representativa do grupo e uma estimativa da variância individual. Mas com 2 repetições, as médias seriam calculadas sobre apenas 2 repetições. Nesse caso, se houver valor atípico, esse valor alteraria demais a média, pois nesse caso, cada parcela representa 50% de peso no cálculo da média. No caso de perda, também seria problemático, pois uma só repetição impede o cálculo de média, sendo então perdida uma das combinações possíveis de tratamento. Recomenda-se então um cálculo amostral que forneça uma sobra. Com pelo menos 4 repetições, o peso de cada parcela é de 25% no cálcuo da média. 15 Interações de 1a.ordem (2 fatores) Interação de 2a.ordem (3 fatores) 33 4 repetições × 16 tratamentos Þ n= 64 à gl do erro = 48 É possível estimar o cálculo amostral através dos gl. É uma forma prática com fundamentação estatística, mas quando a resposta é muito instável, é melhor calcular através do desvio-padrão da resposta. Às vezes 10 gl não é suficiente para variáveis instáveis. P.: Quando se usa análise de covariância? R.: Quando há um fator que entra na análise que não é o fator de estudo nem um fator desejado. Mas ele surge e é um problema que tem que ser contornado. Ele pode entrar como co-variavel. Essa covariável, apesar de não ser objeto de estudo, deve ser medida e colocada na análise de forma a determinar a influência da mesma sobre o resultado. Situação experimental: Um pesquisador estudou o efeito de vitamina B12 (0 e 50mg) e antibiótico (0, 250mg) em fêmeas de Pastor Alemão da desmama à puberdade. Delineamento inteiramente casualizado. Resposta: ganho de peso médio diário (em gramas) da genitália Experimento Antibiótico 0 250 Resposta Vitamina 0 50 0 50 1 1,30 1,19 1,05 1,56 2 1,08 1,26 1,05 1,55 3 1,19 1,21 1,00 1,52 4 1,19 1,22 0,98 1,53 Total 4,76 4,88 4,08 6,16 Média 1,19 1,22 1,02 1,54 Þ Fatorial 2 × 2 QUADRO DE ANÁLISE DE VARIÂNCIA Fonte de Variação gl SQ QM Total (n-1) 15 0,60 Antibiótico (A) 1 0,02 Vit B12 (V) 1 0,30 A + V 1 0,25 Erro 12 0,03 0,0025 SQ TOTAL ( ) ( ) ( ) 60,0 16 88,19 53,1...3,1 2 22 =-++=totalSQ 34 SQ ANTIBIÓTICO ( ) ( ) 02,0 8 24,1064,9 22 =- + = FCSQA SQ VITAMINA ( ) ( ) 30,0 8 04,1184,8 22 =- + = FCSQV SQ TRATAMENTO (só os três: A, V e interação) ( ) ( ) 57,0 4 16,6...76,4 22 =- ++ = FCSQTRAT SQ A × V vitanttratVA SQSQSQSQ --=´ SQ ERRO Obtido pela diferença: SQe = SQT – SQA – SQV– SQA × V = 0,03 QMe (S2) 0025,0 12 03,0 === gl SQeQMe CV %03,4100 24,1 0025,0 100 =´=´= geralX S CV DMS (teste t) 072,0 4 0025,02 12%,5 = ´´= tdms Antibiótico Vitamina 0 250 dif Média geral 0 1,19 a A 1,02 b B 0,17 1,10 50 1,22 b A 1,54 a A -0,32 1,38 dif -0,03 -0,52 Média geral 1,20 1,28 Médias seguidas de letras distintas, minúsculas na linha e maiúsculas na coluna, diferem pelo teste t (p < 0,05) (as médias não têm valor nesse caso, pois são utilizadas só quando não há interação entre os fatores.) 35 Exemplo com letras caracterizando ausência de interação (nesse caso, não são apresentadas as letras dentro do quadro: 0 250 0 aB bB B 50 aA bA A a b GRÁFICO PARA MOSTRAR INTERAÇÃO Quando as retas são paralelas, ainteração é não significativa. Situação experimental: Ração enriquecida com 2 concentrações de cálcio e três de fósforo Deseja-se saber qual a combinação de concentração desses nutrientes leva ao maior ganho de peso em frangos de corte. Ca (2 e 4,5%) P (0,2; 0,5 e 0,8%) Þ (2 × 3) Resposta: peso aos 45 dias em kg Galpão com 6 lotes de 200 frangos 4 galpões em diferentes localizações Unidade experimental: peso médio de 20 frangos Delineamento: Blocos casualizados, utilizando 4 galpões (blocos) com 6 repetições em cada bloco. Cada lote receberá um tratamento. Como cada lote tem 200 frangos, a medida será realizada só em 20 frangos cuja média é a unidade experimental. Galpões P Ca I II II IV Total Total (Ca=2,0) Total (Ca=4,5) 0,2 2,0 1,3 1,2 1,7 1,4 5,6 5,6 0,2 4,5 2,0 1,8 2,1 1,9 7,8 7,8 0,5 2,0 2,9 2,4 2,7 2,6 10,6 10,6 0,5 4,5 2,9 2,7 3,5 3,1 12,2 12,2 0,8 2,0 3,3 3,1 3,4 3,3 13,1 13,1 0,8 4,5 1,9 1,5 2,5 1,7 7,6 7,6 Total 14,3 12,7 15,9 14,0 56,9 29,3 27,6 1,1 1,2 1,4 1,54 0 antibiótico 0 vitamina 250 antibiótico 1,22 1,60 36 QUADRO DE ANÁLISE DE VARIÂNCIA Fonte de Variação gl SQ QM Total (n-1) 23 12,0696 Galpão 3 0,8646 Cálcio (Ca) 1 0,121 Fósforo (P) 2 6,086 Ca × P 2 4,585 Erro 15 0,4129 0,0275 SQT = (1,3)2+...+(1,7)2 – G2/24 SQgalpão = (Bl1)2 + ... + (Bl4)2 – FC SQCa = [(29,3)2+(27,3)2]/12 – (56,9)2/24 SQP = [(13,4)2+(22,8)2+(20,7)2]/8 – (56,9)2/24 SQtrat = [(5,6)2+ ... +(7,6)2]/4 – FC = 10,792 SQCa × P = SQtrat – SQca – SQP %99,6100 37,2 0275,0 =´=CV 25,0 4 0275,02 15%,5 = ´ ´= tdms QUADRO DE COMPARAÇÃO Fósforo Cálcio 0,2 0,5 3,28 2 1,4 c B 2,65 b B 3,28 a A 4,5 1,95 b A 3,05 a A 1,9 b B Médias seguidas de letras distintas, minúsculas na linha e maiúsculas na coluna, diferem pelo teste t (p < 0,05) 37 Interação entre fatores (continuação) Os tratamentos estatísticos, quando há interação entre fatores, estão combinados de forma em que todos os níveis de um fator estão presentes em todos os níveis de outro fator. Arranjo em parcela subdividida Tanto o arranjo fatorial quanto o arranjo em parcelas subdivididas são formas de compor o tratamento estatístico, que estão dentro de um delineamento. O delineamento é decorrente quase sempre de uma restrição (uniformidade de ambiente, amostra) que leva à formação de blocos. Situação experimental Carga parasitária de esquistossomose no volume globular em coelhos aos 7, 14 e 21 dias pós infecção. Tratamentos: · Ausência de carga (controle) Þ 7, 14 e 21 dias · Carga de 103 Þ 7, 14 e 21 dias · Carga de 106 Þ 7, 14 e 21 dias Resposta: volume globular (fluxo continuado, medido aos 7, 14 e 21 dias) Unidades experimentais: 15 Coelhos (grupo homogêneo) Há interação entre fatores, pois queremos estudar 3 cargas em 3 dias para cada fator. A interação é 3 × 3, mas diferentemente do arranjo fatorial, cada animal gera 3 informações. Nesse caso, um animal foi alocado ao tratamento (carga do parasita) através de sorteio. Porém, as avaliações nos dias 7, 14 e 21 são realizadas num mesmo animal. O fator carga é subdividido, sendo que cada unidade experimental gera 3 resultados. Quando dentro de um fator várias respostas são geradas, configura-se um tipo de arranjo em parcelas subdivididas (split plot). Esse ensaio apresenta um delineamento inteiramente casualizado com carga na parcela e tempo na subparcela. É comum que o tempo, num experimento, seja subparcela num arrajno em parcela subdividida. Porém deve-se estar atento porque nem sempre esse é o caso. É necessário que a resposta seja de fluxo continuado. Se o animal tiver que ser sacrificado, não é possível reutilizar a parcela. Daí, torna-se necessário usar o arranjo fatorial. Exemplo: Experimento para verificar produção de matéria seca em variedades de sorgo nas 4 estações do ano. A variedade de sorgo será a parcela. As respostas para cada estação do ano serão medidas em cada variedade. 38 Situação experimental O sêmen é estocado em uma temperatura constante e quando é descongelado, há um tempo do retorno à condição de utilização. Sêmen eqüino em três tempos de estocagem (12, 24 e 48 hs) × velocidade de retorno (A, B). O ejaculado de um animal é dividida em 3 amostras (A1, A2 e A3). As 3 amostras serão sorteadas para tempo de estocagem T12, T24 e T48. Cada uma das amostras será dividida em 2 alíquotas, as quais serão sorteadas para as velocidades de retorno (VA e VB). Esse procedimento é realizado em todas as repetições do experimento (animais). Resposta: porcentagem de defeitos no acrossoma. Blocos: os animais são blocados (vantagem para o controle de variação nesse caso em que a resposta é muito instável e é possível obter alíquotas de material proveniente de animais difíceis de serem obtidos em quantidade) Alíquota 1 (sorteado p/ Vel B) Amostra 1 (sorteado p/ 48hs) Alíquota 1 (sorteado p/ Vel A) Alíquota 1 (sorteado p/ Vel A) Animal Þ 1 ejaculado (1 repetição = 1 animal) Amostra 2 (sorteado p/ 12 hs) Alíquota 1 (sorteado p/ Vel B) Alíquota 1 (sorteado p/ Vel A) Amostra 3 (sorteado p/ 24 hs) Alíquota 1 (sorteado p/ Vel B) Tempo de estocagem × Velocidade de retorno 3 × 2 = 6 tratamentos à t1: 48, VB à t2: 48, VA à t1: 12, VA à t1: 12, VB à t1: 24, VA à t1: 24, VB Delineamento em blocos casualizados e arranjo em parcelas subdivididas com tempo de estocagem na parcela e velocidade de retorno na subparcela (nem sempre o tempo é subparcela) Situação experimental Estudar 5 anestésicos em cães. Há limitação para obtenção de animais uniformes e espaço no hospital. Resposta: freqüência cardíaca em 3 tempos (fluxo continuado). 39 Repetições: 5 cães (serão utilizados apenas 5 cães) Arranjo fatorial: 5 × 3 = 15 (5 anestésicos em 3 tempos) Delineamento em quadrado latino e arranjo em parcela subdividida 5 × 3, sendo os anestésicos as parcelas e os tempos de avaliação as subparcelas Sem. 1 Sem. 2 Sem. 3 Sem.4 Sem. 5 10 min 10 min 10 min 10 min 10 min 20 min 20 min 20 min 20 min 20 min Cão 1 B 30 min D 30 min E 30 min C 30 min A 30 min 10 min 10 min 10 min 10 min 10 min 20 min 20 min 20 min 20 min 20 min Cão 2 C 30 min B 30 min A 30 min E 30 min D 30 min 10 min 10 min 10 min 10 min 10 min 20 min 20 min 20 min 20 min 20 min Cão 3 D 30 min A 30 min C 30 min B 30 min E 30 min 10 min 10 min 10 min 10 min 10 min 20 min 20 min 20 min 20 min 20 min Cão 4 A 30 min E 30 min B 30 min D 30 min C 30 min 10 min 10 min 10 min 10 min 10 min 20 min 20 min 20 min 20 min 20 min Cão 5 E 30 min C 30 min D 30 min A 30 min B 30 min à B (10, 20, 30 min) Þ parcela (soma das 5 repetições) à B (10 min) Þ subparcela (soma das 5 repetições) Todos os 5 cães serão subemtidos aos 5 anestésicos e todos os anestésicos serão testados em todas as semanas. As respostas serão medidas em 3 tempos para cada anestésico. O estudo deverá ser realizado num prazo de 5 semanas, dando um tempo de recuperação (wash-out) do efeito residual do tratamento anterior antes de proceder o seguinte. Delineamento em quadrado latino e arranjo em parcelas subdivididas com anestésico na parcela e os tempos de avaliação na subparcela. Nos delineamentos estudados anteriormente, o quadro da ANOVA apresentava somente um tipo de erro. Nos arranjos em parcela subdividida há dois tipos de erro: erro a e erro b. Erros a e b Erro a Þ variação individual atribuída à parcelaErro b Þ variação individual atribuída à subparcela Na comparação das médias, ora é utilizado o erro a, ora o erro b e outras vezes os dois erros são utilizados com ponderação. Portanto as análises com dms serão realizadas três vezes: a, b e ponderada. O valor da resposta de cada uma das 5 combinações do tratamento com o anestésico B, medida aos 10 minutos (B-10) é uma subparcela. Os valores dessas 5 subparcelas apresentam variação individual. Essa variação que ocorre dentro de uma mesma subparcela será chamada de erro b: erro da subparcela. O mesmo ocorre com as combinações B-20, B-30, A-10, A-20, A-30 e assim por diante, gerando também uma 40 variação individual para essas subparcelas. A média dessas variações individuais das subparcelas vai gerar o erro b. Quando é considerado o resultado de cada anestésico, esse é a soma das suas respectivas subparcelas, gerando o resultado da parcela. A soma de B-10, B-20 e B-30 nas 5 repetições resulta na resposta da parcela B. Os resultados de cada uma das 5 parcelas também apresentam variação. A média das variações das parcelas é chamada de erro a. Da mesma forma que no arranjo fatorial, o arranjo em parcelas subdivididas tem o objetivo de avaliar qual a melhor combinação de tratamentos. Pela forma de condução do experimento, quando um fator está incluído no outro, configura-se uma forma específica de arranjo fatorial denominada parcela subdividida. Não é raro o pesquisador dividir um experimento cuja resposta é avaliada por tempo. Isso gera um prejuízo devido ao efeito do tamanho amostral. Considerando esse experimento como exemplo, há 75 repetições. Quando o experimento é dividido em 3 ensaios, um para cada um dos tempos de avaliação, cada experimento resultante teria n = 25. Outra limitação da divisão é que no estudo dividido não podem ser feitas comparações entre os tempos, ao contrário do ensaio completo no qual pode-se avaliar a evolução da resposta nos 3 tempos, inferindo a partir das comparações entre resultados obtidos nos diferentes tempos. A divisão do estudo leva a duas perdas: informação e precisão experimental. Exemplo: Suplementação na dieta de frangos com duas concentrações de Cálcio, e outra de Fósforo com três níveis de concentração. A resposta será medida em 45 e 90 dias. As parcelas são o arranjo fatorial 2 × 3, mais um terceiro fator (tempo) que é a subparcela. As subparcelas são os tempos de avaliação para cada parcela (2 × 3 × 2). No caso do animal for abatido (resposta descontinuada) o mesmo estudo deverá ser reconfigurado apenas em arranjo fatorial, havendo necessidade de dobrar a amostra para avaliar o fator tempo. Ca P Tempo 45d 0,2 90d 45d 0,5 90d 45d 2,0 0,8 90d 45d 0,2 90d 45d 0,5 90d 45d 4,5 0,8 90d 41 Nesse caso, há um arranjo fatorial na parcela composta por 2 fatores, mais um terceiro fator na subparcela. Se a resposta não fosse continuada, caso o animal tivesse que ser abatido, não seria parcela subdividida, mas somente arranjo fatorial. Haveria dessa forma necessidade de compensar o tamanho amostral aumentando o número de repetições. Continuação da situação experimental anterior, porém com tempos de estocagem de 12, 24, 36. O sêmen é estocado em uma temperatura constante e quando é descongelado, há um tempo do retorno à condição de utilização. Sêmen eqüino em três tempos de estocagem (12, 24 e 36 hs) × velocidade de retorno (A, B). O ejaculado de um animal é dividida em 3 amostras (A1, A2 e A3). As 3 amostras serão sorteadas para tempo de estocagem T12, T24 e T36. Cada uma das amostras será dividida em 2 alíquotas, as quais serão sorteadas para as velocidades de retorno (VA e VB). Esse procedimento é realizado em todas as repetições do experimento (animais). Resposta: porcentagem de defeitos no acrossoma. Blocos: os animais são blocados Repetições: 10 animais produzindo 60 alíquotas de sêmen Delineamento em blocos casualizados e arranjo em parcelas subdivididas com tempo de estocagem na parcela e velocidade de retorno na subparcela Tempo de estocagem Totais Vel. 12 24 36 sub A sub B Animais Animal 1 A 8 10 16 34 B 12 15 19 46 80 Animal 2 A 3 7 11 21 B 6 12 18 36 57 Animal 3 A 10 13 20 43 B 15 17 23 55 98 Animal 4 A 4 6 13 23 B 6 10 17 33 56 Animal 5 A 9 12 19 40 B 14 18 24 56 96 Animal 6 A 5 6 11 22 B 11 15 22 48 70 Animal 7 A 7 10 15 32 B 10 18 23 51 83 Animal 8 A 5 9 13 27 B 9 16 23 48 75 Animal 9 A 13 14 21 48 B 17 22 29 68 116 Animal 10 A 4 8 9 21 B 9 13 20 42 63 TOTAIS 177 251 366 311 483 794 10 animais × 3 estocagens × 2 velocidades 10 × 3 × 2 = 60 observações ou U.E. (cada unidade é uma subparcela) Totais das parcelas 12 24 36 Animal 1 20 25 35 Animal 2 9 19 29 Animal 3 25 30 43 Animal 4 10 16 30 Animal 5 23 30 43 Animal 6 16 21 33 Animal 7 17 28 38 Animal 8 14 25 36 Animal 9 30 36 50 Animal 10 13 21 29 42 Quando se tem tempo 12 e velocidade A, dentro dessa parcela 12 e desse mesmo nível do fator de subparcela (A), a variação entre 8, 3, 10, ...,13, 4) é a variação individual entre subparcelas, ou erro b. A parcela é composta pelos valores das subparcelas. Quando é observado o valor total da parcela do nível 12, esse é formado pela soma de 10 parcelas (8+12=20; 3+6=9; ...; 13+17=30; 4+9=13), a variação individual entre essas parcelas é denominada erro a, ou variação atribuída à parcela. tempo de estocagem = parcela à erro a = variação entre estocagens velocidade = subparcela à erro b = variação entre velocidades Þ 30 parcelas e 60 subparcelas QUADRO DE ANÁLISE DE VARIÂNCIA Fonte de Variação gl SQ QM Total (parcelas) (30-1) 29 1.496,7333 Animal (blocos) (10-1) 9 566,7333 Tempo de estocagem (T) (3-1) 2 907,0333 Erro a à obtido por diferença 18 22,9667 1,2759 Total (subparcelas) (60-1) 59 2.076,7333 Velocidade (2-1) 1 493,0667 T × V (2 × 1) 2 22,0333 Sub-blocos (30-1) (parcelas) 29 1.496,7333 Erro b (59-1-2-29) 27 64,8999 2,4037 * erro a à [efeitos de animal e tempo] erro b à [efeitos de animal, tempo e velocidade] Se o delineamento fosse inteiramente casualizado, não haveria controle de fonte de variação pela formação de blocos (animal). Para encontrar a SQerro a, é calculado o SQtotal das parcelas – SQanimal – Sqtempo. O SQerro b é calculado pela SQtotal de subparcelas – SQde todas as fontes de variação à SQtotal de subparcelas – SQvelocidade – SQinteração – SQsub-blocos. Não é necessário colocar sub-blocos no quadro, mas é bom colocar para não esquecer de subtrair seu valor para o cálculo do erro b. Sub-bloco pode ser entendido como divisão das subparcelas. Para velocidade, que é o fator que está sendo dividido dentro do outro fator, tempo de estocagem comporta-se como um bloco. Há 2 velocidades, A e B, sendo que as duas passam pelo fator tempo de estocagem, da mesma forma em que os blocos no delineamento. Nesse experiento há o fatorial 3 × 2 = 6 tratamentos. Os gl de tratamento são 5, desdobrados em velocidade (1), tempo de estocagem (2) e interação (2). SQ parcelas (total) à denominador = 2 Þ duas repetições por parcela ( ) ( ) ( ) ( ) 7333,496.1 60 794 2 29...2520 2222 =- ++ =parcelasSQ Total de subparcelas na parcela Delineamento Fator da parcela Fator da subparcela Interação 43 SQ animal ( ) ( ) ( ) ( ) 7333,566 60 794 6 63...5780 2222 =- +++ =animalSQ SQ tempo ( ) ( ) ( ) ( ) 0333,907 60 794 20 366251177 2222 =- ++ =tempoSQ O total para cada tempo é calculado a partir de 20 observações (10 animais × 2 velocidades). SQ erroaSQea = 1.496,7333 – 566,7333 – 907,0333 = 22,9667 Þ 2759,1 18 9667,22 ==aQMe SQ subparcelas à denominador = 1 Þ uma repetição por subparcela ( ) ( ) ( ) ( ) 7333,076.2 60 794 20...128 2 222 =-+++=ssubparcelaSQ SQ velocidade ( ) ( ) 0667,493 30 483311 3030 2222 =- + =-+= FCFC VV SQ BAvelocidade SQ interação SQ (v × t) = SQtrat – SQt – SQvel SQ tratamento (necessário para calcular a SQinteração) A interação é um fator que envolve a parcela e a subparcela, e será estudada na subparcela. A SQtratamento = SQtempo + SQvelocidade + SQinteração. Tempo de estocagem foi colocada na primeira parte do quadro da ANOVA porque é parcela. A velocidade é subparcela, colocada na segunda parte do quadro, pois está dentro da parcela. Conforme um critério de ordem de apresentação dos dados, a interação, que é a combinação dos fatores, é apresentada após a apresentação dos fatores isolados (fatores principais). Nessa situação, calcular somente o SQtratamento não é indicado, pois haveria perda de informação no sentido em que se deseja saber os efeitos dos fatores e suas combinações. Total de repetições por animal Total de repetições por tempo de estocagem Total de repetições por subparcela Total de repetições por velocidade 1 44 Tratamentos à fatorial 2 × 3 = 6 T12A = 68 T24A = 95 T36A = 148 T12B = 109 T24B = 156 T36B = 218 ( ) ( ) ( ) 1333,422.1 10 218...10968 222 =- +++ = FCSQtratamento SQ (v × t) = SQtratamento – SQtempo – SQvelocidade Þ SQ (v × t) = 1.422,1333 – 907,0333 – 493,0667 = 22,0333 SQ errob SQeb = 2.076,7333 – 493,0667 – 22,0333 – 1.496,7333 = 64,8999 Þ 4037,2 27 8999,64 ==aQMe Continuação: parcela subdividida Comparação de médias Tempos Velocidades 12 24 36 Média velocides A 6,8 9,5 14,8 10,37 B 10,9 15,6 21,8 16,10 Média tempos 8,85 12,55 18,30 QM para erros: QMea = 1,2759 (com 18 gl) QMeb = 2,4037 (com 27 gl) O erro b é o erro que envolve todas as subparcelas, ou seja, todas as unidades experimentais. É o erro do experimento para o cálculo do CV. CV: 100´= X QM CV errob à média geral: 23,13 60 794 60 === G X %72,11100 23,13 4037,2 =´=CV Total de repetições por tratamento 45 dms parcela à tempo de estocagem subparcela à velocidade de retorno 1a.comparação: níveis da subparcela / fixando a parcela VA – VB / 12 à comparam-se as velocidades A e B para tempo 12 VA – VB / 24 à comparam-se as velocidades A e B para tempo 24 VA – VB / 36 à comparam-se as velocidades A e B para tempo 36 à Quando compara subparcelas dentro de uma parcela (a parcela é fixa portanto há erro de parcela) devo usar o QMeb (que é o erro da subparcela) Þ não há variação causada por parcela 2a.comparação: níveis de parcela / fixando a subparcela 12 – 24 – 36 / vel A à comparam-se os tempos 12, 24 e 36 para velocidade A 12 – 24 – 36 / vel B à comparam-se os tempos 12, 24 e 36 para velocidade B à Quando comparo parcelas dentro de uma subparcela, tenho o fator parcela + o fator subparcela (variação de parcela e subparcela) Þ devo combinar o erro a e o erro b com média aritmética ponderada. 1. dms para subparcela/parcelas r QMetdms bglerrob 2 , ´= a Þ r à número de repetições para calcular as médias 2. dms para parcela/subparcelas r QMe tdms ponderadoponderado 2 ´= S/P P/S S/P P/S 46 b QMebQMeQMe ba ponderado )1( -+= Þ b = número de níveis do fator da subparcela ( ) ( ) ba bbaa ponderado QMebQMe QMebtQMett ´-+ ´-´+´= 1 1 Þ ta à t 5%, gl erro a Þ tb à t 5%, gl erro b 1. dms para velocidade/tempo de estocagem 42,1 10 4037,22 27, = ´´= atdms 2. dms para tempo/velocidade ( ) 8398,1 2 4037,2122729,1 = ´-+ =ponderadoQMe ( ) ( ) 0690,24037,2122729,1 4037,212052,22729,1101,2 = ´-+ ´-´+´ =ponderadot 26,1 10 8398,120690,2 =´´=dms Comparação de médias Tempos Velocidades 12 24 36 Média velocidades A 6,8 a A 9,5 b A 14,8 c A 10,37 B 10,9 a B 15,6 b B 21,8 c B 16,10 Média tempos 8,85 12,55 18,30 à Em qualquer tempo, a velocidade A é melhor que a velocidade B à A porcentagem de defeitos aumenta com o tempo, tanto na velocidade A como na B. Þ RECOMENDAÇÃO: velocidade A, tempo 12 à Como o comportamento é o mesmo dentro da velocidade e dentro do tempo Linhas = igual à todas na seqüência abc Colunas = igual à sempre na ordem AB S/P P/S não há interação 47 Comparação relatadas através das médias, nas margens da tabela Tempos Velocidades 12 24 36 Média velocidades A 10,37 A B 16,10 B Média tempos 8,85 a 12,55 b 18,30 c Reta vel A abaixo de vel B, pois apresenta menor % de defeito. Vel A Vel B 48 ASSOCIAÇÃO DE VARIÁVEIS QUANTITATIVAS · Correlação de Pearson · Regressão linear Correlação à medida de associação entre variáveis (respostas) não dependentes Regressão linear à condição de dependência entre variáveis Correlação A correlação de Pearson mede a associação entre respostas independentes (variáveis quantitativas). Para que a correlação seja utilizada, é pré-requisito que haja variação em ambas as respostas. Se não houver variação em uma das respostas, a correlação será não significativa. Coeficiente de correlação de Pearson (r(x,y)), mede a “intensidade”da variância entre duas variáveis x e y. Para as análises de correlação e regressão linear, a “amplitude”do intervalo das variáveis deve ser pequena. ( ) ( )( ) ( ) ( ) ú ú û ù ê ê ë é - ú ú û ù ê ê ë é - - = åååå ååå n y y n x x n yx xy r yx 2 2 2 2 , Þ ( ) YX XY yx SQSQ SP r ´ =, Após o cálculo do coeficiente, há necessidade de verificar a significância estatística. Exemplo: Situação experimental: ganho de peso em novilhos em 5 meses n = 12 Reprodutor Confinados (x) Campo (y) x × y x2 y2 1 73 64 4.672 5.329 4.096 1 71 62 4.402 5.041 3.844 1 72 66 4.752 5.184 4.356 2 64 55 3.520 4.096 3.025 2 65 59 3.835 4.225 3.481 2 66 65 4.290 4.356 4.225 2 70 65 4.550 4.900 4.225 3 71 69 4.899 5.041 4.761 3 68 64 4.352 4.624 4.096 3 70 65 4.550 4.900 4.225 3 67 63 4.221 4.489 3.969 66 62 4.092 4.356 3.844 Total 823 759 52.135 56.541 48.147 Soma de produtos de X e Y Numerador da S2X Numerador da S2Y 49 Sx = 823 Sy = 759 Sxy = 52.135 Sx2 = 56.541 Sy2 = 48.147 O ganho de peso nos confinados não interfere no ganho de peso do campo e vice-versa. Entretanto, o ganho de peso de confinados se correlaciona com o ganho em campo? Aplicando-se a fórmula: ( ) ú û ù ê ë é -ú û ù ê ë é - ´ - = 12 759 147.48 12 823 541.56 12 759823 135.52 22 , yxr ( ) 688,0, =yxr à para 10 gl (12 – 2) Þ r(x,y) = 68,8% Na tabela (Tabela A-4), o coeficiente para 10 gl é 0,58. como o r calculado (0,688) é maior que o r tabelado (0,58), a corrrelação é significativa (p < 0,05). A correlação encontrada é positiva. Intervalo de confiança para o Coeficiente de Correlação Os limites do intervalo de confiança devem abranger 95% dos resultados de estudos de duas populações independentes e correlacionadas. Quando - 0,70 < r < 0,70, os valores de r podem estar distribuídos livremente entre –1 e + 1 seguindo uma distribuição próxima à normal. Quando r está próximo dos limites de –1 ou +1, a distribuição se dá de forma assimétrica. Para compensar essa
Compartilhar