Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 1 UNIVERSIDADE DE SÃO PAULO Faculdade de Medicina Veterinária e Zootecnia Departamento de Nutrição e Produção Animal VNP Planejamento e Análises Estatísticas de Experimentos em Produção Animal 25 35 45 55 65 750 75 150 225 300 5.4 5.6 5.8 6.0 6.2 6.4 6.6 6.8 7.0 pH Concentrados (%) Monensina(mg/dia) 6.8-7.0 6.6-6.8 6.4-6.6 6.2-6.4 Prof. Dr. Paulo Henrique Mazza Rodrigues Pirassununga – SP 2006 2 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 2 Classificação de Variável Resposta: Alessandra Soares A escolha da variável resposta compreende o processo de seleção e mensuração das características respostas para o experimento. A finalidade da classificação da variável resposta é facilitar a interpretação dos dados, produzido um resumo verbal ou numérico para descrever os pontos principais dos dados do experimento. O método mais apropriado para classificação da variável resposta dependerá da natureza dos dados. Variáveis em escala de medidas mensuradas com instrumentos como régua, balança, dosador a fim de se obter valores para comprimento, peso e volume são considerados Variável Categórica que podem ser: Quantitativos ou numéricos – São classificados como numéricos discretos (números inteiros): - contagem de ovos postos pela tartaruga marinha; - número de animais com febre aftosa no ano passado. Ou ainda classificados como numéricos contínuos (medida numa escala continua): - volume, área, peso, massa (avaliação do ganho de peso num rebanho de gado de corte); Qualitativos ou categóricos – São classificados como nominais, por exemplo: - sexo: macho e fêmea. Ou classificados como categóricos ordinais, tais como: - animais jovens, adultos e idosos. Temos faixa etária como sendo uma variável ordenada categórica; Variáveis com escalas de medida intervalar (aproxima-se da concepção comum de medida) ou racional (razões iguais entre valores) são designadas Variáveis Continuas, elas são consideradas uma forma refinada de classificação, como segue abaixo: - Continua: números e frações – são valores numéricos distintos, podendo ser finito ou infinito. Exemplo: ganho de peso, produção de leite, idade de um animal é uma variável continua. - Descontinua – números inteiros – são valores numéricos isolados e finitos. Exemplo: quantidade de leitões nascidos de uma porca, número de cordeiros nascidos, quantidade de frutos em uma árvore. Outros tipos de classificação: Quanto ao fluxo de resposta que pode ser: - Fluxo continuado – quando ocorre reutilização da unidade experimental – exemplo: ensaios de digestibilidade, cinzas ósseas para medir matéria mineral, ou área de olho do lombo por ultra-som, não sendo necessário realizar abate do animal para obter informações. 3 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 3 - Fluxo descontinuado – obtido uma única vez na unidade experimental – exemplo: rendimento de carcaça, cinzas na tíbia, área de olho de lombo convencional, há necessidade de realizar abate do animal para obtenção das medidas. Quanto a distribuição de freqüência: - Variável normalmente distribuída – exemplo: ganho de peso em novilhas, altura de cernelha em cavalos. - Variável com distribuição não normal – contagem de células somáticas no leite, titulação de anticorpos. E o ultimo tipo de classificação da variável resposta que diz respeito a instabilidade: - pouco instável – intervalo de variação pequeno: pH ruminal, parâmetros produtivos em aves. - muito instável – grande intervalo de variação: amônia ruminal, OPG nas fezes. Média Ana Maria de Freitas Oliveira Moreira Definição É o resultado da divisão da soma de todos os elementos de um conjunto de números pelo número total de elementos do conjunto. Média = ( X1 + X2 + X3 + ..............+ Xn ) n Onde : n é o número total de elementos do conjunto; Xn é o valor numérico de cada elemento do conjunto . Características importantes da Média : - A unidade de medida da média é a mesma dos valores da variável ; - O resultado de multiplicar a média pela quantidade n de valores da variável X é igual à soma dos n valores da variável ; - A média está posicionada de forma equilibrada entre os valores da variável , isto é , os valores da variável se distribuem ao redor da média . - Os valores numéricos devem estar sempre na mesma unidade . Desvantagem da Média : 4 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 4 - Quando ocorrem valores muito extremos , ou muito discrepantes . Neste caso , ela passa a não representar tão bem a amostra . Como calcular a Média : Exemplo : Produção de leite (em kg/vaca/dia) 15,8 13,2 17,6 15,1 13,8 15,5 17,1 15,4 15,6 16,7 Média = 15,8 + 17,6 + 13,8+ 17,1 + 15,6 + 13,2 + 15,1 + 15,5 + 15,4 + 16,7 = 15,58 kg 10 Neste caso , a média pode representar um valor a ser considerado ; porém se houver indivíduos com produção muito acima ou muito abaixo dos valores utilizados no exemplo , a Média tenderia a não representar tão bem a amostra . Ex .: Produção de 9,8 ou de 24,0 kg/vaca/dia . Considerações : Analisando o procedimento de cálculo da Média , pode-se inferir que : - Todos os valores da variável são incluídos no cálculo da Média ; - A Média é um valor único ; - A Média não é um valor resistente como a Mediana ou a Moda , porque mudanças nos valores da variável mudam o valor da Média ; - Nas variáveis com distribuição de freqüência simétrica , os valores da Média , Mediana e Moda coincidem , seus valores são iguais ; - Entretanto , se um ou mais valores da variável forem diferentes da maioria dos valores da amostra ( valor suspeito , extremo , “out lier” ) , a Média será uma medida distorcida da tendência dos valores da amostra . Ex : A um rebanho que tem média de produção de 20 kg/vaca/dia é adicionado um animal com produção de 40 kg/dia . Os valores médios de produção irão aumentar apenas devido a um animal , não representando a realidade do rebanho . A Média , a Mediana e a Moda de uma variável serão iguais somente quando sua distribuição de freqüência for simétrica . 5 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 5 A comparação das medidas de tendência central de uma variável antecipa a forma de distribuição de freqüências da variável : - Se a relação entre as medidas de tendência central for Média > Mediana , a distribuição terá inclinação na sua parte direita . Esta inclinação será tanto mais acentuada quanto maior for a Média em relação à Mediana . - Se a relação entre as medidas de tendência central for Média < Mediana , a distribuição terá inclinação na sua parte esquerda . Esta inclinação será tanto mais acentuada quanto menor for a Média em comparação à Mediana . Vantagens e Desvantagens das Medidas de Tendência Central Vantagens Desvantagens Moda Fácil de calcular ; Não é afetada por valores extremos ; Pode ser aplicada em qualquer escala (nominal , ordinal , intervalar e proporcional) Pode estar afastada do centro dos valores ; Difícil de incluir em equações matemáticas; Não utiliza todos os dadosda variável ; A variável pode ter mais de uma Moda ; Algumas variáveis não têm Moda . Mediana Fácil de calcular ; Não é afetada por valores extremos ; É um valor único ; Pode ser aplicada nas escalas ordinal , intervalar e proporcional . Difícil de incluir em equações matemáticas; Não utiliza todos os valores da variável . Média Fácil de compreender e aplicar ; Utiliza todos os valores da variável ; É um valor único ; Fácil de incluir em equações matemáticas ; Pode ser aplicada nas escalas intervalar e proporcional . É afetada por valores extremos ; É necessário conhecer todos os valores da variável . Bibliografia consultada GOMES , Frederico Pimentel , 1984 , A estatística moderna na pesquisa agropecuária , Potafos , Piracicaba , 160 pg . GOMES , Frederico Pimentel , 2000 , Curso de estatística experimental , 14ª edição , F. Pimentel – Gomes , Piracicaba , 480 pg . LAPPONI , Juan Carlos, 2000 , Estatística usando Excel , Lapponi Treinamento e Editora , São Paulo , 450 pg . 6 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 6 MEDIANA Andréa Vaz A estatística descritiva, como o próprio nome diz, é aquela que descreve os dados e, dentro desta, encontramos meios que nos ajudam a posicionar a Curva de Gauss no eixo. Esses meios são chamados de Medidas de Tendência Central. Dentre elas, destacamos: média, moda e mediana. A média é o valor mais provável de uma variável x, ou seja, é onde há o equilíbrio. Pode-se dizer, que a média é o valor igual à soma dos dados de uma lista dividida pela quantidade de dados aí existente. Já a moda, é o valor que mais se repete, ou seja, é o valor que ocorre com maior freqüência em uma lista de dados. A mediana é o valor que separa os dados ao meio, sendo que metade destes dados está abaixo e a outra metade está acima deste determinado valor. Somente este valor que está no meio é importante. Os outros valores são ignorados. Para se determinar a mediana quando for um número ímpar de dados, apenas localiza-se o dado central (que é a mediana) mas, quando o número de dados for par, é necessário tirar a média dos dois dados centrais (somar os dois valores e dividir por dois) para obter-se a mediana. Para facilitar, os dados devem ser colocados em ordem crescente. Dada a distribuição dos dados obtidos em um rebanho leiteiro (dados em litros de leite), observa-se: Tabela1. Distribuição de dados de produção leiteira de um rebanho leiteiro. Produção leiteira 13,0 14,0 14,5 15,0 15,0 15,5 16,0 16,0 17,0 19,5 19,5 Na tabela acima, observa-se 11 dados coletados sendo que, o dado “15,5”, é o que se encontra no meio, ou seja, tem-se 5 dados acima e 5 dados abaixo dele. Sendo assim, 15,5, é a mediana dos dados acima apresentados. Observando os dados de ganho de peso (gramas) de um experimento com frangos de corte, vê-se que existe mais de um dado central: 7 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 7 Tabela 2. Dados de ganho de peso (gramas) coletados em um experimento com frangos de corte. Ganho de peso (em gramas) 12,3 14,5 14,5 15,6 16,7 16,8 17,8 18,0 A mediana, nos dados acima, será determinada pela média dos valores centrais (15,6, 16,7). Portanto, a mediana é igual a (15,6 + 16,7)/2, ou seja, 16,15. Se média e mediana forem muito próximas, há maior probabilidade da Curva de Gauss estar equilibrada. Assim, quando uma distribuição de dados é razoavelmente simétrica, sem valores extremamente altos ou baixos, os valores da média e mediana em geral são muito próximos um do outro. Mediana ≈ Média Quando os dados apresentam um valor muito acima ou muito abaixo dos outros dados obtidos, haverá um desvio na Curva de Gauss, podendo esta apresentar uma alteração em sua apresentação: Mediana < Média Mediana > Média 8 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 8 Bibliografia DOWNING, Douglas; CLARK, Jeffrey. Estatística Aplicada. 1 ed. Saraiva: São Paulo, 1998. 455p. FREUND, John E.; SIMON, Gary A. Estatística Aplicada. 9a ed. Bookman: Porto Alegre, 2000. 404p. SAMPAIO, Ivan Barbosa Machado. Estatística Aplicada à Experimentação Animal. 1 ed. Fundação de Ensino e Pesquisa em Medicina Veterinária: Belo Horizonte, 1998. 221p. VIEIRA, Sonia. Princípios de estatística. 1 ed. Guazzeli: São Paulo, 1998. 144p. VIEIRA, Sonia. Estatística experimental. 2a ed. Atlas: São Paulo, 1999. 185p. MODA Aryana Duckur Nunes A moda é o valor que ocorre com maior freqüência em uma amostra, ou seja, o valor que mais se repete. Por exemplo, dado o conjunto de dados abaixo: Tabela 1: Produção leiteira diária de 15 vacas. 12,5 litros 13,0 litros 13,0 litros 14,5 litros 15,0 litros 15,0 litros 15,0 litros 16,5 litros 16,5 litros 17,0 litros 18,0 litros 18,5 litros 20,0 litros 20,5 litros 21,0 litros A moda deste conjunto de dados é 15,0 litros, porque 15,0 é o valor que ocorre maior número de vezes, ou seja, 3 vezes no presente exemplo. Nenhum outro valor se repete tantas vezes. 9 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 9 Podem existir conjuntos de dados que não apresentem moda, pois nenhum valor se repete, como apresentado no conjunto abaixo: 1, 2, 3, 4, e 5 Ainda, podem existir conjuntos de dados com duas modas ou mais, como, por exemplo, o seguinte conjunto de números: 1, 2, 2, 3, 4, 4, e 5 As modas neste caso são 2 e 4, uma vez que 2 e 4 se repetem com maior freqüência, ou seja, se repetem duas vezes cada número. A moda pode ser obtida mesmo que a variável seja qualitativa ou semi- quantitativa, ou seja, pode ser obtida de tabelas de distribuição de freqüência. A Tabela seguinte apresenta, como exemplo, a distribuição de freqüência de vacas leiteiras segundo o escore de condição corporal das mesmas: Tabela 2: Freqüência de vacas leiteiras segundo o escore corporal. Escore corporal Freqüência de vacas leiteiras 1 2 2 10 3 47 4 36 5 5 Segundo os dados apresentados na Tabela acima, o escore 3 ocorre com maior freqüência (47 vezes). Então, a moda deste conjunto de dados é o escore 3. Referências Bibliográficas GOMES, F. P. Iniciação à Estatística. 6. ed. rev. amp. São Paulo: Nobel, 1978. p. 211. MAGALHÃES, M. N; LIMA, A. C. P. de. Noções de Probabilidade e Estatística. 4. ed. São Paulo: EDUSP, 2002. 392 p. VIEIRA, S. Introdução à Bioestatística. 3. ed. Rio de Janeiro: Campus, 1980. p. 196. QUARTIS Flávio Alves 10 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 10 Definem-se como quartis os números que separam as observações de uma determinada amostra em quartos. Sendo separados, dessa forma, em quartil 1, quartil 2 e quartil 3. - Quartil 1 (Q1): é o número que separa os dados 25% menores dos 75% maiores. - Quartil 2 (Q2): é o número que separa os dados 50% menores dos 50% maiores. Portanto, é a própria mediana dos dados. - Quartil 3 (Q3): é o número que separa os dados 75% menores dos 25% maiores. Esta medida tem a vantagem de se utilizar a mesma unidade apresentada nos dados, como, por exemplo, kg, litro,grama, etc. Tabela - Produção Leiteira (kg/vaca/dia) Q1 = 14,5 Q2 = 16,5 Q3 = 19,0 Na Tabela acima, a média entre 14,5 e 14,5 é o primeiro quartil, que separa o primeiro quarto dos demais. O valor igual a 16,5 é o segundo quartil, que separa os dois primeiros quartos dos demais, ou seja, a amostra em duas partes iguais. O valor igual a 19,0, obtido pela média entre 18,5 e 19,5, é o terceiro quartil, que separa os três primeiros quartos do demais. PERCENTIS Ainda, uma amostra pode ser dividida em percentis. Geralmente este método é utilizado em amostragens muito grandes e também tem a vantagem de manter a mesma unidade da variável analisada (kg, litros, grama, etc.). Comumente são utilizados 6 percentis para a caracterização de uma amostra: - 1%: 1% dos valores está abaixo deste dado e 99% estão acima. - 5%: 5% dos valores estão abaixo deste dado e 95% estão acima. - 10%: 10% dos valores estão abaixo deste dado e 90% estão acima. - 90%: 90% dos valores estão abaixo deste dado e 10% estão acima. - 95%: 95% dos valores estão abaixo deste dado e 5% estão acima. 12,5 15,0 18,5 13,0 15,0 19,5 13,0 16,5 20,0 14,5 16,5 20,5 14,5 17,0 21,0 11 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 11 - 99%: 99% dos valores estão abaixo deste dado e 1% estão acima AMPLITUDE Iaçanã Valente Ferreira Gonzaga É uma medida de dispersão definida como a distância entre o extremo superior e o extremo inferior. Embora simples de se obter, têm a desvantagem de não levar em consideração a dispersão de todos os dados de uma determinada amostra em relação a média, uma vez que se utiliza de apenas dois dados, o extremo superior e o inferior. Descuida do conjunto de valores intermediários, o que quase sempre invalida a idoneidade do resultado, é apenas uma indicação aproximada da dispersão ou variabilidade. Deve ser considerada, ainda, a influência de possíveis “outliers”, que são dados discrepantes. Por estes motivos, é muito pouco utilizada como medida de dispersão dos dados em trabalhos científicos. Exemplo 1) Tomando o seguinte conjunto de números: 2, 3, 3, 5, 5, 5, 8, 10 e 12 Temos que o extremo superior é igual a 12 e o extremo inferior igual a 2. Portanto, a amplitude é igual a 10 (12 – 2 = 10). Exemplo 2) Apresentando os seguintes dados: Dados de escore em vacas para produção leiteira: A B C D 3 2 1 1 3 3 2 1 3 3 4 5 3 4 5 5 Amplitude do grupo A: 3 - 3 = 0 Amplitude do grupo B: 4 - 2 = 2 Amplitude do grupo C: 5 - 1 = 4 Amplitude do grupo D: 5 - 1 = 4 12 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 12 Como podemos verificar, no nosso exemplo, temos 4 dados e usamos somente 50 % deles. A amplitude do grupo D é igual ao C, mas a dispersão entre os dados é diferente. No grupo D temos apenas dois tipos de escore, 1 e 5; enquanto que no grupo C temos 4 tipos diferentes de escore. Isto mostra que a amplitude, embora fácil de calcular, não deve ser usada normalmente como medida de dispersão, já que a amplitude nem sempre distingue conjuntos com dispersão diferente. Referências Bibliográficas: VIEIRA, Sônia; HOFFMAN, Rodolfo. Elementos de Estatística. São Paulo: Editora Atlas S.A., 1986. 159p. CRESPO, Antônio Crespo. Estatística Fácil. 10a ed. São Paulo: Editora Saraiva, 1993. 224p. FERREIRA, Daniel Furtado. Estatística Básica. 1a ed. Lavras: Editora UFLA,1995. 664p. RODRIGUES, Paulo Henrique Mazza. Medidas de Dispersão, 03 de abril de 2006. Notas de Aula. VARIÂNCIA (Var ou s2) Karen Peres A variância mede a dispersão dos dados em torno da média (Vieira, 1985), ou seja, quanto que cada indivíduo, em média, está se desviando da média. Ela é a medida que se obtém somando os quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra menos um. Mais detalhadamente, para o cálculo da variância é realizada a subtração de cada valor individualmente da média do grupo, sendo que cada resultado desta subtração é chamado de desvio. Então, este desvio é elevado ao quadrado, fazendo desaparecer todos os sinais negativos. Posteriormente, somam-se esses quadrados dos desvios (SQD). Por último e em se tratando de uma população, faz-se a média desses quadrados, obtendo-se a variância. Perceba que a média obtida dos desvios, sem antes elevá-los ao quadrado, resultaria em um valor igual a zero, não sendo possível calcular a dispersão ao redor da média. Já, no caso de se tratar de uma amostra, obtida de uma amostragem de uma população, devemos dividir a soma dos quadrados dos desvios pelo número de indivíduos da amostra menos um (n-1). Este valor (número de indivíduos da amostra menos um) é chamado de graus de liberdade. Para se entender melhor o porquê se usa os graus de liberdade, vamos mostrar a explicação dada por Sampaio (2002). “Se uma variável foi descrita através de 30 observações, a estimativa de sua média foi obtida a partir de 30 graus de 13 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 13 liberdade. Entretanto, a estimativa de seu desvio padrão será obtida a partir de 29 graus de liberdade porque um grau de liberdade será cobrado pela estimativa anterior daquela média, utilizada no cálculo do desvio”. Ex: Lote A Lote B Lote C Lote D Va lo re s - M éd ia De sv io De sv io 2 Va lo re s - M éd ia De sv io De sv io 2 Va lo re s - M éd ia De sv io De sv io 2 Va lo re s - M éd ia De sv io De sv io 2 3 -3 0 0 2 -3 -1 1 1 -3 -2 4 1 -3 -2 4 3 -3 0 0 3 -3 0 0 2 -3 -1 1 1 -3 -2 4 3 -3 0 0 3 -3 0 0 4 -3 1 1 5 -3 2 4 3 -3 0 0 4 -3 1 1 5 -3 2 4 5 -3 2 4 M éd ia = 3 SQ D = 0 M éd ia = 3 SQ D = 2 M éd ia = 3 SQ D= 10 M éd ia = 3 SQ D= 16 População: Var = 0/4 = 0 População: Var = 2/4 = 0,5 População: Var = 10/4 = 2,5 População: Var = 16/4 = 4 Amostra: Var = 0/3 = 0 Amostra: Var = 2/3 = 0,67 Amostra: Var = 10/3 = 3,33 Amostra: Var = 16/3 = 5,33 No exemplo, primeiro devemos fazer a média dos valores de cada lote. Assim, para o lote A, (3 + 3 + 3 + 3 / 4) = 3; para o lote B, (2 + 3 + 3 + 4 / 4) = 3; e assim para os outros lotes. Em poder da média, cada valor individualmente é subtraído da média do seu lote, dando o desvio para cada valor. Assim, para o lote A, o primeiro valor que é 3, é subtraído da média do lote que é 3, dando o desvio igual a zero. Isso é feito para cada valor, de todos os lotes. Outro exemplo, no lote B, o primeiro valor é igual a 2 e ele é subtraído da média do lote B que é 3, resultando num desvio igual a -1. Depois, para calcularmos a média dos desvios, deveríamos fazer a soma dos desvios e dividir pelo número de observações. Contudo, se fizermos a soma dos desvios, o valor resultante sempre será igual a zero, por exemplo, como visto no lote B, (-1) + (0) + (0) + (1) = 0. Por causa disso, com o intuito de sumirmos com os valores negativos e a média dos desvios não dar igual a zero, devemos elevar o valor de cada desvio ao quadrado, antes de realizar a média destes. Os valores dos desvios ao quadrado estão demonstrados na quarta coluna de cada lote. Agora sim poderemos fazer a soma dos quadrados dos desvios (SQD). Podemos ver,no exemplo, que para o lote A, a SQD dá 0, pois 0 + 0 + 0 + 0 =0; para o lote B, a SQD resulta no valor 2, pois 1 + 0 +0 + 1 = 2; para o lote C a SQD resulta em 10 (4 + 1 + 1 + 4) e para o lote D, a SQD resulta em 16 ( 4 + 4 + 4 + 4). Em poder das SQD para cada lote, agora devemos fazer a média destes valores, que é o que chamamos de variância. Como já explicado, se tivermos todos os dados da população a média será igual a SQD dividido pelo número de dados, como no exemplo para o lote B, SQD/ n = 2/4 = 0,5, portanto a variância é igual a 0,5 para o lote B. Entretanto, como normalmente dispomos de uma amostra da população, devemos dividir a SQD pelos graus de liberdade, ou seja, pelo n-1; assim para o lote 14 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 14 A, devemos dividir a SQD por n-1, ou seja, 0/(4-1), que dá a variância igual a 0; para o lote B, 2/(4-1) = 0,67; para o lote C, 10/(4-1) = 3,33 e para o lote D, 16/(4-1) = 5,33. Fórmula: Variância (Var ou s2) = Σ (desvios)2 ou Variância (Var ou s2) = Σx2 – (Σx)2 n-1 n n-1 Para utilizarmos a primeira fórmula, precisamos obter os desvios. Já a segunda fórmula, é uma forma de obtermos a soma de quadrados dos desvios (SQD) sem ser necessário obter os desvios, pois, como se pode demonstrar: SQD = ∑d2 = ∑ x2 – (∑x)2 n Diferentemente da amplitude, a vantagem da variância é que se trata de uma medida de dispersão que leva todos os indivíduos da amostra em consideração e não apenas os dois extremos. Como desvantagem, a unidade da variância não é a mesma dos dados, ou seja, é a unidade do dado elevada ao quadrado. Isso traz algumas dificuldades de interpretação, uma vez normalmente temos dificuldade de associar a grandeza da variância com a grandeza dos dados. Para solucionarmos esta desvantagem, devemos tirar a raiz quadrada da variância, que é o que chamamos de desvio padrão (DP ou s) e que será apresentado adiante. Medidas de Dispersão Lígia Garcia Mesquita Resumem as variabilidades de um conjunto de valores em torno de uma medida de tendência central, comumente a média. A variância, o desvio padrão, o erro padrão da média e o coeficiente de variação são exemplos de medidas de dispersão. DESVIO PADRÃO É uma das medidas de dispersão mais empregada, pois leva em consideração a totalidade dos valores da variável em estudo e possui a vantagem de ter a mesma unidade de medida da variável em estudo (SAMPAIO, 1998). O desvio padrão baseia-se nos desvios em torno da média aritmética, ou seja, representa o quanto em média os dados se distanciam da média (GOMES, 2000). Quando há o interesse no desvio padrão populacional, a fórmula básica pode ser traduzida como a raiz quadrada dos desvios quadrados médios dividido por n e é representada por σσσσ. No entanto, quando há interesse não apenas na descrição dos dados, mas, partindo da amostra, como nos casos de experimentação animal, convém efetuar- se uma modificação, que consiste em usar o divisor n - 1 em lugar de n. Portanto, a 15 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 15 fórmula neste caso pode ser traduzida como a raiz quadrada dos desvios quadrados médios dividido por (n – 1) e é representada por S (TRIOLA, 1999). É definido desta forma a fim de mostrar uma medida da dispersão, que o desvio padrão: 1. Seja um número não negativo; 2. Tenha a mesma unidade de medida que os dados em questão, diferentemente da variância. Processo para determinar o desvio padrão amostral: 1) Achar a média dos valores [Me(x)]. 2) Subtrair a média de cada valor individual [Xi-Me(X)], sendo Xi cada dado em questão. 3) Elevar ao quadrado cada uma das diferenças obtidas. 4) Somar todos os quadrados obtidos. 5) Dividir a somatória obtida no passo 4 por n-1. 6) Extrair a raiz quadrada do resultado do passo 5. A tabela 1 mostra um exemplo da determinação do desvio padrão amostral. Tabela 1: Cálculo do desvio padrão da população representada por (- 4, -3, -2, 3, 5). Xi Me(X) [Xi-Me(X)] [Xi-Me(X)]2 - 4 - 0,2 - 3,8 14,44 - 3 - 0,2 - 2,8 7,84 - 2 - 0,2 - 1,8 3,24 3 - 0,2 3,2 10,24 5 - 0,2 5,2 27,04 ∑[Xi-Me(X)]2 62,8/4*= 15,7 σσσσ √15,7=3,96 *Se uma variável foi descrita por 5 observações, a estimativa da média será obtida a partir de 5 graus de liberdade. No entanto, a estimativa de seu desvio padrão será obtida a partir de 4 graus de liberdade (n-1), já que um grau de liberdade foi cobrado pela estimativa anterior daquela média, utilizada no cálculo do desvio. 16 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 16 O desvio padrão possui algumas propriedades, dentre as quais destacamos: 1ª = Somando-se (ou subtraindo-se) uma constante a todos os valores de uma variável, o desvio padrão não se altera. 2ª = Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado (ou dividido) por essa constante. REFERÊNCIAS BIBLIOGRÁFICAS GOMES, F.P. Introdução. In: GOMES, F.P. Curso de estatística experimental. Piracicaba: Universidade de São Paulo, Escola Superior de Agricultura Luiz de Queiroz, 2000. p.2-4. SAMPAIO, I.B.M. Estatísticas Descritivas Básicas. In: Estatística aplicada à experimentação animal. Belo Horizonte: Fundação de Ensino e Pesquisa em Medicina Veterinária e Zootecnia, 1998, p.16. TRIOLA, M.F. Descrição, Exploração e Comparação de Dados. In: TRIOLA, M.F. Introdução a estatística. Rio de Janeiro: LTC –Livros Técnicos e Científicos Editora S.A., 70edição, 1999, p.39-43. Coeficiente de Variação (CV) Rafael Murarolli O Coeficiente de Variação (CV) é uma medida de dispersão que se presta para a comparação de distribuições diferentes (WIKIPÉDIA, 2006). O CV permite comparações entre variáveis de naturezas distintas e fornece uma idéia de precisão dos dados (GARCIA, 1989). O CV constituiu-se numa estimativa do desvio do erro experimental em relação à média, sendo uma medida de avaliação da precisão experimental. Assim, considera-se que quanto menor for a sua estimativa, maior será a precisão do experimento e vice-versa (SILVA et al., 2002, citado por RIBEIRO et al, 2004). Pode ser considerado “baixo” quando inferiores a 10%, “médio” quando de 10 a 20%, “médio-alto” quando de 20 a 30% e, “alto” quando superior a 30%. O Valor de Referência é dado pela Média dos dados. O CV é igual ao desvio-padrão dividido pela média: CV= DP . 100 X Se a Média for baixa, o CV vai ser alto. 17 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 17 Ex: Tabela 1: Score corporal de vacas leiteiras A B C D 3 2 1 1 3 3 2 1 3 3 4 5 3 4 5 5 Média 3 3 3 3 Amp 0 2 4 4 S. Desvio 0 0 0 0 Média Desvio 0 0 0 0 ∑ Desvio2 0 2 10 16 ∑ Média Desvio2 0 0,5 5 4 Var 0 0,67 3,33 5,33 DP 0 0,82 1,82 2,30 CV 0% 27,3% 60,7% 77,0% Umas das vantagens do CV é que ele transforma o Desvio Padrão (DP) em uma escala relativa, podendo passar de 100. Outra vantagem do CV é ser um número abstrato, independente da unidade usada, ou seja, na análise de um experimento, seus dados poderão ser dados em kg/há, ou libras/acre, ou ton/parcela que o CV obtido será o mesmo, independentementeda unidade usada (GOMES, 1984). Ex: Tabela 2: Comparação do peso vivo de bezerros e vacas para a determinação da Média, Desvio Padrão (DP) e, Coeficiente de Variação (CV). Bezerro Vaca 25 -52 = 25 545 -52 = 25 30 02 = 0 550 02 = 0 35 +52 = 25 555 +52 = 25 Média 30 25 550 25 DP 5 5 CV 16,67% 0,90% Explicando o exemplo acima: - Existem 2 grupos de animais (BEZERROS com 25, 30 e 35 kg PV e, VACAS com 545, 550 e 555 kg PV); - Para se achar o quanto o valor se desvia da média faz-se a subtração do Peso do Animal – Peso Médio (25 – 30 = -5). Para que esse número não fique negativo, deve-se elevar este número ao quadrado (-52 = 25 → Desvio Quadrado); 18 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 18 - Após, faz-se a somatória destes desvios (25+0+25), divide-se esta somatória por n-1 (3-1 = 2) → 25+0+25/2 = 25 → Variância; - Para se achar o Desvio Padrão (DP), deve-se tirar a raiz quadrada da variância ( = 5),e; - Para calcular o Coeficiente de Variação, basta aplicar os valores na fórmula CV = DP . 100. X Não se pode julgar um trabalho somente pelo o Coeficiente de Variação. Irá depender muito da variável que está sendo estudada. Cada variável se comporta de maneira diferente, ou seja, enquanto dentro de um determinado grupo o CV é normalmente pequeno, em outro grupo este CV poderá ser discrepante. Exemplo: - para Ganho de Peso em Aves � CV = 2% - para Ganho de Peso em bovinos � CV = 20% pH rumimal � varia POUCO. N ruminal � varia MUITO. Coeficiente de variação: - 1º � cada variável é uma variável diferente (unidade experimental); - 2º � toda vez que 1 tratamento difere de outro tratamento, o CV aumenta,e; - 3º � se a Média do tratamento for muito baixa, é natural que o CV aumente. Se a Média = 0 � CV = infinito. Neste caso o CV não é a melhor Medida de Dispersão. As medidas de dispersão não fazem correção para o nº de animais utilizados no experimento. Então, se o nº de animais (Unidades Experimentais) for diferente do outro experimento, não se pode comparar estes desvios (só se compara dentro de um mesmo experimento). ↓ Muito cuidado em julgar os trabalhos somente pelo C.V. Referências Bibliográficas GARCIA, C, H. Tabelas para classificação do coeficiente de variação. IPEF – Instituto de Pesquisa e Estudos Florestais. Circular Técnica n. 171. Novembro de 1989. Piracicaba-SP. GOMES, F. P. A estatística moderna na pesquisa agropecuária, In: Associação Brasileira para Pesquisa da Potassa e do Fosfato. 1984. Piracicaba. p.: 160. Editora POTAFOS. RIBEIRO, N. D., CARGNELUTTI FILHO, A., HOFFMANN JUNIOR, L., POSSEBON, S. B. Precisão experimental na avaliação de cultivares de feijão de diferentes hábitos de crescimento. Ciência Rural. Santa Maria. vol.34, no.5 Setembro/Outubro. 2004. WIKIPÉDIA. Desenvolvido pela Wikimedia Foundation. Apresenta conteúdo enciclopédico. Disponível em: 19 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 19 <http://pt.wikipedia.org/w/index.php?title=Coeficiente_de_varia%C3%A7%C3%A3o&oldid =545196>. Acesso em: 31 Mai 2006 Erro Padrão da Média: Ricardo Cazes A Variância, o Desvio Padrão e o Coeficiente de Variação não fazem correção para o número de animais utilizados no experimento. Portanto, caso o n de um experimento for diferente de outro, não poderemos realizar comparações entre eles usando estas ferramentas, dado que elas permitem comparar somente os dados dentro do mesmo experimento. De forma a podermos comparar dados de diferentes experimentos que apresentem n diferentes, usa-se o Erro Padrão da Média ou EPM. O erro padrão da média envolve a média e o desvio padrão, segue a estrutura normal da curva de Gauss. Como exemplo, suponhamos um universo de 5 milhões de tartarugas onde queremos saber qual o peso médio das mesmas. Para isto é realizada uma captura para obtenção de uma amostra das mesmas e assim saber o peso médio desta amostra. Caso realizemos uma segunda ou terceira captura, obteremos diferentes pesos médios. Amostra 1 = 100 tartarugas (n=100) com peso médio de 10 Kg. Amostra 2 = 200 tartarugas (n=200) com peso médio de 12 Kg. Amostra 3 = 300 tartarugas (n=300) com peso médio de 11 Kg. Cada vez que capturarmos uma amostra de tartarugas, vamos obter diferentes pesos médios que, ao realizar uma média dos pesos médios de cada captura, resultará em uma aproximação mais fidedigna da média da população de 5 milhões de tartarugas. x = peso médio 1 + peso médio 2 + peso médio 3 3 x = 10 + 12+ 11 = 11 kg 3 Os estatísticos perceberam que para obter o desvio padrão de várias médias, não era necessário realizar diversas capturas. Este valor poderia ser estimado dividindo-se o desvio padrão de uma amostra pelo raiz quadrada do número de indivíduos de apenas uma captura ou amostragem. EPM = DP = (Desvio padrão de 1 amostra) √ n √ (número de animais capturados) 20 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 20 O EPM é uma medida de dispersão bastante usada para comparar a variabilidade de um experimento com a de outro, uma vez que faz correções para o número de unidades experimentais utilizadas entre experimentos. Como exemplo comparemos 2 experimentos diferentes: Isso é uma tabela? Experimento 1 Experimento 2 Desvio Padrão(DP) 70 50 N° de EU( n) 200 50 A primeira vista poderíamos considerar que o experimento 2 é melhor que o 1 pelo fato de apresentar um DP menor. Certamente seriamos precipitados ao realizar esta afirmação, porque o n de ambos experimentos é diferente. Ao aplicar a formula do EPM teremos o seguinte resultado: EPM 1= 70 = 4,95 EPM 2= 50 = 7,07 √200 √50 O experimento 1 é melhor porque apresenta um erro menor que o 2. é A medida do EPM é também usada para determinar o Intervalo de Confiança (IC), que é o intervalo aonde devem estar as medias (do peso das tartarugas por ex.) para ternos uma confiança que deveria ser igual o maior a 95%. A formula para obter o IC é a seguinte: IC = X ± Z . EPM ou IC = X ± Z . DP √ n MEDIDAS DE FORMA Rodrigo da Costa Gomes Assimetria (Skewness) Definição Assimetria pode ser definida como o grau de deformação de uma curva de freqüências ou o grau de afastamento que uma distribuição apresenta do seu eixo de simetria o qual é traçado no valor da média. As medidas de assimetria possibilitam analisar uma distribuição de acordo com as relações entre suas medidas de moda, média e mediana, quando observadas graficamente. 21 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 21 Uma distribuição é dita simétrica quando apresenta o mesmo valor para a moda (Mo), a média ( x ) e a mediana (Md), como exemplificado pela figura abaixo. Figura 1 – Representação gráfica de distribuição simétrica Sempre que a curva da distribuição se afastar do referido eixo, será considerado haver uma assimetria da distribuição. Em função disso, uma distribuição pode ser classificada como assimétricanegativa ou assimétrica positiva. Uma distribuição é considerada assimétrica negativa quando o valor da média é menor ou igual ao da mediana e este menor ou igual ao valor da moda. Neste caso, na representação gráfica desta distribuição, visualiza-se a formação de uma “cauda” ao lado esquerdo do centro da curva (Figura 2, c). Já para uma distribuição ser considerada assimétrica positiva, o valor da média é maior ou igual ao da mediana e este maior ou igual ao valor da moda. Neste caso, na representação gráfica desta distribuição, visualiza-se a formação de uma “cauda” ao lado direito do centro da curva (Figura 2, b). Figura 2 – Representação gráfica de distribuições assimétricas positiva e negativa. Cálculo do coeficiente de assimetria 22 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 22 Para o dado exemplo, onde são apresentados abaixo valores de produção leiteira: Tabela 1 – Média e desvios em função de valores empíricos de produção leiteira x (litros de leite) Desvios (x-x’) Quadrado dos desvios Cubo dos desvios 12 -15 -3 9 -27 15 -15 0 0 0 20 -15 5 25 125 13 -15 -2 4 -8 x’=15 ∑=60 ∑=90 Observa-se que, se ao invés de realizarmos a soma dos quadrados dos desvios, realizarmos a soma do cubo destes desvios há uma potencialização do erro, sendo que este ainda irá se apresentar de forma negativa ou positiva. Se a soma dos cubos for negativa, a curva da distribuição dos desvios tenderá á esquerda e se for positiva, tenderá à direita. Dessa forma, o coeficiente de assimetria pode ser calculado pela fórmula: N s XX S n I i∑ = − = 1 3 ˆ onde: S = coeficiente de assimetria; s = desvio padrão Xi = valor relacionado à observação i; x = média; N = número de observações. Se: S = 0, então a distribuição é simétrica, S < 0, então a distribuição é assimétrica negativa (inclinada para a esquerda) e, S > 0, então a distribuição é assimétrica positiva (inclinada para a direita). PRINCÍPIO DA CASUALIZAÇÃO Walesca Pastore “O princípio da Casualização rege que todas as unidades experimentais devem possuir a mesma chance de serem designadas a qualquer um dos tratamentos, bem como qualquer um dos tratamentos deve ter a mesma chance de receber qualquer uma das unidades experimentais” 23 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 23 O confundimento ocorre quando os efeitos de duas ou mais variáveis não podem distinguir-se uns dos outros, podendo ocorrer quando o principio da casualisação não é seguido. Quando a amostra total disponível para um ensaio é uniforme, ou seja, (condição que nem sempre é verdadeira), é imprescindível que cada animal seja direcionado a um tratamento por sorteio. Por exemplo, animais que se deixam capturar mais facilmente, se colocados em um mesmo grupo experimental, podem comprometer o experimento, resultando em confundimento. Neste caso, não será possível afirmar se as diferenças observadas são realmente devidas aos tratamentos ou ao temperamento deles (ou alguma patologia implícita). Exemplo: Para um exemplo hipotético contendo três tratamentos (A, B e C) e 12 coelhos. No momento da distribuição dos animais para cada um dos tratamentos, os coelhos que se deixam capturas mais facilmente podem, simplesmente ter um comportamento menos arredio ou podem estar apresentado apatia por alguma patologia que pode não estar facilmente visível e passar despercebida, fato que poderá resultar em confundimento. Para evitar possíveis confundimento deve-se distribuir os coelhos, por exemplo, da seguinte forma: 1º A 7º A 2º B 8º B 3º C 9º C 4º A 10º A 5º B 11º B 6º C 12º C Observa-se que ao capturar os coelhos, cada um vai para um tratamento seqüencialmente, evitando, dessa forma, que os coelhos mais lentos, caiam todos, no mesmo tratamento. Sendo assim, é importante eliminar o máximo possível o erro e distribuir o que não for possível eliminar. Por exemplo, quando os animais de experimento não são homogêneos deve-se dividi-los igualmente entre os tratamentos. Exemplo: Um grupo de 10 vacas e dois tratamentos (A e B). Caso entre as 10 vacas, 2 delas sejam muito mais leves que as demais (8), devemos distribuir cada uma das mais leves, uma no tratamento A e a outra no tratamento B. Portanto, em determinadas situações, não devemos confiar inteiramente na casualização, como por exemplo: em um experimento com vacas leiteiras, após a casualização das unidades experimentais, se a média de leite for muito diferente entre os tratamentos, casualiza-se novamente. Princípio do Controle Local 24 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 24 Willian Correa Miguel O Controle Local de um experimento tem como objetivo determinar onde ele será instalado. Este fato tem grande importância, pois pode-se detectar se as diferenças observadas entre os tratamentos são referentes aos mesmos e não a fatores do meio. Quando isto não é possível, isto é, quando não consegue-se explicar se as diferenças foram causadas pelos tratamentos ou por outros fatores, denomina-se como Confundimento Estatístico. Para impedir que este fato grave ocorra, o pesquisador deve-se atentar em alguns pontos: - Uniformidade dos animais. - Uniformidade dos tratamentos. - Uniformidade do meio. Uniformidade dos animais Deve-se sempre garantir uma boa homogeneidade entre os animais a serem inseridos no experimento, mas quando isto não é possível devido a diferenças entre os animais (por exemplo, pesos), o pesquisador deve agir de forma a minimizar o problema. O exemplo abaixo se refere a um conjunto de 8 coelhos que devem ser designados a 2 tratamentos (tratamentos A e B): Coelhos Peso (kg) Coelhos Peso (kg) Trat. A Trat. B 1 3,0 5 3,0 1A 5B 2 2,0 6 2,0 2A 6B 3 2,0 7 3,0 7A 8B 4 2,0 8 3,0 4A 3B Alocar os animais mais pesados em um só tratamento e deixar os mais leves no outro, seria uma forma errônea de distribuí-los. Uma ferramenta para superar este problema é o delineamento em blocos. Neste caso, distribuíram-se os animais em blocos, de forma que dois mais pesados (3,0 kg) caiam em um tratamento e os outros dois no outro tratamento; seguindo o mesmo método para os mais leves (2,0 kg). Assim, os coelhos 1, 2, 7 e 4 poderão ser designados ao Tratamento A e os coelhos 5, 6, 8 e 3 ao Tratamento B. A intenção é de eliminar os erros. 25 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 25 Uniformidade dos tratamentos Após alocar os animais corretamente, imagina-se que não ocorrerá mais nenhum problema para a execução do experimento. Porém, o pesquisador deve-se certificar que esses animais estarão recebendo as mesmas condições para que o tratamento em questão seja testado com êxito. Dentro deste ponto, têm-se três considerações a fazer: a) Igual acesso ao tratamento: ao planejar um experimento, deve-se garantir que todos os animais do experimento tenham a mesma possibilidade de acesso ao tratamento a eles aplicado. Por exemplo, quando se trata de um experimento cujos tratamentos envolvem a adição de algum medicamento na ração de leitões, deve-se garantir que todos os leitões do grupo consumirão tal medicamento. Dependendo da forma de administração deste medicamento, tem-se um maior controle, por exemplo, uma forma injetável. b) Administração da dose em função do PV: caso exista diferença de peso entre os animais,deve-se saber o quanto aplicar de um certo medicamento. É muito importante respeitar a quantidade dose/kg, por exemplo, um medicamento deve ser aplicado na proporção 3ml/kg; se aplicar 15 ml em um animal de 5 kg, não pode-se aplicar a mesma quantidade em um animal de 3 kg. A resposta pode variar de acordo com a proporção aplicada, interferindo na avaliação do tratamento testado. O pesquisador que deve decidir o critério de administração, sendo, portanto, de suma importância, a realização de uma revisão bibliográfica adequada. c) Administração de placebo no grupo controle: ao testar os efeito de uma nova droga, comumente o pesquisador se pergunta se deve ou não administrar um placebo ao grupo controle. Tal decisão deve levar em consideração os objetivos do experimento, ou seja, se tem como objetivo avaliar a resposta fisiológica da droga ou avaliar o aspecto econômico da sua utilização. Por exemplo, admiti-se um experimento que se proponha avaliar os efeitos da aplicação de Hormônio de Crescimento Porcino em suínos. Aplica-se uma solução salina (soro fisiológico sem hormônio) no grupo controle para que todos os animais sofram o mesmo estresse. Deste modo, o efeito do tratamento poderá ser avaliado em iguais condições, isto é, sem que o efeito estresse (ou ausência do mesmo) interfira no resultado. Se caso não fosse administrada a solução salina ao grupo controle e o mesmo apresentasse um ganho de peso superior aos tratamentos, não teríamos como certificar que tal efeito foi devido aos tratamentos serem ineficientes ou pelo simples fato dos animais que não sofreram o estresse da aplicação do soro tiveram um desempenho melhor, ocasionado pelo fato de seu bem estar não terem sido alterados. Uniformidade do meio Ao planejar um experimento é necessário garantir uma condição ambiental igual a todos os animais nos diferentes tratamentos do experimento. Utilizando o exemplo anterior dos coelhos, quando instalaram-se os animais em suas gaiolas, deve-se garantir uma iluminação igual a todos os coelhos, tanto os do tratamento A como os do tratamento B. Se a instalação proporciona maior iluminação na parte superior das gaiolas, não podem-se alocar os animais de um só tratamento naquela posição, pois favoreceria (ou não) este tratamento. Portanto, deve-se alocá-los de forma que todos recebam a mesma condição 26 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 26 ambiental, ou seja, dois animais de tratamentos diferentes recebam iguais condições de iluminação, sejam elas ótimas ou não. 1A 5B 6B 2A 7A 8B 3B 4A Desta forma todos os coelhos, um para cada tratamento, estão sob condições ambientais extremamente iguais, impossibilitando que qualquer fator externo possa influenciar, negativamente ou positivamente, a resposta dos animais aos seus respectivos tratamentos. Referências Bibliográficas SAMPAIO, I.B.M. Estatística aplicada à experimentação animal. Belo Horizonte: Fundação de Ensino e Pesquisa em Medicina Veterinária e Zootecnia, Premissas da análise estatística Para se utilizar os testes de estatística paramétrica, precisa-se, inicialmente, verificar se os dados respeitam alguns requisitos, que são eles: - modelo matemático aditivo; - independência dos erros; 27 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 27 - normalidade dos resíduos; - homogeneidade das variâncias. As duas primeiras premissas devem ser respeitadas antes mesmo de se iniciar o experimento, enquanto que as duas últimas são analisadas no momento da análise dos dados. Modelo matemático aditivo Esta premissa diz que toda resposta observada após um tratamento, sofre influência de uma média geral, do efeito de um determinado tratamento, do efeito de um possível bloco e de um erro não explicado. Yij = µ + Trat “i” + Bloco”j” + e “ij” Onde: Yij= observação do tratamento “i” e do bloco “j” µ = média geral Trat “i” = efeito do tratamento “i” Bloco “j” = efeito do bloco “j” e“ij” = erro não explicado Independência dos erros Ao se respeitar esta premissa afirma-se que não houve erro de casualização, ou seja, se o resultado obtido a partir de um experimento, indicar que há diferença entre tratamentos é porque realmente existe esta diferença. Caso esta premissa não seja respeitada, os dados não são confiáveis e, portanto, devem ser descartados. Normalidade dos resíduos Esta premissa diz respeito à distribuição normal das variáveis nas populações. Assim, os desvios, que são a diferença entre o valor absoluto de cada dado e a média de seu grupo, devem apresentar distribuição normal, ou seja, respeitar a curva normal de Gauss. O valor de cada dado deve ser subtraído da média de seu grupo e depois dividido pelo desvio padrão. Este valor poderá ser estudentizado ou não. Se o valor real for próximo do teórico pode-se afirmar que os dados estão próximos da curva Gaussiana. Vários testes são descritos para a identificação da normalidade. O SAS apresenta os testes de Shapiro-Wilk (ou teste W), o teste de Kolmogorov-Smirnov (teste D), Cramer-von Mises (teste W-Sq) e Anderson-Darling (teste A-Sq), sendo o primeiro, o mais utilizado, pois pode ser empregado para um n >2 e < 51. Sendo o valor de P maior que 0,05, aceita-se H0, ou seja, a curva é normal. Entretanto, sendo o valor de P inferior a 0,05 (5%), rejeita-se H0 e assume-se a hipótese alternativa de que os dados não são normais. A execução manual dos cálculos dos testes de normalidade é muito laboriosa, entretanto, os resultados são facilmente obtidos pelo programa SAS através do procedimento UNIVARIATE seguido pelo comando NORMAL. PROC UNIVARIATE NORMAL PLOT; VAR CONC; RUN; 28 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 28 Tests for Normality Test --Statistic--- -----p Value------ Shapiro-Wilk W 0.91212 Pr < W 0.2271 Kolmogorov-Smirnov D 0.178832 Pr > D >0.1500 Cramer-von Mises W-Sq 0.086678 Pr > W-Sq 0.1542 Anderson-Darling A-Sq 0.488221 Pr > A-Sq 0.1881 O comando PLOT é opcional e mostra os gráficos de mediana e quartis (“Box-Plot”), ramos e folhas (“Stem and Leaf”) e de normalidade. Para se executar os testes sobre os valores estudentizados, deve-se criar um banco de dados utilizando o procedimento GLM antes da realização do procedimento UNIVARIATE para os testes de normalidade. PROC GLM; CLASS TRAT; MODEL CONC = TRAT; OUTPUT OUT = DOIS RESIDUAL=RES STUDENT = STU; RUN; PROC UNIVARIATE NORMAL PLOT DATA = DOIS; HISTOGRAM STU/NORMAL; VAR STU; RUN; A função HISTOGRAM, após o procedimento UNIVARIATE fornece o histograma dos dados, que neste exemplo são dos dados estudentizados acompanhados da curva normal. A utilização de valores estudentizados favorece a identificação de valores extremos (“out liers”). Tests for Normality Test --Statistic--- -----p Value------ Shapiro-Wilk W 0.876278 Pr < W 0.0785 Kolmogorov-Smirnov D 0.220754 Pr > D 0.1026 Cramer-von Mises W-Sq 0.115348 Pr > W-Sq 0.0633 Anderson-Darling A-Sq 0.66238 Pr > A-Sq 0.0656 Extreme Observations ------Lowest------ ------Highest-----Value Obs Value Obs -1.303795 9 0.133678 8 -0.892344 2 0.930538 6 -0.793388 11 0.987829 12 -0.746514 4 1.638858 5 -0.699640 7 1.675316 10 The SAS System The UNIVARIATE Procedure Variable: STU Stem Leaf # Boxplot 1 67 2 | 1 0 1 +-----+ 0 9 1 | | 0 1 1 | + | -0 3 1 | | -0 98776 5 *-----* -1 3 1 | ----+----+----+----+ Normal Probability Plot 1.75+ * +*+++ | +++++ | *++*+ 29 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 29 0.25+ +++*+ | ++++ * | * +*++* * * -1.25+ * +++++ +----+----+----+----+----+----+----+----+----+----+ -2 -1 0 +1 +2 -1. 6 -0. 8 0 0. 8 1. 6 0 5 10 15 20 25 30 35 40 45 P e r c e n t STU Homogeneidade das variâncias A análise de variância só pode ser realizada se a variância de um determinado tratamento A não for muito diferente da variância de um tratamento B. O teste da homogeneidade das variâncias é realizado pelo cálculo do valor de F, que é obtido dividindo-se o valor da maior variância pelo valor da menor variância. F calculado = Maior variância / Menor variância O F calculado deve ser comparado com o valor de referência na tabela de distribuição F a 5%, sendo que, para que as variâncias sejam consideradas homogêneas o valor calculado deve ser inferior ao tabelado. Entretanto, quando tem-se mais de 10 graus de liberdade utiliza- se o valor 4 como referência. As variâncias podem ser facilmente obtidas utilizando o procedimento MEANS do SAS, com o comando VAR. PROC MEANS MEAN VAR CV; CLASS TRAT; VAR DEFMA; RUN; The SAS System 7 The MEANS Procedure Analysis Variable : DEFMA N Coeff of TRAT Obs Mean Variance Variation ------------------------------------------------------------------- 1 6 6.7500000 10.7750000 48.6300669 2 6 17.0666667 180.7266667 78.7702843 Neste exemplo, para verificar se as variâncias são homogêneas, divide-se a variância de maior valor pela variância de menor valor. Então 30 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 30 180,73/10,78 = 16,77. Como esta relação é maior que o valor tabelado (5,05) elas não são homogêneas. Outra forma de analisar a homogeneidade das variâncias é através do TTEST. Ele dá o resultado direto, mas ele só pode ser utilizado em uma condição específica: quando existirem apenas dois tratamentos e for um experimento inteiramente casualizado. PROC TTEST; CLASS TRAT; VAR DEFMA; RUN; Equality of Variances Variable Method Num DF Den DF F Value Pr > F DEFMA Folded F 5 5 16.77 0.0077 O Num DF indica os graus de liberdade do numerador e o Den DF indica os graus de liberdade do denominador. O valor de F é a relação entre a variância maior e a variância menor. O valor de p indica a probabilidade de elas serem homogêneas. Este valor deve ser maior que 5% para elas serem homogêneas, então neste exemplo, elas não são homogêneas. E quando as premissas não forem respeitadas? Quando as premissas não são respeitadas, não podemos efetuar imediatamente a análise estatística. Primeiramente, devem-se excluir valores extremos (“out liers”) e/ou realizar a transformação dos dados para valores em base logarítmica, para raiz quadrada, valor inverso ou arco seno. Logarítmica: LOG (x+1) Raiz Quadrada: RQ (x + ½) Inversa: 1/x Arco seno: ARC SEN [(x/100)1/2] Após a transformação dos dados, as premissas devem ser verificadas novamente, e, se respeitadas, prossegue-se com a análise de variância. Contudo, se mesmo após a retirada de “out liers” e a transformação dos dados, as premissas não forem acatadas, segue-se com a estatística não-paramétrica. Delineamentos Experimentais Alessandra Soares Ricardo Leandro Cazes Para o delineamento experimental não importa como e quanto são os tratamentos; o que importa é como se faz para designar a unidade experimental para cada tratamento. Existem 3 tipos básicos de delineamentos: a) Delineamento inteiramente casualizado; b) Delineamento em blocos ao acaso e c) Delineamentos em reversão. 31 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 31 O propósito da casualização é evitar a tendenciosidade que possa decorrer do confundimento. Este, decorrente das condições experimentais com características estranhas. Assim, a casualização cumpre 2 propósitos: a) evitar a manifestação de características estranhas que possa implicar em confundimento tendencioso dos efeitos de condições experimentais sobre características respostas e b) propiciar estimativas não tendenciosas de erro experimental, apropriadas para as inferências derivadas das amostras. A casualização deve ser tão ampla quanto possível, abrangendo todas as características estranhas não controladas, como aquelas relacionadas ao ambiente, que está fora do controle do pesquisador. Devemos evitar o arranjo sistemático ou regular, como exemplo, a repetição de alguns tratamentos sempre na mesma ordem. Se isto acontecer, podemos anular o sorteio e casualizar novamente. Delineamento Completamente Casualizados No Delineamento completamente casualizado que é considerado um dos mais simples de todos, os tratamentos se distribuem ao acaso em todas as unidades experimentais (UE) e o número de repetições ou parcelas por tratamento pode ser igual ou diferentes as UE. Porém há necessidade de uniformidade das UE e que todas sejam facilmente identificadas para receber o tratamento. Os tratamentos são atribuídos á essas unidades experimentais completamente ao acaso, ou seja, sem qualquer restrição, e o tratamento é a única variação a ser estudada. O delineamento inteiramente casualizado apresentam certas vantagens importantes em relação a experimentos de delineamentos mais complexos, tais como: - Qualquer numero de repetições ou de tratamentos pode ser usado e o numero de repetições pode variar de um tratamento para outro sem que isto dificultea análise. - Proporciona o máximo número de graus de liberdade ao resíduo. - A morte de animais ou outras causas que levam à perda de parcelas, podem reduzir o número de repetições de alguns tratamentos, porém nenhuma dificuldade trará no caso de termos um experimento inteiramente casualizado. A desvantagem desse delineamento é que ele é mais apropriado para um pequeno número de tratamentos e para um material experimental homogêneo, e como a aleatorização não é restrita ao erro experimental, há uma estimativa muita alta de variância residual. Exemplo 1: Nesse delineamento pressupõe-se que as unidades são homogêneas ou não precisam ser agrupadas. Os tratamentos são sorteados para as diferentes unidades experimentais. 32 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 32 Num experimento como este a formação de grupos mais homogêneos implica em uma diminuição do grau de liberdade do residuo e conseqüentemente redução do valor de F, podendo mascarar as diferenças entre os tratamentos que existam de fato. - Delineamento experimental completamente casualizado para 5 tratamentos (T1, T2, T3, T4 e T5) com 4 repetições de cada tratamento. Exemplo 2: Consideremos um experimento para determinar o efeito na dieta de pintinhos de um dia com farelo de soja tratado enzimaticamente com α- galactocidase, onde o objetivo é conhecer os diferentes valores energéticos, ganho de peso e quantidade de água das fezes. Os pintinhos foram tratados com 3 dietas: T1- Dieta com farelo de soja não tratado. T2- Dieta com farelo de soja tratada com água. T3- Dieta com farelo de soja tratado com α-galactocidase. Para cada tratamento foram escolhidos ao acaso boxes com cinco pintinhos cada, totalizando 6 boxes por tratamento. A unidade experimental neste caso é considerada o Boxe. Tabela 1. Analise de Variância: Coeficiente de Variação Grau de Liberdade Tratamento 2 Resíduo 15 Total 17 Em resumo o delineamento inteiramente casualizado é considerado o mais útil onde não existe nenhuma fonte de variação identificável entre as unidades experimentais, exceto as dos efeitos dos tratamentos. É o mais flexível com respeito ao arranjo físico das unidades experimentais. Ele maximiza os graus de liberdade para a estimação da variância por UE (erro experimental ou erro residual), e maximiza o valor de F. BLOCOS AO ACASO Rodrigo Ribeiro Quando agrupamos tratamentos em conjuntos chamados blocos, com duas repetições, por exemplo, devemos ter dois blocos, cada um com todos os tratamentos. Sendo o primeiro com os tratamentos A, B, C e D, e o segundo bloco também, para casualizarmos sorteamos os tratamentos no caso A, B, C e D, casualização T3 T5 T2 T3 T4 T4 T2 T1 T5 T1 T3 T3 T4 T5 T2 T1 T5 T1 T2 T4 T1, T2, T3, T4 e T5 33 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 33 fazemos o sorteio e obtemos o primeiro bloco, repetindo esse processo obtendo o segundo bloco, por exemplo. 1º Bloco – CBAD 2º Bloco – ACDB. Sempre devemos ter todos os tratamentos em cada bloco em condições uniformes de um bloco para outro, e nos casos dos animais, cada bloco deve conter indivíduos de constituição genética, peso, idades, etc.; bem semelhantes. Por exemplo, num ensaio com leitões em cada bloco devemos ter animais do mesmo sexo, leitegada e pesos semelhantes; de um bloco para outro variarão os pesos e as leitegadas e até sexo, se for o caso. Nos ensaios de laboratórios as amostras de cada bloco devem ser analisadas simultaneamente, no mesmo dia e pelo mesmo analista (GOMES, 1984). Segundo esse exemplo dado em aula, separando os animais por peso aproximado: Tabela 1: Blocos ao acaso por diferença de peso. Peso/Bloco I II III 500 kg 430 kg 390 kg 498 kg 428 kg 380 kg 457 kg 410 kg 375 kg Se o animal de 500 kg cair no tratamento A, então os animais 498 e 457 kg também devem cair no tratamento A, mantendo a uniformidade do bloco. Podemos criar blocos para tentarmos separar características que achamos relevante para o experimento. Mas se a característica que for escolhida para ser separada em blocos não for significativa, só irá perder os graus de liberdade, diminuindo assim a qualidade de seu tratamento. Em casos em que a amostra planejada não pode ser obtida imediatamente no início do ensaio, este pode ser conduzido em blocos temporais seqüenciais, desde que os períodos seqüenciais não tenham diferenças dramáticas (de clima, por exemplo). Se para um ensaio com vinte cabritos e quatro tratamentos, recebêssemos apenas dez em uma primeira leva e doze animais uma semana depois, poderíamos iniciar com dois animais por tratamento no primeiro período (usaríamos então oito dos dez disponíveis, dois para cada tratamento) e na segunda semana entraríamos com os doze (três animais por tratamento). Assim, estaríamos balanceando um fator de variação que seria tempo ( SAMPAIO, 2005). Outro exemplo que utilizamos no dia 04/04, supondo que ele é em blocos, para calcularmos seus graus de liberdade: Tabela 2: Blocos ao caso por tratamento. Blocos Trat A Trat B Trat C Trat D A 35 40 39 27 34 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 34 B 19 35 27 12 C 31 46 20 13 D 15 41 29 28 E 30 33 45 3 Soma 130 195 160 110 Média 26 39 32 22 Tabela 3: Cálculo dos graus de liberdade do experimento de blocos ao acaso. Causas G.L. Tratamento 4 – 1 = 3 Bloco 5 -1 = 4 Erro 12 TOTAL 20 – 1 = 19 Se a formação de blocos for eficiente, uma parte da variabilidade do resíduo foi para o bloco, mas se foi utilizado uma variabilidade fraca, perdemos Graus de liberdade. Fontes de variação podem ser blocadas desde que não exista possibilidade de os tratamentos testados interagirem com o efeito de blocos, sendo assim, o comportamento dos tratamentos entre si independa do bloco onde estiverem localizados. Não se deve formar blocos após o começo do experimento. Exemplos de efeitos que possam ser blocados em ensaios de animais: A) Efeito temporal: no caso de não haver um número considerável de animais e com a precisão de nascimento e de desmama, podendo obter cada terço da amostra total necessária em três diferentes ocasiões, não podendo ser muito espaçadas no tempo para não abranger diferentes condições climáticas, neste caso a ordem de netrada seria designada como blocos, todos os tratamentos estão presentes em cada bloco. B) Efeito local: se caso não há infraestrutura única necessária para abrigar todos os animais, sendo necessário a utilização de galpões visinhos com condições de meio diferentes (aeração, temperatura, sombreamento, etc); cada galpão será considerado um bloco e deverá conter todos os tratamentos. C) Efeito de sexo: só quando totalmente conhecido o efeito de sexo pode ser blocado, como é o caso em suínos. Se a amostragem for desuniforme em sexo, este efeito pode ser blocado desde que exista a informação que sexo e os tratamentos estudados interagem, sexo será considerado um fator, tratamento outro e a interação sexo X tratamento terá que ser estudada. 35 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 35 D) Efeito de animal: quando a resposta medida for de fluxo continuado ou permitir a separação de alíquotas (ejaculado de um jumento por exemplo), todos os tratamentos (diluentes) podem ser testados no mesmo ejaculado, que por sua vez poderá diferir daquele obtido em outro animal, como cada ejaculado será testado em todos os tratamentos e as características do sêmen variam de animal paraanimal, existiram duas fontes de variação: a devida elos diluentes e a devida aos jumentos, que será blocada ( SAMPAIO, 1943). REFERÊNCIAS BIBLIOGRÁFICAS: GOMES, F. P. A estatística moderna na pesquisa agropecuária, Piracicaba, POTAFOS, 1984. pag 35 - 37. SAMPAIO, I. B. M. estatística aplicada à experimentação animal, Belo Horizonte: Fundação de ensino e pesquisa em Medicina Veterinária, 1998. pág 50 – 59. SAMPAIO, I. B. M.DELINEAMENTO ESTATÍSTICO EM PESQUISA COM SERES HUMANOS E ANIMAIS. UFMG. http://www.ufmg.br/bioetica/trabalhos 2005, acessado, 15/05/2006. Experimentos em Delineamentos Alternados. Amaury Vanilote Os delineamentos alternados são utilizados quando se tem poucos indivíduos para formar as unidades experimentais. Por exemplo, quando os animais necessários para efetuar o ensaio são caros e de alto custo de manutenção, assim como “animais fistulados”, ou, no caso de estudos agronômicos, quando se tem uma área limitada para realizar o experimento e esta área não é homogênea. Esse tipo de delineamento tem divisão esquemática em linhas e colunas (Figura 1). A B C C A B B C A 1 2 3 I II III Colunas Linhas 36 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 36 Figura 1 – Representação esquemática de experimento alternado com três colunas (1, 2 e 3) e três linhas (I, II e III), e com distribuição dos tratamentos A, B e C para cada unidade experimental. Em experimentação agrícola, as linhas e colunas podem representar o local espacial onde uma unidade experimental está alocada. Em experimentos com animais, cada coluna pode representar um animal e cada linha um período experimental. As unidades experimentais são representadas por cada quadrado, representado pela combinação de linha/coluna. Por exemplo, o primeiro quadrado alojado na coluna 1 e linha I é uma unidade experimental, assim como o quadrado na coluna 2 e linha I, e assim por diante até o quadrado na coluna 3 e linha III do exemplo acima. Quando da condução de experimento com animais com esse tipo de delineamento, as avaliações devem ser passíveis de serem realizadas mais de uma vez no mesmo animal, ou seja, as variáveis respostas devem ser de fluxo contínuo, pelo fato de que os animais serão utilizados várias vezes para colheita de dados. Pode-se colher sangue de um mesmo animal por várias vezes durante sua vida, mas não há como realizar a aferição do peso do seu fígado mais de uma vez. Quando as linhas representarem períodos experimentais, estes devem ser relativamente curtos, principalmente quando o tempo cronológico afetar a(s) variável(is) resposta (Ex.: produção de leite, ovos, etc.). Cross-Over O Cross-Over é um delineamento alternado em seqüência balanceada. Nesse tipo de delineamento alternado, normalmente utilizam-se dois tratamentos e duas linhas (Ex.: períodos). A metade das colunas numa mesma linha deve receber um tratamento, enquanto a outra metade deve receber o outro tratamento (Figura 2). Recomenda-se que o número de colunas seja par para manter o balanceamento. Na segunda linha devem-se inverter os tratamentos, ou seja, as colunas que receberam o tratamento “A” devem receber o “B” e vice-versa. Figura 2 – Representação esquemática de experimento alternado Cross-Over, com oito colunas (1, 2, 3, 4, 5, 6, 7 e 8) e duas linhas (I e II), e com distribuição de dois tratamentos (A e B). Observar que as colunas que recebiam um tipo de tratamento numa linha receberam o outro tratamento na outra linha. A A A 1 2 3 I II Colunas B B A B B 4 5 6 7 8 B B B B A A A A Linhas 37 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 37 No delineamento Cross-Over podem existir três causa de variação: o tratamento, as colunas e as linhas. O efeito de coluna fica a critério do pesquisador de ser adicionada ou não ao modelo. Geralmente, quando as colunas são homogêneas (por exemplo animais com mesmos peso, sexo, raça, estágio de produção, idade, manejo, baias semelhantes) e a diferença entre as mesmas é mínima, o pesquisador pode retirar o efeito de coluna, caso ache interessante. Os cálculos dos graus de liberdade estão representados nos quadros 1 e 2. Quadro 1 – Cálculo dos graus de liberdade de experimento com delineamento Cross-Over utilizando efeito de coluna. C.V. G.L. Exemplo 1** Tratamento (no de tratamentos - 1) (2-1) = 1 Coluna* (no de colunas - 1) (8-1) = 7 Linha (no de linhas - 1) (2-1) = 1 Erro (GLTotal – GLTrat. - GL Coluna - GL Linhas) (15 - 1 - 7 -1) = 6 TOTAL (no de unidades experimentais - 1) (16-1) = 15 * O efeito de coluna é utilizado a critério do pesquisador. ** Exemplo utilizando efeito de coluna. 38 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 38 Quadro 2 – Cálculo dos graus de liberdade de experimento com delineamento Cross-Over sem utilizar efeito de coluna. C.V. G.L. Exemplo 2** Tratamento (no de tratamentos - 1) (2-1) = 1 Coluna* (no de colunas - 1) Linha (no de linhas - 1) (2-1) = 1 Erro (GLTotal – GLTrat. - GL Coluna - GL Linhas) (15 - 1 -1) = 13 TOTAL (no de unidades experimentais - 1) (16-1) = 15 * O efeito de coluna é utilizado a critério do pesquisador. **Exemplo não utilizando efeito de coluna. Quando se coloca o efeito de coluna no modelo, há uma redução dos graus de liberdade do resíduo, já que está se introduzindo uma variação a mais no modelo. A retirada do efeito de coluna aumenta os graus de liberdade do resíduo, o que conseqüentemente pode reduzir o quadrado médio do resíduo (QM = SM / GL). Essa redução gera aumento no valor do F calculado (Fcalc.=QM trat / QM res) e quanto maior esse valor, melhor será a análise de variância pois o Fcalc vai se deslocar para direita na curva de Gauss melhorando a precisão da análise. Essa retirada do efeito de coluna deve ser realizada com ponderação a fim de não piorar (aumentar) a variabilidade entre as parcelas experimentais, (aumento da Soma de Quadrados do resíduo), pois caso haja efeito de coluna e retiramos esse efeito do modelo, a variação vai para a SQres aumentando o valor do Fcalc. O modelo estatístico experimental pode ser representado da seguinte maneira: eijkLkCjTi ++++=Υ µ Onde: Y – observação do tratamento i na coluna j e linha k; µ – média geral; Ti – efeito do tratamento i; Cj – efeito da coluna j; Lk – efeito da linha k; eijk – erro não explicado. 39 Planejamento e Análises Estatísticas de Experimentos em Produção Animal. Página 39 Switch-Back O Switch Back é um delineamento alternado em reversão simples. Esse é um delineamento semelhante ao Cross-Over, sendo normalmente utilizado para dois tratamentos, porém com uma linha a mais (Ex.: 2 tratamentos e 3 períodos). Da mesma forma que o Cross-Over, no Switch-Back a metade das colunas numa mesma linha deve receber um tratamento, enquanto a outra metade deve receber o outro tratamento (Figura 3). Recomenda-se que o número de colunas seja par para manter o balanceamento. Na segunda linha devem-se inverter os tratamentos, ou seja, as colunas que receberam o tratamento “A” devem receber o “B” e vice-versa, e na terceira linha a distribuição de tratamentos por colunas será igual à realizada na primeira linha, desta forma a coluna (ex.: animal) é controle dela mesma. Figura 3 – Representação esquemática de experimento alternado Switch-Back, com oito colunas (1, 2, 3, 4, 5, 6, 7 e 8) e três linhas (I, II e III), e com distribuição de dois tratamentos (A e B). Observar que as colunas que recebiam um tipo de tratamento na primeira linha receberam o outro tratamento na segunda linha
Compartilhar