Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Planejamento de Experimentos em Engenharia Ambiental 1. INTRODUÇÃO AO CURSO A Estatística Experimental tem como objetivo o estudo dos experimentos, isto é, seu planejamento, execução, análise dos dados e interpretação dos resultados obtidos. Para que um experimentador conduza e avalie uma pesquisa corretamente, é essencial um certo conhecimento de estatística, principalmente no que se refere às potencialidades e às limitações das técnicas utilizadas. Assim sendo, o presente curso visa apresentar aos alunos os métodos estatísticos mais usados em Engenharia Ambiental. Todos os métodos apresentados serão descritos detalhadamente, com um mínimo de teoria, porém com exemplos aplicativos na Engenharia Ambiental. 1.1. ALGUNS CONCEITOS BÁSICOS 1.1.1. POPULAÇÃO E AMOSTRA Boa parte do conhecimento humano se baseia em um número relativamente reduzido de informações. Isto é verdadeiro, tanto no que se refere aos problemas do cotidiano, como no que se refere à pesquisa cientifica. Por definição, POPULAÇÃO é o conjunto de elementos que têm, em comum, uma determinada característica. Todo subconjunto não vazio e com menor número de elementos do que o conjunto definido com POPULAÇÃO constitui, por definição, uma AMOSTRA desta população. Uma população em Ecologia, é o número total de indivíduos de uma determinada espécie em uma área definida. Por exemplo, o número total de árvores da espécie Caesalpinia echinata Lam (Pau Brasil) presentes em uma Área de Preservação Permanente constitui uma população. Esta população, embora finita, é considerada para fins de amostragens como uma população infinita. Uma vez definida a unidade amostral (1 árvore, um conjunto de 5 árvores, ou um quadrado no qual será contado o número de espécies de Pau-Brasil), a população pode ser considerada como um conjunto de unidades amostrais e um subconjunto tomado aleatoriamente deste conjunto é chamado de AMOSTRA ALEATÓRIA DE TAMANHO N. 2 Planejamento de Experimentos em Engenharia Ambiental Assim sendo, as observações são obtidas através de contagens do número de indivíduos em cada unidade amostral. Estas observações são chamadas de VARIÁVEL EM ESTUDO. 1.1.2. EXPERIMENTO OU ENSAIO Experimento é um trabalho previamente planejado, que segue determinados princípios básicos e no qual se faz a comparação dos efeitos dos tratamentos. Ensaio consiste na exposição das ideias e pontos de vista do autor sobre determinado tema, buscando originalidade no enfoque, sem, contudo, explorar o tema de forma conclusiva. 1.1.3. TRATAMENTO É o método, elemento ou material, cujo efeito se deseja medir ou comparar em um experimento. Por exemplo, um tratamento pode ser: Uma variedade de mudas para recuperar uma área degradada, um tipo de enzima para tratamento de efluentes, um fungo que degrada plástico, compostagem de lixo orgânico, etc. 1.1.4 UNIDADE EXPERIMENTAL OU PARCELA É a unidade na qual o tratamento é aplicado. É na parcela que obtemos os dados que deverão refletir o efeito de cada tratamento ensaiado. A parcela pode ser constituída por uma planta, uma área com um grupo de plantas, uma placa de Petri com um meio de cultura, um animal, um lote de animais, etc. 1.1.5. DELINEAMENTO EXPERIMENTAL É o plano utilizado na experimentação, e implica na forma como os tratamentos deverão ser distribuídos nas unidades experimentais e como serão analisados os dados a serem obtidos. Como exemplo, temos o delineamento inteiramente casualizado, o delineamento em blocos casualizados, o delineamento em quadrado latino, o delineamento em parcelas subdivididas, etc. 3 Planejamento de Experimentos em Engenharia Ambiental 1.2. MEDIDAS DE POSIÇÃO E DE DISPERSÃO As populações são descritas por certas características chamadas de Parâmetros. As amostras são descritas pelas mesmas características, que, neste caso, são chamadas de Estimativas de Parâmetros. Alguns destes parâmetros são chamados de Medidas de Posição e outros de Medidas de Dispersão. 1.2.1. MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL Uma característica comum a todas as populações ou amostras é a variabilidade dos indivíduos que a constituem. Geralmente, os dados de uma população ou amostra tendem a ser mais númerosos em torno de um valor central e vão se tornando mais raros à medida que nos afastamos desse valor. A medida de posição representa o valor em torno do qual os dados observados tendem a se agrupar. Como medidas de posição, podemos citar as seguintes: Média, Mediana, Moda, Quartil, Decil, Percentil, etc. Destas, as que mais nos interessam são a média, a mediana e a moda, que discutiremos em seguida. 1.2.1.1. MÉDIA A média é a mais importante das medidas de posição. Existem vários tipos de média, dentre as quais podemos citar: -MÉDIA ARITMÉTICA SIMPLES -MÉDIA ARITMÉTICA PONDERADA -MÉDIA GEOMÉTRICA -MÉDIA HARMÔNICA 1.2.1.1.1. MÉDIA ARITMÉTICA SIMPLES 4 Planejamento de Experimentos em Engenharia Ambiental Do ponto de vista estatístico, é a mais utilizada das medidas de posição. A média aritmética simples, ou simplesmente média aritmética de uma amostra aleatória de tamanho n, dita x₁, x₂,..., xn, é representada por �̂� ou �̅� e é dada por: �̂� = �̅� = ∑ 𝑥ᵢ𝑛𝑖=1 𝑛 = 𝑥1 + 𝑥2 +⋯+ 𝑥𝑛 𝑛 Devemos distinguir, neste caso, a média verdadeira, que é obtida quando tomamos todos os dados de uma população, e a média estimada, que é aquela obtida a partir de uma amostra. Assim, a média verdadeira será: 𝑚 = �̅� = ∑ 𝑥ᵢ𝑁𝑖=1 𝑁 , Onde N representa o número de dados da população. EXEMPLO 1: Cálculo da média aritmética Considere como exemplo os dados abaixo, referentes ao nº de formigas Atta laevigata encontradas em unidades amostrais de 500 cm² (0,05 m²) em um reflorestamento. 14, 15, 12, 7, 8, 14, 11, 14, 10, 9, 10 A média desta amostra será: �̂� = �̅� = ∑ 𝑥ᵢ𝑛𝑖=1 𝑛 = 14+15+12+7+8+14+11+14+10+9+10 11 = 124 11 = 11,2727. Então, o número médio de formigas em 500 cm² é 11,2727. 1.2.1.1.2. MÉDIA ARITMÉTICA PONDERADA Embora a média aritmética simples seja a mais usual, em certas situações ela não é a mais recomendada. Suponhamos o seguinte exemplo: A intensidade média de infestação de ervas daninhas na recuperação de uma determinada mata ciliar, assim como o número de parcelas infestadas de cada variedade são apresentados a seguir: 5 Planejamento de Experimentos em Engenharia Ambiental VARIEDADE Nº DE PARCELAS % DE INFESTAÇÃO Borreria alata DC 12 9,10 Commelina benghalensis L. 40 14,57 Senecio brasiliensis Less. 4 3,20 Solanum paniculatum L 2 2,89 Rhynchospora corymbosa (L.) Britt. 6 8,74 Rychardia scabra L 18 11,70 Brachiaria decumbens Stapf 21 10,10 Melinis minutiflora Beauv. 10 7,15 Se considerarmos simplesmente a média de infestação por variedade, sem levar em conta o número de parcelas, a infestação média de ervas daninhas na mata ciliar será: �̂� = 9,10 + 14,57 + 3,20 + ⋯+ 7,15 8 = 8,43%. Observamos, entretanto, que este dado é muito irreal, em decorrência da grande variação no número de parcelas infestadas por variedade. Neste caso, obtemos uma informação mais real, usando a média aritmética ponderada, tomando como peso, em cada variedade, o número de parcelas. Assim, teremos: �̂�𝑝 = 12(9,10) + 40(14,57) + ⋯+ 10(7,15) 12 + 40 +⋯+ 10 = 11,12%.Então, a média aritmética ponderada pode ser definida como: �̂�𝑝 = ∑ 𝑝ᵢ𝑥ᵢ𝑛𝑖=1 ∑ 𝑝ᵢ𝑛𝑖=1 , Onde, pᵢ é o peso de cada observação no cálculo da média. 1.2.1.1.3. MÉDIA GEOMÉTRICA Em casos bem mais raros, utilizamos a média geométrica, que consiste em determinar a raiz enésima do produto dos n dados considerados, isto é: �̂�𝑔 = √𝑥1. 𝑥2… . 𝑥𝑛 𝑛 , (xᵢ>0). 6 Planejamento de Experimentos em Engenharia Ambiental Se tivermos, por exemplo os dados: 2, 4, 8, 16, 32, a média geométrica será: �̂�𝑔 = √2.4.8.16.32 5 = √32,768 5 = 8,0 ao passo que a média aritmética seria: �̂� = 2 + 4 + 8 + 16 + 32 5 = 62 5 = 12,4 1.2.1.1.4. MÉDIA HARMÔNICA Dados x₁, x₂,..., 𝑥𝑛, todos diferentes de zero, definimos a média harmônica como: �̂�ℎ = 1 1 𝑛 [ 1 𝑥1 + 1 𝑥2 +⋯+ 1 𝑥𝑛 ] = 1 1 𝑛 ∑ 1 𝑥𝑖 𝑛 𝑖=1 . Admitindo-se os dados: 2, 4, 8, 16, 32, temos: �̂�ℎ = 1 1 5 [ 1 2 + 1 4 + 1 8 + 1 16 + 1 32] = 1 1 5 [0,96875] �̂�ℎ = 1 0,19375 = 5,1613 Note que, �̂�ℎ ≤ �̂�𝑔 ≤ �̂�. 1.2.1.2. MEDIANA A mediana de um conjunto ordenado de dados é o valor que ocupa a posição central (nem sempre pertencente ao conjunto de dados), isto é, é precedido e seguido pelo mesmo número de dados. Sejam as observações: 𝑥1, 𝑥2, … , 𝑥𝑛, já devidamente ordenadas. Se n é par e n= 2k, a mediana será a média dos dois valores centrais, isto é: 𝑚𝑑 = 𝑥𝑘 + 𝑥𝑘+1 2 . 7 Planejamento de Experimentos em Engenharia Ambiental Assim, se por exemplo, n=10, a mediana será: 𝑚𝑑 = 𝑥5 + 𝑥6 2 . Quando n é ímpar, e n=2k+1, a mediana será: 𝑚𝑑 = 𝑥𝑘+1. Se, por exemplo, n=11, temos: 𝑚𝑑 = 𝑥6. No exemplo 1, citada para o cálculo da média, temos: 7, 8, 9, 10, 10, 11, 12, 14, 14, 14, 15, a mediana será: }𝑘=5 𝑛=11 ⇒ 𝑚𝑑 = 𝑥𝑘+1 = 𝑥6 = 11. 1.2.1.3. MODA A moda é, por definição, o valor que ocorre com maior frequência na amostra. Então, podemos ter distribuições com mais do que uma moda (PLURIMODAL). No exemplo 1, temos que a moda é: 𝑀𝑜=14, que ocorre com frequência 3. Numa amostra de dados igualmente repetidos, podemos calcular a moda pela fórmula de PEARSON: Moda = Média - 3(Média - Mediana). No exemplo 1, obtivemos: �̂� = 11,2727 𝑒 �̂�𝑑 = 11. Então, pela fórmula de PEARSON, obteríamos: Moda = 11,2727 - 3(11,2727 - 11) = 10,4546. 8 Planejamento de Experimentos em Engenharia Ambiental 1.2.2. MEDIDAS DE DISPERSÃO As medidas de dispersão são também chamadas de medidas de variação, e medem o grau com que os dados tendem a se distribuir em torno de um valor central, que geralmente é a média aritmética. Dentre as medidas de dispersão, discutiremos a Amplitude total, a Variância, o Desvio padrão, o Erro padrão da média e o Coeficiente de variação. 1.2.2.1. AMPLITUDE TOTAL A amplitude total é a medida não muito informativa, pois leva em conta apenas os dados extremos numa amostra. Admitamos as seguintes amostras, todas com média �̂� = 9,0: (1) (2) (3) 9,0 7,0 0,6 9,0 8,0 3,4 9,0 9,0 9,8 9,0 10,0 13,8 9,0 11,0 17,4 A média �̂� = 9,0 não nos dá, por si só, uma completa informação a respeito do comportamento dos dados. Entretanto, se tomarmos a diferença entre o maior e o menor deles, isto é, a Amplitude total, teremos, respectivamente: A₁ = 9,0 – 9,0 = 0,0 A₂ = 11,0 – 7,0 = 4,0 A₃ = 17,4 – 0,6 = 16,8 De imediato, concluímos que a 3ª amostra é a mais dispersa delas. Por outro lado, a fim de comprovar a ineficiência dessa medida, consideremos uma 4ª amostra: 0,6 9,0 9,0 9,0 17,4. 9 Planejamento de Experimentos em Engenharia Ambiental Neste caso, a média ainda é 9,0 e a amplitude é a mesma da 3ª amostra, isto é, 16,8, e, no entanto, as duas amostras são bem distintas. Falta então, alguma informação a mais, que permita diferenciá-las. 1.2.2.2. VARIÂNCIA A variância é uma medida de dispersão que leva em conta todas as observações. É, indiscutivelmente, a melhor medida de dispersão. Consideremos um conjunto de observações correspondentes a uma população finita de N elementos, que representamos por: x₁, x₂, x₃, x₄,..., 𝑥𝑛. A partir destas observações, podemos calcular a média da população por: 𝑚 = ∑ 𝑥𝑖 𝑁 𝑖=1 𝑁 , e os seus desvios em relação à média: 𝑒𝑖 = 𝑥𝑖 −𝑚, (𝑖 = 1,2, … ,𝑁). Podemos mostrar que: ∑𝑒𝑖 𝑁 𝑖=1 = 0. Prova: ∑𝑒𝑖 𝑁 𝑖=1 =∑(𝑥𝑖 −𝑚) 𝑁 𝑖=1 = (𝑥1 −𝑚) + (𝑥2 −𝑚) +⋯+ (𝑥𝑁 −𝑚) =∑𝑥𝑖 𝑁 𝑖=1 − 𝑁𝑚 =∑𝑥𝑖 𝑁 𝑖=1 − 𝑁 ∑ 𝑥𝑖 𝑁 𝑖=1 𝑁 10 Planejamento de Experimentos em Engenharia Ambiental =∑𝑥𝑖 𝑁 𝑖=1 −∑𝑥𝑖 𝑁 𝑖=1 = 0. Então, a variância da população é definida como a média dos quadrados dos desvios em relação à média aritmética, isto é: 𝜎2 = 𝑆𝑄𝐷 𝑁 = ∑ (𝑥𝑖 −𝑚) 2𝑁 𝑖=1 𝑁 , onde, 𝑆𝑄𝐷 =∑𝑒𝑖 2 𝑁 𝑖=1 . Quando trabalhamos com amostras, temos dois casos a considerar: a) Os dados constituem uma amostra, mas os desvios são tomados em relação à média verdadeira (média da população). Neste caso, o divisor é n, mas temos uma estimativa da variância que representamos por: �̂�2 = ∑ (𝑥𝑖 −𝑚) 2𝑛 𝑖=1 𝑛 b) Os dados constituem uma amostra e os desvios são tomados em relação à estimativa da média (�̂�). Este é o caso mais usual, e a estimativa da variância fica: 𝑠2 = ∑ (𝑥𝑖 − �̂�) 2𝑛 𝑖=1 𝑛 − 1 . Um modo mais prático de calcular a Soma dos Quadrados dos Desvios (SQD) é o seguinte: 𝑆𝑄𝐷 =∑(𝑥𝑖 − �̂�) 2 𝑛 𝑖=1 =∑(𝑥𝑖 2 − 2�̂�𝑥𝑖 + �̂� 2) 𝑛 𝑖=1 =∑𝑥𝑖 2 − 2�̂�∑𝑥𝑖 + 𝑛�̂� 2 𝑛 𝑖=1 𝑛 𝑖=1 =∑𝑥𝑖 2 − 2 ∑ 𝑥𝑖 𝑛 𝑖=1 𝑛 .∑𝑥𝑖 𝑛 𝑖=1 + 𝑛 (∑ 𝑥𝑖 𝑛 𝑖=1 ) 2 𝑛2 𝑛 𝑖=1 11 Planejamento de Experimentos em Engenharia Ambiental =∑𝑥𝑖 2 − 2 (∑ 𝑥𝑖 𝑛 𝑖=1 ) 2 𝑛 𝑛 𝑖=1 + (∑ 𝑥𝑖 𝑛 𝑖=1 ) 2 𝑛 =∑𝑥𝑖 2 − (∑ 𝑥𝑖 𝑛 𝑖=1 ) 2 𝑛 𝑛 𝑖=1 . Então, a variância pode ser estimada pela fórmula seguinte: 𝑠2 = ∑ 𝑥𝑖 2𝑛 𝑖=1 − (∑ 𝑥𝑖 𝑛 𝑖=1 ) 𝑛 2 𝑛 − 1 . A vantagem desta fórmula, é que trabalhamos diretamente com os dados originais, não havendo necessidade de calcularmos previamente a média e os desvios em relação a ela. Para os dados do exemplo 1, temos: ∑𝑥𝑖 𝑛 𝑖=1 = 14 + 15 +⋯+ 10 = 124 ∑𝑥𝑖 2 𝑛 𝑖=1 = 142 + 152 +⋯+ 102 = 1472 então: 𝑠2 = 1472 − (124)2 11 11 − 1 = 74,1818 10 = 7,4182. 1.2.2.2.1. ALGUMAS PROPRIEDADES DA VARIÂNCIA 1) Quando somamos a cada valor xᵢ, uma constante k, a variância não se altera. Prova: Seja uma amostra aleatória de tamanho n, cujos elementos são representados por x₁, x₂, x₃,...,𝑥𝑛. Se somarmos a cada valor xᵢ uma constante k, teremos: z₁, z₂, z₃,..., 𝑧𝑛, onde zᵢ=xᵢ+k para i=1,2,...,n. Então, �̂�(𝑧) = ∑ 𝑧𝑖 2𝑛 𝑖=1 − (∑ 𝑧𝑖 𝑛 𝑖=1 ) 2 𝑛 𝑛 − 1 = ∑ (𝑧𝑖 − �̂�𝑧) 2𝑛 𝑖=1 𝑛 − 1 12 Planejamento de Experimentos em Engenharia Ambiental �̂�(𝑧) = ∑ [(𝑥𝑖 + 𝑘) − ∑ (𝑥𝑖 + 𝑘) 𝑛 𝑖=1 𝑛 ] 2 𝑛 𝑖=1𝑛 − 1 �̂�(𝑧) = ∑ [𝑥𝑖 + 𝑘 − 𝑛𝑘 𝑛 − ∑ 𝑥𝑖 𝑛 𝑖=1 𝑛 ] 2 𝑛 𝑖=1 𝑛 − 1 �̂�(𝑧) = ∑ [𝑥𝑖 − ∑ 𝑥𝑖 𝑛 𝑖=1 𝑛 ] 2 𝑛 𝑖=1 𝑛 − 1 �̂�(𝑧) = ∑ (𝑥𝑖 − �̂�𝑥) 2𝑛 𝑖=1 𝑛 − 1 = �̂�(𝑥). 2) Multiplicando-se cada valor xᵢ por uma constante k, a variância fica multiplicada por k². Prova: Seja uma amostra aleatória de tamanho n cujos elementos são representados por x₁, x₂, x₃,..., 𝑥𝑛. Se multiplicarmos cada valor xᵢ por uma constante k, teremos: z₁, z₂, z₃,..., 𝑧𝑛, onde zᵢ=k.xᵢ, para i=1, 2, 3,..., n. Então, �̂�(𝑧) = ∑ (𝑧𝑖 − �̂�𝑧) 2𝑛 𝑖=1 𝑛 − 1 �̂�(𝑧) = ∑ [𝑘𝑥𝑖 − ∑ 𝑘𝑥𝑖 𝑛 𝑖=1 𝑛 ] 2 𝑛 𝑖=1 𝑛 − 1 �̂�(𝑧) = ∑ [𝑘𝑥𝑖 − 𝑘 ∑ 𝑥𝑖 𝑛 𝑖=1 𝑛 ] 2 𝑛 𝑖=1 𝑛 − 1 �̂�(𝑧) = ∑ [𝑘 (𝑥𝑖 − ∑ 𝑥𝑖 𝑛 𝑖=1 𝑛 )] 2 𝑛 𝑖=1 𝑛 − 1 �̂�(𝑧) = 𝑘2 ∑ (𝑥𝑖 − �̂�𝑥) 2𝑛 𝑖=1 𝑛 − 1 �̂�(𝑧) = 𝑘2. �̂�(𝑥). 1.2.2.3. DESVIO PADRÃO 13 Planejamento de Experimentos em Engenharia Ambiental A variância, pela sua natureza, tem uma unidade quadrática. A sua raiz quadrada, que ainda é uma medida de dispersão, é denominada desvio padrão. A vantagem do desvio padrão é ter a mesma unidade dos dados originais e, consequentemente, da média. Assim, no caso do exemplo 1, o desvio padrão é: 𝑠 = √𝑠2 = √7,4182 = 2,7236. É importante observar que as amostras 3 e 4 apresentadas no item 1.2.2.1., embora não pudessem ser diferenciadas pela amplitude total, podem perfeitamente ser identificadas através da variância ou do desvio padrão. Realmente, o quadro seguinte mostra seus comportamentos: Amostra Média Amplitude Variância Desvio padrão 3 9,00 16,8 49,04 7,00 4 9,00 16,8 35,28 5,94 Observamos portanto, que a amostra 3 é a mais dispersa do que a amostra 4. 1.2.2.4. ERRO PADRÃO DA MÉDIA Se em vez de uma amostra tivéssemos várias, provenientes de uma mesma população, obteríamos também diversas estimativas da média, e provavelmente distintas entre si. A partir dessas diversas estimativas da média, poderíamos estimar uma variância, considerando-se os desvios de cada média, em relação à média de todas elas. Seria então uma estimativa da variância da média. Entretanto, demonstra-se que a partir de uma única amostra, podemos estimar essa variância, através da fórmula: �̂�(�̂�) = 𝑠2 𝑛 , onde s² é a estimativa da variância dos n dados, calculada da maneira usual. A sua raiz quadrada é denominada Erro padrão da média, ou seja: 𝑠(�̂�) = 𝑠 √𝑛 . 14 Planejamento de Experimentos em Engenharia Ambiental O erro padrão da média fornece uma ideia da precisão da estimativa da média, isto é, quanto menor ele for, maior precisão terá a estimativa da média. Assim, para os dados do exemplo 1, temos: 𝑠(�̂�) = 2,7236 √11 = 0,8212. Sempre que apresentamos uma média, é conveniente apresentar também o seu erro padrão. Assim, no exemplo 1, poderíamos apresentar a média e seu erro padrão, da seguinte maneira: 11,2727 ± 0,8212. No caso das amostras 1 a 4 exemplificadas no item 1.2.2.1. teríamos: Amostra 1: 9,0 ± 0,0 Amostra 2: 9,0 ± 0,7 Amostra 3: 9,0 ± 3,1 Amostra 4: 9,0 ± 2,6 O que nos mostra a menor precisão da estimativa da média na amostra 3. 1.2.2.5. COEFICIENTE DE VARIAÇÃO É uma medida de dispersão que expressa percentualmente o desvio padrão por unidade da média, ou seja: 𝐶𝑉 = 100. 𝑠 �̂� . Como s e �̂� são expressos na mesma unidade dos dados, o coeficiente de variação é um número abstrato, isto é, não tem unidade e portanto é expresso em porcentagem da média. No exemplo 1, temos: 𝐶𝑉 = 100. (2,7236) 11,2727 = 24,16%. 15 Planejamento de Experimentos em Engenharia Ambiental Nos ensaios de campo, esperam-se coeficientes de variação, da ordem de 10 a 20%. Porém, em ensaios entomológicos, de levantamento de pragas, normalmente os coeficientes de variação são maiores que 30%. 2. PLANEJAMENTO DE EXPERIMENTOS 2.1. INTRODUÇÃO O principal objetivo da Estatística Experimental é o estudo dos experimentos, seu planejamento, execução, análise e interpretação dos resultados obtidos. Os dados que empregamos na análise estatística consistem em uma amostra da população em estudo, e são obtidos de trabalhos previamente planejados, que são os experimentais, sendo por isso chamados de dados experimentais. O que nos obriga a utilizar a análise estatística é a presença, em todos os dados experimentais, de efeitos de fatores não controlados (que podem ou não ser controláveis) e que causam a variação. Entre os fatores que não podem ser controlados, podemos citar pequenas variações nas dosagens dos inseticidas, pequenas variações na infestação das parcelas pelas pragas em estudo, variação na constituição genética das plantas (mais ou menos resistentes), pequenas variações na fertilidade do solo, profundidade de semeadura, etc. Esses efeitos, que estão sempre presentes, não podem ser conhecidos individualmente e, no conjunto, alteram, pouco ou muito, os resultados obtidos. Os efeitos desses fatores que não podem ser controlados são chamados de variação do acaso ou variação aleatória. Procurando tomar mínima a variação do acaso, o experimentador deve fazer o planejamento do experimento de tal forma que consiga isolar os efeitos de todos os fatores que podem ser controlados. 16 Planejamento de Experimentos em Engenharia Ambiental O planejamento constitui a etapa inicial de qualquer trabalho e, portanto, um experimento também deve ser devidamente planejado, de modo a atender aos interesses do experimentador e as hipóteses necessárias para a validade da análise estatística. Frequentemente, o estatístico é consultado para tirar conclusões com base em dados experimentais. Como estas conclusões dependem da forma como foi realizado o experimento, o estatístico solicitará uma descrição detalhada do experimento e de seus objetivos. Frequentemente, ocorrem casos em que, após a descrição do experimento, o estatístico verifica que não pode chegar a conclusão alguma, uma vez que o experimentador não utilizou um delineamento adequado ou não atendeu às hipóteses básicas necessárias para a validade da análise estatística. Para evitar essa perda de tempo e de recursos, é primordial o planejamento adequado do experimento. Ao iniciar o planejamento de um experimento, o experimentador deve formular e responder a uma série de perguntas. Como exemplo, podemos citar: 1. Quais as características que serão analisadas? Num mesmo experimento, várias características podem ser estudadas. Por exemplo, em um experimento que tem como objetivo avaliar qual espécie se adaptará melhor a um determinado habitat podemos levar em consideração os tipos de nutrientes que essa planta necessita como a quantidade de água, a intensidade de luz solar, os impactos que sua inclusão causará as espécies já existentes e a fauna, etc. Portanto, devemos definir adequadamente quais as características de interesse, para que as mesmas possam ser determinadas no decorrer do experimento. 2. Quais os fatores que afetam essas características? Relacionar todos os fatores que possuem efeito sobre as características que serão estudadas, como por exemplo: variedade, nutrientes, água, temperatura, intensidade luminosa, etc. 3. Quais desses fatores serão estudados no experimento?17 Planejamento de Experimentos em Engenharia Ambiental Nos experimentos simples, apenas um tipo de tratamento ou fator pode ser estudado de cada vez, sendo os demais fatores mantidos constantes. Por exemplo, quando fazemos um experimento de avaliação da melhor espécie a se adaptar a um determinado habitat com alto índice pluviométrico, todos os outros fatores, tais como, tipos de nutrientes, temperatura, intensidade luminosa devem ser os mesmos para todas as espécies. No caso de experimentos mais complexos, como os experimentos fatoriais e em parcelas subdivididas, podemos estudar simultaneamente os efeitos de dois ou mais tipos de tratamentos ou fatores. 4. Como será a unidade experimental ou parcela? A escolha da parcela deve ser feita de forma a minimizar o erro experimental. Devido à importância da definição da unidade experimental, faremos uma discussão mais detalhada sobre o assunto em seguida. 5. Quantas repetições deverão ser utilizadas? O número de repetições de um experimento depende do número de tratamentos a serem utilizados e do delineamento experimental escolhido. De um modo geral, recomenda-se que o número de parcelas do experimento não seja inferior a 20 e que o número de graus de liberdade associado aos efeitos dos fatores não controlados ou acaso não seja inferior a 10. 2.2. UNIDADE EXPERIMENTAL OU PARCELA Um dos aspectos mais importantes a ser considerado durante o planejamento do experimento é a definição da unidade experimental ou parcela. De um modo geral, a escolha da parcela deve ser feita de forma a minimizar o erro experimental, isto é, as parcelas devem ser o mais uniforme possível, para que as mesmas consigam refletir o efeito dos tratamentos aplicados. Em experimentos de campo, o tamanho e a forma das parcelas podem variar bastante, em função de: 1. Material com que se está trabalhando: Dependendo da cultura que está sendo estudada, devemos aumentar ou diminuir o tamanho das parcelas. Por exemplo, um problema dos experimentos de campo com plantas perenes e frutíferas arbóreas é o tamanho da área, 18 Planejamento de Experimentos em Engenharia Ambiental devido ao porte das plantas que normalmente exigem largos espaçamentos. É muito frequente, nesses experimentos, o uso de parcelas grandes, em detrimento do número de repetições, com a justificativa de diminuir a área experimental, a mão-de-obra e o consequente custo da pesquisa. (1) 2. O objetivo da pesquisa: O objetivo do trabalho experimental também influencia no tamanho da parcela. Por exemplo, se desejarmos estudar o efeito da profundidade de semeadura do Syzygium jambolanum sobre o desenvolvimento inicial das plantas, não necessitamos trabalhar com parcelas tão grandes, pelo fato do tamanho da área experimental poder ser de pequeno porte. 3. Número de tratamentos em estudo: Quando o número de tratamentos é muito grande, como ocorre com os experimentos de melhoramento genético vegetal, o tamanho das parcelas deve ser reduzido, para diminuir a distância entre as parcelas externas, visando homogeneidade entre elas. 4. Quantidade disponível de sementes: Nos experimentos de melhoramento genético vegetal, este é um fator limitante para o tamanho das parcelas. 5. Uso de máquinas agrícolas: Nos experimentos em que é necessária a utilização máquinas agrícolas, tais como, tratores e colheitadeiras, o tamanho das parcelas deve ser, obrigatoriamente, grande. 6. Área total disponível para a pesquisa: Frequentemente, o pesquisador tem que ajustar seu experimento ao tamanho da área disponível, que em geral é pequeno, o que resulta na utilização de parcelas pequenas. 7. Custo, tempo e mão-de-obra: São fatores que também limitam o tamanho das parcelas. No que se refere á forma das parcelas, experimentos realizados em diversos países, com diferentes culturas, têm mostrado que, para se obter maior precisão, as parcelas devem ser compridas e estreitas, evitando-se que toda a parcela ocupe uma mancha de alta ou baixa fertilidade do solo, que possa existir na área experimental. 19 Planejamento de Experimentos em Engenharia Ambiental Para as parcelas de tamanho pequeno, o efeito da forma é muito pequeno. O tamanho e a forma ideais para a parcela são aqueles que resultem em maior homogeneidade das parcelas. Em alguns experimentos, devemos utilizar bordaduras nas parcelas, para se evitar a influência sobre a parcela, dos tratamentos aplicados nas parcelas vizinhas. Neste caso, teremos a área total e a área útil da parcela, sendo que os dados a serem utilizados na análise estatística serão aqueles coletados apenas na área útil da parcela. Nos experimentos em casa-de-vegetação, para a constituição de cada parcela, podemos utilizar um conjunto de vasos ou, então, um único vaso com 2 ou 3 plantas e, às vezes, uma única planta constituindo a unidade experimental. Em experimentos de laboratório, uma amostra simples do material poderá constituir a parcela, porém, às vezes é necessário utilizar uma amostra composta. Quando são feitas varias determinações em uma mesma amostra, o valor da parcela será a média das várias determinações. Não devemos confundir as diversas determinações da mesma amostra, com as repetições do experimento. 2.3. PRINCÍPIOS BÁSICOS DA EXPERIMENTAÇÃO Para assegurar que os dados serão obtidos de forma a propiciar uma análise correta e que conduza a conclusões válidas com relação ao problema em estudo, o experimentador deve levar em conta alguns princípios básicos ao planejar o experimento. 2.3.1. PRINCÍPIO DA REPETIÇÃO O principio da repetição consiste na reprodução do experimento básico. Sejam, por exemplo, 2 variedades, A e B, plantadas em 2 parcelas o mais semelhante possível. O fato da variedade A se comportar melhor que a B, pouco ou nada significa, pois a variedade A pode ter tido um melhor comportamento por um simples acaso. Podemos tentar contornar o problema, plantando as variedades A e B em diversas parcelas, e considerando o comportamento médio de cada variedade. Aqui intervém o princípio da repetição, ou seja a reprodução do experimento básico. Entretanto, apenas este princípio não resolve totalmente o problema, pois se todas as parcelas com a variedade A estiverem grupadas e as com as variedade B também, o efeito dos 20 Planejamento de Experimentos em Engenharia Ambiental fatores não controlados continuará a ser uma hipótese possível para o melhor comportamento da variedade A. 2.3.2. PRINCÍPIO DA CASUALIZAÇÃO O princípio da casualização consiste na distribuição dos tratamentos às parcelas de forma casual, para se evitar que um determinado tratamento venha a ser beneficiado por sucessivas repetições em parcelas melhores. Se, por exemplo, temos as 2 variedades A e B, distribuídas ao acaso em 6 parcelas cada, teremos : A B A B B A B A A B B A Então, se a variedade A se comportar melhor que a B em qualquer das parcelas, pela teoria de probabilidades, a probabilidade de que isso ocorra por acaso é: 𝑝 = 6! . 6! 12! = 1 924 = 0,1% ⇨ 𝑞 = 1 − 𝑝 = 99,9% Isso significa que o resultado obtido ainda pode ser devido ao acaso, porém a probabilidade de que isto ocorra por acaso é de apenas 0,1%, ou seja, existe uma probabilidade de 99,9% de que haja realmente um melhor comportamento de um dos tratamentos. 2.3.3. PRINCÍPIO DO CONTROLE LOCAL Este princípio é frequentementeutilizado, mas não é de uso obrigatório. A função do controle local é tornar o delineamento mais eficiente, reduzindo o erro experimental. O controle local consiste na formação de grupos de parcelas o mais homogêneos possível, de modo a reduzir o erro experimental. Cada grupo constitui um bloco, sendo que os tratamentos devem ser sorteados dentro de cada bloco. Por exemplo: 21 Planejamento de Experimentos em Engenharia Ambiental Bloco 1 Bloco 2 Bloco 3 Bloco 4 Bloco 5 Bloco 6 2.4. RELAÇÃO ENTRE OS PRINCÍPIOS BÁSICOS DA EXPERIMENTAÇÃO E OS DELINEAMENTOS EXPERIMENTAIS A análise de variância consiste na decomposição da variância total de um material heterogêneo em partes atribuídas a causas conhecidas e independentes e a uma porção residual de origem desconhecida e de natureza aleatória. Quando planejamos um experimento, levando em conta apenas os princípios da repetição e da casualização, sem considerar o princípio do controle local, temos o Delineamento Inteiramente Casualizado (DIC) ou Delineamento Inteiramente ao Acaso. Só devemos utilizar esse delineamento, quando temos certeza da homogeneidade das condições experimentais. É frequentemente utilizado em experimentos de laboratório, onde as condições experimentais podem ser perfeitamente controladas. Num experimento inteiramente casualizado, com 5 tratamentos, cada um dos quais foi repetido 5 vezes, teremos o seguinte esquema de análise de variância: CAUSAS DE VARIAÇÃO G.L. TRATAMENTOS RESÍDUO 4 20 TOTAL 24 O resíduo ou erro, é a causa de variação que reflete o efeito dos fatores não controlados, também chamados de acaso. Quando não há homogeneidade entre parcelas, devemos utilizar o princípio do controle local, estabelecendo os blocos. Neste caso, o delineamento a ser utilizado é o Delineamento em Blocos Casualizados (DBC). B A A B A B B A B A A B 22 Planejamento de Experimentos em Engenharia Ambiental O esquema de análise de variância de um experimento em blocos casualizados com 5 tratamentos e 5 repetições é dada por: CAUSAS DE VARIAÇÃO G.L. TRATAMENTOS BLOCOS RESÍDUO 4 4 16 TOTAL 24 Quando necessitamos controlar 2 tipos de heterogeneidade, devemos utilizar o Delineamento em Quadrado Latino (DQL). Neste delineamento, os tratamentos sofrem um duplo controle local, sendo dispostos em linhas e colunas. Para um experimento em quadrado latino com 5 tratamentos, o esquema de análise de variância será: CAUSAS DE VARIAÇÃO G.L. TRATAMENTOS LINHAS COLUNAS RESÍDUO 4 4 4 12 TOTAL 24 3. TESTES DE SIGNIFICÂNCIA 3.1. INTRODUÇÃO Um dos principais objetivos da Estatística é a tomada de decisões a respeito da população, com base na observação de amostras, ou seja, a obtenção de conclusões válidas para toda a população, com base em amostras retiradas dessa população. Ao tentarmos tomar decisões, é conveniente a formulação de hipóteses ou suposições relativas às populações. Essas suposições, que podem ou não ser verdadeiras, são chamadas de 23 Planejamento de Experimentos em Engenharia Ambiental hipóteses estatísticas e consistem, geralmente, em considerações a respeito das distribuições de probabilidade das populações. Em muitos casos formulamos uma hipótese estatística com o objetivo de rejeitá-la ou invalidá-la. Por exemplo, quando realizamos um experimento com o objetivo de verificar quais sementes germinam melhor em uma área, levando-se em consideração a incidência de luz, formulamos a hipótese de que não existam diferenças entre as variedades em relação a germinação (isto é, que quaisquer diferenças observadas são devidas unicamente aos fatores não controlados ou acaso ). Essa hipótese inicial que formulamos, é denominada de hipótese da nulidade e é representada por H0. Admitindo-se essa hipótese como verdadeira, se verificarmos que os resultados obtidos ao final do experimento em uma amostra aleatória diferem acentuadamente dos resultados esperados para essa hipótese, com base na teoria das probabilidades, podemos concluir que as diferenças observadas são significativas, e rejeitar essa hipótese. Então rejeitamos a hipótese da nulidade em favor de outra, que é representada por H1 e denominada de hipótese alternativa. Por exemplo, no caso da comparação entre as variedades, a hipótese alternativa seria: As variedades testadas se comportam de maneira diferente em relação à intensidade de luz no local. Os métodos que nos permitem decidir se aceitamos ou rejeitamos uma determinada hipótese, ou se a amostra observada difere significativamente dos valores esperados, são denominados de testes de significância, ou testes de hipóteses. Porém, ao tomarmos decisões de rejeitar ou aceitar uma determinada hipótese, estamos sujeitos a incorrer em dois tipos de erros: Erro do tipo I - é o erro que cometemos ao rejeitar uma hipótese verdadeira, que deveria ser aceita. Erro do tipo II - é o erro que cometemos ao aceitar uma hipótese falsa, que deveria ser rejeitada. Esses dois tipos de erro estão associados de tal forma que a medida que diminuímos a probabilidade de ocorrência de um deles, automaticamente aumentamos a probabilidade de ocorrência do outro. 24 Planejamento de Experimentos em Engenharia Ambiental Geralmente, em estatística, controlamos apenas o erro do Tipo I, através do nível de significância do teste. O nível de significância do teste, representada por α, é a probabilidade máxima com que nos sujeitamos a correr o risco de cometer um erro do Tipo I, ao testarmos uma hipótese. Na prática, é usual fixarmos esse nível de significância em 5% ou em 1%, ou seja, α = 0,05 ou α = 0,01. Então, se por exemplo, escolhermos o nível de significância de 5%( α=0,05), isso indica que temos 5 chances em 100 de rejeitarmos uma hipótese que deveria ser aceita, isto é, há uma confiança de 95% de que tenhamos tomado uma decisão correta . Essa confiança que temos de termos tomado uma decisão correta é denominada de Grau de Confiança do Teste, e é dada por 100(1-α)%. O teste de significância mais utilizado em estatística experimental é o Teste F, que estudaremos a seguir. 3.2. TESTE F DE SNEDECOR PARA ANÁLISE DE VARIÂNCIA A Análise de Variância é uma técnica que nos permite fazer a decomposição da variância total em partes atribuídas a causas conhecidas e independentes e a uma porção residual de origem desconhecida e de natureza aleatória. O teste F tem por finalidade comparar estimativas de variâncias. Na análise de variância, as estimativas de variância são dadas pelos quadrados médios (Q.M), obtendo-se um Q.M. para cada causa de variação. Assim, num experimento inteiramente casualizado, temos 2 estimativas de variância: uma devida aos efeitos de tratamentos (dada pelo QM Tratamentos) e outra devida aos efeitos dos fatores não controlados ou acaso (dada pelo QM Resíduo). Para aplicar o teste F na análise de variância, utilizamos sempre no denominador, o QM Resíduo, ou seja, comparamos sempre uma variância devida aos efeitos do fator controlado (Tratamentos, blocos, linhas, colunas, etc.), com a variância devida aos efeitos dos fatores não controlados ou acaso (Resíduo). Então: 25 Planejamento de Experimentosem Engenharia Ambiental F = 𝑄𝑀 𝑇𝑟𝑎𝑡𝑎𝑚𝑒𝑛𝑡𝑜𝑠 𝑄𝑀 𝑅𝑒𝑠í𝑑𝑢𝑜 Sob a hipótese da nulidade, isto é, supondo-se que os efeitos dos tratamentos são todos equivalentes, teríamos 2 estimativas de variância (QM Tratamentos e QM Resíduo) que não deveriam diferir, a não ser por flutuações amostrais, pois ambas estimam a variação do acaso. Assim, QM Resíduo - estima a variação do acaso: σ2 QM Tratamentos – estima a variação do acaso mais a variação devida ao efeito de tratamentos σ2 + K σT 2 Portanto, F = 𝑄𝑀 𝑇𝑟𝑎𝑡𝑎𝑚𝑒𝑛𝑡𝑜𝑠 𝑄𝑀 𝑅𝑒𝑠í𝑑𝑢𝑜 = σ2 + K σT 2 σ2 A seguir, comparamos o valor de F calculado com os valores da tabela da distribuição F (geralmente aos níveis de 5% e 1%). Os valores críticos são obtidos na tabela da distribuição F, em função do número de graus de liberdade de tratamentos (ou de blocos), na horizontal e do número de graus de liberdade do resíduo, na vertical. O Critério do Teste é o seguinte: Se F calculado ≥ F tabela, o teste é significativo no nível testado. Então, devemos rejeitar a hipótese da nulidade (H0), e concluir que os efeitos dos tratamentos diferem entre si a esse nível de probabilidade, e essas diferenças não devem ser atribuídas ao acaso, mas sim aos efeitos dos tratamentos testados, com uma grau de confiança de 100(1-α)%. Se F calculado < F tabelado, o teste é não significativo ao nível testado. Então, não devemos rejeitar a hipótese da nulidade (H0). Neste caso, concluímos que os efeitos dos tratamentos não diferem entre si a esse nível de probabilidade. A seguir, apresentamos um esquema gráfico da distribuição F. 26 Planejamento de Experimentos em Engenharia Ambiental Resumidamente, temos: a) Fcalc < Ftab (5%) – O Teste F é não significativo ao nível de 5% de probabilidade. Aceitamos H0 – Utiliza-se a notação FcalcNS. b) Ftab(5%) < Fcalc < Ftab(1%) – O teste é significativo ao nível de 5% de probabilidade. Rejeitamos H0, com um grau de confiança superior a 95%. Utiliza-se a notação: Fcalc* c) Fcalc > Ftab(1%) – O teste é significativo ao nível de 1% de probabilidade. Rejeitamos H0, com um grau de confiança superior a 99%. Utiliza-se a notação: Fcalc ** 3.3. EXEMPLO DE APLICAÇÃO DO TESTE F Um engenheiro ambiental foi contratado para tratar uma área contaminada por metais pesados. Para isso ele decidiu testar qual tratamento seria mais eficiente para ser aplicado nesse local, sendo então aplicados 5 tratamentos com 4 repetições. Os tratamentos testados foram: 1) LAd+iodo 2)LAd 3)LVd+iodo 4) LVd 5) iodo O delineamento experimental utilizado foi em blocos casualizados, utilizando vasos preenchidos com amostras de Latossolo Amarelo Distrófico e Latossolo Vermelho Distrófico. Após experimento feito, foram obtidas as seguintes somas de quadrados para a análise de variância: SQ Tratamentos = 4538, 1880 SQ Blocos = 1266, 0535 27 Planejamento de Experimentos em Engenharia Ambiental SQ Total = 9237, 6055 As hipóteses que desejamos testar, para tratamentos, são: H0: Os tratamentos testados não diferem entre si quanto à eficiência. H1: Os tratamentos testados diferem entre si quanto à eficiência. Para testar essas hipóteses, podemos montar o seguinte quadro de análise de variância: CAUSAS DE VARIAÇÃO G.L. S.Q. Q.M F TRATAMENTOS BLOCOS RESÍDUO 4 3 12 4538,1880 1266,0535 3433,3640 1134,5470 422,0178 286,1137 3,97* 1,48NS - TOTAL 19 9237,6055 - - Valores de F da Tabela: Para Tratamentos (4x12 g.l.): { 5% = 3,26 1% = 5,41 Para Blocos (3x12 g.l.): { 5% = 3,49 1% = 5,95 Conclusões: a) Para Tratamentos: O teste foi significativo ao nível de 5% de probabilidade. Rejeitamos a hipótese H0, e concluímos que os tratamentos (pelos menos 2) testados nessa área possuem uma eficiência maior , a esse nível de probabilidade, com um grau de confiança superior a 95% de probabilidade. b) Blocos: O teste foi não significativo ao nível de 5% de probabilidade. Não rejeitamos a hipótese H0, e concluímos que os vasos utilizados como blocos não diferem entre si em relação a eficiência do tratamento, a esse nível de probabilidade. 3.4. TESTES PARA COMPARAÇÃOD E MÉDIAS 3.4.1. INTRODUÇÃO 28 Planejamento de Experimentos em Engenharia Ambiental O Teste F nos permite apenas tirar conclusões muito gerais, relacionados com o comportamento dos tratamentos como um todo, indicando apenas se eles se comportam da mesma maneira ou de maneira diferente, nada nos informando com relação a quais os melhores tratamentos. Para verificar quais são os melhores tratamentos, devemos utilizar os testes de comparação de médias. Antes de entrarmos no estudo dos testes de comparação de médias, devemos abordar alguns conceitos relacionados com estes testes. 3.4.2.CONTRASTE DE MÉDIAS Contrastes de médias são relações lineares entre as médias verdadeiras dos tratamentos, de forma que a soma algébrica dos coeficientes dessa função seja nula. Então, uma combinação linear das medias do tipo: Y= c1m1+ c2m2 +...+cImI , será um contraste se e só se: ∑𝑐𝑖 = 𝐼 𝑖=1 𝑐1 + 𝑐2 +⋯𝑐𝐼 = 0. Assim, se num experimento, temos 3 tratamentos, cujas médias verdadeiras são m1, m2 e m3, as relações: Y1= m1- m2 Y2= m1+ m2 - 2m3 são contrastes, enquanto que a relação: Y3= m1 + m2 – m3 não é um contraste. O número de contrastes que podemos formar com um grupo de médias é grande, e numa análise estatística, formamos aqueles que realmente são de interesse do pesquisador. 3.4.3. ESTIMATIVA DO CONTRASTE 29 Planejamento de Experimentos em Engenharia Ambiental Geralmente, não conhecemos as médias verdadeiras, de forma que o verdadeiro valor do contraste também nos é desconhecido. Porém, como conhecemos as estimativas das médias, podemos calcular as estimativas dos contrastes. Então, para um contraste de médias na forma geral: Y= c1m1 + c2m2 +...+cImI , com ∑𝑐𝑖 = 0 , 𝐼 𝑖=1 obtemos a estimativa: �̂�= c1�̂�1 + c2�̂�2+...+cI �̂�I. Devemos frisar bem que, quando trabalhamos com estimativas de médias, obtemos também estimativas de contraste. O valor verdadeiro do contraste só seria obtido, se conhecêssemos as médias populacionais. 3.4.4. COVARIÂNCIA ENTRE DOIS CONTRASTES Consideremos as duas estimativas de contraste: �̂�1= a1�̂�1 + a2�̂�2+...+aI �̂�I. e �̂�2= b1�̂�1 + b2�̂�2+...+bI �̂�I. , nas quais, as médias foram estimadas com r1 , r2,... , rI repetições, respectivamente. A estimativa de covariância entre essas duas estimativas de contrastes é definida por: 𝐶�̂�𝑉(�̂�1, �̂�2) = a1b1�̂�(�̂�1) + a2b2�̂�(�̂�2) +...+ aIbI�̂� (�̂�I). Lembrando que �̂�(�̂�1) = 𝑠𝑖 2 𝑟𝑖 , (i = 1,2,...,I ) 30 Planejamento de Experimentos em Engenharia Ambiental temos: 𝐶�̂�𝑉(�̂�1, �̂�2) = a1b1 𝑠1 2 𝑟1 + a2b2 𝑠2 2 𝑟2 +...+ aIbI 𝑠𝐼 2 𝑟𝐼 . Como geralmente temos 𝑠1 2 = 𝑠2 2 = ...= 𝑠𝐼 2 = 𝑠2 ,então 𝐶�̂�𝑉(�̂�1, �̂�2)=( 𝑎1𝑏1 𝑟1 + 𝑎2𝑏2 𝑟2 +...+ 𝑎𝐼𝑏𝐼 𝑟𝐼 )s2 Na prática, principalmente nas análises de variância, frequentemente admitimos a mesma variância para todos a médias e geralmente trabalhamos com o mesmo número de repetições, resultando: 𝐶�̂�𝑉(�̂�1, �̂�2) =(a1b1+ a2b2+...+ aIbI ) 𝑠2 𝑟 3.4.5. CONTRASTES ORTOGONAIS A ortogonalidade entre dois contrastes traduz uma independência entre eles, isto é, a variação de um é completamente independente da variação do outro. Dizemos que 2 contrastes são ortogonais entre si se a covariância entre eles for nula. Assim, a condição de ortogonalidade é dada por: 𝑎1 𝑏1 𝑟1 𝑠1 2 + 𝑎2 𝑏2 𝑟2 𝑠2 2 +...+ 𝑎𝐼 𝑏𝐼 𝑟𝐼 𝑠𝐼 2 = 0, ou seja, ∑ 𝑎𝑖 𝑏𝑖 𝑟𝑖 𝑠𝑖 2 𝐼 𝑖=1 = 0 Se admitirmos a mesma variância para todas as médias, a condição de ortogonalidade será: a1b1 + a2b2 +...+ aIbI = 0, 31 Planejamento de Experimentos em Engenharia Ambiental ou seja, ∑𝑎𝑖 𝑏𝑖 𝐼 𝑖=1 = 0 Para exemplificar, vamos considerar os dois contrastes Y1 e Y2, vistos anteriormente. Podemos escrevê-los da seguinte forma: Y1 = m1 - m2 + 0m3 Y2 = m1+ m2 –2m3 Neste caso, temos: Y1 => 1 -1 0 Y2 => 1 +1 -2 _____________________________ ∑ 𝑎𝑖 𝑏𝑖 3 𝑖=1 = (1) + (-1) + (0) = 0 Portanto, Y1 e Y2 são ortogonais entre si. 3.4.6. VARIÂNCIA DE UM CONTRASTE Consideremos um contraste na forma Y = c1m1 + c2m2 +...+ cImI , cuja estimativa é : �̂�= c1�̂�1 + c2�̂�2+...+cI �̂�I. A estimativa de variância da estimativa do contraste é representada por �̂�(�̂�) e é dada por: �̂�(�̂�) = 𝐶�̂�𝑉(�̂�, �̂�)= 𝑐1 2�̂�(�̂�1) + 𝑐2 2�̂�(�̂�2) + ⋯+ 𝑐𝐼 2�̂�(�̂�𝐼), e é válida apenas quando todas as médias são independentes. Substituindo-se as variâncias das médias, obtém-se: 32 Planejamento de Experimentos em Engenharia Ambiental �̂�(�̂�) = 𝑐1 2 𝑠1 + 2 𝑟1 𝑐2 2 𝑠2 + 2 𝑟2 … +𝑐𝐼 2𝑠𝐼 2 𝑟𝐼 . Se tivermos 𝑠1 2 = 𝑠2 2 = ⋯ = 𝑠𝐼 2 = 𝑠2 , então : �̂�(�̂�) = ( 𝑐1 2 𝑟1 + 𝑐2 2 𝑟2 +⋯+ 𝑐𝐼 2 𝑟𝐼 ) 𝑠2 e ainda, se tivermos r1 = r2 = ...= rI , �̂�(�̂�) = (𝑐1 2 + 𝑐2 2 +⋯+ 𝑐𝐼 2) 𝑠2 𝑟 3.4.7.ERRO PADRÃO DO CONTRASTE O erro padrão de um contraste, representado por s(�̂�), é a raiz quadrada da estimativa da variância da estimativa do contraste, ou seja: s(�̂�) = √�̂�(�̂�) . 3.5. TESTE t DE STUDENT O teste t é um teste que serve para confrontar médias ou grupos de médias, e portanto, implica na utilização de contrastes de médias. Admitindo-se então, um contraste na sua forma geral: Y = c1m1 + c2m2 +...+ cImI , e sua estimativa �̂�= c1�̂�1 + c2�̂�2+...+cI �̂�I , que podemos confrontar pelo Teste t. A estatística do Teste t é calculada da seguinte forma: 𝑡𝑐 = �̂� − 0 √�̂�(�̂�) = �̂� − 0 𝑠(�̂�) 33 Planejamento de Experimentos em Engenharia Ambiental Normalmente, comparamos o valor do contraste com o valor zero (0), isto é, verificamos se sua estimativa não difere estatisticamente de zero. Na realidade, quando assim procedemos, estamos verificando se os grupos de médias contrastadas não diferem estatisticamente entre si. Embora não muito usual, o contraste poderia ser confrontado com qualquer outro valor A, constante. Sua expressão, nesse caso, seria: 𝑡𝑐 = �̂� − 𝐴 √�̂�(�̂�) = �̂� − 𝐴 𝑠(�̂�) Em ambos os casos, o valor de t calculado deve ser comparado com os valores de t tabelados, para verificar a significância di teste. Estes valores de t são tabelados em função do número de graus de liberdade do resíduo da análise de variância. O critério do teste é o seguinte: a) Se | tc |≥ ttab, o teste é significativo ao nível 𝛼 de probabilidade considerada. Neste caso, rejeitamos H0 e concluímos que as médias ou grupos de médias testadas no contraste diferem significativamente entre si. b) Se | tc |< ttab, o teste é não significativo ao nível 𝛼 de probabilidade considerada. Neste caso, não rejeitamos H0, e concluímos que as médias ou grupos de médias testados no contraste não diferem significativamente entre si. Para a aplicação exata do teste t, são necessárias duas condições básicas: 1. Que os contrastes sejam estabelecidos “a príon”, ou seja, que os mesmos não sejam sugeridos pelos resultados. 2. Que os contrastes a serem testados sejam ortogonais entre si. EXEMPLO DE APLICAÇÃO: Para exemplificar a aplicação do teste t, vamos utilizar os dados do exemplo utilizado no teste F, considerando-se que as médias das 4 repetições de cada tratamento foram: �̂�1 = 97,20 t/ha �̂�2= 135,18 t/ha �̂�3= 139,65 t/ha s 2 = QMRes = 286,1137 34 Planejamento de Experimentos em Engenharia Ambiental �̂�4= 124,55 t/há r = 4 �̂�5= 131,75 t/há Supondo que se deseja testar o contraste: �̂� = 4�̂�1 − �̂�2 − �̂�3 − �̂�4 − �̂�5, que corresponde a verificar se a média do tratamento LAd+iodo difere da média dos outros tratamentos, temos: �̂� = 4(97,20) - 135,18 - 139,65 - 124,55 - 131,75 �̂� = -142,33 �̂�(�̂�) = [ 42 + (-1)2 + (-1)2 +(-1)2 +(-1)2 ] 286,1137 4 = 1430,5685 𝑠(�̂�) = √1430, 5685 = 37,83 tc = �̂�−0 𝑠(�̂�) = −142,33 37,83 = -3,76 **. Os valores críticos de t são tabelados em função do número de g.l. do resíduo. Neste caso temos 12 graus de liberdade para o resíduo, então: 𝑡𝑡(12𝑔.𝑙.,∝ =0,05) = 2,18 𝑡𝑡(12𝑔.𝑙.,∝ =0,01) = 3,06 Como |tc| > tt , concluímos que o contraste é significativo ao nível de 1% de probabilidade. As hipóteses, neste caso são: H0: Y=0 vs. Ha:Y ≠ 0, então, rejeitamos H0, em favor de Ha :Y ≠ 0, isto é, existe uma probabilidade acima de 99% de que o valor do contraste seja diferente de zero. Neste caso, concluímos que o grupo formado pelo tratamento LAd+iodo difere significativamente do grupo formado pelos outros tratamentos, sendo que o LAd+iodo apresenta uma maior eficiência, conforme pode-se observar pelo valor da estimativa do contraste. 3.6. TESTE DE TUKEY 35 Planejamento de Experimentos em Engenharia Ambiental O Teste de Tukey pode também ser usado como um complemento do Teste F da análise de variância. Ele serve para confrontar todo e qualquer contraste entre 2 médias de tratamentos. Assim, num experimento com I tratamentos, podemos comparar: 𝐶𝐼 2 = 𝐼! 2!.(𝐼−2)! = 𝐼(𝐼−1) 2 contrastes. É um teste versátil, porém não nos permite comparar 2 grupos de médias. Baseia-se na diferença mínima significativa (d.m.s.) representada por ∆ e dada por: ∆ = q 𝑠 √𝑟 = q.s(�̂�) onde, q é o valor da amplitude total estudentizada, valor encontrado em tabelas, em função do número de tratamentos do experimento (n) e do número de graus de liberdade do resíduo (n’), geralmente ao nível de 5% de probabilidade. s é o desvio padrão residual, dado por s = √𝑄𝑀𝑅𝑒𝑠 r é o número de repetições com que foram calculadas as médias dos tratamentos. O procedimento para aplicação do teste é o seguinte:1. Calcula-se o valor de ∆. 2. Calculam-se todas as estimativas de contrastes entre duas médias, do tipo: �̂� = �̂�𝑖 − �̂�𝑗 (i = 1, 2,..., I-1) e (j = i+1, i+2,..., I) 3. Comparam-se os valores de |�̂�| com ∆. Se |�̂�| ≥ ∆ o contraste é significativo ao nível ∝de probabilidade considerado, indicando que as médias dos tratamentos testados no contraste diferem entre si a esse nível de probabilidade. 4. Indica-se a significância do teste, colocando-se uma das notações (NS, * ou **) sobre o valor da estimativa do contraste. Para que o teste seja exato, exige que todas as médias tenham o mesmo número de repetições. Quando as médias não forem calculadas com o mesmo número de repetições, o teste de Tukey é aproximado, e, neste caso, a d.m.s. deve ser obtida através da expressão: 36 Planejamento de Experimentos em Engenharia Ambiental ∆′= 𝑞√ 1 2 �̂�(�̂�) EXEMPLO DE APLICAÇÃO: Para exemplificar a aplicação do teste de Tukey, vamos utilizar os dados do exemplo utilizado no teste F, onde: �̂�1 = 97,20 t/ha �̂�2= 135,18 t/ha �̂�3= 139,65 t/ha s2 = QMRes = 286,1137 �̂�4= 124,55 t/ha r = 4 �̂�5= 131,75 t/ha 1) Cálculo do valor de ∆: q(5 trat x 12 gl do resíduo) (5%) = 4,51 s = √𝑄𝑀𝑅𝑒𝑠 = 16,91 r = 4 Então, temos: ∆ = q 𝑠 √𝑟 = 4,51 .16,91 √4 = 38,14 t/ha Delta = DMS = Diferença mínima significativa > ∆ = * < ∆ = ns 2) Obtenção das estatísticas dos contrastes: Para obter sempre estimativas de contrastes positivas, é conveniente colocar as médias em ordem decrescente, embora isto não seja imprescindível para a aplicação do teste. Então, ordenando as médias, teremos: �̂�3= 139,65 �̂�2= 135,18 �̂�5= 131,75 �̂�4= 124,55 �̂�1 = 97,20 A obtenção das estimativas dos contrastes pode ser feita de duas maneiras: a) Escrevendo cada um dos contrastes: �̂�1 = �̂�3 − �̂�2 = 4,47 𝑁𝑆 �̂�6 = �̂�2 − �̂�4 = 10,63 𝑁𝑆 37 Planejamento de Experimentos em Engenharia Ambiental �̂�2 = �̂�3 − �̂�5 = 7,90 𝑁𝑆 �̂�7 = �̂�2 − �̂�1 = 37,98 𝑁𝑆 �̂�3 = �̂�3 − �̂�4 = 15,10 𝑁𝑆 �̂�8 = �̂�5 − �̂�4 = 7,20 𝑁𝑆 �̂�4 = �̂�3 − �̂�1 = 42,45 ∗ �̂�9 = �̂�5 − �̂�1 = 34,55 𝑁𝑆 �̂�5 = �̂�2 − �̂�5 = 3,43 𝑁𝑆 �̂�10 = �̂�4 − �̂�1 = 27,35 𝑁𝑆 b) Montando um quadro resumido com as médias em ordem decrescente: �̂�3 �̂�2 �̂�5 �̂�4 �̂�1 �̂�3 _ 4,47 NS 7,90NS 15,10NS 42,45* �̂�2 _ _ 3,43 NS 10,63NS 37,98NS �̂�5 _ _ _ 7,20 NS 34,55NS �̂�4 _ _ _ _ 27,35 NS �̂�1 _ _ _ _ _ 3.7. TESTE DE DUNCAN O Teste de Duncan também pode ser utilizado como um complemento do Teste F da análise de variância. Para ser exato, este teste também exige que as médias possuam todas o mesmo número de repetições. Este teste baseia-se na Amplitude total mínima significativa, representada por D e dada por: 𝐷 = 𝑧𝛼. 𝑠 √𝑟 = 𝑧𝛼. 𝑠(�̂�), onde: 𝑧𝛼 = Amplitude Total Estudentizada. Valor encontrado em tabelas, em função do número de médias abrangidas pelo contraste e do número de graus de liberdade do resíduo. 𝑠 = √𝑄𝑀𝑅𝑒𝑠, 𝑟 = nº de repetições com que foram obtidas as médias. 38 Planejamento de Experimentos em Engenharia Ambiental O Procedimento para a aplicação do Teste de Duncan é o seguinte: 1. Ordenam-se as médias em ordem decrescente. 2. Calcula-se a estimativa do contraste que abrange k médias. 3. Calcula-se o valor de Dk correspondente, dado por: 𝐷𝑘 = 𝑧(𝑘,𝛼). 𝑠 √𝑟 4. Compara-se o valor de | �̂� | com Dk.. Se | �̂� | ≥ 𝐷𝑘 o teste é significativo. Neste caso, reduz-se de um nº de médias abrangidas pelo contraste (valor de k) e volta-se ao passo 2. Se | �̂� | < 𝐷𝑘 o teste é não significativo. Neste caso, unem-se por uma barra as médias abrangidas pelo contraste, e não são feitas mais comparações entre estas médias. Quando as médias dos tratamentos não são igualmente repetidas, o teste é apenas aproximado, e calculamos a amplitude total mínima significativa por: 𝐷′ = 𝑧𝛼 . √ 1 2 �̂�(�̂�). EXEMPLO DE APLICAÇÃO: Para exemplificar a aplicação do teste de Duncan, vamos utilizar os dados do exemplo utilizado no teste F: 1) Médias em ordem decrescente: �̂�3= 139,65 t/ha �̂�2= 135,18 t/ha �̂�5= 131,75 t/ha s2 = QMRes = 286,1137 �̂�4= 124,55 t/ha r = 4 �̂�1 = 97,20 t/há 2) Contraste que abrange 5 médias : �̂�1 = �̂�3 − �̂�1 = 42,25 𝑡/ℎ𝑎 39 Planejamento de Experimentos em Engenharia Ambiental 𝐷5 = 𝑧5. 𝑠 √𝑟 = 3,36. 16,91 √4 = 28,41 𝑡/ℎ𝑎 Com �̂�1 > 𝐷5 , o teste é significativo ao nível de 5% de probabilidade , rejeitamos H0 e concluímos que �̂�3 ≠ �̂�1. 3) Contrastes que abrangem 4 médias: �̂�2 = �̂�3 − �̂�4 = 15,10 𝑡/ℎ𝑎 e �̂�3 = �̂�2 − �̂�1 = 37,98 𝑡/ℎ𝑎 𝐷4 = 𝑧4. 𝑠 √𝑟 = 3,33. 16,91 √4 = 28,16 𝑡/ℎ𝑎 Como �̂�2 < 𝐷4, o teste é não significativo ao nível de 5% de probabilidade, não rejeitamos H0 e concluímos que �̂�3 não difere de �̂�4. Como �̂�3 > 𝐷4, o teste é significativo ao nível de 5% de probabilidade, rejeitamos H0 e concluímos que �̂�2 ≠ �̂�1. Neste caso, ligamos por uma barra as médias �̂�3 𝑒 �̂�4, e não se faz mais comparações entre médias que estejam ligadas por esta barra. Assim, temos: �̂�3 = 139,65 𝑡/ℎ𝑎 �̂�2 = 135,18 𝑡/ℎ𝑎 �̂�5 = 131,75 𝑡/ℎ𝑎 �̂�4 = 124,55 𝑡/ℎ𝑎 �̂�1 = 97,20 𝑡/ℎ𝑎 4) Contrastes que abrangem 3 média: �̂�4 = �̂�5 − �̂�1 = 34,55 𝑡/ℎ𝑎 40 Planejamento de Experimentos em Engenharia Ambiental 𝐷3 = 𝑧3. 𝑠 √𝑟 = 3,23. 16,91 √4 = 27,31 𝑡/ℎ𝑎 Como �̂�4 > 𝐷3, o teste é significativo ao nível de 5% de probabilidade, rejeitamos H0 e concluímos que �̂�5 ≠ �̂�1. 5) Contrastes que abrangem 2 médias: �̂�5 = �̂�4 − �̂�1 = 27,35 𝑡/ℎ𝑎 𝐷2 = 𝑧2. 𝑠 √𝑟 = 3,08. 16,91 √4 = 26,04 𝑡/ℎ𝑎 Como �̂�5 > 𝐷2 , o teste é significativo ao nível de 5% de probabilidade, rejeitamos H0 e concluímos que �̂�4 ≠ �̂�1. Portanto, o resultado final do teste pode ser representado da seguinte maneira: �̂�3 = 139,65 𝑡/ℎ𝑎 �̂�2 = 135,18 𝑡/ℎ𝑎 �̂�5 = 131,75 𝑡/ℎ𝑎 �̂�4 = 124,55 𝑡/ℎ𝑎 �̂�1 = 97,20 𝑡/ℎ𝑎 Conclusão: As médias ligadas por uma mesma barra não diferem entre si pelo teste de Duncan, ao nível de 5% de probabilidade. 3.8. TESTE DE SCHEFFÉ Quando, numa análise de variância, encontramos um valor significativo para o Teste F, isto nos indica a existência de pelo menos um contraste significativo entre as médias dos tratamentos. O Teste de Scheffé se presta para testar contrastes, mesmo que estabelecidos “a posterion”. É um teste mais rigoroso que o Teste t, porém é mais flexível, pois não exigeque os contrastes seja estabelecidos “a príon”, nem mesmo que sejam ortogonais entre si. Deve ser aplicado 41 Planejamento de Experimentos em Engenharia Ambiental apenas nos casos em que o Teste F para tratamentos na análise de variância, seja significativo. Sua aplicação é recomendada para contrastes que envolvam mais de duas médias. A estatística do teste é: 𝑆 = √(𝐼 − 1). 𝐹. �̂�(�̂�), onde, 𝐼 − 1 = nº de g.l. de tratamentos F = valor da tabela da distribuição F, ao nível 𝛼 de probabilidade (𝛼 = 0,05), em função do nº de g.l. de tratamentos pelo número de g.l. do resíduo. Critério do Teste: Se |�̂�| ≥ S, dizemos que o contraste é significativo ao nível de 𝛼 de probabilidade. Se |�̂� | < S, dizemos que o contraste é não significativo ao nível de 𝛼 de probabilidade. EXEMPLO DE APLICAÇÃO: Para exemplificar a aplicação do Teste de Scheffé, vamos utilizar os dados do exemplo utilizado no teste F, onde: �̂�1 = 97,20 t/ha �̂�2= 135,18 t/ha �̂�3= 139,65 t/ha s2 = QMRes = 286,1137 �̂�4= 124,55 t/ha r = 4 �̂�5= 131,75 t/ha Supondo que se deseja testar o contraste: �̂� = 4�̂�1 − �̂�2 − �̂�3 − �̂�4 − �̂�5, 42 Planejamento de Experimentos em Engenharia Ambiental que corresponde a verificar se a média do tratamento LAd+iodo difere das médias dos outros tratamentos, temos: �̂� = 4(97,20) - 135,18 - 139,65 - 124,55 - 131,75 �̂� = -142,33 �̂�(�̂�) = [ 42 + (-1)2 + (-1)2 +(-1)2 +(-1)2 ] 286,1137 4 = 1430,5685 Ftab(4g.l.Trat.x12g.l.Res.,5%) = 3,26 Portanto, a estatística do teste será: S = √(𝐼 − 1). 𝐹. �̂�(�̂�) = √(5 − 1). 3,26 . 1430,5685 = √18654,61 = 136,58 t/ha Então, como |�̂�| > S, o contraste é significativo ao nível de 5% de probabilidade, indicando que devemos rejeitar H0, e concluir que, em média, o grupo de outros tratamentos apresenta uma eficiência maior que o LAd+iodo . 4. DELINEAMENTO INTEIRAMENTE CASUALIZADO 4.1. CARACTERIZAÇÃO O delineamento inteiramente casualizado é o mais simples de todos os delineamentos experimentais, e os experimentos instalados de acordo com este delineamento são chamados de experimentos inteiramente casualizados ou Experimentos Inteiramente ao Acaso. Este delineamento apresenta as seguintes características: 1) Leva em conta apenas os princípios da repetição e da casualização, deixando de lado o principio do controle local e, portanto, as repetições não são organizadas em blocos. 2) Os tratamentos são designados às parcelas de forma inteiramente casual, com qualquer número de repetições. As principais vantagens desse delineamento são as seguintes: 43 Planejamento de Experimentos em Engenharia Ambiental 1) Proporciona grande flexibilidade de trabalho, pois podemos utilizar qualquer número de tratamentos e de repetições, e o número de repetições pode variar de um tratamento para outro, sem causar sérios problemas na análise. 2) Nos proporciona o maior número possível de graus de liberdade para o resíduo. As principais desvantagens desse delineamento são: 1) Exige homogeneidade das parcelas experimentais. 2) Geralmente nos conduz a uma estimativa bastante alta para a variância residual, tendo em vista que todas as variações, exceto aquela devido ao efeito de tratamentos, são tomadas como variação do acaso. Para a instalação desses experimentos, devemos ter certeza da homogeneidade das condições experimentais. Este delineamento é bastante utilizado em ensaios de laboratório e em ensaios com vasos, realizados dentro de casas de vegetação, em que as condições experimentais podem ser perfeitamente controladas. A distribuição casual dos tratamentos a todas as parcelas do experimento é a principal característica deste delineamento. Por exemplo, num experimento no delineamento inteiramente casualizado com 5 tratamentos e 4 repetições, a casualização dos tratamentos seria feita sorteando-se para cada uma das 20 parcelas do experimento uma combinação de tratamento e repetição. Assim, um sorteio para distribuição dos tratamentos às parcelas poderia ser o seguinte: B4 D1 B1 A2 D4 D2 A1 C4 D3 B3 E1 E3 B2 A3 C2 A4 C1 E4 C3 E2 44 Planejamento de Experimentos em Engenharia Ambiental 4.2. MODELO MATEMÁTICO Todo delineamento experimental possui um modelo matemático que o representa. Para podermos efetuar a análise de variância de um experimento em um determinado delineamento, devemos levar em conta o modelo matemático desse delineamento e aceitar algumas hipóteses básicas necessárias para a validade da análise. No caso do delineamento inteiramente casualizado, que é o mais simples de todos, tendo como causas de variação, apenas o efeito de tratamentos e o efeito do acaso, o modelo matemático é o seguinte: 𝑥𝑖𝑗 = 𝑚 + 𝑡𝑖 + 𝑒𝑖𝑗. onde, 𝑥𝑖𝑗 é o valor observado na parcela que recebeu o tratamento i na repetição j, m é a média geral do experimento, 𝑡𝑖 é o efeito devido ao tratamento i, que foi aplicado à parcela, 𝑒𝑖𝑗 é o efeito dos fatores não controlados na parcela que recebeu o tratamento i na repetição j. 4.3. HIPÓTESES BÁSICAS PARA APLICAÇÃO DA ANÁLISE DE VARIÂNCIA As hipóteses básicas que devemos admitir para tornar válida a aplicação da análise de variância são as seguintes: 1) Aditividade: Os efeitos dos fatores que ocorrem no modelo matemático devem ser aditivos. 2) Independência: Os erros ou desvios 𝑒𝑖𝑗, devido aos efeitos dos fatores não controlados devem ser independentes. 3) Homocedasticidade ou Homogeneidade de Variâncias: Os erros ou desvios 𝑒𝑖𝑗, devido aos efeitos dos fatores não controlados ou acaso, devem possuir uma variância comum 𝜎2. 4) Normalidade: Os erros ou desvios 𝑒𝑖𝑗, devido aos efeitos dos fatores não controlados ou acaso, devem possuir distribuição normal de probabilidades. 45 Planejamento de Experimentos em Engenharia Ambiental Porém, nem sempre estas condições são todas satisfeitas, o que nos obriga a utilizar certas metodologias específicas que contornam satisfatoriamente o problema. Um dos casos mais frequentes é o da heterogeneidade de variâncias. Neste caso, na maioria das vezes, uma transformação adequada contorna o problema e permite a aplicação do método da analise de variância. As transformações mais utilizadas são: 1) Raiz quadrada: 𝑦 = √𝑥 Geralmente utilizada para dados de contagem, que frequentemente seguem a distribuição de Poisson, em que a média e a variância são iguais. Por exemplo, número de microrganismos em uma cultura, número de árvores cortadas por parcela, número de metais pesados presentes em um rio, etc. Quando ocorrem valores nulos ou valores baixos, é mais recomendável utilizar as transformações √𝑥 + 0,5 ou √𝑥 + 1 respectivamente. 2) Arco Seno: y=arcoseno√ 𝑥 100 Esta transformação é recomendável para dados de porcentagem, proveniente de contagem, que geralmente seguem a distribuição binomial, como por exemplo: % de espécies monitoradas, % de eficiência de enzimas no tratamento de resíduos, etc. 3) Transformação Logarítmica: y= log(x) Utilizada quando é constatada uma certa proporcionalidade entre as médias e os desvios padrões dos diversos tratamentos. Por exemplo, no caso de contagens de áreas desmatadas, se as áreas desmatadassão númerosas, as contagens serão altas para a testemunha e para os tratamentos que não controlam o desmatamento, enquanto que, para os tratamentos que controlam o desmatamento, a amplitude será baixa. Quando entre as contagens existem zeros, deve-se utilizar a transformação log(x+1). 46 Planejamento de Experimentos em Engenharia Ambiental 4.4. OBTENÇÃO DA ANÁLISE DE VARIÂNCIA Para a obtenção da análise de variância, vamos considerar um experimento inteiramente casualizado com I tratamentos e J repetições. Os valores observados que se referem à característica em estudo, podem ser agrupados num quadro como o seguinte: Tratamento Repetições Total 1 2 ... j ... J 1 𝑥11 𝑥12 ... 𝑥1𝑗 ... 𝑥1𝐽 𝑇1 =∑𝑥1𝐽 𝐽 𝑗=1 2 𝑥21 𝑥22 ... 𝑥2𝑗 ... 𝑥2𝐽 𝑇2 =∑𝑥2𝐽 𝐽 𝑗=1 ... ... ... ... ... ... ... ... i 𝑥𝑖1 𝑥𝑖2 ... 𝑥𝑖𝑗 ... 𝑥𝑖𝐽 𝑇1 =∑𝑥𝑖𝑗 𝐽 𝑗=1 ... ... ... ... ... ... ... ... I 𝑥𝐼1 𝑥𝐼2 ... 𝑥𝐼𝑗 ... 𝑥𝐼𝐽 𝑇1 =∑𝑥𝐼𝐽 𝐽 𝑗=1 Total 𝐺 =∑∑𝑥𝑖𝑗 𝐽 𝑗=1 𝐼 𝑖=1 De acordo com o modelo matemático deste delineamento, o valor observado na parcela que recebeu o tratamento i, na repetição j é representado por: 𝑥𝑖𝑗 = 𝑚 + 𝑡𝑖 + 𝑒𝑖𝑗. O método utilizado para obtenção da análise de variância é chamado de método dos mínimos quadrados, e consiste em minimizar a soma dos quadrados dos erros 𝑒𝑖𝑗. Então, de acordo com o método dos mínimos quadrados, temos: 47 Planejamento de Experimentos em Engenharia Ambiental 𝑒𝑖𝑗 = 𝑥𝑖𝑗 −𝑚 − 𝑡𝑖 𝑒𝑖𝑗 2 = (𝑥𝑖𝑗 −𝑚 − 𝑡𝑖) 2 ∑ ∑ 𝑒𝑖𝑗 2 = ∑ ∑ (𝑥𝑖𝑗 −𝑚 − 𝑡𝑖) 2𝐽 𝑗=1 𝐼 𝑖=1 𝐽 𝑗=1 𝐼 𝑖=1 . Fazendo 𝑧 = ∑ ∑ 𝑒𝑖𝑗 2𝐽 𝑗=1 𝐼 𝑖=1 , temos: 𝜕𝑧 𝜕𝑚 = −2.∑∑(𝑥𝑖𝑗 −𝑚 − 𝑡𝑖) 𝐽 𝑗=1 𝐼 𝑖=1 𝜕𝑧 𝜕𝑚 = −2. [∑∑𝑥𝑖𝑗 𝐽 𝑗=1 − 𝐼𝐽𝑚 − 𝐽∑𝑡𝑖 𝐼 𝑖=1 𝐼 𝑖=1 ] 𝜕𝑧 𝜕𝑡𝑖 = −2.∑(𝑥𝑖𝑗 −𝑚 − 𝑡𝑖) 𝐽 𝑗=1 , (𝑖 = 1,2, … , 𝐼) Fazendo 𝜕𝑧 𝜕𝑚 = 0 e 𝜕𝑧 𝜕𝑡𝑖 = 0, temos: { ∑∑𝑥𝑖𝑗 𝐽 𝑗=1 − 𝐼𝐽�̂� − 𝐽∑�̂�𝑖 𝐼 𝑖=1 = 0 𝐼 𝑖=1 ∑𝑥𝑖𝑗 𝐽 𝑗=1 − 𝐽�̂� − 𝐽�̂�𝑖 = 0 Impondo a restrição de que ∑ �̂�𝑖 𝐼 𝑖=1 = 0, temos: { ∑∑𝑥𝑖𝑗 𝐽 𝑗=1 − 𝐼𝐽�̂� = 0 𝐼 𝑖=1 ∑𝑥𝑖𝑗 𝐽 𝑗=1 − 𝐽�̂� − 𝐽�̂�𝑖 = 0 Então, �̂� = ∑ ∑ 𝑥𝑖𝑗 𝐽 𝑗=1 𝐼 𝑖=1 𝐼𝐽 = 𝐺 𝐼𝐽 e, 48 Planejamento de Experimentos em Engenharia Ambiental 𝐽�̂� + 𝐽�̂�𝑖 =∑𝑥𝑖𝑗 𝐽 𝑗=1 𝐽�̂�𝑖 =∑𝑥𝑖𝑗 𝐽 𝑗=1 − 𝐽�̂� �̂�𝑖 = ∑ 𝑥𝑖𝑗 𝐽 𝑗=1 𝐽 − �̂�. Mas, como 𝑇𝑖 = ∑ 𝑥𝑖𝑗 𝐽 𝑗=1 , temos: �̂�𝑖 = 𝑇𝑖 𝐽 − �̂�. Podemos agora obter as somas de quadrados: 1) Soma de Quadrados Total: SQTotal- É definida como a soma dos quadrados dos devidos em relação à média aritmética. Então, SQtotal =∑∑(𝑥𝑖𝑗 − �̂�) 2 𝐽 𝑗=1 𝐼 𝑖=1 =∑∑(𝑥𝑖𝑗 2 − 2�̂�𝑥𝑖𝑗 + �̂� 2) 𝐽 𝑗=1 𝐼 𝑖=1 =∑∑𝑥𝑖𝑗 2 𝐽 𝑗=1 𝐼 𝑖=1 − 2�̂�∑∑𝑥𝑖𝑗 𝐽 𝑗=1 + 𝐼𝐽�̂�2 𝐼 𝑖=1 =∑∑𝑥𝑖𝑗 2 𝐽 𝑗=1 𝐼 𝑖=1 − 2�̂�𝐺 + 𝐼𝐽�̂�2 =∑∑𝑥𝑖𝑗 2 − 2 𝐺 𝐼𝐽 . 𝐺 + 𝐼𝐽 𝐺2 (𝐼𝐽)2 𝐽 𝑗=1 𝐼 𝑖=1 =∑∑𝑥𝑖𝑗 2 𝐽 𝑗=1 𝐼 𝑖=1 − 2 𝐺2 𝐼𝐽 + 𝐺2 𝐼𝐽 49 Planejamento de Experimentos em Engenharia Ambiental =∑∑𝑥𝑖𝑗 2 𝐽 𝑗=1 𝐼 𝑖=1 − 𝐺2 𝐼𝐽 ou ainda SQTotal =∑∑𝑥𝑖𝑗 2 − 𝐶 𝐽 𝑗=1 𝐼 𝑖=1 onde, 𝐶 = 𝐺2 𝐼𝐽 . 2) Soma de Quadrados de Tratamentos: SQTrat- É definida como a soma dos quadrados dos efeitos dos tratamentos. Então: SQTrat = 𝐽�̂�1 2 + 𝐽�̂�2 2 +⋯+ 𝐽�̂�𝐼 2 = 𝐽(�̂�1 2 + �̂�2 2 +⋯+ �̂�𝐼 2 ) = 𝐽 [( 𝑇1 𝐽 − �̂�) 2 + ( 𝑇2 𝐽 − �̂�) 2 +⋯+ ( 𝑇𝐼 𝐽 − �̂�) 2 ] = 𝐽 [( 𝑇1 2 𝐽2 − 2�̂� 𝑇1 𝐽 + �̂�2) + ( 𝑇2 2 𝐽2 − 2�̂� 𝑇2 𝐽 + �̂�2) +⋯+ ( 𝑇𝐼 2 𝐽2 − 2�̂� 𝑇𝐼 𝐽 + �̂�2)] = [( 𝑇1 2 𝐽 + 𝑇2 2 𝐽 + ⋯+ 𝑇𝐼 2 𝐽 ) − 2�̂�(𝑇1 + 𝑇2 +⋯+ 𝑇𝐼) + 𝐼𝐽�̂� 2] = 1 𝐽 [𝑇1 2 + 𝑇2 2 +⋯+ 𝑇𝐼 2] − 2�̂�𝐺 + 𝐼𝐽 𝐺2 (𝐼𝐽)2 SQTrat = 1 𝐽 [𝑇1 2 + 𝑇2 2 +⋯+ 𝑇𝐼 2] − 𝐺2 𝐼𝐽 ou ainda: SQTrat = 1 𝐽 ∑𝑇𝑖 2 − 𝐶 𝐼 𝑖=1 50 Planejamento de Experimentos em Engenharia Ambiental 3) Soma de quadrados do resíduo: SQRes SQRes = SQTotal − SQTrat Podemos, a seguir, montar o seguinte quadro de análise de variância: CAUSAS DE VARIAÇÃO GL SQ QM F TRATAMENTOS RESÍDUO I-1 I(J-1) SQTrat SQRes SQTrat/(I − 1) SQRes/[I(𝐽 − 1)] QMTrat/QMRes TOTAL IJ-1 SQTotal HIPÓTESES TESTADAS: H0: ti = 0, i = 1,2, … , I. H1: pelo menos um valor ti ≠ 0. CRITÉRIO DO TESTE: Comparamos o valor de F calculado para tratarmos com o valor de F tabelado em função do número de graus de liberdade de tratamentos e do número de graus de liberdade do resíduo, ao nível α de significância. Se FTrat > FTab, concluímos que o teste é significativo, e portanto, devemos rejeitar H0 e concluir que existe diferença significativa entre os efeitos dos tratamentos testados em relação à característica em estudo. 4.5 EXEMPLO DE APLICAÇÃO Num experimento inteiramente casualizado, estudou-se o efeito de diferentes plantas nativas do Cerrado para fitorremediação de um solo onde há a presença de metais pesados. Foram utilizados como tratamentos, seis plantas diferentes, e os resultados obtidos de absorção (%) de metais pesados por cada planta foram os seguintes: Espécie de Planta Rep.1 Rep. 2 Rep. 3 Rep. 4 Totais Espécie 1 4,81 4,76 4,80 4,33 18,70 51 Planejamento de Experimentos em Engenharia Ambiental Espécie 2 Espécie 3 Espécie 4 Espécie 5 Espécie 6 3,83 3,46 3,73 2,53 3,26 3,31 3,78 3,33 3,10 3,31 3,75 3,81 3,53 3,28 3,40 3,58 4,16 3,88 2,66 2,93 14,47 15,21 14,47 11,57 12,90 Total 87,32 As hipóteses que desejamos testar são: H0: As espécies de plantas testadas possuem efeitos semelhantes sobre a absorção de metais pesados do solo. H1: As espécies de plantas testadas possuem efeitos diferentes sobre a absorção de metais pesados do solo. Cálculo das Somas de Quadrados: a) Soma de Quadrados Total: SQTotal =∑∑𝑥𝑖𝑗 2 𝐽 𝑗=1 𝐼 𝑖=1 − 𝐶 ∑∑𝑥𝑖𝑗 2 𝐽 𝑗=1 𝐼 𝑖=1 = 4,812 + 4,762 + 4,802 +⋯+ 2,932 = 326,2588 C = 𝐺2 𝐼𝐽 = 87,322 6.4 = 317,6993 Portanto, SQTotal = 326,2588 − 317,6993 = 8,5595. b) Soma de Quadrados devido ao efeito de Tratamentos: SQTrat = 1 𝐽 ∑𝑇𝑖 2 − 𝐶 𝐼 𝑖=1 52 Planejamento de Experimentos em Engenharia Ambiental SQTrat = 1 𝐽 [𝑇1 2 + 𝑇2 2 +⋯+ 𝑇𝐼 2] − 𝐺2 𝐼𝐽 SQTrat = 1 4 [18,702 + 14,472 +⋯+ 12,902] − 87,322 6.4 SQTrat = 1 4 [1300,0708] − 317,6993 = 7,3184. c) Soma de Quadrados do Resíduo: SQRes = SQTotal − SQTrat SQRes = 8,5595 − 7,3184 = 1,2411. Então, podemos montar o seguinte quadro de análise de variância: CAUSAS DE VARIAÇÃO GL SQ QM F TRATAMENTOS RESÍDUO 5 18 7,3184 1,2411
Compartilhar