Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA EXPERIMENTAL: ANÁLISE ESTATÍSTICA DE EXPERIMENTOS Versão Preliminar João Gilberto Corrêa da Silva Universidade Federal de Pelotas Instituto de Física e Matemática Departamento de Matemática, Estatística e Computação ESTATÍSTICA EXPERIMENTAL: ANÁLISE ESTATÍSTICA DE EXPERIMENTOS Versão Preliminar João Gilberto Corrêa da Silva Pelotas, 2003 Conteúdo Capítulo Página 1. Delineamentos Experimentais Simples.......................................... 1 2. Discriminação da Variação Atribuível a Tratamentos ................... 51 3. Derivações dos Delineamentos Simples ........................................ 115 4. Experimentos Fatoriais .................................................................. 135 5. Delineamentos com Parcelas Divididas ......................................... 185 6. Análise de Regressão e Correlação Linear Simples ....................... 213 7. Análise de Regressão Linear Múltipla ........................................... 241 8. Pressuposições do Modelo Estatístico: Violações, Implicações, Verificação e Remédios ................................................................. 269 Apêndice – Tabelas ............................................................................. 301 Estatística Experimental. 2. Análise Estatística de Experimentos ii 1 Delineamentos Experimentais Simples Conteúdo 1.1 Introdução ...........................................................................................................................1 1.2 Delineamento Completamente Casualizado .......................................................................3 1.2.1 Igual número de repetições dos tratamentos ..................................................................3 1.2.1.1 Introdução ...............................................................................................................3 1.2.1.2 Estimação dos parâmetros por ponto ......................................................................4 1.2.1.3 Análise da variação ................................................................................................8 1.2.1.4 Teste de hipótese ..................................................................................................10 1.2.2 Diferentes números de repetições dos tratamentos ......................................................19 1.2.2.1 Introdução .............................................................................................................19 1.2.2.2 Estimação dos parâmetros por ponto ....................................................................20 1.2.2.3 Análise da variação ..............................................................................................20 1.3 Delineamento Blocos Casualizados .................................................................................23 1.3.1 Introdução .....................................................................................................................23 1.3.2 Estimação dos parâmetros ............................................................................................24 1.3.3 Análise da variação ......................................................................................................25 1.3.4 Teste de hipótese ..........................................................................................................26 1.4 Delineamento Quadrado Latino .......................................................................................30 1.4.1 Introdução .....................................................................................................................30 1.4.2 Estimação dos parâmetros ............................................................................................32 1.4.3 Análise da variação ......................................................................................................32 1.5 Precisão do experimento ..................................................................................................36 1.6 Mais de Uma Observação por Unidade Experimental .....................................................38 1.6.1 Introdução .....................................................................................................................38 1.6.2 Modelo estatístico .........................................................................................................38 1.6.3 Análise estatística .........................................................................................................39 1.7 Exercícios .........................................................................................................................42 1.8 Exercícios de Revisão ......................................................................................................45 1.1 Introdução Concluída a condução do experimento e estando disponíveis os seus resultados, deve ser procedida a análise estatística desses resultados para a derivação das inferências que constituem o objetivo do experimento. Os procedimentos de análise estatística para a derivação dessas inferências devem basear-se no modelo estatístico que expresse a relação das variáveis respostas com as Estatística Experimental. 2. Análise Estatística de Experimentos 2 características explanatórias e as características estranhas, que foi determinada pela estrutura do experimento. Em experimentos bem planejados, o modelo estatístico e esses correspondentes procedimentos de análise estatística são previstos no documento escrito do plano do experimento. Nesse texto consideram-se procedimentos de análise estatística univariada, isto é, procedimentos apropriados para a análise estatística individual de variáveis respostas. Esses procedimentos de inferência são apropriados quando as variáveis respostas relevantes são de interesse individual e não apresentam estrutura de relação importante. Nessas circunstâncias as inferências relevantes para a consecução dos objetivos do experimento podem ser derivadas a partir das análises individuais dessas variáveis respostas. Essa situação é muito frequente. De fato, em muitos experimentos, as variáveis respostas têm diferentes níveis de importância e as mais importantes, que devem ser submetidas à análise estatística, não apresentam relação estrutural relevante, de modo que podem ser consideradas individualmente. Deve ser observado, entretanto, que, mesmo nessa situação, procedimentos de análise estatística multivariada podem adicionar informações relevantes referentes à variação conjunta de variáveis respostas. Usualmente, é conveniente que a aplicação de procedimentos de inferência estatística seja precedida de uma análise descritiva e exploratória dos resultados do experimento. Essa análise preliminar pode ser útil para: a) inspeção dos dados para a identificação de possíveis falhas e anomalias importantes; b) verificação de possíveis erros de especificação e de violações de pressuposições do modelo estatístico; e c) observação da coerência revelada pelos dados entre as expectativas, particularmente aquelas relacionadas com a hipótese científica, e a verificação empírica. Os procedimentos de inferência estatística são de três tipos: • Estimação por ponto; • Estimação por intervalo - Intervalo de confiança; • Teste de hipótese. O método de estimação por ponto de um parâmetro consiste em determinar para aproximação do valor desconhecido desse parâmetro um valor particular derivado a partir dos valores observados de uma amostra da população objetivo. Esse valor, que é uma função dos valores da amostra, é um estimador por ponto do parâmetro. O valor dessa função determinado a partir de uma amostra particular é uma estimativa por ponto desse parâmetro. A estimativadeterminada para um parâmetro é utilizada como se fosse o verdadeiro valor do parâmetro, sabendo o pesquisador que esse não é o caso. Então, é desejável que o estimador satisfaça algumas propriedades convenientes. As duas propriedades mais importantes são a não tendenciosidade e a variância mínima. Um estimador de um parâmetro é não tendencioso se a média dos valores que ele determina para todas as amostras de tamanho n da população objetivo é o próprio valor do parâmetro. Ele é um estimador não tendencioso de variância mínima, também denominado melhor estimador, se entre todos os estimadores não tendenciosos desse parâmetro ele é o de menor variância. (Naturalmente, em geral, a consideração de todas as amostras de um dado tamanho n de uma população somente pode ser concebida abstratamente, particularmente para populações conceituais.) O método de estimação por intervalo de um parâmetro consiste em determinar para aproximação do valor desconhecido desse parâmetro um intervalo derivado como função dos valores observados de uma amostra da população objetivo que contenha o parâmetro com uma dada probabilidade. Um intervalo determinado com a probabilidade 1-α de conter o valor de 1. Delineamentos Experimentais Simples 3 um parâmetro é um intervalo de confiança para esse parâmetro com coeficiente de confiança 1- α. O método de teste de hipótese referente a um conjunto de parâmetros é um processo de decisão entre duas hipóteses alternativas referentes a esse parâmetro com base nos valores observados de uma amostra; geralmente, uma hipótese que especifica uma forma de relação particular para esses parâmetros e uma hipótese que nega tal relação. Esse Capítulo e o seguinte descrevem e ilustram a aplicação desses métodos de inferência para os delineamentos experimentais simples: completamente casualizados, blocos casualizados e quadrado latino, para a situação de um único fator experimental fixo e ausência de controle estatístico. 1.2 Delineamento Completamente Casualizado 1.2.1 Igual número de repetições dos tratamentos 1.2.1.1 Introdução Considere-se um experimento unifatorial com delineamento completamente casualizado com t tratamentos e com um mesmo número r de repetições para todos os tratamentos. Denote-se por yij o valor observado da variável resposta na unidade experimental correspondente à repetição j do tratamento i (i=1,2,...,t, j=1,2,...,r). Postula que o valor observado yij da variável resposta tem a seguinte expressão: yij = m + ti + eij, j=1,2,...,r; i=1,2,...,t, onde m representa a média geral esperada, ti o efeito diferencial esperado do tratamento i e eij o erro experimental. Em outras palavras, isso significa que m e ti representam, respectivamente, a média geral e o efeito diferencial do tratamento i na população amostrada. Supõe-se que os termos m e ti são constantes populacionais desconhecidas, ou seja, parâmetros, e que o termo eij é uma realização de uma variável aleatória com distribuição normal de média igual a zero e variância σ2, comum para todas as unidades experimentais. Supõe-se, ademais, que os erros experimentais de quaisquer duas unidades experimentais não são correlacionados, ou seja, que a correlação de eij e ei’j’ é nula para i≠i’ ou j≠j’. O propósito do experimento é a derivação de inferências referentes aos parâmetros ti, ou m+ti. Para a situação de modelo fixo, as inferências de interesse são: estimação por ponto e por intervalo, e testes de hipóteses. Para a formulação de expressões correspondentes a conceitos importantes disponham- se os tr valores observados na amostra yij (i=1,2,...,t, j=1,2,...,r) em uma tabela com as observações nas unidades experimentais de cada tratamento em uma mesma linha (Tabela 1.1). Estatística Experimental. 2. Análise Estatística de Experimentos 4 Tabela 1.1. Valores observados da variável resposta em um experimento unifatorial com delineamento completamente casualizado com t tratamentos e r repetições. Tratamento (i) Repetição (j) Soma yi. Média iy . 1 2 ... r 1 y11 y12 ... y1r 1y . 1y . 2 y21 y22 ... y2r 2y . 2y . ... ... ... ... t yt1 yt2 ... ytr ty . ty . O total e a média das observações de cada tratamento estão dispostos na penúltima e na última coluna da Tabela 1.1. A soma e a média das observações do tratamento i são denotadas, respectivamente, por iy . e iy . 1 (i=1,2,...,t), de modo que: r i ij j 1 y y. = = ∑ e i i 1 r y y. .= . O total geral e a média geral da amostra são denotados por y.. e y. . , respectivamente: t i i 1 y y . = = ∑.. e 1 y y..n =. . . onde n = tr é o total de unidades experimentais. 1.2.1.2 Estimação dos parâmetros por ponto O método de estimação por ponto mais usual é o método dos quadrados mínimos. Esse método de estimação consiste em determinar para estimadores dos parâmetros os correspondentes valores possíveis desses parâmetros que tornam mínima a soma dos quadrados dos erros eij = yij – m – ti correspondentes aos valores observados da variável resposta na amostra, yij, i=1,2,...,t, j=1,2,...,r. Assim, os estimadores de quadrados mínimos dos parâmetros m, t1,t2,...,tt são os valores particulares 1 2 tˆ ˆ ˆm̂, t , t , ..., t 2 dos correspondentes conjuntos dos valores possíveis de m,t1,t2, ...,tt, respectivamente, que tornam mínima a função: f(m,t1,t2,...,tt) = t r t r 2 2 ij ij i i 1 j 1 i 1 j 1 e (y m t ) = = = = = − −∑∑ ∑∑ . A minimização dessa função quadrática dos parâmetros m e ti (i=1,2,...,t) pode ser efetuada por sua derivação parcial em relação a cada um dos parâmetros e resolução do sistema de equações que resulta da anulação simultânea dessas derivadas parciais. Esse sistema de 1+t 1 Pontos no lugar de índices denotam soma dos valores da variável resposta em relação aos índices substituídos. A barra acima do símbolo da variável resposta denota média dos valores da variável resposta em relação aos índices substituídos por pontos. 2 Denotam-se os estimadores pelas mesmas letras utilizadas para simbolizar os correspondentes parâmetros distinguindo-os por circunflexo. 1. Delineamentos Experimentais Simples 5 equações a 1+t incógnitas (m,t1,t2, ...,tt) é indeterminado. Impondo a condição 1 2 tˆ ˆ ˆt t ... t 0+ + + = para os estimadores 1 2 tˆ ˆ ˆt , t ,..., t (análoga à condição t1+t2+...+tt=0 imposta para aos correspondentes parâmetros t1, t2,...,tt), obtém-se a seguinte solução única, que constitui o conjunto dos estimadores de quadrados mínimos dos parâmetros: m̂ y= . . , i it̂ y y= −. . ., i=1,2,...,t, onde, conforme definido anteriormente, y.. é a média geral da amostra e iy . é a média dos valores observados para o tratamento i. Assim, o estimador da média da população amostrada é a média da amostra e o estimador do efeito diferencial de um tratamento é o desvio de sua média em relação à média da amostra. Observe-se que: i i i ˆˆ ˆm m t y= + = . , de modo que iy . é o estimador da média populacional do i-ésimo tratamento. O valor estimado (ou valor predito) pelo modelo postulado para a resposta na unidade experimental correspondente à j-ésima repetição do tratamento i é definido como: =+= iji t̂m̂ŷ i im̂ y= = . , i=1,2,...,t, ou seja, a média observada do tratamento nessa unidade experimental. Define-se como resíduo de uma unidade experimental o valor estimado do erro experimental nessa unidade experimental determinado pela expressão do valor observado nessa unidade com os parâmetros substituídos pelos correspondentes estimadores: ij i ij ˆˆ ˆy m t e= + + ij ijy êˆ= + . Então, o resíduo tem a seguinte expressão: ij ij î ˆ ˆe y m t= − − ij ijˆy y= − ij iy y= − . . O estimador de quadrados mínimos da variação atribuível ao erro experimental é a soma dos quadrados dos resíduos: SQ Erro = t r t r 2 2 ij ij i i 1 j 1 i 1 j 1 ê (y y ) = = = = = −∑∑ ∑∑ . . O estimadorda variância atribuível ao erro experimental (variância casual) σ2 é, então: 2 1 t(r 1) s SQ Erro − = , onde t(r-1) é o número de unidades de informação independentes (ou seja, não redundantes) referentes ao erro experimental, usualmente denominado número de graus de liberdade do erro. De modo geral, o número de graus de liberdade associado com a estimativa da variância Estatística Experimental. 2. Análise Estatística de Experimentos 6 casual é o número de unidades experimentais menos o número de parâmetros linearmente independentes do modelo estatístico. Com o delineamento completamente casualizado apenas t dos t+1 parâmetros m, t1, t2,...,tt são linearmente independentes. Exemplo 1.1. Considerem-se os resultados de um experimento que teve como objetivo a comparação de seis cultivares de soja (denotadas por A, B, C, D, E e F), apresentados sobre o croqui do experimento, Figura 1.1. C 46 A 64 E 39 C 48 B 53 D 56 F 46 C 43 F 50 B 51 F 65 C 35 A 59 D 45 D 45 F 59 E 59 B 55 A 50 E 53 E 53 A 63 D 42 B 69 Figura 1.1. Produção de grãos por parcela do experimento de comparação de seis cultivares de soja do Exemplo 1.1, registrada sobre o croqui do experimento. Inicialmente, as observações são arranjadas em uma tabela apropriada para os cálculos (Tabela 1.2) organizada de modo semelhante à Tabela 1.1. (Observe-se que a ordem das repetições de cada tratamento é irrelevante.) Tabela 1.2. Resultados do experimento do Exemplo 1.1 dispostos em uma tabela apropriada para a execução da análise estatística. Tratamento (i) Repetição (j) Soma .iy Média .iy i t̂ 1 2 3 4 1 - A 64 59 50 63 236 59 7 2 - B 53 51 55 69 228 57 5 3 - C 46 48 43 35 172 43 -9 4 - D 56 45 45 42 188 47 -5 5 - E 39 59 53 53 204 51 -1 6 - F 46 50 65 59 220 55 3 Total geral: y.. =1.248 0 Média geral: y. . =52 As somas e médias de tratamentos são facilmente calculadas e preenchidas nas colunas próprias da Tabela 1.2. O total geral e a média geral dos resultados do experimento estão ao pé desta tabela. Assim, por exemplo, 1. Delineamentos Experimentais Simples 7 y1. = y11 + y12 + y13 + y14 = 64 + 59 + 50 + 63 = 236, donde: 1 i. 1 1 4r y y 236 59= = =. , y.. = y1. + y2. + ... + y6. = 236 + 228 + ... + 220 = 1.248 e 1 1 24tr y y 1.248 52= = =.. . . . As estimativas das médias esperadas dos tratamentos e da média esperada do experimento estão assim determinadas, já que i im̂ y= . e m̂ y= . . . As estimativas dos efeitos esperados dos tratamentos são, então, imediatamente determinadas e preenchidas na última coluna da tabela; por exemplo: 1 1t̂ y y= −. .. = 59-52 = 7. A soma dessas estimativas é nula. O valor estimado da variável resposta para a parcela correspondente à repetição 1 do tratamento 1 é: 11 1 1 ˆˆŷ m t y 59= + = =. . O resíduo para esta mesma parcela é, então: 11 11 1ê y y 64 59 5= − = − =. . Os valores estimados e os resíduos assim determinados para todas as parcelas do experimento são apresentados na Tabela 1.3, ao lado dos valores observados. Note-se que a soma dos resíduos é nula para cada tratamento. Tabela 1.3. Valores observados, valores estimados e resíduos das parcelas do experimento do Exemplo 1.1. Valor observado Valor estimado Resíduo Trat. Repetição Trat. Repetição Trat. Repetição 1 2 3 4 1 2 3 4 1 2 3 4 1 64 59 50 63 1 59 59 59 59 1 5 0 -9 4 2 53 51 55 69 2 57 57 57 57 2 -4 -6 -2 12 3 46 48 43 35 3 43 43 43 43 3 3 5 0 -8 4 56 45 45 42 4 47 47 47 47 4 9 -2 -2 -5 5 39 59 53 53 5 51 51 51 51 5 -12 8 2 2 6 46 50 65 59 6 55 55 55 55 6 -9 -5 10 4 A estimativa da variação casual, ou seja, a soma dos quadrados dos resíduos é, então: SQ Erro = 52 +02 +(-9)2 +...+42 = 972; donde se obtém a estimativa da variância casual: 2 1 1 186(4 1) s SQ Erro 972 54 − = = = . Estatística Experimental. 2. Análise Estatística de Experimentos 8 1.2.1.3 Análise da variação Os procedimentos para os testes de hipóteses referentes aos parâmetros do modelo são baseados na análise da variação. A análise da variação é o procedimento algébrico que consiste em decompor a variação total das observações em componentes atribuíveis às fontes de variação sistemáticas no experimento (ou seja, fatores e variáveis estranhas controladas) e ao erro experimental. Tais componentes correspondem exatamente aos termos considerados na equação do modelo estatístico, excluída a média geral esperada do experimento. Assim, em experimento unifatorial com delineamento completamente casualizado, a variação total é decomposta em duas fontes: tratamento e erro. De fato, substituindo os parâmetros pelos respectivos estimadores na equação do modelo para a observação na parcela correspondente à j-ésima repetição do tratamento i, obtém-se: ijiij êt̂m̂y ++= , donde: ijiij êt̂m̂y +=− , isto é, ij i ij ˆ ˆy y t e− = +.. = i . ij i(y y ) (y y )= − + −. . . . Dessa forma, o desvio da observação em relação à média geral (desvio total da observação) é a soma do efeito estimado do tratamento e do resíduo na parcela. Elevando ambos os membros ao quadrado, obtém-se: 2 2 2 ij i . ij i i ij i(y y ) (y y ) (y y ) 2(y y )(y y )− = − + − + − −.. .. . . . . . . Somando ambos os membros para todas as observações (isto é, para todos os valores dos índices), resulta: t r t t r 2 2 2 ij i ij i i 1 j 1 i 1 i 1 j 1 (y y ) r (y y ) (y y ) = = = = = − = − + −∑∑ ∑ ∑∑.. . .. . , já que a soma correspondente ao último termo é nula e: t r r t t 2 2 2 i i i i 1 j 1 j 1 i 1 i 1 (y y ) (y y ) r (y y ) = = = = = − = − = − ∑∑ ∑ ∑ ∑. . . . .. . .. . A penúltima equação é a equação fundamental da análise da variação para o delineamento completamente casualizado. Ela exprime a variação total dos valores observados da variável resposta como a soma da variação atribuível aos efeitos de tratamentos e da variação atribuível ao erro experimental. Seu primeiro membro é denominado soma de quadrados total e os dois termos do segundo membro, respectivamente, soma de quadrados de tratamento e soma de quadrados do erro. Simbolicamente, essa equação pode ser expressa na forma: SQ Total = SQ Tratamento + SQ Erro. Correspondentemente, os n-1 graus de liberdade referentes às n=tr observações do experimento são decompostos em t-1 graus de liberdade para os t tratamentos e tr-1-(t-1) = t(r- 1) graus de liberdade para o erro: tr-1 = t-1 + t(r-1). 1. Delineamentos Experimentais Simples 9 A decomposição da variação total é usualmente apresentada em uma tabela, denominada tabela da análise da variação, Tabela 1.4. Tabela 1.4. Esquema da análise da variação para experimento unifatorial completamente casualizado com igual número de repetições dos tratamentos. Fonte de variação GL SQ Tratamento t-1 SQ Trat. = t 2 i i 1 r (y y ) = −∑ . .. Erro t(r-1) SQ Erro = t r 2 ij i i 1 j 1 (y y ) = = −∑∑ . Total tr-1 SQ Total = t r 2 ij i 1 j 1 (y y ) = = −∑∑ .. Os quocientes das somas de quadrados de tratamento e do erro pelos correspondentes graus de liberdade, nas respectivas linhas da tabela da análise da variação, são denominados quadrados médios, indicados por: QM Tratamento = SQ Tratamento/(t-1) e QM Erro = SQ Erro/t(r-1). As expressões das somas de quadrados da Tabela 1.4 são denominadas fórmulas de definição. Elas são úteis por darem idéia da origem das respectivas fontes de variação que exprimem. Entretanto, para cálculo em calculadoras não programáveis, podem ser mais convenientes as seguintes expressões equivalentes, usualmente denominadas fórmulas de cálculo: SQ Total = t r 2 ij i 1 j 1 y C = = −∑∑ , SQ Tratamento = t 2 i i 1 1 r y C = −∑ . , onde o termo C, denominado termo de correção (para a média),tem a seguinte expressão: 2 t r 2 2 ij i 1 j 1 1 C y y tr y tr 1 tr = = = = = ∑∑ .. . .. A SQ Erro pode ser obtida por diferença: SQ Erro = SQ Total – SQ Tratamento. Exemplo 1.1 (continuação). Para os dados do experimento do Exemplo 1.1 tem-se, utilizando resultados nas Tabelas 1.2 e 1.3: SQ Tratamento = 4[72 +52 +...+32 ] = 760, SQ Erro = 52 +02 +...+42 = 972 e SQ Total = (64-52)2 +(59-52)2 +...+(59-52)2 = 1.732. Esses resultados são apresentados em uma tabela de análise da variação, completada com os graus de liberdade e os quadrados médios, Tabela 1.5. Estatística Experimental. 2. Análise Estatística de Experimentos 10 Tabela 1.5. Tabela da análise da variação para os dados de produção de grãos do experimento do Exemplo 1.1. Fonte de variação GL SQ QM Tratamento 5 760 152 Erro 18 972 54 Total 23 1.732 Esses mesmos resultados podem ser obtidos pelas fórmulas de cálculo, a partir dos resultados na Tabela 1.2, como segue: 21 24 C 1.248 64.896= = , SQ Total = 642 +592 +...+592 - C = = 66.628 - 64.896 = 1.732, SQ Trat. = 4 1 (2362 +2282 +...+2202 ) - C = = 65.656 - 64.896 = 760, SQ Erro = SQ Total – SQ Tratamento = = 1.732 - 760 = 972. 1.2.1.4 Teste de hipótese O processo lógico para a derivação de inferências referentes aos efeitos dos tratamentos num experimento é a comparação de duas fontes de variação: 1) variação entre as unidades experimentais com diferentes tratamentos, atribuível ao erro experimental e aos efeitos dos tratamentos, se existentes, e 2) variação entre as unidades experimentais com um mesmo tratamento - atribuível exclusivamente ao erro experimental. Se a primeira fonte de variação revela-se consideravelmente superior à segunda, de modo a não poder tal superioridade ser atribuível apenas às distintas formas de estimação do erro experimental, então, o experimento evidencia a existência de efeitos diferenciais reais de tratamentos. A hipótese científica de um experimento é formulada positivamente, na forma genérica: “os efeitos dos tratamentos sobre a variável resposta diferem”. De modo geral, duas diferentes formas de estimar o erro experimental conduzirão a diferentes estimativas, mesmo na ausência de efeitos diferenciais de tratamentos. Por essa razão, o procedimento estatístico para o teste de uma hipótese científica consiste em iniciar com a formulação de uma versão negativa dessa hipótese, ou seja, com uma hipótese da forma: “os efeitos dos tratamentos não diferem”. Então, se a variação entre as unidades experimentais com diferentes tratamentos se revela consideravelmente superior à variação entre as unidades experimentais com um mesmo 1. Delineamentos Experimentais Simples 11 tratamento, essa hipótese é rejeitada, concluindo-se pela existência de diferenças reais entre os efeitos de tratamentos. A hipótese estatística compreende o conjunto de duas hipóteses - a hipótese de negação: “os efeitos dos tratamentos não diferem”, denominada hipótese de nulidade, e a hipótese complementar, ou seja: “os efeitos dos tratamentos diferem”, denominada hipótese alternativa. Essas duas hipóteses são usualmente denotadas simbolicamente por H0 e HA, respectivamente. A hipótese estatística (ou seja, as hipóteses de nulidade e alternativa) referente à existência de efeitos diferenciais esperados dos tratamentos, pode ser simbolicamente formulada como segue: H t i t H t para tratamento i A i 0 0 1 2 0 : , , ,..., : , = = ≠ algum Dada a relação mi = m + ti, i=1,2,...t, e a condição imposta aos parâmetros t1+t2+...+tt=0, essa hipótese estatística pode ser alternativamente expressa em termos das médias esperadas (populacionais) dos tratamentos, na forma: ′= === iei,stratamentodosparummenospelopara,mm:H m...mm:H 'iiA t210 Procedimento para o teste da hipótese referente aos efeitos dos tratamentos O quadrado médio de uma fonte de variação é a variação atribuível a esta fonte referente a uma unidade de informação independente provida pelo experimento, ou seja, é o quociente da correspondente soma de quadrados pelos respectivos graus de liberdade. Então, os quadrados médios correspondentes ao erro experimental e aos efeitos de tratamentos são, respectivamente, QM Erro = SQ Erro ÷ GL Erro e QM Tratamento = SQ Tratamento ÷ GL Tratamento. Demonstra-se que o valor populacional estimado pelo QM Erro é a variância do erro experimental, ou variância casual, ou seja, que: E(QM Erro) = σ2, o que significa que o QM Erro é um estimador não tendencioso da variância casual σ2. Também pode ser demonstrado que: E(QM Tratamento) = t 2 2 i i 1 r t 1 t = − σ + ∑ . Isso significa que o QM Tratamento é um estimador tendencioso da variância casual σ2, com viés não negativo t 2 i i 1 r t 1 t = − ∑ . O QM Tratamento será um estimador não tendencioso de σ 2 se e somente se 0t t 1i 2 i =∑ = , ou seja, se e somente se ti=0, i=1,2,...,t, pois nesse caso, E(QM Tratamento) = σ2. Esta condição corresponde à hipótese de nulidade H0. Demonstra-se, também, que: 2 (r 1)QM Erro V − σ = Estatística Experimental. 2. Análise Estatística de Experimentos 12 tem distribuição qui-quadrado com t(r-1) graus de liberdade, denotada por 2 )1(t r−χ , e que, sob a hipótese de nulidade H0: 2 (t 1)QM Tratamento U − σ = tem distribuição qui-quadrado com t-1 graus de liberdade, ou seja, 2 1t−χ . Ademais, QM Erro e QM Tratamento são estatisticamente independentes. O quociente de duas variáveis aleatórias com distribuições qui-quadrado independentes é uma variável aleatória com distribuição F, ou seja: Se U e V são variáveis aleatórias independentes com distribuições qui-quadrado com ν1 e ν2 graus de liberdade, respectivamente, então, a variável aleatória F = 2 1 /V /U ν ν tem distribuição F com ν1 e ν2 graus de liberdade, o que é denotado por 21, F νν . Logo, no presente caso, a estatística: F = 2 1 /V /U ν ν = = ErroQM TratamentoQM tem distribuição Ft-1,t(r-1). A função densidade de probabilidade de uma variável aleatória F com esta distribuição tem a representação gráfica da forma ilustrada na Figura 1.2. (Recorde-se que a probabilidades da ocorrência de valores de uma variável aleatória em um intervalo correspondem à área sob a curva de sua função de densidade de probabilidade compreendida entre os extremos desse intervalo; a área total sob a curva é igual a 1, o que significa a certeza da ocorrência de algum valor da variável aleatória). Figura 1.2. Representação gráfica da distribuição F. Observe-se, entretanto, que, se a hipótese de nulidade H0 não é verdadeira, então, o QM Tratamento superestima a variância do erro σ2. Nesse caso, a estatística: F = ErroQM TratamentoQM 1. Delineamentos Experimentais Simples 13 não tem distribuição F. Nessa situação; esta estatística tem distribuição F não central com parâmetro de não centralidade ∑ = σ t 1i 22 i /tr . Probabilidades de valores desta estatística F não central situadas na cauda direita são superiores às probabilidades de valores da variável aleatória F na correspondente cauda. As representações gráficas das funções de densidade de probabilidade destas duas estatísticas são ilustradas na Figura 1.3. Figura 1.3. Representação gráfica da distribuição da estatística F sob a hipótese H0 (distribuição F central - linha contínua) e da distribuição F sob a hipótese HA (distribuição F não central - linha tracejada). O teste de hipótese é um processo de decisão sob incerteza. O pesquisador não sabe qual das duas hipóteses H0 e HA é a correta, exprimindo a verdadeira situação. Com base na evidência provida pelo experimento, ele deve decidir em favor de H0 ou de HA. Uma das quatro seguintes situações pode resultar desse processo de decisão: a hipótese H0 é a verdadeira situação e o pesquisador decide em favor desta hipótese ou em favorda hipótese alternativa, ou a hipótese HA é verdadeira e o pesquisador decide em favor desta hipótese ou em favor da hipótese de nulidade. Se a decisão do pesquisador coincidir com a verdadeira situação, a decisão será correta; caso contrário, a decisão será incorreta. Nessas circunstâncias, a decisão derivada poderá ser correta ou incorreta (o que o pesquisador jamais saberá!). Há duas possibilidades de decisão correta e duas possibilidades de decisão incorreta, conforme é mostrado na Tabela 1.6. Tabela 1.6. Decisões alternativas que podem resultar do processo de teste de uma hipótese estatística. Verdadeira situação Decisão H0 HA H0 Correta Incorreta Erro tipo I HA Incorreta Erro tipo II Correta Estatística Experimental. 2. Análise Estatística de Experimentos 14 O erro que corresponde à decisão incorreta de rejeitar a hipótese de nulidade quando ela exprime a situação real (ou seja, na presente circunstância, declarar a existência de diferenças entre os efeitos de tratamentos quando estes são iguais) é denominado erro tipo I . A probabilidade desse erro em um teste de hipótese é denotada pela letra grega α. O outro erro de decisão, correspondente a aceitar a hipótese de nulidade quando a alternativa exprime a realidade (ou seja, no presente caso, declarar os efeitos de tratamentos iguais quando eles realmente diferem) é denominado erro tipo II ; sua probabilidade é denotada pela letra grega β. Muito frequentemente, o pesquisador tem a expectativa da presença de efeitos reais de tratamentos e executa o experimento para comprovar essa expectativa objetivamente. Nessas circunstâncias, o pesquisador deseja que o teste de hipótese atribua probabilidade elevada de declarar a presença de efeitos diferenciais dos tratamentos se esses efeitos forem reais. Essa probabilidade, expressa por 1-β, é denominada potência do teste. Seria desejável a fixação de ambas as probabilidades α e β em valores muito pequenos, próximos de zero. Entretanto, α e β não podem ser ambos escolhidos convenientemente pequenos. De fato, a diminuição de α implica no aumento de β e vice-versa. Então, muito frequentemente, o pesquisador fixa apenas α = Prob.(Erro tipo I) em um valor convenientemente pequeno, mas não demasiadamente pequeno para que β = Prob.(Erro tipo II) não resulte inconvenientemente alta. Um teste de hipótese nessas circunstâncias é denominado teste de significância; o valor α, arbitrariamente escolhido é denominado nível de significância do teste. O argumento desse processo é o seguinte: Se a hipótese H0 é correta, a estatística F tem a distribuição indicada em linha contínua na ilustração da Figura 1.3; caso contrário, a distribuição da estatística F é da forma indicada em linha tracejada, com área sob a curva mais concentrada à direita. Então, se a hipótese H0 é correta, valores da estatística F em uma cauda direita de pequena área são muito pouco prováveis; tais valores elevados de F são mais prováveis se a hipótese correta é a HA. Assim, na ignorância da verdadeira situação (H0 ou HA?), uma regra de decisão natural é a seguinte: Se o valor da estatística F determinado no experimento situa-se em uma área que corresponde uma probabilidade razoavelmente grande (seja 1-α, α pequeno) de sua ocorrência sob a hipótese de nulidade H0 se aceita esta hipótese; caso contrário, ou seja, se o valor da estatística F é elevado, situando-se na área complementar à direita daquela, que corresponde a uma probabilidade de sua ocorrência sob H0 (ou seja, α) consideravelmente pequena, rejeita-se H0 (Figura 1.4). 1. Delineamentos Experimentais Simples 15 Figura 1.4. Região de aceitação e região de rejeição da hipótese H0 do processo de decisão no teste de uma hipótese estatística. O valor de F na fronteira dessas duas áreas, denotado por Fα, demarca duas regiões: (0, Fα): Região de aceitação de H0 e (Fα,∞): Região de rejeição de H0. Assim, o nível de significância α escolhido para um teste de hipótese estabelece como região de rejeição da hipótese de nulidade H0 a cauda superior da distribuição F com área α. A hipótese de nulidade será rejeitada se o valor da estatística F observado no experimento situar-se nessa região; caso contrário, ou seja, se o valor observado de F situar-se na região complementar, à esquerda daquela, denominada região de aceitação, a hipótese H0 será aceita. Claro que com esse processo de decisão sob incerteza o pesquisador corre o risco inevitável de rejeitar a hipótese H0 em situações em que ela é verdadeira (risco ou erro tipo I) com probabilidade α, assim como, também, o risco de aceitar a hipótese H0 quando a alternativa HA é a verdadeira (risco ou erro tipo II), com probabilidade β. As probabilidades desses dois erros de decisão devem ser estabelecidas a priori, ou seja, no plano do experimento. A escolha das probabilidades α e β deve ser feita para cada experimento, com base no julgamento da seriedade relativa dos dois tipos de erro e sabendo que a desejável diminuição de α implica no aumento de β e vice-versa. Em um teste de significância, o pesquisador fixa a probabilidade α de erro tipo I (nível de significância do teste) em um valor convenientemente pequeno (mas não demasiadamente pequeno que implique em valor indesejavelmente grande de β), não determinando a probabilidade β de erro tipo II. O nível de significância α = 0,05 tem sido tradicionalmente adotado, de modo generalizado. Essa escolha implica na admissibilidade da rejeição incorreta da hipótese de nulidade em 5% dos casos. Observe-se que, em geral, a rejeição da hipótese de nulidade H0 é mais forte do que sua aceitação. De fato, a aceitação de H0 pode decorrer de: a) inexistência de diferenças de Estatística Experimental. 2. Análise Estatística de Experimentos 16 efeitos de tratamentos, ou b) insuficiente sensibilidade (precisão) do experimento para revelar diferenças reais de efeitos de tratamentos. Procedimento para o teste de significância O teste de significância dos efeitos de tratamentos (ou da variação atribuível a tratamentos) pode ser efetuado com o auxílio de tabelas de pontos percentuais superiores da distribuição F, que apresentam os valores Fα que demarcam caudas superiores da distribuição F correspondentes a algumas probabilidades (áreas das caudas superiores), mais comumente 0,05, 0,01 e 0,001 (Tabela A1 do Apêndice). Para efetuar o teste de significância com o auxílio dessas tabelas o pesquisador compara o valor da estatística F observado no experimento com o valor Fα tabelado para o nível de significância α escolhido. Se o valor observado de F é superior ao valor Fα da tabela, a hipótese de nulidade H0 é rejeitada, atribuindo-se tal fato a diferenças reais entre os efeitos dos tratamentos. Diz-se, então, que "a variação atribuível aos efeitos de tratamentos foi significativa", ou que "os efeitos de tratamentos foram significativos". Caso contrário, ou seja, se o valor de F observado no experimento é inferior ao valor Fα da tabela, a hipótese H0 é aceita, concluindo-se que a "a variação atribuível aos efeitos de tratamentos não foi significativa", ou que "os efeitos de tratamentos não foram significativos". Naturalmente, a confiabilidade da rejeição da hipótese de nulidade será tanto maior quanto mais elevado for o valor da estatística F observado no experimento. Por isso, em um teste com nível de significância α, alguns textos recomendam a comparação do valor observado de F também com valores de referência da tabela que demarcam áreas superiores da distribuição F menores que α. Assim, na situação mais usual em que o nível de significância (algumas vezes também denominado nível mínimo de significância) escolhido é α = 0,05, se o valor observado Fo de F é maior que o valor de F que demarca a área superior 0,05, ou seja, F0,05, o valor Fo também é comparado com F0,01 e F0,001. Então, a significância da variação atribuível aos efeitos de tratamentos podeser qualificada pela indicação da posição do valor observado Fo relativamente a esses valores F0,05, F0,01 e F0,001 da tabela, ou, equivalentemente, pela indicação do nível de probabilidade alcançado pelo valor observado da estatística F, ou seja, pela indicação da grandeza da área superior P da distribuição F demarcada por Fo relativamente a essas probabilidades 0,05, 0,01 e 0,001 (Figura 1.5). Fo < F0,05 → P > 0,05: não significativa F0,05 < Fo < F0,01 → P < 0,05: significativa F0,01 < Fo < F0,001 → P < 0,01: muito significativa Fo > F0,001 → P < 0,001: altamente significativa Figura 1.5. Qualificação da significância dos efeitos atribuíveis a tratamentos, em testes de significâncias efetuados com o uso de tabelas da distribuição F. O resultado do teste de significância é muito frequentemente indicado na tabela da análise da variação pela colocação, ao lado do valor observado da estatística F, de um dos seguintes símbolos, na ordem das situações alternativas indicadas na Figura 1.5: - (ou ns), *, ** e ***. Alternativamente, pode-se preencher numa última coluna daquela tabela, encabeçada por “P” ou “Prob. > F”, o nível de probabilidade alcançado pelo valor observado da estatística F (>0,05, <0,05, <0,01 e <0,001, respectivamente). 1. Delineamentos Experimentais Simples 17 As facilidades atuais de computação, propiciadas por equipamentos eletrônicos e programas ("pacotes") de análise estatística, permitem a determinação da probabilidade de valores de F superiores a um valor particular F' qualquer da distribuição F. Assim, resultados de análises estatísticas efetuadas com esses recursos informam a probabilidade de um valor de F superior ao valor da estatística F observado no experimento, denotada por Prob.>F, ou, mais simplesmente, por P. Com esse recurso, a decisão do teste de significância é obtida pela comparação do valor Prob.>F determinado para o experimento com o nível de significância α previamente escolhido. Então, se “Prob.>F” < α, rejeita-se a hipótese H0; caso contrário, ou seja, se “Prob.>F” > α, se aceita a hipótese H0 (Figura 1.6). Para esses dois resultados alternativos, a conclusão do teste de significância é, respectivamente: "a variação atribuível a tratamentos foi significativa (P=...)", com a indicação do valor de Prob.>F entre parênteses, e "a variação atribuível a tratamentos não foi significativa (P > α)”. Figura 1.6. Decisão em um teste de significância segundo a grandeza relativa do valor “Prob. > F” e do nível de significância α. A indicação de valores de Prob.>F em publicações técnico-científicas é muito útil por propiciar ao leitor condições para seu próprio julgamento referente à confiabilidade da rejeição ou aceitação da hipótese de nulidade. É importante salientar que não há qualquer razão lógica para o uso generalizado e tradicional do valor α = 0,05 para nível de significância. Essa escolha implica na rejeição incorreta da hipótese de nulidade em 5% dos casos; ou seja, na rejeição incorreta da hipótese H0 em aproximadamente 5 de 100 repetições do experimento. Como a gravidade relativa dos erros tipo I e tipo II varia segundo o experimento, é mais apropriado que o pesquisador estabeleça o nível de significância α (probabilidade do erro tipo I) e, por consequência, a probabilidade β do erro tipo II para cada experimento, segundo sua apreciação da seriedade relativa dos erros tipo I e tipo II para cada caso particular. Exemplo 1.1 (continuação). Considere-se o teste de significância da variação atribuível a cultivares para o experimento do Exemplo 1.1, com nível de significância α=0,05. O valor observado da estatística F é: 152 54 F 2,815== . 1) Uso de valores de F disponíveis em tabelas: Compara-se esse valor observado F=2,815 da estatística F com os valores da estatística F providos pela Tabela A1 do Apêndice, para 5 e 18 graus de liberdade: Estatística Experimental. 2. Análise Estatística de Experimentos 18 5;18 2,77, P 0,05 F (P) 4,25, P 0,01 6,81, P 0,001 = = = = Como o valor observado F=2,815 é superior ao valor F da tabela para P=0,05, ou seja, F5;18(0,05) =2,77, a hipótese de nulidade dos efeitos de cultivares é rejeitada. Entretanto, esse valor observado de F é inferior ao F5;18(0,01) =4,25. Então, a conclusão do teste de significância pode ser expressa, abreviadamente, pela sentença "a variação atribuível aos efeitos de cultivares foi significativa (P=0,05)”. Os resultados da análise da variação e do teste de significância da variação (global) atribuível a cultivares podem ser apresentados na tabela da análise da variação, Tabela 1.7. Tabela 1.7. Resultados da análise da variação e do teste de significância dos efeitos de tratamentos, para os dados do Exemplo 1.1. Fonte de variação GL SQ QM F Tratamento 5 760 152 2,815 * Erro 18 972 54 Total 23 1.732 2) Uso de valores “Prob.>F” providos por computação eletrônica. Compara-se o valor (Prob.>F) =0,0476 com o nível de significância α=0,05, pré-estabelecido. Como o valor (Prob.>F) =0,0476 é inferior a α=0,05, a hipótese de nulidade é rejeitada. A conclusão do teste de significância pode ser expressa, abreviadamente, pela sentença "a variação atribuível aos efeitos de cultivares foi significativa (P=0,0476)". Note-se que, com o primeiro processo de decisão estrito, a hipótese de nulidade é rejeitada pela observação de um valor da estatística F levemente superior ao valor tabelado para P=0,05, e que um valor circunstancial levemente inferior ao valor tabelado (por exemplo, F=2,76) conduziria à aceitação da hipótese de nulidade. Esse processo rígido de decisão não é razoável. Essa é uma razão para a conveniência a adoção do segundo procedimento baseado em resultados providos pelo uso de computadores. O conhecimento da probabilidade da cauda superior limitada pelo valor observado da estatística F e sua indicação na expressão do resultado ou conclusão do teste de significância permite uma apreciação mais adequada do resultado do teste de significância do que a indicação simbólica por meio de asteriscos, baseada apenas em níveis de probabilidade discretos disponíveis em tabelas. No presente exemplo, o processamento da análise da variação e do teste de significância da variação atribuível a cultivares por computador produz os resultados resumidos na Tabela 1.8. 1. Delineamentos Experimentais Simples 19 Tabela 1.8. Resumo da análise da variação e resultado do teste de significância dos efeitos de cultivares processados por um "pacote" de análise estatística. Dados do Exemplo 1.1. Fonte de variação GL SQ QM F Prob.>F Tratamento 5 760 152 2,815 0,0476 Erro 18 972 54 Total 23 1.732 A Figura 1.7 mostra a relação entre os dois processos de teste de significância: a) comparação do valor observado F da estatística F com o valor Fα desta estatística, que limita cauda de área α, e b) comparação da probabilidade de obter um valor da estatística F superior ao valor observado desta estatística, Prob.>F, com o nível de significância α. Figura 1.7. A hipótese H0 é rejeitada porque, para o nível de significância escolhido α=0,05, (F=2,815) > (Fα=2,77) ou, equivalentemente, [(Prob.>F)=0,0476] < α. 1.2.2 Diferentes números de repetições dos tratamentos 1.2.2.1 Introdução No delineamento completamente casualizado o número de repetições pode não ser o mesmo para todos os tratamentos. Números diferentes de repetições podem decorrer do próprio plano do experimento ou da decisão de desconsiderar os resultados de algumas unidades experimentais. A primeira situação pode resultar, por exemplo, de restrições do material experimental, que pode não ser suficiente para o número de repetições desejável para todos os tratamentos (a quantidade de semente disponível para algumas cultivares pode ser escassa, por exemplo), ou da necessidade ou conveniência de adotar números diferentes de repetições paradois ou mais grupos de tratamentos (em algumas circunstâncias, pode ser conveniente um número de repetições mais elevado para o tratamento testemunha, por exemplo). Por outro Estatística Experimental. 2. Análise Estatística de Experimentos 20 lado, ocorrências fortuitas durante a execução do experimento (por exemplo, morte de plantas ou animais, prejuízo causado por agentes estranhos e falta de registro ou registro equivocado de medidas) podem originar fontes de variação estranhas que ficam confundidas com os efeitos de tratamentos. Nestas circunstâncias, pode ser mais conveniente desconsiderar a resposta nas unidades experimentais afetadas, originando-se o que se denomina parcela perdida. Nesse caso, o procedimento de análise estatística resulta ligeiramente alterado. Seja ri o número de repetições do i-ésimo tratamento (i=1,2,...,t). A equação do modelo estatístico para a resposta observada na parcela correspondente à j-ésima repetição do tratamento i é, então, yij = m + ti + eij, j=1,2,...,ri, i=1,2,...,t. As pressuposições referentes aos termos dessa equação, para completar a especificação do modelo estatístico, são as mesmas listadas para a situação de igual número de repetições dos tratamentos. Entretanto, agora, é conveniente impor a seguinte restrição aos efeitos esperados dos tratamentos: r1 t1 +r2 t2 +...+rt tt =0. 1.2.2.2 Estimação dos parâmetros por ponto Os estimadores de quadrados mínimos dos parâmetros têm expressões semelhantes às anteriores, com as adequadas alterações para levar em conta os diferentes números de repetições dos tratamentos: m̂ y= . . e i it̂ y y= −. . . , onde: 1 n y y=. . .. , t i i 1 n r = = ∑ , i rt ij i 1 j 1 y y = = = ∑∑. . e ii i 1 r y y= .. , i r i ij j 1 y y = = ∑. . 1.2.2.3 Análise da variação O esquema da análise da variação, com as fontes de variação e os correspondentes graus de liberdade e expressões de definição e de cálculo das somas de quadrados, é apresentado na Tabela 1.9. 1. Delineamentos Experimentais Simples 21 Tabela 1.9. Esquema da análise da variação para experimento unifatorial completamente casualizado com diferentes números de repetições. Fonte de variação GL SQ Fórmula de definição Fórmula de cálculo 1 Tratamento t-1 t 2 i i i 1 r (y y ) = −∑ . . . i t 2 i i 1 1 y r C = −∑ . Erro ∑ = − t 1i i )1r( irt 2 ij i i 1 j 1 (y y ) = = −∑∑ . Por diferença Total n-1=∑ = − t 1i i 1r irt 2 ij i 1 j 1 (y y ) = = −∑∑ .. irt 2 ij i 1 j 1 y C = = −∑∑ 1 t 2 2 i i 1 y 1 n C n y , onde: n r . = = = = ∑.. .. Exemplo 1.2. Considere-se um experimento que teve como objetivo a avaliação da eficácia do uso do Triclabendazole para o controle da fascíola em bovinos de corte, aplicado em épocas estratégicas, no intervalo do desmame ao abate. O experimento constou dos seguintes tratamentos: 1-Triclabendazole quatro vezes ao ano, 2-Triclabendazole duas vezes ao ano, 3-Controle. O experimento foi conduzido com 32 animais, dos quais 12 foram atribuídos ao tratamento 1, 12 ao tratamento 2 e 8 ao tratamento 3. Os tratamentos foram aplicados aos animais individualmente a partir do desmame e os animais foram mantidos juntos, em um mesmo potreiro. Os dados de peso ao abate, em kg por animal, são apresentados na Tabela 1.10, que inclui as estimativas determinadas para os parâmetros do modelo estatístico. Estatística Experimental. 2. Análise Estatística de Experimentos 22 Tabela 1.10. Resultados do experimento do Exemplo 1.2 - Peso ao abate, em kg/animal. Animal (j) Tratamento (i) 1 2 3 1 366 404 338 2 374 329 369 3 311 384 393 4 358 440 312 5 354 424 374 6 380 339 311 7 449 296 412 8 358 397 464 9 476 467 10 425 383 11 398 367 12 376 362 yi. 4.625 4.592 2.973 y.. = 12.190 .ii ym̂ = 385,42 382,67 371,63 94,380ym̂ .. == ...ii yyt̂ −= 4,48 1,73 -9,31 Como na situação de igual número de repetições dos tratamentos, as somas de quadrados podem ser determinadas por fórmulas de definição ou de cálculo. A determinação das somas de quadrados pelas fórmulas de cálculo é efetuada a seguir: 21 32 C 12.190 4.643.628,13= = , SQ Total = 3662 +3742 +...4642 – C = 4.711.960 - 4.643.628,12 = 68.331,88, SQ Tratamento = 1 12 (4.6252 +4.5922) + 1 8 2.9732 - C = = 3.539.757,42 + 1.104.841,12 - 4.643.628,12 = 970,42. A análise da variação é completada na própria tabela da análise da variação (Tabela 1.11), de modo análogo ao caso em que o número de repetições é igual para todos os tratamentos. 1. Delineamentos Experimentais Simples 23 Tabela 1.11. Análise da variação dos resultados do experimento do Tabela 1.2. Fonte de variação GL SQ QM F Prob.>F Tratamento 2 970,42 485,208 0,2089 0,8127 Erro 29 67.361,46 2.322,809 Total 31 68.331,88 1.3 Delineamento Blocos Casualizados 1.3.1 Introdução Considere-se um experimento em blocos casualizados com t tratamentos e b blocos cujos resultados são dispostos na Tabela 1.12, de dupla-entrada, onde yij representa o valor observado da variável resposta na unidade experimental com o tratamento i no bloco j. Tabela 1.12. Resultados de um experimento unifatorial em blocos casualizados dispostos em uma tabela de dupla-entrada. Tratamento (i) Bloco (j) Soma iy . Média y i. 1 2 ... b 1 y11 y12 ... y1b 1y . 1y . 2 y21 y22 ... y2b 2y . 2y . ... ... ... ... T yt1 yt2 ... ytb ty . ty . Soma (y.j) y.1 y.2 ... y.b y. . Média jy. 1y. 2y. by. y. . Nas duas últimas colunas e nas duas últimas filas da Tabela 1.12 estão as somas e médias de tratamentos e blocos, respectivamente: b i ij j 1 y y = = ∑. , t j ij i 1 y y = = ∑. , i i 1 b y y=. . , j j 1 t y y=. . e, ao pé das duas últimas colunas, estão o total geral e a média geral do experimento, respectivamente: t b i j i 1 j 1 y y y = = = =∑ ∑.. . . , 1 n y y=. . .. , onde n = tb é o número total das unidades experimentais. Estatística Experimental. 2. Análise Estatística de Experimentos 24 1.3.2 Estimação dos parâmetros A estimação dos parâmetros pode ser procedida pelo método dos quadrados mínimos. Esse método de estimação determina como estimadores dos parâmetros os correspondentes valores de m, t1 ,t2 ,..,tt , b1 ,b2 ,...,bb que tornam mínima a soma dos quadrados dos erros como função dos parâmetros: f(m, t1 ,t2 ,..,tt ,b1 ,b2 ,...,bb) = ∑∑ = = t 1i b 1j 2 ije = = ∑∑ = = −−− t 1i b 1j 2 jiij )btmy( . A minimização dessa função quadrática pode ser efetuada por sua derivação parcial em relação a cada um dos parâmetros e resolução do sistema de 1+t+b equações a 1+t+b incógnitas (média, t efeitos de tratamentos e b efeitos de blocos) que resulta da anulação simultânea das derivadas parciais. Esse sistema de equações é indeterminado. Uma solução única pode ser obtida pelo estabelecimento das condições 0t̂...t̂t̂ t21 =+++ e 0b̂...b̂b̂ b21 =+++ , análogas àquelas impostas para os parâmetros. Essa solução constitui os estimadores para os parâmetros: m̂ y= . . , i i .t̂ y y= − . . , i=1,2,...t, e j jb̂ y y= −. . ., j=1,2,...b, onde iy . é a média das observações para o tratamento i, jy. é a média para o bloco j e y. . é a média geral das observações do experimento. Dessa forma, o estimador do efeito de um tratamento é o desvio entre a média do tratamento e a média geral do experimento, e o estimador do efeito de um bloco é o desvio da média do bloco em relação à média geral. O valor estimado (ou valor predito) para a resposta em uma unidade experimental é definido como: jiij b̂t̂m̂ŷ ++= , i=1,2,...t, j=1,2,...b. A resposta observada em uma unidade experimental pode ser expressa da seguinte forma, pela substituição dos parâmetros pelos respectivos estimadores na equação do modelo: ijjiij êb̂t̂m̂y +++= , onde: jiijij b̂t̂m̂yê −−−=ijij ŷy −= é o desvio entre o valor observado e o valor estimado para a unidade experimental, denominado resíduo da observação. O estimador de quadrados mínimos da variância casual σ2 é: t b 2 ij i 1 j 1 1 (t 1)(b 1) ˆs e = = − − = =∑∑ 1. Delineamentos Experimentais Simples 25 t b 2 ij i j i 1 j 1 1 (t 1)(b 1) (y y y y ) = = − − = − − +∑∑ . . . . . onde (t-1)(b-1) é o correspondente número de graus de liberdade, isto é, número de observações menos número de parâmetros independentes no modelo estatístico que são estimados: tb-(t+b-1)=(t-1)(b-1). 1.3.3 Análise da variação A partir da última expressão para a resposta observada sobre uma unidade experimental, obtém-se: ij i j ij ˆˆˆ ˆy m t b e− = + + , ou seja: ij i j ij ˆˆ ˆy y t b e− = + + =.. i j ij i j(y y ) (y y ) (y y y y )= − + − + − − +. . . . . . . . . . . Dessa forma, o desvio total da resposta observada em uma unidade experimental é decomposto em três componentes: efeito estimado do tratamento, efeito estimado do bloco e resíduo referente à unidade experimental. Elevando os desvios totais ao quadrado e somando para todas as unidades experimentais, obtém-se a seguinte equação fundamental da análise da variação para o delineamento blocos casualizados: 2 2 2 2 ij i j ij i j i j i j i j (y y ) b (y y ) + t (y y ) (y y y y )− = − − + − − +∑∑ ∑ ∑ ∑∑. . . .. . .. . . .. , já que as somas de produtos dos termos do segundo membro da expressão do desvio total são nulas e que: 2 2 2 i i i i j j i i (y y ) (y y ) b (y y ) − = − = − ∑∑ ∑ ∑ ∑. . . . . . . .. e 2 2 2 j j j i j i j j (y y ) (y y ) t (y y ) − = − = − ∑∑ ∑ ∑ ∑. .. . . . . .. . Assim, em um experimento em blocos casualizados, a soma de quadrados total, que exprime a variação total das observações do experimento, é decomposta em três componentes, correspondentes às três fontes de variação presentes neste delineamento: os dois primeiros exprimindo os efeitos de tratamentos e de blocos, designados, respectivamente, SQ Tratamento e SQ Bloco, e o último atribuível ao erro experimental, designado SQ Erro ou SQ Erro; ou seja: SQ Total = SQ Tratamento + SQ Bloco + SQ Erro. Correspondentemente, os tb-1 graus de liberdade referentes à variação total podem ser decompostos em t-1, b-1 e tb-1-(t-1)-(b-1) = (t-1)(b-1) graus de liberdade, correspondentes às variações atribuíveis a tratamento, bloco e erro, respectivamente: tb-1 = t-1 + b-1 + (t-1)(b-1). Essa decomposição da variação total e dos correspondentes graus de liberdade pode ser apresentada em uma tabela de análise da variação, Tabela 1.13. Estatística Experimental. 2. Análise Estatística de Experimentos 26 Tabela 1.13. Esquema da análise da variação para experimento unifatorial com delineamento blocos casualizados. Fonte de variação GL SQ Bloco b-1 2 j j t (y y )−∑ . . . Tratamento t-1 2 i i b (y y )−∑ . . . Erro (t-1)(b-1) 2 ij i j i j (y -y y y )− +∑∑ . . .. Total tb-1 2 ij i j (y y )−∑∑ . . A tabela da análise da variação é completada com a determinação dos quadrados médios, obtidos pelo quociente das somas de quadrados pelos respectivos graus de liberdade: QM Bloco = SQ Bloco/(b-1), QM Tratamento = SQ Tratamento/(t-1) e QM Erro = SQ Erro/(t-1)(b-1). As expressões das somas de quadrados da Tabela 1.13 são denominadas fórmulas de definição. As seguintes expressões, denominadas fórmulas de cálculo, derivadas das fórmulas de definição, são mais convenientes para cálculos com o recurso de calculadoras de bolso não programáveis: SQ Total = 2ij i j y C−∑∑ , SQ Bloco = 2j j 1 y C t −∑ . e SQ Tratamento = 2i i 1 y C b −∑ . , onde: 2 2 ij i j 1 1 C y y tb tb = = ∑∑ .. . A SQ Erro pode ser obtida por diferença, na própria tabela da análise da variação: SQ Erro = SQ Total - SQ Bloco - SQ Tratamento. 1.3.4 Teste de hipótese A primeira hipótese de interesse é, geralmente, a hipótese de nulidade dos efeitos esperados de tratamentos (ou, equivalentemente, igualdade das médias esperadas de tratamentos): ≠ == tratamentoummenospelopara,0t:H t,...,2,1i,0t:H iA iO 1. Delineamentos Experimentais Simples 27 Pelo mesmo argumento desenvolvido para o delineamento completamente casualizado, essa hipótese pode ser testada pela estatística QM Tratamento QM Erro F = , que, sob a hipótese de nulidade, tem distribuição F com t-1 e (t-1)(b-1) graus de liberdade. A fonte de variação “bloco” corresponde à característica estranha controlada por controle local e constitui um fator de unidade ou fator de erro. Nessas circunstâncias, o efeito de bloco é aleatório. Se há um fator experimental associado parceiro desse fator de unidade, esses fatores resultam completamente confundidos, e tal fator experimental não é testável. Se não há um fator experimental associado a bloco, pode haver interesse no teste da seguinte hipótese referente à variância σb 2 atribuível ao fator de unidade bloco: >σ =σ 0:H 0:H 2 bA 2 bO O teste dessa hipótese informa sobre a eficácia do controle experimental propiciado pela formação de blocos. Um teste dessa hipótese é provido pela estatística F QM Bloco QM Erro = que, sob a hipótese HO: 2 bσ =0, tem distribuição F com b-1 e (t-1)(b-1) graus de liberdade. A rejeição da hipótese de nulidade H0 é evidência da eficácia do controle local exercido pela formação de blocos. Exemplo 1.3. Considere-se um experimento que foi conduzido com o propósito de comparar as seguintes cultivares de ervilha de porte baixo: 1-Única, 2-Profusion, 3-Roi des Fins Verts, 4-Early Harvest, 5-Annonay, 6-Fins des Gourmets, quanto à produção de grãos secos. Os resultados - produção de grãos secos em decagramas por parcela de 4m2 - estão registrados sobre o croqui do experimento, Figura 1.8. Bloco 1 5 76 4 88 2 72 6 60 3 72 1 112 Bloco 2 3 44 2 43 6 39 1 87 4 84 5 33 Bloco 3 2 84 1 72 3 44 4 60 5 35 6 65 Bloco 4 5 34 4 64 1 69 2 49 6 48 3 42 Figura 1.8. Croqui do experimento de comparação de seis cultivares de ervilha, Exemplo 1.3, com os dados de produção de grãos secos, em dag/4m2. Os resultados do experimento são dispostos em uma tabela de dupla-entrada, Tabela 1.14, completada com as estimativas das médias e dos efeitos de cultivares e blocos. Estatística Experimental. 2. Análise Estatística de Experimentos 28 Tabela 1.14. Resultados do experimento do Exemplo 1.3 dispostos em uma tabela de dupla-entrada, com as estimativas das médias e dos efeitos de cultivares e blocos. Cultivar Bloco Soma iy . Média iy . =it̂ iy y−. . . 1 2 3 4 1 112 87 72 69 340 85,0 23,5 2 72 43 84 49 248 62,0 0,5 3 72 44 44 42 202 50,5 -11,0 4 88 84 60 64 296 74,0 12,5 5 76 33 35 34 178 44,5 -17,0 6 60 39 65 48 212 53,0 - 8,5 Soma jy. 480 330 360 306 1.476=y.. Média jy. 80,0 55,0 60,0 51,0 61,5=y.. j jb̂ y y= −. . . 18,5 -6,5 -1,5 -10,5 Observe-se que a soma das estimativas dos efeitos diferenciais de cultivares e a soma das estimativas dos efeitos diferenciais de blocos, respectivamente na última coluna e na última linha da Tabela 1.14, são ambas nulas, salvo erros de aproximação. O valor estimado da resposta na unidade experimental com a variedade 1 no bloco 1 é: 11 1 1 ˆˆˆy m t b= + + = = 61,5 + 23,5 + 18,5 = 103,5. O resíduo da observação nessa mesma parcela é: 11 11 11ˆ ˆe y y= − = = 112 - 103,5 = 8,5. Semelhantemente, podem ser obtidos os valores estimados e os resíduos para as demais parcelas do experimento, apresentados na Tabela 1.15, ao lado das respostas observadas. Observe-se que a somados resíduos é nula, para cada tratamento e para cada bloco. 1. Delineamentos Experimentais Simples 29 Tabela 1.15. Valores observados, valores estimados e resíduos das parcelas do experimento do Exemplo 1.3. Valor observado Valor estimado Resíduo Cult. Bloco Cult. Bloco Cult. Bloco 1 2 3 4 1 2 3 4 1 2 3 4 1 112 87 72 69 1 103,5 78,5 83,5 74,5 1 8,5 8,5 -11,5 -5,5 2 72 43 84 49 2 80,5 55,5 60,5 51,5 2 -8,5 -12,5 23,5 -2,5 3 72 44 44 42 3 69,0 44,0 49,0 40,0 3 3,0 0,0 -5,0 2,0 4 88 84 60 64 4 92,5 67,5 72,5 63,5 4 -4,5 16,5 -12,5 0,5 5 76 33 35 34 5 63,0 38,0 43,0 34,0 5 13,0 -5,0 -8,0 0,0 6 60 39 65 48 6 71,5 46,5 51,5 42,5 6 -11,5 -7,5 13,5 5,5 A estimativa da variância casual σ2 é: 2 1 (t 1)(b 1) s − − = SQ Erro = = )14)(16( 1 −− (8,52 +8,52 +...+5,52) = 149,333. Essa estimativa da variância é, mais usualmente, obtida pela análise da variação, efetuada a seguir. As somas de quadrados podem ser determinadas pelas fórmulas de definição, usando resultados da Tabela 1.14 e da Tabela 1.15, como segue: SQ Bloco = 6×[18,52 +(-6,5)2 +(-1,5)2+(-10,5)2] = 2.982, SQ Cultivar = 4×[23,52 +0,52 +...+(-8,5)2 ] = 4.764, SQ Erro = 8,52 +8,52 +...+5,52 = 2.240, SQ Total = (112-61,5)2 +(87-61,5)2 +...+(48-61,5)2 = 9.986. Alternativamente, essas somas de quadrados podem ser determinadas pelas fórmulas de cálculo: C = 1 24 1.4762 = 90.774, SQ Total = 1122+872+...+482 - C = = 100.760 - 90.774 = 9.986, SQ Bloco = 1 6 (4802+3302+3602+3062) - C = = 93.756 - 90.774 = 2.982, SQ Cultivar = 1 4 (3402+2482+...+2122) - C = = 95.538 - 90.774 = 4.764, Estatística Experimental. 2. Análise Estatística de Experimentos 30 SQ Erro = SQ Total - SQ Bloco - SQ Cultivar = = 9.986 - 2.982 - 4.764 = 2.240. A análise da variação e os testes de significância são completados na própria tabela da análise da variação, Tabela 1.16. Tabela 1.16. Análise da variação e teste de significância dos efeitos de tratamentos para os dados do Exemplo 1.3. Fonte de variação GL SQ QM F Prob.>F Bloco 3 2.982,0 994,000 6,656 0,0045 Cultivar 5 4.764,0 952,800 6,380 0,0023 Erro 15 2.240,0 149,333 Total 23 9.986,0 Dado que (Prob.>F)=0,0023 é inferior a α = 0,05, rejeita-se a hipótese de nulidade dos efeitos de cultivares. Logo, conclui-se que a variação entre os efeitos de cultivares foi significativa (P=0,0023). 1.4 Delineamento Quadrado Latino 1.4.1 Introdução Uma observação particular em um experimento em quadrado latino pode ser classificada segundo o tratamento, fila e coluna a que se refere. Entretanto, com a disposição das observações em uma tabela de tripla-entrada ter-se-ia, para t tratamentos, apenas 1/t das células não vazias. Por essa razão, é comum a disposição dos dados em uma tabela de dupla- entrada para filas e colunas, com a identificação do tratamento correspondente em cada célula da tabela. Considerem-se os resultados de um experimento em quadrado latino que são dispostos na Tabela 1.17, onde y*jk é o valor observado da variável resposta na unidade experimental na fila j e na coluna k, com um dos t tratamentos, indicado por um asterisco. O asterisco é usado no lugar do índice que especifica o tratamento já que o tratamento em uma célula particular dessa Tabela, que corresponde à combinação de uma fila com uma coluna, depende do resultado da casualização para o experimento particular. 1. Delineamentos Experimentais Simples 31 Tabela 1.17. Resultados de um experimento em quadrado latino dispostos em uma tabela de dupla-entrada, por fila e coluna. Fila (j) Coluna (k) Soma jy. . Média jy. . 1 2 ... t 1 y*11 y*12 ... y*1t 1y. . 1y. . 2 y*21 y*22 ... y*2t 2y . . 2y. . ... ... ... ... t y*t1 y*t2 y*tt ty . . ty . . Soma ky.. 1y.. 2y.. ty.. y... Média ky.. 1y.. 2y.. ty.. y... Nas duas últimas colunas e nas duas últimas linhas da Tabela 1.17 estão as somas e médias das observações para linhas e para colunas, respectivamente: t j * jk k 1 y y = = ∑. . , j j 1 t y y=. . . . , t k jk j 1 y y = = ∑.. * , k k 1 t y y=.. .. , onde n=t2. (Observe-se que quando as observações em uma fila são somadas em relação ao índice k, que denota coluna, também são somadas em relação ao índice i, que denota tratamento; semelhantemente, quando as observações em uma coluna são somadas em relação ao índice j também são somadas em relação ao índice i.) Ao pé das duas últimas colunas estão o total geral e a média geral das observações do experimento: t t j k j 1 j 1 y y y = = = =∑ ∑.. . . . .. , 1 n y y=... ..., onde: n = t2. Observe-se que as somas e as médias para filas e para colunas podem ser obtidas por meio das somas de observações em relação a tratamentos; por exemplo, as somas para filas podem ser obtidas pela expressão: t j ijk i 1 y y = = ∑. . . Para os cálculos, necessita-se, também, das somas e das médias de tratamentos, que podem ser obtidas, alternativamente, pela soma das observações para as linhas ou para as colunas. t i ijk j 1 y y = = ∑.. ou t i ijk k 1 y y = = ∑.. ; i i 1 t y y=.. .. . Note-se, novamente, que as médias de tratamentos, de filas e de colunas são obtidas pelas somas de apenas um dos três índices (um dos outros dois índices é simultaneamente somado), e que a média geral é obtida pela soma de apenas dois dos três índices (o outro índice é simultaneamente somado). Estatística Experimental. 2. Análise Estatística de Experimentos 32 1.4.2 Estimação dos parâmetros Os estimadores dos parâmetros do modelo, determinados pelo método dos quadrados mínimos, são os seguintes: m̂ y= . . . , i it̂ y y= −. . . . . , i=1,2,...,t, j jf̂ y y= −. . .. . , j=1,2,...,t, k kĉ y y= −. . . . . , k=1,2,...,t. O valor estimado da resposta em uma unidade experimental é definido como: ijk i j k ˆˆˆ ˆŷ m t f c= + + + , e o erro estimado ou resíduo: ijk ijk ijkˆ ˆe y y= − . 1.4.3 Análise da variação Da expressão do modelo estatístico para uma observação com os parâmetros substituídos pelos correspondentes estimadores, obtém-se a seguinte expressão para o desvio total: ijk i j k ˆˆˆ ˆŷ m t f c= + + + , i j k ijk i j k(y y ) (y y ) (y y ) (y y y y y )= − + − + − + − − − +. . . . . . . . . . . . . . . . . . . . . . . . . Elevando ambos os membros ao quadrado e somando para todas as unidades experimentais, obtém-se a seguinte decomposição da soma de quadrados total: 2 ijk j k (y y )−∑∑ .. . 2 2 2 i j k i j k t (y y ) t (y y ) t (y y )= − + − + − +∑ ∑ ∑. . . .. . . .. . . . .. . 2ijk i j k j k (y y y y y )+ − − − +∑∑ .. . . .. .. . , onde os termos do segundo membro são somas de quadrados que estimam as variações atribuíveis a efeitos de tratamentos, efeitos de filas, efeitos de colunas e ao resíduo, nesta ordem. Dessas expressões de definição das somas de quadrados podem ser derivadas expressões mais convenientes para cálculos com calculadoras não programáveis. Correspondentemente a essa decomposição da variação total, os t2-1 graus de liberdade referentes à variação das t2 unidades do experimento são decompostos em quatro componentes: t-1 graus de liberdade referentes a cada um dos efeitos atribuíveis a coluna, fila e tratamento e (t-1)(t-2) graus de liberdade referente ao erro experimental: t2-1 = (t-1) + (t-1) + (t-1) + (t-1)(t-2). A decomposição da variação total e dos correspondentes graus de liberdade pode ser apresentada em uma tabela de análise de variação, Tabela 1.18, onde aparecem, lado a lado, as fórmulas de definição e as fórmulas de cálculo das somas de quadrados. 1. Delineamentos Experimentais Simples 33 Tabela 1.18. Esquema da análise da variação para um experimento unifatorial em quadrado latino com t tratamentos. Fonte de variação GL SQ Fórmula de definição Fórm. de cálculo 1 Fila t-1 2 j j t (yy )−∑ . . .. . 2j k 1 t y C−∑ . . Coluna t-1 2 k k t (y y )−∑ .. .. . 2k k 1 t y C−∑ .. Tratamento t-1 2 i i t (y y )−∑ . . .. . 2i i 1 t y C−∑ .. Erro (t-1)(t-2) 2 ijk i j k j k (y y y y 2y )− − − +∑∑ . . . . . . . .. Por diferença Total t2-1 2 ijk j k (y y )−∑∑ .. . 2 ijk j k y C−∑∑ 1 2 2 ijk j k 2 2 1 1 t t C y y = = ∑∑ .. . Exemplo 1.4. Considerem-se resultados de um experimento que teve como objetivo a comparação de variedades tardias de trigo: 1 - IAS 20, 2 - Passo Fundo, 3 - Vila Velha, 4 - Curitiba e 5 - S.1, em duas épocas de plantio. O experimento adotou o delineamento em quadrado latino 5x5 em cada uma das duas épocas. Os dados de produção de grãos na primeira época, em decagramas por parcela de 6m2, são apresentados na Figura 1.9, registrados no croqui do experimento. Nessa mesma figura estão determinadas as somas, as médias e as estimativas dos efeitos de filas e colunas. Estatística Experimental. 2. Análise Estatística de Experimentos 34 Fila Coluna Soma Média =jf̂ jy y−. . ... 1 2 3 4 5 jy. . jy. . 1 1 61 3 29 4 75 5 134 2 94 393 78,6 -1,2 2 4 70 5 120 3 35 2 83 1 53 361 72,2 -7,6 3 5 133 2 86 1 57 3 16 4 51 343 68,6 -11,2 4 3 38 1 65 2 96 4 91 5 132 422 84,4 4,6 5 2 111 4 89 5 138 1 92 3 46 476 95,2 15,4 Soma ky.. 413 389 401 416 376 1.995 Média: ky.. 82,6 77,8 80,2 83,2 75,2 1.995 25 y 79,8= =... k kĉ y y= −.. ... 2,8 -2,0 0,4 3,4 -4,6 Figura 1.9. Produção de grãos, em dag/6m2, e somas, médias e efeitos estimados de colunas e filas, referentes ao experimento de comparação de variedades de trigo do Exemplo 1.4. As somas e médias da amostra e as estimativas dos efeitos diferenciais de variedades estão na Tabela 1.19. Tabela 1.19. Somas e médias observadas e estimativas dos efeitos diferenciais de variedades para o experimento do Exemplo 1.4. Variedade Soma iy . . Média iy . . it̂ iy y−. . . . . 1 328 65,6 -14,2 2 470 94,0 14,2 3 164 32,8 -47,0 4 376 75,2 -4,6 5 657 131,4 51,6 O valor estimado da resposta na unidade experimental na primeira fila e primeira coluna, com o tratamento 1 é: 111 1 1 1 ˆˆˆ ˆŷ m t f c= + + + = = 79,8 - 1,2 + 2,8 - 14,2 = 67,2; e o correspondente resíduo: 1. Delineamentos Experimentais Simples 35 111 111 111ˆ ˆe y y= − = = 61 - 67,2 = -6,2. Os valores estimados e resíduos assim determinados para todas as 25 parcelas do experimento constam da Tabela 1.20. Tabela 1.20. Valores estimados e resíduos das parcelas do experimento do Exemplo 1.4. Valor estimado Resíduo Fila Coluna Fila Coluna 1 2 3 4 5 1 2 3 4 5 1 1 3 4 5 2 1 1 3 4 5 2 67,2 29,6 74,4 133,6 88,2 -6,2 -0,6 0,4 0,4 5,8 2 4 5 3 2 1 2 4 5 3 2 1 70,4 121,8 25,6 89,8 53,4 -0,4 -1,8 9,4 -6,8 -0,4 3 5 2 1 3 4 3 5 2 1 3 4 123,0 80,8 54,8 25,0 59,4 10,0 5,2 2,2 -9,0 -8,4 4 3 1 2 4 5 4 3 1 2 4 5 40,2 68,2 99,0 83,2 131,4 -2,2 -3,2 -3,0 7,8 0,6 5 2 4 5 1 3 5 2 4 5 1 3 112,2 88,6 147,2 84,4 43,6 -1,2 0,4 -9,2 7,6 2,4 As somas de quadrados são efetuadas a seguir, pelas fórmulas de definição: SQ Fila = 5[(-1,2)2+(-7,6)2+...+15,42] = 2.214,8, SQ Coluna = 5[2,82+(-2,0)2+...+(-4,6)2] = 223,6, SQ Variedade = 5[(-14,2)2+14,22+...+51,62] = 26.480,0, SQ Erro = (-6,2)2+(-0,6)2+...+2,42 = 729,6. Esses mesmos resultados são obtidos pelas expressões de cálculo: C = 1 25 1.9952 = 159.201, SQ Total = 612 +292 +...+462 - C = = 188.849 - 159.201 = 29.648, SQ Fila = 1 5 (3932 +3612 +...+4762 ) - C = = 161.415,8 - 159.201 = 2.214,8, SQ Coluna = 1 5 (4132 +3892 +...+3762 ) - C = = 159.424,6 - 159.201 = 223,6, Estatística Experimental. 2. Análise Estatística de Experimentos 36 SQ Variedade = 1 5 (3282 +4702 +...+6572 ) - C = = 185.681 - 159.201 = 26.480. Analise da variação e os testes de significância podem ser completados na própria tabela da análise da variação, Tabela 1.21. Tabela 1.21. Análise da variação e testes de significância dos efeitos de variedades, para o experimento do Exemplo 1.4. Fonte de variação GL SQ QM F Prob.>F Coluna 4 223,6 55,9 0,919 0,4843 Fila 4 2.214,8 553,7 9,107 0,0013 Variedade 4 26.480,0 6.620,0 108,882 < 0,0001 Erro 12 729,6 60,8 Total 24 29.648,0 Logo a variação entre os efeitos de variedades foi significativa (P<0,0001). 1.5 Precisão do experimento A precisão de um experimento relaciona-se com o erro experimental, ou seja, a variabilidade do material experimental não controlada por controle local ou controle estatístico: A precisão de um experimento é tão maior quanto menor é o erro experimental. Dessa forma, a precisão do experimento é expressa pela variância do erro experimental σ2, que também pode ser designada de variância da observação em uma unidade experimental, ou variância de uma unidade experimental, que é estimada por s2 = QM Erro. A unidade de medida da variância do erro experimental, assim como a de sua estimativa, é o quadrado da unidade de medida da variável resposta, ou dos dados em consideração, o que dificulta a sua interpretação como medida de precisão do experimento. Uma expressão mais conveniente da precisão do experimento sob esse aspecto é o desvio padrão da observação em uma unidade experimental ou desvio padrão de uma unidade experimental, σ, que é estimado por s = QM Erro , cuja unidade de medida é a mesma da variável resposta. Entretanto, o desvio padrão, assim como a variância, depende da unidade de medida. Consequentemente, desvios padrões de experimentos semelhantes e referentes a uma mesma característica expressa por variáveis com distintas unidades de medida não são comparáveis. Uma expressão da precisão do experimento independente da unidade de medida e, portanto, mais conveniente é o coeficiente de variação, usualmente designado por CV, definido como o desvio padrão da observação em uma unidade experimental expresso como percentagem da média, ou seja: 100 m σ , estimado por: s 100 m̂ , onde s QM Erro= . 1. Delineamentos Experimentais Simples 37 A precisão da estimativa de uma média de tratamento, baseada em r repetições, é expressa pela correspondente variância da média de tratamento: i 2 2 y rσ = σ , estimada por i 2 2 ys s r= , ou sua raiz quadrada - o desvio padrão da média de tratamento. Exemplo 1.4 (continuação). Para o experimento do Exemplo 1.4, essas medidas da precisão são, respectivamente: s2 = 60,8 dag2/6m2, s = 8,60 = 7,797 dag/6m2, CV = 100 60,8 79,8 = 9,77%, i 2 y 60,8 5 s 12,6= = dag2/6m2 e iy 60,8 5 s 3,4871= = dag/6m2. O coeficiente de variação, como qualquer das outras medidas de precisão não é uma medida absoluta da precisão de um experimento. Ele é uma medida de precisão relativa, que depende da variável resposta e da área e da linha de pesquisa. Não tem sentido comparar coeficientes de variação referentes a variáveis respostas distintas, bem como de experimentos conduzidos com espécies vegetais ou animais diferentes, ou com critérios distintos de controle experimental. Por exemplo, em experimentos de comparação de cultivares de trigo, coeficientes de variação de características da planta, como altura e peso da produção de grãos, são sabidamente maiores que coeficientes de variação de características do grão, como peso hectolitro e teor de amido; semelhantemente, em experimentos de nutrição de suínos, não são comparáveis coeficientes de variação referentes a peso corporal ao abate e coeficientes de variação de características da carcaça, como comprimento de carcaça e espessura de gordura. Também não são comparáveis coeficientes de variação de peso da produção de grãos de trigo e de peso da
Compartilhar