Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE FEDERAL DE LAVRAS/MG DEPARTAMENTO DE CIÊNCIAS EXATAS/DEX PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIAS AGRÁRIAS Curso Básico de Estatística Experimental Uso do SISVAR na Análise de Experimentos Roberta Bessa Veloso Silva Doutoranda em Estatística e Experimentação Agropecuária Patos de Minas, MG Agosto de 2007 ÍNDICE Página 1. INTRODUÇÃO ................................................................................................................................... 01 2. CONCEITOS BÁSICOS...................................................................................................................... 01 2.1 PRINCÍPIOS BÁSICOS DA EXPERIMENTAÇÃO......................................................................02 2.1.1 REPETIÇÃO.................................................................................................................................02 2.1.2 CASUALIZAÇÃO........................................................................................................................03 2.1.3 CONTROLE LOCAL...................................................................................................................03 3. PRESSUPOSIÇÕES DA ANÁLISE DE VARIÂNCIA.......................................................................03 3.1ADITIVIDADE.................................................................................................................................03 3.2 INDEPENDÊNCIA..........................................................................................................................03 3.3 NORMALIDADE............................................................................................................................03 3.4 HOMOGENEIDADE DE VARIÂNCIAS.......................................................................................03 4. ARQUIVO DE DADOS ...................................................................................................................... 04 5. DELINEAMENTO INTEIRAMENTE CASUALIZADO .................................................................. 04 6. ALGUMAS CONSIDERAÇÕES SOBRE A ESCOLHA DO TESTE ADEQUADO........................13 6.1 PRINCIPAIS TESTES DE COMPARAÇÃO DE MÉDIAS...........................................................14 7. DELINEAMENTO EM BLOCOS CASUALIZADOS ..................................... ..................................16 8. DELINEAMENTO EM QUADRADO LATINO.................................................................................24 9. REGRESSÃO NA ANÁLISE DE VARIÂNCIA.................................................................................29 10. EXPERIMENTOS FATORIAIS........................................................................................................ 36 11. EXPERIMENTOS EM PARCELAS SUBDIVIDIDAS.................................................................... 45 12. REFERÊNCIAS BIBLIOGRÁFICAS ............................................................................................... 58 13. CONTATOS....................................................................................................................................... 59 1 1. INTRODUÇÃO Nas últimas décadas, os cálculos estatísticos foram muito facilitados pelo uso de aplicativos computacionais. Isso permitiu que métodos complexos e demorados fossem rotineiramente aplicados. Entretanto, muitos pesquisadores substituíram esses aplicativos por uma consulta a um profissional da área de estatística. O que se observa hoje são análises de experimentos mal realizadas e resultados erroneamente interpretados. Tal fato justifica a participação de um técnico com conhecimento em técnicas experimentais e métodos quantitativos em todas as fases do experimento, desde o planejamento, condução, coleta de dados, até a fase de análise dos dados e interpretação dos resultados. Diversos pacotes estatísticos para análise de experimentos estão disponíveis, podendo-se citar programas como o SAS – Statistical Analysis System – (Sas Institute Inc., 2000), que é, em geral, um dos programas mais utilizados em todo o mundo para análise de dados da área agronômica, biológica e social, o STATGRAPHICS – Statistical Graphics System – (Statgraphics, 1999), o STATISTICA for Windows (Statistica, 2002), dentre outros. Podem-se encontrar programas nacionais em que o leitor poderá ter acesso com maior facilidade, dentre eles: o SANEST – Sistema de Análise Estatística para Microcomputadores – da Universidade Federal de Pelotas (Zonta & Machado, 1991); o SISVAR – Sistema de Análise de Variância – da Universidade Federal de Lavras (Ferreira, 2000a); o SAEG – Sistema para Análises Estatísticas (Ribeiro Júnior, 2001) e o GENES – Aplicativo computacional em Genética e Estatística (Cruz, 2001), ambos da Universidade Federal de Viçosa. Este curso tem por objetivo apresentar alguns sistemas computacionais com aplicações diversas na análise estatística de experimentos com destaque ao SISVAR, pela facilidade de acesso e utilização. 2. CONCEITOS BÁSICOS Esse item tem por objetivo apresentar alguns conceitos básicos necessários a uma eficiente utilização dos programas estatísticos a serem vistos no curso. Maiores detalhes poder ser vistos em Banzatto & Kronka (1995), Ferreira (2000b), Pimentel Gomes (2000) e Pimentel Gomes e Garcia (2002). a) Experimentação: é uma atividade que tem por objetivo estudar os experimentos, ou seja, seu planejamento, condução, coleta e análise dos dados e interpretação dos resultados. 2 b) Experimentador: é o indivíduo responsável pela condução dos experimentos com a maior precisão possível. c) Estatística: Conjunto de técnicas que se ocupam com a coleta, organização, análise e interpretação de dados, tendo um modelo por referência. d) Estatístico: é o indivíduo especialista em estatística experimental. Contribui com os pesquisadores na tomada de decisão nas diversas fases dos experimentos. e) Experimento: é um trabalho planejado, que segue determinados princípios básicos, com o objetivo de se fazer comparações dos efeitos dos tratamentos. f) Tratamento: é a condição imposta à parcela experimental, cujo efeito deseja-se medir ou comparar em um experimento. g) Parcela experimental: é a menor unidade de um experimento em que se aplica o tratamento ou a combinação deste. Denomina-se de parcela útil a unidade na qual os tratamento são avaliados e onde são coletadas as variáveis respostas. h) Bordadura: é uma área de proteção utilizada para evitar que uma parcela seja afetada pelo tratamento da parcela vizinha. i) Delineamento experimental: é a forma de distribuição dos tratamentos na área experimental. Os principais delineamentos experimentais utilizados são: inteiramente casualizado, blocos casualizados e quadrado latino. j) Esquemas experimentais: são formas de arranjos dos tratamentos nos experimentos em que são estudados, ao mesmo tempo, os efeitos de dois ou mais tipos de tratamentos ou fatores. Os principais esquemas experimentais são fatorial, parcela subdividida e experimentos em faixa. k) Análise de variância: é uma técnica que permite decompor a variação total observada nos dados experimentais em causas conhecidas e não conhecidas. l) Erro experimental: variação devida ao efeito dos fatores não controlados ou que ocorre ao acaso, de forma aleatória. Ramalho et al. (2000) definem o erro experimental como as variações aleatórias entre parcelas que receberam o mesmo tratamento. 2.1 PRINCÍPIOS BÁSICOS DA EXPERIMENTAÇÃO São princípios que devem ser atendidos para que um experimento forneça dados que possam ser analisados através deprocedimentos estatísticos. Os princípios básicos da experimentação são: repetição, casualização e controle local. 2.1.1 Repetição: consiste no número de vezes em que o tratamento aparece no experimento. Tem por finalidade permitir a obtenção da estimativa do erro 3 experimental, aumentar a precisão das estimativas e aumentar o poder dos testes estatísticos. 2.1.2 Casualização: consiste em propiciar aos tratamentos a mesma probabilidade de serem designados a qualquer uma das parcelas experimentais. Têm por finalidade dar validade às estimativas calculadas com os dados observados e aos testes de hipóteses realizados. 2.1.3 Controle local: sua função é diminuir o erro experimental. É usado quando uma área experimental é heterogênea. Tem por finalidade dividir uma área heterogênea em áreas menores e homogêneas, chamadas de blocos. 3. PRESSUPOSIÇÕES DA ANÁLISE DE VARIÂNCIA Para a realização de uma análise de variância devem-se aceitar algumas pressuposições básicas: 3.1 Aditividade: os efeitos de tratamento e erro devem ser aditivos; 3.2 Independência: os erros devem ser independentes, ou seja, a probabilidade de que o erro de uma observação qualquer tenha um determinado valor não deve depender dos valores dos outros erros; 3.3 Normalidade: os erros devem ser normalmente distribuídos; 3.4 Homogeneidade: os erros devem apresentar variâncias comuns (homogeneidade=homocedasticidade de variâncias). Estas pressuposições visam facilitar a interpretação dos resultados e testar a significância nos testes de hipóteses. Na prática, o que pode ocorrer é a validade aproximada e não exata de alguma (s) dessas pressuposições; nesse caso, o pesquisador não perderia tanto com a aproximação visto que os testes aplicados na análise de variância são robustos quanto a isso. A homogeneidade de variância é que, na maioria das vezes, é necessária pois, caso não seja verificada, o teste F e de comparações múltiplas poderão ser alterados. Quanto alguma (s) das pressuposições da análise não se verificam (m), existem alternativas que podem ser usadas, entre elas a transformação de dados com a posterior análise de variância destes dados transformados ou a utilização dos recursos da estatística não paramétrica. Feitas as considerações iniciais necessárias para o entendimento dos próximos assuntos, iniciaremos agora os conceitos e exemplos dos delineamentos mais usuais. 4 4. ARQUIVO DE DADOS O Microsoft Excel, além de ser uma planilha eletrônica que possui poderosos recursos, apresenta alta compatibilidade com os principais programas estatísticos. Além disso, tem a grande vantagem de facilidade de acesso e de interação com o usuário. Independente de se utilizar o SAS ou o SISVAR, as planilhas com os dados dos experimentos a serem analisados, serão feitas utilizando-se o Excel. Na Tabela 3 está apresentado um exemplo de planilha criada utilizando-se o Excel. Observe que nas colunas são especificados os tratamentos, blocos e variáveis a serem analisadas, e nas linhas estão às observações referentes às parcelas experimentais. Devemos utilizar sempre o ponto (.) ao invés da vírgula (,) como separador decimal. Se o tratamento for qualitativo devemos codificá-los por meio das letras (A, B, C,...), caso seja quantitativo, devemos informar as quantidades estudadas. 5. DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC) No delineamento inteiramente casualizado é necessário a completa homogeneidade das condições ambientais e do material experimental (como por exemplo, quanto à fertilidade do solo, distribuição uniforme de água, etc) sendo os tratamentos distribuídos nas parcelas de forma inteiramente casual (aleatória). O DIC possui apenas os princípios da casualização e da repetição, não possuindo controle local e, portanto, as repetições não são organizadas em blocos. VANTAGENS • Possui grande flexibilidade quanto ao número de tratamentos e repetições, sendo dependente, entretanto, da quantidade de material e área experimental disponíveis; • Pode-se ter DIC não balanceado, ou seja, com números de repetições diferentes entre tratamentos, o que leva a grandes alterações na análise de variância; mas os testes de comparações múltiplas passam a ser aproximados e não mais exatos. O ideal é que os tratamentos sejam igualmente repetidos; • Considerando o mesmo número de parcelas e tratamentos avaliados, é o delineamento que possibilita o maior grau de liberdade do erro. 5 DESVANTAGEM • Exige homogeneidade das condições experimentais. Se as condições não forem uniformes, como se esperava antes da instalação do experimento, toda variação (exceto a devida a tratamentos) irá para o erro, aumentando sua estimativa e reduzindo, portanto, a precisão do experimento. O modelo estatístico para o delineamento inteiramente casualizado é dado por: ij i ijy eµ α= + + em que: ijy é o valor observado na parcela experimental que recebeu o i -ésimo tratamento na j -ésima repetição ( 1,..., )j r= ; µ representa uma constante geral associada e esta variável aleatória iα é o efeito do tratamento i ( )1,2,...,i t= ; ijε é o erro experimental associado a observação ijy , suposto ter distribuição normal com média zero e variância comum. Na Tabela 1 é apresentado o esquema da análise de variância para os experimentos instalados no delineamento inteiramente casualizado. Tabela 1. Esquema da análise de variância para experimentos instalados no delineamento inteiramente casualizado. FV GL SQ QM F Tratamento 1t − SQ Trat QM Trat QM Trat / QM Erro Erro ( )1t r − SQ Erro QM Erro Total 1tr − SQ Total Um exemplo de um experimento em que serão avaliadas 5 tratamentos (T1, T2, T3, T4 e T5), instalado no delineamento inteiramente casualizado, com 4 repetições (R1, R2, R3 e R4), é apresentado a seguir: T4 R3 T1 R2 T2 R3 T4 R1 T3 R2 T1 R3 T2 R4 T5 R1 T5 R3 T2 R1 T4 R2 T3 R1 T3 R4 T3 R3 T4 R4 T5 R4 T1 R4 T2 R2 T5 R2 T1 R1 6 Observa-se que não há qualquer restrição à casualização, podendo um determinado tratamento ocupar qualquer posição na área experimental. Para exemplificar, será utilizado parte dos dados obtidos por uma empresa que avalia famílias de Eucaliptos camaldulensis. Os dados são referentes ao volume de madeira por árvore, em m3x104. São apresentados os dados de 5 famílias avaliadas em um delineamento inteiramente casualizado (DIC) com 6 repetições. Tabela 2. Volume de madeira por árvore, em m3x104, de 5 famílias de Eucaliptos camaldulensis. Repetições Famílias I II III IV V VI A 212 206 224 289 324 219 B 108 194 163 111 236 146 C 63 77 100 99 68 76 D 175 239 100 104 256 267 E 133 106 185 136 147 210 Delineamento Inteiramente Casualizado Balanceado (SISVAR) Sejam os dados apresentados na Tabela 2 referentes a um experimento instalado no delineamento inteiramente casualizado com 5 tratamentos e 6 repetições, em que foi avaliado o efeito das famílias de Eucaliptos camaldulensis sobre o volume de madeira, em m3x104. Serão listados abaixo os procedimentos para se efetuar a análise de variância utilizando o programa SISVAR. Para gerar arquivos do Excel do tipo dbase para ser usado diretamente no Sisvar, sem a necessidade de importar é necessário executar uma série de procedimentos. Esses procedimentos são descritos na seqüência para servir de referência para o usuário do Sisvar. É conveniente salientar que para que o Excel gere adequadamente os arquivos *.dbf é necessário seguir estritamente os passos a seguir. a) ir no painel de controle do computador e escolher configurações regionais. Na opção trocar os formatos de números, datas e horários escolher a aba opções regionais e modificar. Escolher a aba númerose marcar somente a caixa símbolo decimal com “.” no lugar de “,”. Confirmar a opção clicando em Ok, duas vezes e pronto. b) Abra o Excel e se o arquivo estiver pronto é só abri-lo. Caso contrário digite o arquivo na seguinte estrutura: 7 • Primeira linha com o cabeçalho das variáveis; • Demais linhas com os valores de cada parcela – cada coluna deve ser uma variável; • Não deixe células vazias. Formatar cada coluna do seguinte tipo: se por exemplo, a primeira coluna for do tipo qualitativa (texto), então marque a coluna “A” e escolha formatar células e escolher a opção texto; se a segunda for numérica, marcar a segunda coluna e escolher formatar células número. Escolher o número de casas decimais correspondente ao maior número de casas decimais observado para essa coluna e marcar obrigatoriamente a caixa escrita usar separador de 1000 (.). Isso é importantíssimo, pois o Excel possui problemas de eliminar o separador de decimais no arquivo exportado, formando números onde a parte inteira e a decimal não foram separadas uma da outra. Repetir para as demais colunas esse procedimento. É possível marcar várias colunas do mesmo tipo ao mesmo tempo para serem formatadas conjuntamente. No caso numérico deve-se escolher o número de casas decimais do valor observado que apresente um maior número de casas decimais para que o arquivo final não seja truncado em uma precisão não pretendida. Após é necessário marcar toda a área de dados, inclusive a primeira linha com os nomes das variáveis. É importante não marcar células vazias após o final da digitação dos dados no meio do arquivo, pois o Sisvar não suporta esse tipo de dados. Foi feito pra trabalhar com dados balanceados. Escolher a opção arquivo salvar como e a sub-opção “salvar como tipo dbase 3 ou dbase 4, digitar o nome para o arquivo e confirmar. O Excel dá uma mensagem que o arquivo não suporta múltiplas planilhas e que pode ser perdidos os dados. Confirmar essa mensagem e pronto, o arquivo já é <nome.dbf>, pronto pra ser utilizado pelo Sisvar (não precisa importar). Existem alguns cuidados que devem ser tomados para esse processo: • Salve antes de qualquer coisa o arquivo Excel para poder recorrer ao mesmo, caso dê problemas na exportação para dbase; • Abra o arquivo no editor de dados do Sisvar para checar se tudo está certo, principalmente se as casas decimais não foram coladas a parte inteira dos dados (problema do Excel e não do Sisvar); • Lembre-se de sair do Excel antes de abrir o arquivo no Sisvar para não gerar conflitos de compartilhamento. 8 Após todo esse procedimento você terá o seu arquivo na extensão dbf pronto para ser utilizado pelo Sisvar. O Sisvar está com algum problema para identificar um caminho ou nome de arquivos em que sinais de acentuação de português foram utilizados. Assim recomenda-se nomes de pastas e arquivos sem acentos, principalmente se o usuário estiver utilizando o Windows XP em inglês. Tabela 3. Os dados são referentes ao volume de madeira por árvore, em m3x104. São apresentados os dados de 5 famílias de Eucaliptos camaldulensis avaliadas em um delineamento inteiramente casualizado (DIC) com 6 repetições. Família Repetição Volume (m3x104) A 1 212 A 2 206 A 3 224 A 4 289 A 5 324 A 6 219 B 1 108 B 2 194 B 3 163 B 4 111 B 5 236 B 6 146 C 1 63 C 2 77 C 3 100 C 4 99 C 5 68 C 6 76 D 1 175 D 2 239 D 3 100 D 4 104 D 5 256 D 6 267 E 1 133 E 2 106 E 3 185 E 4 136 E 5 147 E 6 210 c) Efetuar a análise de variância • Abrir o SISVAR e ir para Análise\Anava; • Abrir arquivo exemplo1 DIC.dbf (no quadro “variáveis do arquivo” deve aparecer as variáveis do arquivo a ser analisado); 9 • Informar as Fontes de Variação. (no DIC, ver Tabela 1 → TRAT, Erro e Total. Não é necessário informar Erro e Total);Clicar em FAMILIA, adicionar e Fim; • Clicar em Yes para encerrar o quadro de análise de variância; • Clicar em FAMILIA no Quadro “Opções do quadro da análise de variância”; • Escolher a opção Teste de Tukey e/ou de Scott-Knott (Deve-se pedir cada teste individualmente, clicar em FAMILIA, teste escolhido, OK); • No quadro, “Variáveis a serem analisadas”, selecionar variável para analisar, no nosso exemplo “volume”; • Clicar em Finalizar\Finalizar. d) Saída dos resultados • Salvar relatório como exemplo1 DIC.doc RESULTADOS Arquivo analisado: C:\Documents and Settings\Bessa\Meus documentos\Roberta\Curso de estatística experimental\exemplo pag 4.DB -------------------------------------------------------------------------------- Variável analisada: volume Opção de transformação: Variável sem transformação ( Y ) -------------------------------------------------------------------------------- TABELA DE ANÁLISE DE VARIÂNCIA -------------------------------------------------------------------------------- FV GL SQ QM Fc Pr>Fc -------------------------------------------------------------------------------- FAMILIA 4 86725.533333 21681.383333 8.890 0.0001 erro 25 60973.833333 2438.953333 -------------------------------------------------------------------------------- Total corrigido 29 147699.366667 -------------------------------------------------------------------------------- CV (%) = 29.79 Média geral: 165.7666667 Número de observações: 30 -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- Teste Tukey para a FV FAMILIA -------------------------------------------------------------------------------- DMS: 83.7649609862759 NMS: 0.05 -------------------------------------------------------------------------------- Média harmonica do número de repetições (r): 6 Erro padrão: 20.1616522691525 -------------------------------------------------------------------------------- Tratamentos Médias Resultados do teste -------------------------------------------------------------------------------- C 80.500000 a1 E 152.833333 a1 a2 B 159.666667 a1 a2 D 190.166667 a2 a3 A 245.666667 a3 -------------------------------------------------------------------------------- 10 -------------------------------------------------------------------------------- Teste Scott-Knott (1974) para a FV FAMILIA -------------------------------------------------------------------------------- NMS: 0.05 -------------------------------------------------------------------------------- Média harmonica do número de repetições (r): 6 Erro padrão: 20.1616522691525 -------------------------------------------------------------------------------- Tratamentos Médias Resultados do teste -------------------------------------------------------------------------------- C 80.500000 a1 E 152.833333 a2 B 159.666667 a2 D 190.166667 a2 A 245.666667 a3 -------------------------------------------------------------------------------- APRESENTAÇÃO DOS RESULTADOS Tabela 4. Valores médios (erro padrão) de volume de madeira, em m3x104, de 5 famíliasde Eucaliptos camaldulensis. Famílias 1Médias (erro padrão) A 246 a (20,2) B 160 b (20,2) C 81 c (20,2) D 190 b (20,2) E 153 b (20,2) 1 – Médias seguidas da mesma letra, na coluna, não diferem entre si pelo teste de Scott-Knott, considerando o valor nominal de 5% de significância. Interpretação dos resultados Os resultados experimentais nos permitem concluir que houve efeito significativo das famílias de Eucaliptos camaldulensis (p=0,0001) sobre o volume de madeira, em m3x104. O volume de madeira produzido pela família A foi estatisticamente superior ao volume de madeira produzido pelas demais famílias, sendo que as famílias B, D e E foram estatisticamente iguais quanto ao volume produzido. A família C foi estatisticamente inferior a todas as demais quanto ao volume produzido pelo teste de Scott-Knott ao nível nominal de 5% de significância. Exemplo 2 de DIC 11 Em um estudo da influência do recipiente no desenvolvimento de mudas de Eucaliptos camaldulensis spp, empregou-se os seguintes tratamentos: A – Laminado de madeira; B – Torrão paulista, C – Saco plástico; D – Tubo de papel e E – Fértil pote. Cada tratamento foi repetido 6 vezes. No final do primeiro ano foram medidas as alturas das mudas, em metros, encontrando-se os seguintes resultados. Tabela 5. Altura, em metros, de mudas de Eucaliptos ssp., segundo os tipos de recipientes estudados. Tipos de Recipientes Repetições A B C D E 1 1,5 1,4 1,0 1,1 1,4 2 1,4 1,4 1,1 1,3 1,3 3 1,6 1,3 0,9 1,0 1,3 4 1,7 1,2 1,0 1,2 1,2 5 1,8 1,3 1,1 1,1 1,0 6 1,9 1,2 1,2 1,1 1,0 RESULTADOS Arquivo analisado: C:\Documents and Settings\Bessa\Meus documentos\Roberta\Curso de estatística experimental\exemplo pag 5.DB -------------------------------------------------------------------------------- Variável analisada: Altura Opção de transformação: Variável sem transformação ( Y ) -------------------------------------------------------------------------------- TABELA DE ANÁLISE DE VARIÂNCIA -------------------------------------------------------------------------------- FV GL SQ QM Fc Pr>Fc -------------------------------------------------------------------------------- Recipientes 4 1.303333 0.325833 17.581 0.0000 erro 25 0.463333 0.018533 -------------------------------------------------------------------------------- Total corrigido 29 1.766667 -------------------------------------------------------------------------------- CV (%) = 10.75 Média geral: 1.2666667 Número de observações: 30 -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- Teste Tukey para a FV Recipientes -------------------------------------------------------------------------------- DMS: 0.230907167377472 NMS: 0.05 -------------------------------------------------------------------------------- Média harmonica do número de repetições (r): 6 Erro padrão: 0.0555777733351102 12 -------------------------------------------------------------------------------- Tratamentos Médias Resultados do teste -------------------------------------------------------------------------------- C 1.050000 a1 D 1.133333 a1 a2 E 1.200000 a1 a2 B 1.300000 a2 A 1.650000 a3 -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- Teste Scott-Knott (1974) para a FV Recipientes -------------------------------------------------------------------------------- NMS: 0.05 -------------------------------------------------------------------------------- Média harmonica do número de repetições (r): 6 Erro padrão: 0.0555777733351102 -------------------------------------------------------------------------------- Tratamentos Médias Resultados do teste -------------------------------------------------------------------------------- C 1.050000 a1 D 1.133333 a1 E 1.200000 a2 B 1.300000 a2 A 1.650000 a3 -------------------------------------------------------------------------------- APRESENTAÇÃO DOS RESULTADOS Tabela 6. Altura média (erro padrão) de mudas de Eucaliptos ssp, em metros, em função dos tipos de recipientes estudados. Tipos de recipientes 1Médias (erro padrão) A 1,65 a (0,05) B 1,30 b (0,05) C 1,05 c (0,05) D 1,13 c (0,05) E 1,23 b (0,05) 1 – Médias seguidas da mesma letra, na coluna, não diferem entre si pelo teste de Scott-Knott, considerando o valor nominal de 5% de significância. Interpretação dos resultados Os resultados experimentais nos permitem concluir que houve efeito significativo dos tipos de recipientes (p<0,0001) sobre a altura das mudas de Eucaliptos ssp. As mudas desenvolvidas no recipiente de laminado de madeira (recipiente A) foram estatisticamente superiores em altura do que as mudas desenvolvidas nos demais tipos de recipientes. Os recipientes, torrão paulista e fértil pote (recipientes B e E respectivamente) produziram mudas de alturas estatisticamente semelhantes. Os recipientes do tipo saco plástico e tubo de papel (recipientes C e D respectivamente) produziram mudas com alturas estatisticamente semelhante entre si e inferiores as alturas das mudas desenvolvidas nos demais recipientes, pelo teste de Scott-Knott ao nível de 5% de probabilidade. 13 6. ALGUMAS CONSIDERAÇÕES SOBRE A ESCOLHA DO TESTE ADEQUADO Em um projeto, a hipótese é a proposição testável que normalmente envolve a solução de determinado problema. Ela é de natureza criativa. Muitas vezes, o pesquisador não escreve sua hipótese, mas ela está em sua mente. O ideal é que seja escrita, para que o pesquisador possa raciocinar em cima do que está sendo redigido e analisar todas as opções possíveis para testar convenientemente essas hipóteses com os recursos disponíveis. A hipótese que será testada no experimento é frequentemente chamada de hipótese nula (H0) e, geralmente, preconiza a igualdade de efeitos ou igualdade de médias de tratamentos. A outra única possibilidade é que a hipótese nula seja falsa. A hipótese que afirma “a hipótese nula é falsa” é chamada de hipótese alternativa (Ha). É claro que gostaríamos de fazer o julgamento correto sobre a nossa hipótese nula. Podemos estar corretos de duas maneiras: não rejeitando a hipótese quando ela é verdadeira, ou rejeitando-a quando ela é falsa. Mas isso significa que há também duas possibilidades de estarmos errados: rejeitando a hipótese quando ela é verdadeira, ou não a rejeitando quando ela é falsa. O primeiro tipo de erro é chamado erro tipo I e a probabilidade de incorrer nesse tipo de erro é representada por α , o segundo é o erro tipo II e a probabilidade de cometer esse erro é representada por β . Quando aumentamos a região de não rejeição da hipótese nula estamos diminuindo a chance de cometer um erro tipo I. Entretanto, se ampliarmos a região de não rejeição, estamos aumentando o risco de não rejeitara hipótese nula mesmo quando ela é falsa, cometendo um erro tipo II. A outra estratégia consiste em estreitar a zona de não rejeição. Assim, procedendo, é menos provável cometermos um erro tipo II, mas corremos um risco muito maior de cometer um erro tipo I (rejeitar a hipótese nula quando ela é verdadeira). Se decidirmos pela rejeição da hipótese nula, isso significa que temos quase certeza de que ela não é verdadeira. Mais especificamente, costumamos planejar nosso teste de modo que haja apenas 5% de chance de rejeitarmos a hipótese nula quando ela é, de fato, verdadeira. Se, entretanto, decidirmos não rejeitarmos a hipótese nula, isto não significa que ela seja verdadeira e, sim, que não temos evidências suficientes pra rejeitá-la. 6.1 PRINCIPAIS TESTES DE COMPARAÇÃO DE MÉDIAS O TESTE T DE STUDENT 14 Duas médias A e B, obtidas de Ar e Br repetições respectivamente, podem ser comparadas pela relação: A B A B t QME QME r r − = + em que: QME é o quadrado médio do erro, estimado pela análise de variância. As médias comparadas por esse teste serão diferentes estatisticamente se o valor calculado de t for maior que aquele tabelado segundo os graus de liberdade do erro. O valor da diferença mínima significativa (DMS) é dada por: (Student) gl do erro A B QME QMEDMS t r r = + OBS: tabeladot t> , o teste é significativo e rejeitamos a hipótese H0 (H0: média populacional do tratamento A=média populacional do tratamento B) TESTE DE STUDENT NEWMAN KEULS (SNK) Em uma relação decrescente de t médias (A, B, C, D, E), duas delas (A e F) apresentarão diferença significativa se: | | i A F q QME r − ≥ em que: A e F são as médias; QME é o quadrado médio do erro, estimado pela análise de variância e iq é o valor obtido em função da distância entre as médias e dos graus de liberdade do erro. A diferença mínima significativa entre duas médias com distância i entre elas é dada por: (SNK) i QMEDMS q r = TESTE DE TUKEY A opção proposta por Tukey, em 1953, de apenas um valor de diferença mínima significativa, a despeito da existência de várias médias, caracterizou-se o teste como extremamente rigoroso, que embora controlasse muito bem o erro tipo I, permitia o aparecimento do erro tipo II. 15 A diferença mínima significativa proposta por Tukey é dada por: (Tukey) QMEDMS q r = em que: q é o valor tabelado por Tukey em função do número de tratamentos e dos graus de liberdade do erro. TESTE DE SCHEFFÉ A flexibilidade proposta por Scheffé (1953), para comparar qualquer contraste entre médias e permitindo números de observações por tratamento definiu um teste um pouco mais rigoroso que aquele de Tukey, merecendo, portanto, os mesmos comentários com relação ao perigoso aumento do erro tipo II. A diferença mínima significativa para qualquer contraste é dada por: 1 2(Scheffé) ,( 1) var(contraste)DMS t Fν ν= − em que: t é o número de tratamentos; 1 2, Fν ν é o valor tabelado de F com 1ν (graus de liberdade de tratamento) e 2ν (graus de liberdade do erro). A var(contraste) é dada por: 2 var(contraste)= i i cQME r ∑ em que: ic é o coeficiente do tratamento i com ir repetições. TESTE DE DUNCAN O teste de Duncan utiliza a mesma argumentação do teste SNK porém as DMS para comparação de médias mais afastadas foi reduzida reduzindo então as chances de cometer o erro tipo II. (Duncan) i QMEDMS q r = em que: QME é o quadrado médio do erro, estimado pela análise de variância e iq é o valor tabelado por Duncan obtido da distância entre as médias e dos graus de liberdade do erro. Os valores de iq não sobem tão rapidamente quanto aqueles do teste SNK. TESTE DE DUNNETT 16 Para as comparações múltiplas onde apenas um tratamento serve de referência (testemunha) para os demais, ou seja, deseja-se comparar todos com apenas um, Dunnett sugeriu a seguinte diferença mínima significativa (DMS): 2 (Dunnett) 1 t i i QMEDMS D c r = = ∑ em que: D é o valor encontrado na tabela de Dunnett proposta em função dos ( )1t − graus de liberdade de tratamento e graus de liberdade do erro, ic é o coeficiente utilizado no contraste para o tratamento i . DESDOBRAMENTO DOS GRAUS DE LIBERDADE DE TRATAMENTOS De acordo com Banzatto e Kronka (1995), quando aplicamos o teste F numa análise de variância para tratamentos com mais de 1 grau de liberdade, podemos obter apenas informações muito gerais, relacionadas com o comportamento médio dos tratamentos, pois representa um teste médio de diversas comparações independentes. Então, se apenas uma das comparações envolve uma diferença marcante e as outras não, um teste F médio pode falhar para evidenciar a diferença existente. Por essa razão, devemos planejar comparações objetivas, fazendo-se o desdobramento ou decomposição dos graus de liberdade de tratamentos para obter informações mais específicas, relacionadas com o comportamento de cada um dos componentes do desdobramento. Além disso, após a decomposição dos graus de liberdade, podemos aplicar o teste F a cada um dos componentes do desdobramento. A cada comparação atribuímos 1 grau de liberdade e, portanto, para I tratamentos podemos estabelecer (I-1) comparações independentes. Essa técnica se baseia na utilização de contrastes, sendo necessário que cada componente seja explicado por um contraste e que todos os contrastes sejam ortogonais entre si, para que as comparações sejam independentes. Normalmente, trabalhamos com contrastes de médias de tratamentos, e o caso mais comum é aquele onde todos os tratamentos têm o mesmo número, r, de repetições. Nessas condições, uma função linear do tipo: 1 1 2 2 ... I IY c m c m c m= + + + é denominada contrastes de médias de tratamentos, se: 17 1 2 1 ... 0 0 I I i i c c c c = + + + = = ∑ onde: 1 2 ... Ic c c+ + + , são os coeficientes das médias de tratamentos 1 2 ... Im m m+ + + , respectivamente. Assim, por exemplo: 1 1 2Y m m= − 2 1 2 32Y m m m= + − 3 1 2 3 4Y m m m m= + − − são contrastes de médias de tratamentos, pois as somas dos coeficientes são: ( )1 1 1 0Y → + − = ( )2 1 1 2 0Y → + + − = ( ) ( )3 1 1 1 1 0Y → + + − + − = Se Y é um contraste de médias de tratamentos, a soma de quadrados para a comparação feita em Y, é dada por: 2 2 2 2 2 21 2 1 ˆ ˆ . . r ou . .( ...Y Y II i i Y YS Q S Q r c c c c = = × = × + + + ∑ onde: ˆY - é a estimativa do contraste, calculada substituindo em Y os im pelos valores obtidos no experimento; r - é o número de parcelas (repetições) somadas para obter cada média de tratamentos ( )im que entra no contraste. Esta soma de quadrados é uma parte da S.Q.Tratamentos e a ela atribui 1 grau de liberdade. Dois contrastes são ortogonais entre si quando a soma dos produtos dos coeficientes das médias correspondentes for nula. Assim: 1 1 1 2 2 1 ... 0 I I I i i Y c m c m c m c = = + + + = ∑ 18 e 2 1 1 2 2 1 ... 0 I I I i i Y b m b m b m b = = + + + = ∑ são contrastes ortogonais se: 1 1 2 2 1 ... 0 I I I i i i c b c b c b c b = + + + = ∑ Então, 2 . .YS Q é uma parte extraída da diferença entre: 1 . . . .YS Q Trat S Q− Da mesma forma, para uma comparação Y3 (ortogonala Y2 e Y1, 3. .YS Q é uma parte extraída da diferença entre: 1 2 . . . . . .Y YS Q Trat S Q S Q− − Dessa maneira, se: Y1, Y2,...,Y(I-1) são mutuamente ortogonais, isto é, cada par é ortogonal, então: ( )1 2 1 . . . . . . ... . . IY Y Y S Q Trat S Q S Q S Q − = + + + ou ( ) ( ) 22 2 11 2 2 2 2 1 2 1 1 1 1 ˆ ˆ ˆ . . ... I I I I I i i i YY YS Q Trat r r r c c c − − = = = = × + × + + × ∑ ∑ ∑ Esta expressão identifica a partição da S.Q.Trat (que tem (I-1) g.l.), em (I-1) componentes, cada um representando um único grau de liberdade. Exemplo 3 Delineamento Inteiramente Casualizado usando Contrastes Vamos considerar os dados adaptados do trabalho “Aplicação da vermiculita em alfobres” (Dias, 1973), realizado no delineamento inteiramente casualizado, com 4 repetições. Foram comparados os efeitos de 5 tratamentos em relação ao crescimento de mudas de Pinus oocarpa, 60 dias após a semeadura. Os tratamentos utilizados foram: 1. Solo de cerrado (SC) 2. Solo de cerrado + esterco (SC + E) 3. Solo de cerrado + esterco + NPK (SC + E + NPK) 4. Solo de cerrado + vermiculita (SC + V) 19 5. Solo de cerrado + vermiculita + NPK (SC + V + NPK) Os resultados obtidos para as alturas médias de Pinus oocarpa sob aqueles tratamentos, em cm, aos 60 dias após a semeadura são apresentados na Tabela 7. Tabela 7. Alturas médias de Pinus oocarpa, aos 60 dias após a semeadura, em cm. Repetições Tratamentos 1 2 3 4 1 – SC 4,6 5,1 5,8 5,5 2 – SC + E 6,0 7,1 7,2 6,8 3 – SC + E + SPK 5,8 7,2 6,9 6,7 4 – SC + V 5,6 4,9 5,9 5,7 5 – SC + V + SPK 5,8 6,4 6,6 6,8 Examinando os tratamentos, uma comparação que pode interessar é: 1) Solo cerrado somente vs demais Dentre os demais, temos tratamentos: com esterco e com vermiculita. Podemos comparar: 2) Com esterco versus com vermiculita Dentre os tratamentos com esterco temos: com NPK e sem NPK, podemos comparar: 3) Esterco sem NPK versus esterco com NPK Com vermiculita podemos comparar: 4) Vermiculita sem NPK versus vermiculita com NPK 1 1 2 3 4 54Y m m m m m= − − − − 2 2 3 4 5Y m m m m= + − − 3 2 3Y m m= − 3 4 5Y m m= − Estes contrastes são ortogonais entre si, já que são ortogonais dois a dois (ver Banzatto e Kronka, 1995). 20 Algumas observações sobre a estrutura dos tratamentos: Solo cerrado ou solo cerrado com esterco ou vermiculita? SC versus SC + E ou SC + V Solo cerrado com esterco ou solo cerrado com vermiculita? SC + E versus SC + V Esterco sem NPK ou Esterco com NPK? E – NPK versus E+NPK Vermiculita sem NPK ou vermiculita com NPK? V - NPK versus V + NPK RESULTADOS Arquivo analisado: C:\Documents and Settings\Bessa\Meus documentos\Roberta\Curso de estatística experimental\analise DIC contraste.DB -------------------------------------------------------------------------------- Variável analisada: Alturas Opção de transformação: Variável sem transformação ( Y ) -------------------------------------------------------------------------------- TABELA DE ANÁLISE DE VARIÂNCIA -------------------------------------------------------------------------------- FV GL SQ QM Fc Pr>Fc -------------------------------------------------------------------------------- Tratamentos 4 7.597000 1.899250 7.277 0.0018 erro 15 3.915000 0.261000 -------------------------------------------------------------------------------- Total corrigido 19 11.512000 -------------------------------------------------------------------------------- CV (%) = 8.35 Média geral: 6.1200000 Número de observações: 20 -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- Contraste para a FV Tratamentos -------------------------------------------------------------------------------- Média harmonica do número de repetições (r): 4 Erro padrão de cada média dessa FV: 0.255440795488896 CONTRASTE NÚMERO 1 -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- O contraste testado está apresentado a seguir: -------------------------------------------------------------------------------- Nível dessa Fonte de Variação Coeficientes -------------------------------------------------------------------------------- 1 4.0000 2 -1.0000 3 -1.0000 4 -1.0000 5 -1.0000 -------------------------------------------------------------------------------- Obs. Valores dos coeficientes positivos foram divididos por 21 4 e os negativos por 4 -------------------------------------------------------------------------------- Estimativa : -1.08750000 DMS Scheffé : 0.99843489 NMS: : 0.05 Variância : 0.08156250 Erro padrão : 0.28559149 t para H0: Y = 0 : -3.808 Pr>|t| : 0.002 F para H0: Y = 0 : 14.500 Pr>F : 0.002 Pr exata Scheffé : 0.029 -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- Contraste para a FV Tratamentos -------------------------------------------------------------------------------- Média harmonica do número de repetições (r): 4 Erro padrão de cada média dessa FV: 0.255440795488896 CONTRASTE NÚMERO 2 -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- O contraste testado está apresentado a seguir: -------------------------------------------------------------------------------- Nível dessa Fonte de Variação Coeficientes -------------------------------------------------------------------------------- 1 0.0000 2 1.0000 3 1.0000 4 -1.0000 5 -1.0000 -------------------------------------------------------------------------------- Obs. Valores dos coeficientes positivos foram divididos por 2 e os negativos por 2 -------------------------------------------------------------------------------- Estimativa : 0.75000000 DMS Scheffé : 0.89302732 NMS: : 0.05 Variância : 0.06525000 Erro padrão : 0.25544080 t para H0: Y = 0 : 2.936 Pr>|t| : 0.010 F para H0: Y = 0 : 8.621 Pr>F : 0.010 Pr exata Scheffé : 0.124 -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- Contraste para a FV Tratamentos -------------------------------------------------------------------------------- Média harmonica do número de repetições (r): 4 Erro padrão de cada média dessa FV: 0.255440795488896 CONTRASTE NÚMERO3 -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- O contraste testado está apresentado a seguir: -------------------------------------------------------------------------------- Nível dessa Fonte de Variação Coeficientes -------------------------------------------------------------------------------- 1 0.0000 2 1.0000 3 -1.0000 -------------------------------------------------------------------------------- Obs. Valores dos coeficientes positivos foram divididos por 1 e os negativos por 1 -------------------------------------------------------------------------------- Estimativa : 0.12500000 DMS Scheffé : 1.26293134 NMS: : 0.05 Variância : 0.13050000 Erro padrão : 0.36124784 t para H0: Y = 0 : 0.346 Pr>|t| : 0.734 F para H0: Y = 0 : 0.120 Pr>F : 0.734 22 Pr exata Scheffé : 0.998 -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- Contraste para a FV Tratamentos -------------------------------------------------------------------------------- Média harmonica do número de repetições (r): 4 Erro padrão de cada média dessa FV: 0.255440795488896 CONTRASTE NÚMERO 4 -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- O contraste testado está apresentado a seguir: -------------------------------------------------------------------------------- Nível dessa Fonte de Variação Coeficientes -------------------------------------------------------------------------------- 1 0.0000 2 0.0000 3 0.0000 4 1.0000 5 -1.0000 -------------------------------------------------------------------------------- Obs. Valores dos coeficientes positivos foram divididos por 1 e os negativos por 1 -------------------------------------------------------------------------------- Estimativa : -0.87500000 DMS Scheffé : 1.26293134 NMS: : 0.05 Variância : 0.13050000 Erro padrão : 0.36124784 t para H0: Y = 0 : -2.422 Pr>|t| : 0.029 F para H0: Y = 0 : 5.867 Pr>F : 0.029 Pr exata Scheffé : 0.261 -------------------------------------------------------------------------------- TABELA DE ANÁLISE DE VARIÂNCIA DOS CONTRASTES -------------------------------------------------------------------------------- FV GL SQ QM Fc Pr>Fc -------------------------------------------------------------------------------- Contraste 1 1 3.784500 3.784500 14.500 0.0017 Contraste 2 1 2.250000 2.250000 8.621 0.0102 Contraste 3 1 0.031250 0.031250 0.120 0.7341 Contraste 4 1 1.531250 1.531250 5.867 0.0286 Resíduo 15 3.915000 0.261000 -------------------------------------------------------------------------------- 23 APRESENTAÇÃO DOS RESULTADOS Tabela 8. Coeficientes e estimativa dos contrastes com suas respectivas significativas. Tratamentos (médias) Estimativa do Contraste Contrastes SC 5,25 SC+E 6,775 SC+E+NPK 6,65 SC+V 5,525 SC+V+NPK 6,4 Coeficientes dos contrastes Cerrado ou os demais 4 -1 -1 -1 -1 -1,0875 Esterco ou vermiculita 1 1 -1 -1 0,750 Esterco sem NPK ou esterco com NPK 1 -1 0,125 Vermiculita sem NPK ou vermiculita com NPK 1 -1 -0,875 Interpretação dos resultados Da análise de variância, concluímos que: 1) Solo cerrado somente vs demais Os efeitos sobre a altura de mudas de Pinus oocarpa são diferentes (P<0,01) e, pelos resultados das parcelas, verificamos que é interessante a utilização de esterco ou vermiculita. 2) Esterco vs vermiculita Os efeitos sobre a altura de mudas de Pinus oocarpa são diferentes (P<0,05) e, pelos resultados, verificamos que com esterco é melhor. 3) Esterco sem NPK vs esterco + NPK Os efeitos não diferem (P<0,05) e, portanto se usar esterco, colocar ou não NPK não altera os resultados de altura das mudas. 4) Vermiculita sem NPK vs vermiculita + NPK Se adicionarmos vermiculita, colocando-se NPK, as alturas das mudas serão diferentes (P<0,05) do que não se colocando NPK. 24 7. DELINEAMENTO EM BLOCOS CASUALIZADOS O delineamento em blocos casualizados é utilizado quando as condições experimentais não são homogêneas. A área heterogênea é subdividida em blocos, de forma que, cada bloco seja o mais homogêneo possível. A exigência de homogeneidade dentro de cada bloco pode limitar o número de tratamentos a serem testados. Considerando um experimento em que serão avaliados 5 tratamentos (T1, T2, T3, T4 e T5) em uma área heterogênea, instalado no delineamento em blocos casualizados com 4 blocos, um possível plano experimental a ser utilizado consta de: bloco 1 T3 T1 T2 T5 T4 bloco 2 T1 T4 T3 T5 T2 bloco 3 T5 T3 T1 T2 T4 bloco 4 T4 T5 T3 T2 T1 Observa-se que em cada bloco, tem-se uma repetição de cada tratamento. Os tratamentos são casualizados dentro de cada bloco. A disposição dos blocos vai depender das condições de heterogeneidade da área experimental. No esquema indicado, como a heterogeneidade é no sentido vertical, os blocos devem ser dispostos no sentido horizontal, ou seja, tem-se que em cada bloco todos os tratamentos serão avaliados sob a mesma condição. De maneira geral, o bloco deve ser o mais homogêneo possível, podendo haver diferenças marcantes de um bloco para o outro. VANTAGENS • Controla diferenças nas condições ambientais de um bloco para outro; • Leva a uma estimativa mais exata da variância residual, uma vez que a variação ambiental entre blocos é isolada. 25 DESVANTAGENS • Há uma redução no número de graus de liberdade do erro pois o DBC utiliza o princípio do controle local; • O número de tratamentos a ser utilizado é limitado pela exigência de homogeneidade dentro dos blocos, não podendo ser muito elevado. O modelo estatístico do delineamento em blocos casualizados é dado por: ij i j ijy eµ α β= + + + em que: ijy é o valor observado na parcela experimental que recebeu o tratamento i no bloco j ; µ representa uma constante geral associada a esta variável aleatória; jβ é o efeito do bloco j ( )1, 2,...,j b= ; iα é o efeito do tratamento i ( )1,2,...,i t= ; ijε é o erro experimental. Na Tabela 7 é apresentado o esquema da análise de variância para experimentos instalados no delineamento em blocos casualizados. Tabela 9. Esquema da análise de variância para experimentos instaladosno delineamento em blocos casualizados. FV GL SQ QM F Bloco 1b − SQ Bloco QM Bloco QM Bloco / QM Erro Tratamento 1t − SQ Trat QM Trat QM Trat / QM Erro Erro ( )( )1 1b t− − SQ Erro QM Erro Total 1tb − SQ Total Exemplo 1 de DBC Em 5 bosques distintos, fizeram-se estudos referentes ao crescimento em altura de 4 espécies de Álamo Americano. A distribuição dos tratamentos por blocos foi a seguinte: D B B C A D B A C D C A A D B C C D A B Bosque 1 Bosque 2 Bosque 3 Bosque 4 Bosque 5 Cada parcela constituiu de uma plantação de 100 gemas dos clones. Quando o experimento estava com 5 anos idade, se mediu a altura de todas as árvores sobreviventes e se calculou uma média por parcela. 26 Tabela 10. Altura média, em metros, por clones e por bosques das plantas cultivadas. Clones Bosques A B C D 1 5,47 4,26 3,65 4,86 2 4,56 4,56 4,87 3,95 3 4,87 4,56 2,43 4,56 4 4,26 3,65 3,04 3,65 5 3,65 4,26 2,74 4,26 Delineamento em Blocos Casualizados Balanceado (SISVAR) Sejam os dados da Tabela 10 referentes a um experimento instalado no delineamento em blocos casualizados para avaliar a altura de quatro espécies de Álamo Americano em cinco bosques distintos. a.3) Efetuar a análise de variância • Abrir o SISVAR e ir para Análise\Anava; • Abrir arquivo exemplo1 DBC.dbf (no quadro variáveis do arquivo deve aparecer as variáveis do arquivo a ser analisado); • Informar as Fontes de Variação. (No DBC, ver Tabela 7 → BLOCOS (BOSQUES), CLONES, Erro e Total. Não é necessário informar Erro e Total);Clicar em BLOCO, adicionar, CLONES, adicionar e Fim; • Clicar em Yes para encerrar o quadro de análise de variância; • Clicar em CLONES no Quadro “Opções do quadro da análise de variância”; • Escolher a opção Teste de Tukey e/ou de Scott-Knott (Deve-se pedir cada teste individualmente, clicar em CLONES, teste escolhido, Ok); • No quadro, “Variáveis a serem analisadas”, selecionar variável para analisar, no nosso exemplo “altura”; • Clicar em Finalizar\Finalizar. a.4) Saída dos resultados • Salvar relatório como exemplo1 DBC.doc 27 Tabela 11. Dados de um experimento instalado no delineamento em blocos casualizados para avaliar a altura, em metros, de quatro espécies de Álamo Americano plantados em cinco bosques distintos. Clones Blocos Altura A 1 5,47 A 2 4,56 A 3 4,87 A 4 4,26 A 5 3,65 B 1 4,26 B 2 4,56 B 3 4,56 B 4 3,65 B 5 4,26 C 1 3,65 C 2 4,87 C 3 2,43 C 4 3,04 C 5 2,74 D 1 4,56 D 2 3,95 D 3 4,56 D 4 3,65 D 5 4,26 RESULTADOS Arquivo analisado: C:\Documents and Settings\Bessa\Meus documentos\Roberta\Curso de estatística experimental\exemplo 1de DBC.DB -------------------------------------------------------------------------------- Variável analisada: ALTURA Opção de transformação: Variável sem transformação ( Y ) -------------------------------------------------------------------------------- TABELA DE ANÁLISE DE VARIÂNCIA -------------------------------------------------------------------------------- FV GL SQ QM Fc Pr>Fc -------------------------------------------------------------------------------- Clones 3 4.155695 1.385232 3.936 0.0362 Blocos 4 2.803820 0.700955 1.992 0.1600 erro 12 4.223580 0.351965 -------------------------------------------------------------------------------- Total corrigido 19 11.183095 -------------------------------------------------------------------------------- CV (%) = 14.45 Média geral: 4.1055000 Número de observações: 20 Teste Tukey para a FV Clones -------------------------------------------------------------------------------- DMS: 1.11437416745546 NMS: 0.05 -------------------------------------------------------------------------------- 28 Média harmonica do número de repetições (r): 5 Erro padrão: 0.265316791779186 -------------------------------------------------------------------------------- Tratamentos Médias Resultados do teste -------------------------------------------------------------------------------- C 3.346000 a1 D 4.256000 a1 a2 B 4.258000 a1 a2 A 4.562000 a2 -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- Teste SNK para a FV Clones Médias DMS NMS: 0.05 -------------------------------------------------------------------------------- 4 1.11437416745546 3 1.00152091822158 2 0.817522501282244 -------------------------------------------------------------------------------- Média harmonica do número de repetições (r): 5 Erro padrão: 0.265316791779186 -------------------------------------------------------------------------------- Tratamentos Médias Resultados do teste -------------------------------------------------------------------------------- C 3.346000 a1 D 4.256000 a1 a2 B 4.258000 a1 a2 A 4.562000 a2 -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- Teste Scott-Knott (1974) para a FV Clones -------------------------------------------------------------------------------- NMS: 0.05 -------------------------------------------------------------------------------- Média harmonica do número de repetições (r): 5 Erro padrão: 0.265316791779186 -------------------------------------------------------------------------------- Tratamentos Médias Resultados do teste -------------------------------------------------------------------------------- C 3.346000 a1 D 4.256000 a2 B 4.258000 a2 A 4.562000 a2 -------------------------------------------------------------------------------- APRESENTAÇÃO DOS RESULTADOS Tabela 12. Altura média (erro padrão) de clones de Álamo Americano, em metros. Clones 1Médias (erro padrão) A 4,56 a (0,26) B 4,26 a (0,26) C 3,35 b (0,26) D 4,26 a (0,26) 1 – Médias seguidas da mesma letra, na coluna, não diferem entre si pelo teste de Scott-Knott, para o valor nominal de 5% de significância. 29 Interpretação dos resultados Os resultados experimentais nos permitem concluir que houve efeito significativo dos diferentes dos diferentes clones de Álamo Americano (p=0,0362) sobre a altura das plantas. Não houve efeito significativo do controle local exercido pelos diferentes bosques (p=0,1600) sobre a altura das árvores. As árvores dos clones A, B e D apresentaram alturas estatisticamente iguais e superiores quando comparadas a árvore do clone C pelo teste de Scott-Knott considerando o valor nominal de 5% de significância. Exemplo 2 de DBC Os dados da tabela 13, que se referem a um experimento de adubação de milhofeito pelos engenheiros Agrônomos Glauco Pinto Viegas e Erik Smith, em blocos ao acaso, permite exemplificar a aplicação da teoria. Os tratamentos constaram de adubação com 0, 25, 50, 75, e 100 kg/ha de P2O5. Tabela 13. Produções de milho, em kg/parcela, de um experimento de adubação de milho. Tratamentos 0 25 50 75 100 Totais de Blocos 3,38 7,15 10,07 9,55 9,14 39,29 5,77 9,78 9,73 8,95 10,17 44,40 4,90 9,99 7,92 10,24 9,75 42,80 4,54 10,10 9,48 8,66 9,50 42,28 18,59 37,02 37,20 37,40 38,56 168,77 RESULTADOS Arquivo analisado: C:\Arquivos de programas\Sisvar\Exemplos\Pimen230.DB -------------------------------------------------------------------------------- Variável analisada: Produção de milho Opção de transformação: Variável sem transformação ( Y ) -------------------------------------------------------------------------------- TABELA DE ANÁLISE DE VARIÂNCIA -------------------------------------------------------------------------------- FV GL SQ QM Fc Pr>Fc -------------------------------------------------------------------------------- Blocos 3 2.734855 0.911618 1.002 0.4252 Adubação kg/parcela 4 72.219880 18.054970 19.853 0.0000 30 erro 12 10.913320 0.909443 -------------------------------------------------------------------------------- Total corrigido 19 85.868055 -------------------------------------------------------------------------------- CV (%) = 11.30 Média geral: 8.4385000 Número de observações: 20 -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- Regressão para a FV Adubação kg/parcela -------------------------------------------------------------------------------- Média harmonica do número de repetições (r): 4 Erro padrão de cada média dessa FV: 0.476823692084751 -------------------------------------------------------------------------------- b1 : X b2 : X^2 b3 : X^3 Modelos reduzidos sequenciais -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- t para Parâmetro Estimativa SE H0: Par=0 Pr>|t| -------------------------------------------------------------------------------- b0 6.422500 0.36934604 17.389 0.0000 b1 0.040320 0.00603140 6.685 0.0000 -------------------------------------------------------------------------------- R^2 = 56.28% -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- Valores da variável independente Médias observadas Médias estimadas -------------------------------------------------------------------------------- 0.000000 4.647500 6.422500 25.000000 9.255000 7.430500 50.000000 9.300000 8.438500 75.000000 9.350000 9.446500 100.000000 9.640000 10.454500 -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- t para Parâmetro Estimativa SE H0: Par=0 Pr>|t| -------------------------------------------------------------------------------- b0 5.189643 0.44875020 11.565 0.0000 b1 0.138949 0.02126319 6.535 0.0000 b2 -0.000986 0.00020390 -4.837 0.0004 -------------------------------------------------------------------------------- R^2 = 85.74% -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- Valores da variável independente Médias observadas Médias estimadas -------------------------------------------------------------------------------- 0.000000 4.647500 5.189643 25.000000 9.255000 8.046929 50.000000 9.300000 9.671357 75.000000 9.350000 10.062929 100.000000 9.640000 9.221643 -------------------------------------------------------------------------------- t para Parâmetro Estimativa SE H0: Par=0 Pr>|t| -------------------------------------------------------------------------------- b0 4.709393 0.47340556 9.948 0.0000 b1 0.276620 0.04817182 5.742 0.0001 b2 -0.004828 0.00122339 -3.947 0.0019 b3 0.000026 0.00000804 3.185 0.0078 -------------------------------------------------------------------------------- R^2 = 98.51% -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- Valores da variável independente Médias observadas Médias estimadas -------------------------------------------------------------------------------- 31 0.000000 4.647500 4.709393 25.000000 9.255000 9.007429 50.000000 9.300000 9.671357 75.000000 9.350000 9.102429 100.000000 9.640000 9.701893 -------------------------------------------------------------------------------- Somas de quadrados seqüenciais - Tipo I (Type I) -------------------------------------------------------------------------------- Causas de Variação G.L. S.Q. Q.M. Fc Prob.<F -------------------------------------------------------------------------------- b1 1 40.642560 40.642560 44.689 0.000 b2 1 21.279114 21.279114 23.398 0.000 b3 1 9.225603 9.225603 10.144 0.008 Desvio 1 1.072603 1.072603 1.179 0.299 Resíduo 12 10.913320 0.909443 -------------------------------------------------------------------------------- APRESENTAÇÃO DOS RESULTADOS Em primeiro lugar, devemos observar os graus de liberdade referentes a tratamentos (Adubação) que serão decompostos em componentes individuais a fim de estudar separadamente os efeitos da regressão de 10 grau (linear), de 20 grau (quadrática), 30 grau (cúbica) e Desvios de Regressão que é o teste de ajustamento da equação de regressão. O quadro de Análise da Variância pode ser reescrito da seguinte maneira: Fonte de Variação gl Soma de Quadrados Quadrado Médio (p-valor) Adubação (4) 72,22 18,055 (p=0,000) Regressão Linear 1 40,64 40,64 (p=0,000) Regressão quadrática 1 21,28 21,28 (p=0,000) Regressão cúbica 1 9,23 9,23 (p=0,008) Desvio de Regressão 1 1,072 1,072 (0,299) Bloco 3 2,73 0,91(p=0,4252) Erro 12 10,92 0,910 Os resultados experimentais nos mostram que existe um efeito significativo das adubações (p=0,000) sobre a sua produção. Verificamos também que uma regressão cúbica (p=0,008) é a que melhor se ajusta aos dados de produção. 8. DELINEAMENTOS EM QUADRADO LATINO (DQL) CARACTERÍSTICAS A casualização para quadrados latinos seguem algumas particularidades. Esse delineamento possui três princípios básicos da experimentação: casualização, repetição e 32 controle local, diferindo do delineamento em blocos casualizados por apresentar controle local em duas direções. O DQL é um delineamento bastante utilizado em condições de campo onde 2 fontes principais de variação estão presentes e que precisam ser controladas. Cada tratamento aparece uma única vez em cada linha (ou bloco horizontal) e em cada coluna (bloco vertical). A exigência principal do quadrado latino é que o número de repetições seja igual ao número de tratamentos. Os delineamentos em quadrado latino recebem este nome porque o número de parcelas totais do experimento corresponde ao quadrado do número de tratamentos ( )2n t= e por terem sido, originalmente, representados por letras latinas. VANTAGENS • Controla diferenças nas condições ambientais de um bloco para outro em duas direções; • Leva a uma estimativa mais exata da variância residual, uma vez que a variação ambiental entre blocos, em duas direções, é isolada. DESVANTAGENS • Há uma redução no número dos graus de liberdade do erro, pois o DQL, utiliza o princípio do controle local em duas direções; • O número de tratamentos a ser utilizado é limitado pela exigência de homogeneidade dentro dos blocos, não podendo ser muito elevado, geralmente o tamanho máximo de quadrados latinos é 8x8. O modelo estatístico do delineamento em quadrado latino é dado a seguir: ijk i j k ijky eµ α β τ= + + + + em que: ijky representa a observação do i -ésimo tratamento na j -ésima coluna e na k -ésima linha; µ representa uma constante geral associada a esta variável aleatória; iα é o efeito do tratamento i ( )1,2,...,i t= ; jβ é o efeito da j -ésima coluna; ( )1,2,...,j t= ; kτ é o efeito da k -ésima linha; ( )1,2,...,k t= ; 33 ijkε representa o erro experimental associado a observação ijky , suposto ter distribuição normal com média zero e variância comum. Tabela 14. Esquema da análise de variância para experimentos instalados no delineamento em quadrado latino. FV GL SQ QM F Tratamento 1t − SQ Trat QM Trat QM Trat / QM Erro Linha 1t − SQ Linhas QM Linhas Coluna 1t − SQ Colunas QM Colunas Erro ( )( )1 2t t− − SQ Erro QM Erro Total 2 1t − SQ Total em que, t é o número de tratamentos. CASUALIZAÇÃO A casualização para delineamentos em quadrados latinos com 2, 3 ou 4 tratamentos é processada como segue: • tome o quadrado padrão (sistematizado); • casualize todas as linhas, exceto a primeira; • casualize todas as colunas. Como exemplo, suponha que você deseja casualizar um quadrado latino com 4 tratamentos: A, B, C e D. Procedemos como segue: O quadrado sistematizado é o seguinte: Coluna 1 Coluna 2 Coluna 3 Coluna 4 Linha 1 A B C D Linha 2 D A B C Linha 3 C D A B Linha 4 B C D A Com o sorteio das linhas, exceto a primeira, obtemos o seguinte quadrado; Coluna 1 Coluna 2 Coluna 3 Coluna 4 Linha 1 A B C D Linha 4 B C D A Linha 2 D A B C Linha 3 C D A B Com o sorteio de todas as colunas, obtemos o quadrado casualizado pronto para a execução e acompanhamento no campo. 34 Coluna 2 Coluna 3 Coluna 4 Coluna 1 Linha 1 B C D A Linha 4 C D A B Linha 2 A B C D Linha 3 D A B C A casualização para quadrados latinos com 5 ou mais tratamentos é semelhante ao procedimento apresentado anteriormente. Para este sorteio não é necessário, no momento de sortear as linhas, fixar a primeira. Exemplo de Quadrado Latino Num experimento de competição de variedades de cana forrageira foram usadas 5 variedades: A= Co 290; B= Co 294; C= Co 297; D= Co 299 e E= Co 295, dispostas em um quadrado latino 5 x 5. O controle feito através de blocos horizontais (linhas) e blocos verticais (colunas) teve por objetivo eliminar influências devida a diferenças de fertilidade em 2 direções. As produções, em kg por parcela, foram as seguintes: Tabela 15. Produção, em kg por parcela, de 5 variedades de cana forrageira. Colunas Linhas 1 2 3 4 5 1 D (432) A (518) B (458) C (583) E (331) 2 C (724) E (478) A (524) B (550) D (400) 3 E (489) B (384) C (556) D (297) A (420) 4 B (494) D (500) E(313) A (486) C (501) 5 A (515) C (660) D (438) E (394) B (318) Delineamento em Quadrado Latino (SISVAR) Sejam os dados da Tabela 15 referentes a um experimento instalado no delineamento em quadrado latino para avaliar a produção, em kg, de cinco variedades de cana forrageira. a.3) Efetuar a análise de variância • Abrir o SISVAR e ir para Análise\Anava; 35 • Abrir arquivo exemplo DQL.dbf (no quadro variáveis do arquivo deve aparecer as variáveis do arquivo a ser analisado); • Informar as Fontes de Variação. (No DQL, ver Tabela 12 → Tratamentos, Linhas, Colunas, Erro e Total. Não é necessário informar Erro e Total);Clicar em Tratamentos, adicionar, Linhas, adicionar, Colunas e Fim; • Clicar em Yes para encerrar o quadro de análise de variância; • Clicar em tratamentos no quadro “Opções do quadro da análise de variância”; • Escolher a opção Teste de Tukey e/ou de Scott-Knott (Deve-se pedir cada teste individualmente, clicar em tratamentos, teste escolhido, Ok); • No quadro, “Variáveis a serem analisadas”, selecionar variável para analisar, no nosso exemplo “PRODUÇÃO”; • Clicar em Finalizar\Finalizar. a.4) Saída dos resultados • Salvar relatório como exemplo DQL.doc RESULTADOS Arquivo analisado: C:\Documents and Settings\Bessa\Meus documentos\Roberta\Curso de estatística experimental\exemplo DQL.DB -------------------------------------------------------------------------------- Variável analisada: PRODUÇÃO Opção de transformação: Variável sem transformação ( Y ) -------------------------------------------------------------------------------- TABELA DE ANÁLISE DE VARIÂNCIA -------------------------------------------------------------------------------- FV GL SQ QM Fc Pr>Fc -------------------------------------------------------------------------------- Tratamentos 4 137488.240000 34372.060000 12.091 0.0004 Linhas 4 30480.640000 7620.160000 2.680 0.0831 Colunas 4 55640.640000 13910.160000 4.893 0.0142 erro 12 34114.720000 2842.893333 -------------------------------------------------------------------------------- Total corrigido 24 257724.240000 -------------------------------------------------------------------------------- CV (%) = 11.33 Média geral: 470.5200000 Número de observações: 25 -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- Teste Tukey para a FV Tratamentos -------------------------------------------------------------------------------- DMS: 107.521299732566 NMS: 0.05 -------------------------------------------------------------------------------- Média harmonica do número de repetições (r): 5 36 Erro padrão: 23.8448876421481 --------------------------------------------------------------------------------
Compartilhar