Prévia do material em texto
Experimentação Agrícola Análise conjunta de experimentos, regressão não linear e softwares estatísticos Msc. Flávia Luciane Bidóia • Unidade de Ensino: 4 • Competência da Unidade: Desenvolver análises estatísticas para interpretação de resultados • Resumo: Interpretação de resultados • Palavras-chave: análise conjunta, regressão, software. • Título da Teleaula: Análise conjunta de experimentos, regressão não linear e softwares estatísticos • Teleaula nº: 04 Introdução Até o momento, com o estudo dos delineamentos e esquemas experimentais, realizamos conclusões específicas. Análise conjunta de experimentos: histórico científico, banco de dados com análises. A análise conjunta é utilizada na interpretação e no uso de dados mais abrangentes. Análise de regressão: nesse tipo de análise de dados, a transformação da interpretação em equações matemáticas irá fornecer subsídios técnicos para que as decisões das empresas e das fazendas tenham alicerce na viabilidade econômica e no uso racional de insumos ou recursos naturais. Softwares estatísticos que fornecerão ferramentas para o uso mais eficiente do tempo do experimentador/pesquisador Análise conjunta de experimentos Análise conjunta de experimentos É uma análise estatística que pode ser realizada com experimentos planejados ou em experimentos que não foram projetados especificamente para serem analisados com ela, mas que satisfazem os critérios para tal. A análise conjunta é utilizada na interpretação e no uso de dados mais abrangentes. 1 2 3 4 5 6 Em muitos casos, poderão ser realizados experimentos em locais diferentes. Da mesma forma, em vez do objetivo de estudos ser os locais diferentes, se atendidos os critérios para proceder a análise conjunta, poderão ser utilizados anos agrícolas, de forma que os experimentos forneçam, além do histórico do comportamento de cultivares de soja, por exemplo, uma maior segurança dos materiais com maior estabilidade produtiva nos últimos anos Exemplificando Uma análise conjunta de um experimento em delineamento de blocos casualizados com todos os tratamentos em comum. Foi realizado um experimento, em 4 ambientes para analisar os teores de nitrogênio em tecido foliar, em resultado do uso de 4 inoculantes comerciais (Bradyrhizobium japonicum), em tratamento de sementes na cultura da soja. 7 8 9 10 11 12 Na sequência, iremos verificar, antes de iniciarmos a análise conjunta, a relação entre o maior (3,40) e o menor valor (0,95) do quadrado médio do erro. A relação é 3,57, relação esta que aponta que podemos prosseguir com a análise de variância, atendendo os critérios de homogeneidade entre os dados e condições dos experimentos. Na Tabela 4.9 há um modelo de análise de variância para análise conjunta de delineamento de blocos casualizados, com as fontes de variação, graus de liberdade, soma de quadrados, quadrados médios e teste F. 13 14 15 16 17 18 Com o término da análise de variância, é possível notar que os inoculantes possuem eficiências diferentes quanto ao incremento de nitrogênio em tecido foliar. O comportamento das bactérias dos inoculantes testados comportaram-se diferentemente nos ambientes testados. Posterior a análise da significância da ANOVA, para o exemplo supracitado, será possível determinar, pelo teste de Tukey, qual dos inoculantes foi mais eficiente nos 4 ambientes testados. Por meio de uma análise numérica das médias, aparentemente, os inoculantes 3 e 4 apresentaram as maiores médias de N em tecido foliar. No entanto, essa diferença é significativa? Além disso, quais as condições edafoclimáticas dos ambientes 2 e 4, por exemplo, que possibilitaram que os inoculantes expressem a sua maior eficiência? Essas são as interpretações obtidas pela submissão dos dados ao teste de Tukey. Regressão não linear Regressão não linear As regressões não lineares, são de muita utilidade e importância e podem ser utilizadas em todos os exemplos já considerados. Utilizamos a análise de regressão para verificar a existência de uma relação funcional significativa entre uma variável dependente com uma ou mais variáveis independentes. 19 20 21 22 23 24 Regressão não linear Diversas áreas da agronomia, como a fertilidade do solo, necessitam de que sejam determinadas as doses de máxima eficiência econômica e as doses de máxima eficiência técnica. A equação gerada, após os dados serem submetidos à análise de variância e à análise de regressão que mais se ajusta ao comportamento dos dados é a representação do fenômeno em estudo. Exemplificando Como exemplo podemos realizar a interpretação de dados de um experimento com cinco doses crescentes (20, 40, 60, 80 e 100 ml ha-1 ) de um herbicida (X), na eficiência de controle de trapoeraba (Commerlina villosa) O primeiro passo é verificar se houve significância e se o nível de confiabilidade foi 5 ou 1%. Suponhamos que no caso anterior houve significância, ou seja, o aumento das doses testadas do herbicida influenciou a eficiência de controle A equação de regressão que mais adaptou-se para explicar o comportamento da eficiência de controle foi a equação de regressão linear Planejamento de experimentos para posterior avaliação de análise conjunta 25 26 27 28 29 30 Situação-problema 1 1. Na região de atuação da Agrodatanalysis, há um questionamento comum, em todos os anos agrícolas, por todos os clientes. Qual a cultivar de soja mais estável dentro da sua região de atuação? Há apenas uma cultivar ou há um grupo de cultivares, qual você leva em consideração, nas suas recomendações? Ao procurar os dados dos últimos anos, você observa que mais de 40 cultivares foram testadas todos os anos. Dentro dessas mais de 40 cultivares, 15 foram testadas, em comum, nos últimos 3 anos. É importante ressaltar que esses experimentos foram conduzidos em delineamento de blocos casualizados. Considerações Nesta situação, você poderá calcular as tabelas de análise de variância para cada um dos três anos, sendo que os anos, neste caso, serão considerados ambientes. É importante, da mesma forma, verificar se, em todos os anos, os experimentos foram casualizados, pois, em algumas situações, já foi observado que algum pesquisador, erroneamente, tem colocado cada tratamento, ao longo dos anos, nas mesmas parcelas, com o objetivo de “memorizar” os seus locais, facilitando, assim, a dinâmica em dias de campo. Se os quadrados médios de erro forem considerados homogêneos, você poderá trabalhar com a análise conjunta de experimentos, respondendo, assim, esse questionamento com muita confiabilidade. Para os próximos anos, você poderá planejar a instalação do mesmo experimento em locais diferentes em um mesmo ano e determinar quais as cultivares que alcançaram os resultados superiores. Equações de regressão Situação-problema 2 1. Levantamento realizado pela Agrodatanalysis a respeito da cultivar de soja mais semeada nas últimas safras, e sobre qual será a cultivar de soja que os produtores pretendem semear no próximo ano agrícola evidenciou que a tendência é que em 62,34% da área agrícola da região será cultivada a cultivar Kroton Supremo. 31 32 33 34 35 36 O levantamento de custo com sementes, realizado na mesma região, chegou a 23,45% do custo total de produção. Sendo assim, os produtores desejam obter a resposta se é possível trabalhar com uma quantidade de sementes mais baixa, sem comprometer a produtividade. Nesse contexto o que você faria? Podemos aplicar a regressão não linear nessa análise? Considerações: No presente caso, podemos desenvolver um ou mais de um experimento em diferentes regiões, com 5 tratamentos dispostos em 4 blocos ou quatro repetições. As populações de plantas podem ser os tratamentos. Você poderá optar, da mesma forma, por intervalo de sementes por metro, como: 8, 10, 12, 14 e 16 plantas por metro. Se os resultados forem significativos, uma equação de regressãoo ajudará a responder esse questionamento de forma a alcançar altas produtividades ao levar em conta, da mesma forma, a rentabilidade. Suponhamos que os resultados foram significativos e que a equação adotada é a seguinte: Nesse sentido, ao derivarmos a equação: sementes por metro linear, conseguimos obter o número de sementes por metro linear. Esse número de sementes, indica a recomendação onde se alcançará a máxima produtividade dessa cultivar. Questionamento Questionamento A principal diferença entre o esquema fatorial e o esquema de parcelas subdividas é que, no segundo caso, as parcelas são testadas “dentro” do fator principal. Por isso, no caso do esquema fatorial, cada fator é testado em parcelas do mesmo tamanho. ( ) Certo ( ) Errado 37 38 39 40 41 42 Regressão não linear Exemplificando Vamos verificar o que foi observado em um experimento com sete doses de cálcio (Ca) por hectare, na cultura do milho, na produtividade em sacas por hectare. Começamos com um incremento de produtividade na dose 5 kg ha-1. Posteriormente há uma queda na produtividade na dose 10, valor semelhante àquele encontrado na dose 25 e 30. A menor produtividade foi encontrada na dose 20. No entanto, vamos aos cálculos para que possamos verificar se essa hipótese realmente se confirma. 43 44 45 46 47 48 Nesse exemplo, para determinarmos a regressão que mais se aproxima de descrever esses dados, para os tratamentos Nos testes que iremos considerar nesta seção, os níveis são equidistantes, sendo 0, 5, 10, 15, 20, 25 e 30 (kg.ha1). Dessa forma, podemos utilizar as tabelas com os coeficientes para interpolação dos polinômios ortogonais. Essa metodologia, utiliza coeficientes e valores dados em tabelas 49 50 51 52 53 54 Para realizarmos o cálculo da SQ do desvio de regressão (S.Q. DR), podemos usar a seguinte fórmula: As regressões quadrática e cúbica são as mais indicadas para realizar as análises estatísticas para esse conjunto de dados Para calcular a equação da regressão: Softwares estatísticos Softwares estatísticos As análises dos dados dos experimentos podem ser inseridos em programas, após a realização das análises, é possível fazer a interpretação dos resultados No material, nós vamos conhecer alguns comandos básicos e a respectiva interpretação dos resultados, utilizando 2 softwares estatísticos. Exemplos de softwares: Sisvar, Genes e R 55 56 57 58 59 60 SISVAR: Esse software possui como principal vantagem a aplicação adequada das comparações múltiplas ou para comparações de médias e testes F, até mesmo para modelos de regressão ajustados. Além disso, é um software livre, não há custos para sua utilização. No entanto, é preciso ter atenção para não deixar células em branco ou vazias no banco de dados, pois o Sisvar não pode executar uma análise nessas condições. Exemplificando Considerar um experimento em delineamento inteiramente casualizado, com 10 tratamentos e 5 blocos O experimento diz respeito à produtividade em cultivares de soja, instalado e conduzido em casa de vegetação, à inoculação de ferrugem asiática (Phakopsora pachyrizi). Abrir arquivo > manipular Após esse passo aparecerá uma nova janela, intitulada Arquivo, em que você irá clicar novamente em Arquivo e selecionar a opção criar Nesse momento aparecerá uma janela com a opção Salvar como Para concluir o salvamento do arquivo você deverá inserir um nome para ele. Escreva: dbcnaopodefaltar – sem acentos 61 62 63 64 65 66 Após definir o nome do arquivo, uma caixa irá aparecer para preencher quantas colunas você irá precisar para analisar o experimento. Como será analisado a influência dos blocos, dos tratamentos e do teor de clorofila, você irá inserir o número 3, referente a três colunas que irá necessitar para compor o experimento. Em seguida, uma nova caixa irá aparecer: Digite o nome da variável. Então, digite Bloco. Outra caixa de confirmação irá aparecer, com o seguinte conteúdo: O campo é numérico? Responda SIM, caso seja numérico, e NÃO para o tipo string (alfanumérico). Entre as opções, selecione ” Como você selecionou 3 colunas e já forneceu as informações para a primeira, uma segunda e uma terceira janela para preenchimento irão aparecer. Os nomes das variáveis serão Tratamento e Clorofila, respectivamente. Para as questões sobre o campo numérico clicar em SIM para essas duas variáveis. 67 68 69 70 71 72 Verificar se os valores foram corretamente digitados. Após isso, clique em Arquivo e posteriormente em Sair. Os dados estarão prontos para análise nesse momento. Após isso, com o software aberto, utilize a segunda opção, Análise, depois selecione Anava. Posteriormente, clique em Abrir arquivo. Nesse momento, os dados Blocos, Tratamento e Clorofila estarão à disposição no quadro branco, ao lado direito da janela do software. Selecione Blocos e Tratamento e posteriormente clique em adicionar. Selecione Fim. Então, irá aparecer uma janela questionando se deseja encerrar o quadro de análise de variância. Clique em Sim. Nesse momento irá aparecer uma janela com opções do quadro de análise de variância. Clique em OK. 73 74 75 76 77 78 Em seguida, uma nova janela irá aparecer a respeito de quais variáveis devem ser escolhidas para analisar Selecione Clorofila e clique em finalizar. No quadro que irá aparecer com as opções das transformações não selecione nenhuma opção, apenas clique em ok. Então, o software irá gerar um arquivo com a tabela de análise de variância do exemplo, demonstrada a seguir Software SISVAR Especificar seu modelo de análise de variância Determinar os cálculos da tabela de análise de variância com a análise de modelos lineares experimentais Determinar comparações múltiplas para médias, regressão para médias de fontes de variação quantitativas, contrastes, entre outros. Software SISVAR A desvantagem é que o Sisvar não realiza modelos lineares não balanceados, além de não possuir métodos de análises multivariadas. Software SISVAR 79 80 81 82 83 84 3. Considerar um experimento em delineamento inteiramente casualizado, com 10 tratamentos e 6 repetições. O experimento diz respeito à produtividade em cultivares de soja, instalado e conduzido em casa de vegetação, à inoculação de ferrugem asiática Considerações: 1. Inserir os dados, evitar sinais e acentuações Verificar o lançamento dos dados 85 86 87 88 89 90 Software SISVAR 2. Clicar em arquivo e depois em sair: dados prontos para análise 3. Selecionar Tratamento e, então, clique em adicionar. Selecione Fim. Após essa ação, vai aparecer uma janela questionando se você deseja encerrar o quadro de análise de variância. Clique em Sim. 4. Irá aparecer uma janela, com opções do quadro de análise de variância. Clique em Tratamentos e selecione Teste de Tukey. 91 92 93 94 95 96 5. Em seguida, uma nova janela irá aparecer, a respeito de quais variáveis que devem ser escolhidas para analisar. Selecione Prod e clique em finalizar. 6. No quadro que irá aparecer com as opções das transformações não selecione nenhuma opção, apenas clique em ok. O software irá gerar um arquivo com a tabela de análise de variância do exemplo, demonstrada a seguir, No relatório gerado pelo Sisvar, apresenta-se o teste de Tukey, com o valor de DMS prontamente resolvido. Questionamento 97 98 99 100 101 102 A análise conjunta se torna mais fácil se o grupo de experimentos possui os mesmos tratamentos, o mesmo número de repetições e o mesmo delineamento experimental. ( ) Certo ( ) Errado 103