Baixe o app para aproveitar ainda mais
Prévia do material em texto
Bio 1005 – Desenho amostral e experimental – PUC-Rio 1 Delineamento experimental e amostral Alexandre G. Christo e Richieri A. Sartori 2018 Bio 1005 – Desenho amostral e experimental – PUC-Rio 2 1 - Introdução Um dos pontos fundamentais para a realização de um bom projeto de pesquisa está na capacidade de obtenção dos dados, seja em campo através das unidades amostrais ou em laboratório, através das unidades experimentais. Uma boa coleta dos dados irá conferir uma grande robustez e validade de resultados e conclusões. Uma unidade amostral ou experimental é a base de um projeto de pesquisa, sendo de grande importância ter em mente questões como a heterogeneidade do objeto de estudo, análises que serão aplicadas, número mínimo de dados a serem utilizados e quais variáveis serão medidas. A definição para a escolha do método de amostrar, número de unidades amostrais e disposição das mesmas é chamado de amostragem. Dificilmente um projeto terá uma boa resposta quando o método de amostragem não for feito da forma correta. Por fim, para se ter a melhor forma de amostragem deve-se ter muito bem definidos os objetivos, as hipóteses e as variáveis. A amostragem está relacionada com dados já existentes em alguma área de estudo. A experimentação está relacionada com a montagem de uma determinada situação em laboratório ou mesmo em campo, sendo mais controlada, onde somente um dos fatores, em um processo mais simples que veremos mais adiante, irá variar, o restante ficará constante. 2 - Método científico Está relacionado com as regras básicas dos procedimentos utilizados para se realizar um projeto de pesquisa, base de todo conhecimento científico. Figura 1: Diagrama da metodologia científica. Apresentação da disciplina Bio 1005 – Desenho amostral e experimental – PUC-Rio 3 3 - Questões importantes para iniciar um projeto: 3.1 Se trata de uma amostragem ou de uma experimentação? 3.2 No caso de uma amostragem, não será possível coletar todos os dados, então a pergunta é: Quantos dados serão possíveis levantar? E assim ter em mente de que há o ideal e há o real. Nem sempre o ideal é possível, por conta de recursos, principalmente, tempo e dinheiro. O importante é que o real esteja dentro do aceitável para um bom trabalho. Mais para frente iremos estudar formas de se calcular o “n” amostral aceitável. 3.3 Quais as variáveis que realmente influenciam e ter em mente que sempre existem variáveis que desconhecidas e que estão influenciando. Quanto mais conhecimento sobre o assunto, mais fácil será de identificar as variáveis. 3.4 Como coletar estes dados? 3.5 Quais análises aplicar no final? Se tiver uma ideia de quais análises aplicar, saberá com mais facilidade quantos dados coletar, por exemplo. Desta forma, o objetivo principal desta disciplina é fazer com que os alunos aprendam a observar, questionar e responder sobre questões de interesse na aplicação de projetos de pesquisa. 4 - Programação (sujeita a mudanças): Aula Conteúdo 1 Apresentação da disciplina; 2 Introdução à delineamento experimental; Elaboração de projetos e artigos; 3 Métodos de amostragem e coleta de dados em campo; Curadoria; 4 Aula de campo 5 Esforço amostral e suficiência amostral; 6 Apresentação dos projetos de pesquisa; 7 G1 8 Introdução a delineamento, DIC 9 DIC - Delineamento inteiramente casualizado. 10 DBI - Delineamento em blocos casualizados; 11 Delineamento em Quadrado Latino - DQL 12 Kruskal Wallis; 13 Trabalhando com o Biostat. 14 Aula de campo. Experimentação de dados de projetos de mestrado e doutorado no JBRJ; 15 G2; 16 Retirar dúvidas e ajudar nas análises dos projetos; 17 G3 - apresentação de artigos; 18 G4; Bio 1005 – Desenho amostral e experimental – PUC-Rio 4 5 - Avaliação G1 – Prova: Desenho amostral e projeto (60% e 40%, respectivamente); G2 – Prova: Delineamento experimental; G3 – Apresentação final dos projetos; 6 - Projeto de pesquisa Grupos de 4 ou 5 pessoas; Duas etapas: projeto e artigo; Projeto: entrega até dois dias antes da apresentação; Artigo: entrega dois dias antes da apresentação; Desenvolvimento em 3 meses. Apresentação em seminário e entrega da parte escrita do artigo no formato da revista Rodriguesia (http://rodriguesia.jbrj.gov.br/). Bio 1005 – Desenho amostral e experimental – PUC-Rio 5 Elaboração de projetos e publicação de artigos científicos Métodos científicos É a metodologia utilizada nos projetos de pesquisa, desde a proposta até a análise dos dados, consistindo em uma série de etapas. Visuali zação de um evento defin ição do problema colet a das informações organiza ção e apresentação a nálise dos ados t omada de decisão Projetos O projeto de pesquisa é a apresentação de uma proposta de trabalho, com explicações claras sobre qual o assunto a ser abordado, quais questões se pretende responder, justificativas que expliquem a razão da existência do mesmo, metodologia que será empregada, previsão de tempo e custos. O projeto é a porta para o financiamento. Um bom projeto que seja justificável, com metodologia confiável e relevância tem grandes chances de conseguir um financiamento ou então uma vaga em programas de pós graduação. Apresentação de um projeto 1. Título 2. Resumo 3. Introdução 4. Justificativa 5. Objetivos 6. Hipóteses 7. Metodologia 8. Resultados esperados 9. Cronograma 10. Orçamento 11. Bibliografia Muitas pessoas, principalmente em início de carreira acham que um projeto tem início com o título, mas este é o último item a ser formulado. O primeiro ponto é determinar qual é o objetivo do trabalho. Não é fácil, principalmente no início conseguir determinar exatamente qual o objetivo. É importante compreender que o projeto precisa estar todo ligado, todos os itens precisam se completar e falar de um mesmo assunto. A seguir um diagrama com uma proposta de formulação de um projeto, claro que pesquisadores diferentes possuem formas diferentes de trabalhar e com o tempo irão encontrar aquela que melhor se adequa. Projeto de pesquisa Artigo científico Bio 1005 – Desenho amostral e experimental – PUC-Rio 6 Figura 1: Diagrama de construção de um projeto de pesquisa. Objetivo O objetivo é o coração do projeto, tendo que haver uma ligação com o título, precisa ser explicado pela introdução, justificado e apresentar uma metodologia que seja capaz de responder a esta questão. Objetivos relevantes são importantes, não necessariamente serão originais, mas na maioria das vezes margeia questões já abordadas, porém com pequenas diferenças, como espécie, local, tempo e assim por diante. Deve se tomar cuidado para não trabalhar com objetivos já respondidos em outros trabalhos. Isso será evitado somente com acompanhamento de revistas cientificas. Introdução A introdução deverá abordar o assunto. Um avaliador de projetos nem sempre é especialista no tema em questão, então se me proponho a trabalhar com a envergadura do rabo da lagartixa “x” que vive na vertente sul da Ilha Comprida e que se alimenta de insetos “y” e “z”, tenho que explicar a importância da lagartixa, da ilha, da vertente, dos insetos e assim por diante. Se o avaliador achar que não é relevante ou não compreender bem o propósito, então seu projeto pode não ser aprovado. A introdução é parte de um levantamento de informações em artigos e livros. Deve-se sempre evitar o grande sábio “Dr. Google”, apesar de saber tudo, nem sempre as informações são precisas, confiáveis ou completas. Sempre que colocamos uma frase devemos dizer de onde tiramos a informação. Por exemplo, a lagartixa “x” só é encontrada nesta ilha sendo de extremaimportância manter o local conservado (Pesquisador, ano). A falta da citação é considerada plágio. Tentar sempre usar literatura original, relevante e atual. O uso de literatura antiga pode implicar em falta de atualização dos dados. O uso de citações de sites, monografias, dissertações, teses e anais de congressos pode não ser aceito por revistas científicas. Bio 1005 – Desenho amostral e experimental – PUC-Rio 7 Justificativa: Diferente da introdução, aqui o pesquisador irá colocar com as próprias palavras, podendo ainda haver citações, sobre a importância do projeto. É um dos itens onde ocorrerá o convencimento do avaliador de que vale a pena financiar o projeto. Hipóteses: Está ligada ao objetivo e aos testes que serão aplicados. No final aceitaremos a hipótese nula ou iremos rejeitas e então, isto será parte da conclusão ou mesmo toda conclusão. Metodologia: Neste item deve ser explicado como será feito o trabalho, iniciando em área de estudo, número de amostras, formas de coleta de dados e análises que serão utilizadas. A metodologia precisa responder ao objetivo. Não adianta o meu objetivo ser sobre determinado assunto e a metodologia servir para outros assuntos. Seguir uma metodologia previamente usada confere mais confiança ao trabalho. Resultados esperados: Existem duas frentes de resultados esperados. Primeiramente o autor do projeto deverá apresentar aquilo que se espera encontrar neste trabalho, mas também deverá apresentar quais produtos se espera obter, por exemplo, artigos científicos, manuais técnicos, programas e assim por diante. Cronograma: Apresenta o planejamento de execução deste projeto e deve ser apresentado de uma forma clara, por exemplo, a tabela abaixo: Tabela 1: Exemplo de cronograma de atividades de um projeto de pesquisa. Atividades M J J A S O N D J F M A M Levantamento bibliográfico e leitura x x x x x x x x x Marcação das parcelas x x x x x Coleta de dados em campo x x x x x x Análise de germinação de sementes x x x x Testes de restauração x x x x x x x Análise dos dados x x x x x x x x x Divulgação de resultados em reuniões científicas x x x x Bio 1005 – Desenho amostral e experimental – PUC-Rio 8 Orçamento: Deve se apresentar os custos discriminados pra cada item. Este ponto também mostra para o avaliador que o pesquisador sabe exatamente onde será gasto o financiamento. Abaixo um exemplo de como o mesmo deverá ser feito. Tabela 2: Exemplo de orçamento previsto para o projeto de pesquisa. Material Quantidade Quantidade Total Utilidade Fitilho 10 rolos 5,00 50,00 Demarcação de parcelas Cano 20 metros 6,00 120,00 Demarcação de parcelas Placa 20 chapas 2,00 40,00 Marcação de árvores Prego 2 kg 6,00 12,00 Marcação de árvores GPS – Garmin MAP 60CSX 1 1600,00 1600,00 Demarcação de pontos em campo Gastos com locomoção 400 litros 4,00 1600,00 Gasolina para deslocamento até as áreas amostrais Fita métrica 4 2,00 8,00 Medidas de CAP Prensa 4 40,00 160,00 Prensar plantas Bandejas para sementeiras 100 8,00 800,00 Experimento com sementes Mudas 480 3,00 1440,00 Experimento com mudas Sementes 3 kg 30,00 90,00 Experimento com semeadura Podão 1 400,00 400,00 Coleta de plantas Mão de obra 10 diárias 100,00 1000,00 Ajuda em campo na coleta Trena 2 60,00 120,00 Demarcação das parcelas Laptop Acer- Aspir E1 2 1200,00 2400,00 Análise de dados Total 9840,00 Referencial bibliográfico: Todas as citações deverão ser listadas em ordem alfabética. Todas as revistas científicas e editais seguem um padrão de referenciamento. Abaixo um exemplo: HEIDEN, G.; BARBIERI, R. & STUMPF, E. R. Considerações sobre o uso de plantas ornamentais nativas. Revista Brasileira de Horticultura ornamental. v. 12, n.1, p. 2-7. 2006 Artigos científicos Os artigos são as principais formas de divulgação de trabalhos de pesquisa. Nas revistas científicas estão as atualizações sobre determinado assunto e é a principal forma de avaliação de um pesquisador, apesar de ser uma metodologia altamente questionável. Bio 1005 – Desenho amostral e experimental – PUC-Rio 9 Os artigos são os produtos finais da proposta do projeto, obviamente não sendo a única forma de apresentação. E importante que os estudantes desde o início comecem a se informar sobre as revistas mais importantes de sua área de interesse. Para buscar informações sobre as revistas é interessante visitar o site da Capes: https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/veiculoPublicacaoQualis/l istaConsultaGeralPeriodicos.jsf Neste site é possível pesquisar as revistas e suas classificações que podem ser: A1, A2, B1, B2, B3, B4, B5 e C. Quanto mais próxima de A1 mais importante a revista e mais pontos possuem os pesquisadores que nelas publicam. Obviamente as revistas brasileiras, em biologia, não estão no topo, então, publicar em uma revista estrangeira é muito importante. Como redigir um artigo científico? Tipo especializado de escrita, assim como a redação de novelas, poesia, peças, artigos de jornais, memorandos e relatórios. Redação científica inclui artigos científicos, relatórios, teses, protocolos de laboratórios, livros texto e monografias; Todos os tipos de redação científica, embora apresentem diferenças em termos de objetivos, estrutura e uso da linguagem, tem aspectos comuns. Redação científica A redação científica deve ser: Direcionada aos profissionais que possuam um nível razoável de conhecimento sobre o tópico. Lógica, isto é, todos os principais passos dedutivos devem ser identificáveis. Clara, sem ambiguidades. Redação científica de boa qualidade pode ser feita em qualquer língua, no entanto as revistas em língua inglesa são acessadas no mundo todo, diferentemente das revistas de língua portuguesa. A tendência atual é a concisão, devido aos custos de produção de uma revista. Leia um trabalho de sua área publicado há 20 ou 30 anos e observe a diferença: não somente no espaço disponível para o desenvolvimento de uma ideia, mas também na quantidade de informação dada. Para iniciantes, redigir textos científicos de boa qualidade é difícil, mesmo utilizando sua própria língua. Isto requer treinamento para escrever e treinamento para ler. Para os cientistas brasileiros no começo de carreira, recomenda-se escrever em Português. Dica importante: ao ler um trabalho científico publicado num periódico internacional de boa qualidade, faça-o várias vezes em dois níveis: Conteúdo científico e Estrutura e uso da linguagem. Partes de um artigo científico: https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/veiculoPublicacaoQualis/listaConsultaGeralPeriodicos.jsf https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/veiculoPublicacaoQualis/listaConsultaGeralPeriodicos.jsf Bio 1005 – Desenho amostral e experimental – PUC-Rio 10 Alguns itens são os mesmo dos projetos e as ideias continuam sendo as mesmas. No entanto, fiquem atentos aos tempos verbais e mudanças que sempre irão ocorrer. Aqui não temos justificativa, cronograma e orçamento. Porém, há a inclusão de resultados, discussão e conclusão. 1. Título 2. Resumo 3. Introdução 4. Objetivos (Deve estar dentro da introdução) 5. Hipóteses (Deve estar dentro da introdução) 6. Metodologia 7. Resultados 8. Discussões 9. Conclusões 10. Agradecimento 11. Bibliografia Figura 2: Diagrama de construção de um artigo científico. Resultados Apresente os resultados relevantes em ordem lógica, criando, portanto, um argumento para convencer o leitor. Determine a forma mais adequada para apresentar os dados como texto, figuras ou tabelas. Apresente outras informações necessárias para interpretar os resultados. Discussão Identifique seus principais resultados, discutindo-os em termos da literatura. Identifique as novas informações e conceitos derivados de seus resultados e discuta-os em termos de literatura. Estabeleça uma conexão entre seus resultados e conceitos da literatura. Bio 1005 – Desenho amostral e experimental – PUC-Rio 11 Passos importante 1. Pesquisa de normas e formas. Cada revista possui seu conjunto de normas. Esteja por dentro das normas da revista que pretende publicar. Leia artigos desta revista e tente sempre referenciar a mesma em seus artigos. 2. Os resultados são a parte central do seu trabalho. Todas as outras partes devem complementá-los. As variáveis são: 3. Inicie com um esquema, fazendo uma lista das principais ideias e fatos a serem incluídos em cada seção. 4. Faça um levantamento da literatura no sentido de atualizar sua bibliografia e depois ajuste seu esquema. As coisas podem ter mudado desde que você preparou seu projeto original, ou você pode descobrir que seus resultados já foram publicados por Louis Pasteur! 5. Prepare todos os dados para a seção de resultados, mas selecione aqueles mais importantes. Determine quais resultados aparecerão em Tabelas e Figuras. O restante terá que ser incluído no texto. Determine a ordem de apresentação de seus dados para proporcionar um argumento lógico e convincente. 6. Não confundir os itens - Ajuste as seções de métodos e resultados uma à outra, em termos de apresentação de informação, consistência e lógica. Não repita a mesma informação nas duas seções, a menos que exista uma justificativa especial. Determinar claramente o que vai em cada local! 7. A discussão e a introdução complementam uma à outra. Volte para seu esquema original e reconsidere estas seções em termos de nova informação oferecida pelos seus resultados. Inter-relação com a literatura em termos de originalidade, relevância e importância. Características de um manuscrito de baixa qualidade Introdução que é uma revisão sem o estabelecimento de objetivos ou justificativas. Texto confuso e organizado de forma não apropriada. Dados ou coleta de resultados sem conclusões. Dados não analisados suficientemente. Discussão que vai muito além dos resultados e/ou não são identificados adequadamente o que é novo e relevante no trabalho. Bio 1005 – Desenho amostral e experimental – PUC-Rio 12 Figura 3: Diagrama de relevância de artigos científicos Métodos de pesquisa Abordagens da pesquisa: A abordagem das pesquisas está relacionada com os tipos de variáveis que serão coletadas, lembrando que estas variáveis se dividem inicialmente em qualitativas e quantitativas. O tipo de variável será de grande importância para definir análises que serão feitas e o “n” que deverá ser trabalhado. Assim, a abordagem da pesquisa pode ser: - Qualitativa: Não trabalha com dados numéricos e sim com dados categóricos, por exemplo, cor, tamanho e fases. Muito utilizado para a compreensão de um grupo social. As análises empregadas são mais restritas e o “n” amostral deve ser alto, no entanto, são projetos importantes em ecologia social, levando em consideração entrevistas, por exemplo. - Quantitativa: Aferições e medições feitas em campo. Há uma quantificação estes dados, por simples contagem ou através de uma coleta de medida de dados. Possui um rol mais amplo de análises que podem ser empregadas. - Mista (quali-quanti): quando em uma mesma pesquisa, ambos os aspectos são usados para recolher mais informações do que se poderia conseguir isoladamente. Métodos de pesquisa Pesquisa exploratória - Este método estabelece critérios, métodos e técnicas para a elaboração de uma pesquisa e visa oferecer informações sobre o objeto desta e orientar a formulação de hipóteses. Neste tipo de pesquisa se concentram as importantes descobertas científicas. Este tipo de pesquisa pode ser empregado inicialmente para se compreender o material de estudo, tendo uma amostragem pequena e sendo somente um ensaio sobre o assunto. Este método é utilizado quando não existem ainda muitas informações sobre o tema analisado. O Bio 1005 – Desenho amostral e experimental – PUC-Rio 13 pesquisador tem como objetivo realizar a construção do levantamento bibliográfico sobre o tema. O método utilizado na pesquisa exploratória envolve além do levantamento bibliográfico, entrevistas com pessoas que tenham domínio do assunto estudado, pesquisas de campo e análise de outros exemplos que estimulem a compreensão do tema. Método descritivo – é um método de pesquisa onde não há a interferência do pesquisador, este apenas analisar a frequência através de alguma forma de levantamento e descrever como o fenômeno acontece. Alguns exemplos são: entrevistas, levantamentos do IBGE, inventários florísticos e fazer um levantamento sobre o determinado local. Método explicativo - Registra fatos, analisa-os, interpreta-os e identifica suas causas. Vai além do método descritivo, pois não somente relata as espécies que ocorrem, por exemplo, como também explica o motivo delas ocorrerem. Tipo de pesquisa: Bibliográfica – desenvolvido com base em material já elaborado, principalmente livros e artigos científicos. Documental – Parecida com a bibliográfica, com diferença na natureza das fontes, sendo arquivos, igrejas, instituições. Experimental – Quando se determina um objeto de estudo, selecionam-se variáveis, metodologia. Levantamento – interrogação direta do assunto à pessoas, com um questionário, amostragem. Estudo de caso – Descreve um tipo de caso interessante; Definições de amostragem Universo - conjunto total de sujeitos que partilham ou apresentam características em comum. População - conjunto de sujeitos que partilham ou apresentam características comuns de uma determinada área. Amostra - Representação de sujeitos de uma determinada população com características relevantes para o estudo. Por exemplo: Se estivermos trabalhando com o conjunto de indivíduos de paineiras na floresta da Tijuca e para isso marcarmos 15 árvores. Consideramos então as árvores marcadas como sendo nossas amostras, a população como sendo todos os indivíduos da espécie existentes na floresta da Tijuca e o Universo como sendo todos os indivíduos desta espécie no mundo. Bio 1005 – Desenho amostral e experimental – PUC-Rio 14 Métodos de amostragem Amostragem probabilística a probabilidade de um elemento ser escolhido é conhecida. São os métodos que permitem generalizar, com confiança para a população, os resultados obtidos a partir da amostra. Permitem obter amostras representativas e otimizam o trabalho de campo. Métodos mais comuns de amostragem probabilística: Amostragem aleatória simples Amostragem sistemática Amostragem estratificada Amostragem por conglomerados Amostragem aleatória simples Todos os elementos da população tem a mesma probabilidade de pertencer à amostra. A técnica mais utilizada para escolha de uma amostra aleatória simples é a de números aleatórios. Amostragem sistemática Os elementos da população apresentam-se ordenados e são retirados periodicamente, ou seja, a cada k elementos, um é escolhido. A vantagem da amostragem sistemática é que necessita de menos tempo que o método de amostragem simples. A desvantagem da amostragem sistemática é que o valor de k é escolhido ao acaso, junto com o iniciador, mas o resto dos casos é escolhido por aplicação do intervalo fixo e, portanto, não são totalmente ao acaso. Amostragem estratificada Usado quando se pode dividir a população em subpopulações (estratos) homogêneas. Os estratos identificados numa dada população (variáveis em estudo) estão representados numa amostra na mesma proporção com que existem na população. Amostragem Estratificada Os elementos da população são divididos primeiramente emgrupos chamados estratos de forma que cada elemento da população pertença a um e somente um estrato. A estratificação é feita para compor grupos mais homogêneos. Existem dois tipos de amostragem estratificada: De mesmo tamanho e Proporcional. No primeiro tipo sorteia-se igual número de elementos em cada estrato. Esse processo é utilizado quando o número de elementos por estrato for aproximadamente o mesmo. No outro caso, utiliza-se proporção para determinar o número de elementos de cada estrato que irão compor a amostra. Bio 1005 – Desenho amostral e experimental – PUC-Rio 15 Amostragem por conglomerados Usada quando a população pode ser dividida em grupos homogêneos selecionados aleatoriamente. A amostragem é feita a partir dos grupos e não dos indivíduos da população. Amostragem não-probabilística não se conhece a probabilidade de um elemento da população ser escolhido para participar da amostra. Dentro deste tipo de método os mais utilizados são: Amostragem por conveniência e Amostragem por quotas Amostragem por conveniência Os casos escolhidos são os que o investigador tem à sua disposição. Este método apresenta fortes limitações porque os resultados e as conclusões só se aplicam à amostra assim constituída, não podendo ser generalizadas com confiança para a população. Contudo, podem ser úteis no início da pesquisa. Exemplos: Colocar linha telefônica durante programa para as pessoas ligarem e dar opiniões; Parar pessoas o supermercado e colher opiniões sobre produtos; Alunos de uma sala de aula específica. Amostragem por quotas As características da população tais como idade, sexo são amostradas de forma não aleatória nas mesmas proporções em que figuram na população. Métodos de pesquisa A curadoria é o cargo exercido por um ou mais curadores, responsáveis pela administração de bens, como coleções e bancos de dados. Esta função é de grande importância, pois as coleções ou os bancos de dados são os pontos centrais de projetos de pesquisa e é parte de princípios éticos a disponibilidade destes dados para o público. A curadoria de dados consiste na organização, gestão e armazenamento e disponibilização dos dados coletados. Como já visto em aulas anteriores, a amostra é a unidade básica de um projeto de pesquisa e o conjunto das mesmas é chamado de amostragem. Cada amostra dentro de um mesmo tratamento devem ser réplicas umas das outras, não sendo viável a análise dos dados sem estas repetições ou replicas. Muitas vezes trabalhos distintos podem ter conjuntos de amostras que podem se agregar passando a ter um “n” mais alto e possibilidades maiores de análises dos dados. No entanto, isso só será possível se os dados forem devidamente organizados de forma correta, armazenados em segurança e tornar disponíveis de uma forma adequada. Como Bio 1005 – Desenho amostral e experimental – PUC-Rio 16 citado anteriormente, a disponibilidade dos dados é algo considerado de boa prática, isso se deve ao fato que, quando o fomento da pesquisa provém de órgãos públicos, os dados devem ser disponibilizados a outros pesquisadores, pois legalmente os dados não pertencem ao pesquisador e sim ao órgão financiador. A curadoria dos dados coletados pode ser dividida em quatro partes: Gestão de dados brutos; Armazenamento; Transformação; e Verificação dos dados; A coleta dos dados se inicia em campo, onde muito dos erros também podem ter início. Primeiramente a coleta será feita através de aferições, os dados serão anotados em uma planilha de campo, depois será passado para o computador e por fim os dados serão analisados. Se neste caminho uma vírgula de um dos valores for esquecida, pode ser que todos os dados sejam comprometidos. Gestão de dados A curadoria é responsável pelos metadados, que são as informações sobre os dados. O termo metadado é recente e vem com o propósito de uma padronização da metodologia de informar sobre os dados. Os metadados devem conter: a) O nome e as informações de contato de quem coletou os dados, caso esse não seja o próprio pesquisador que analisará os dados; b) As informações geográficas sobre o local onde os dados foram coletados; c) O nome do projeto para o qual os dados foram coletados; d) As fontes de apoio que permitiram sua coleta; e) Uma descrição dos métodos utilizados na coleta; f) Os tipos de unidades experimentais ou amostrais; g) As unidades de medida de cada uma das variáveis; e h) As descrições de quaisquer abreviações utilizadas no arquivo de dados. Bio 1005 – Desenho amostral e experimental – PUC-Rio 17 Figura 4: Etiqueta de herbário com as informações necessárias sobre o local de coleta e sobre a amostra. Fonte: Flora do Brasil 2020. Armazenamento dos dados O armazenamento dos dados é muito importante para que este possa ser compartilhado e utilizado por outros grupos de pesquisa. Obviamente, para que os dados sejam armazenados de forma correta é preciso que a gestão dos dados tenha sido feita de forma correta. Todas as pessoas que se interessarem por estes dados precisarão entender todas as informações anotadas nos mesmos. Não é raro encontrar pesquisadores, principalmente no início de suas carreiras, que tiveram problemas com o armazenamento dos dados. Se os dados estão armazenados somente em um local, geralmente pen drive ou computador, eles correm um enorme risco de serem perdidos. É sempre bom armazenar os dados em mais de uma mídia, assim como dropbox e e-mail. Existem muitas plataformas de disponibilização dos dados. Estas plataformas permitem que os dados sejam utilizados por outros pesquisadores, algo que no Brasil não é muito bem aceito por muitos pesquisadores, infelizmente. Transformação dos dados Nem sempre é preciso transformar os dados. Esta é uma exigência para que os dados sejam paramétricos que seja possível aplicar testes mais precisos. Esta exigência vem crescendo cada vez mais nos grupos de pesquisa, no entanto, a transformação de dados, apesar de ser eticamente aceito, ainda é uma manipulação de dados. Claro que, transformar dados não significa apagar ou omitir dados, isso não é aceito. As transformações mais utilizadas são logarítmica, raiz quadrada, angular, inversa ou padronização. Todas elas possuem uma mesma função, reduzir o conjunto de dados e assim fazendo com que os dados se adequem a uma curva normal. Exemplo: Mensuração do comprimento das asas, em centímetros, de 21 morcegos: 158 123 180 145 124 135 152 159 189 147 127 126 145 125 150 156 158 124 190 125 195 Com a análise de normalidade vemos que os dados não são normais: Média = 149.19 Var = 550.06 DP = 23.45 Normalidade= P=0,04 Bio 1005 – Desenho amostral e experimental – PUC-Rio 18 Aplicando uma transformação de dados do tipo logarítmica: 2.198657 2.089905 2.255273 2.161368 2.093422 2.130334 2.181844 2.201397 2.276462 2.167317 2.103804 2.100371 2.161368 2.09691 2.176091 2.193125 2.198657 2.093422 2.278754 2.09691 2.290035 Por fim, aplicando o teste de normalidade: Média = 2.17 Var = 0.0004 DP = 0.066 Normalidade= 0,055 Agora os dados possuem distribuição normal de podem passar por análises paramétricas. Verificação dos dados A última parte referente à curadoria é a verificação dos dados. A verificação é feita através de análises preliminares que irão mostrar como os dados estão distribuídos. Através da mesma é possível encontrar possíveis erros e dados discrepantes. As análises preliminares mais utilizadas são distribuições em gráficos de dispersão, boxplot e medidas descritivas como média, desvio padrão e variância. A verificação dos dados e a transformação caminham juntas. Esforço e suficiência amostral Uma das perguntas mais frequentes nos projetos de pesquisa com amostragem é “Quantos dados deverão ser coletados?”. Não existeuma resposta para esta pergunta, simplesmente por haver uma variação na homogeneidade e tipos dos dados. Quanto mais os dados são heterogêneos, maior deverá ser o “n”. Para ter ideia do tamanho da amostragem é necessário entender o local, a pergunta e se possível fazer um ensaio. Conceitos fundamentais para a compreensão da amostragem Bio 1005 – Desenho amostral e experimental – PUC-Rio 19 Aleatorização; Na oportunidade em que organizamos os ensaios devemos proporcionar condições idênticas para cada tratamento. Se houver algum erro este será atribuído ao acaso, ou seja, não tendencioso. Lembrando sempre que aleatório é o contrário de escolhido, ou seja, nunca use o termo aleatoriamente escolhido. Replicação; Significa a repetição de uma unidade experimental ou amostral. A replicação é necessária para estimar o erro, o qual, por sua vez, vai ser essencial para avaliar a significância estatística ou determinar intervalos de confiança. Todas as réplicas devem estar em condições idênticas de avaliação. Sempre haverá uma relação entre tamanhos das amostras x quantidade de amostras = tamanho da área amostrada, sendo quase sempre mais interessante obtermos uma maior quantidade de amostras com tamanhos menores, do que amostras grandes com “n” baixo. Quanto maior o número de amostras, menor tenderá a ser o erro, ou melhor, maior a chance dos valores se concentrarem no centro dos dados, sendo esta a teoria do limite central. A teoria do limite central afirma que quando o tamanho da amostra aumenta, a distribuição amostral da sua média aproxima-se cada vez mais de uma distribuição normal. Com 30 graus de liberdade, independendo de qual distribuição que a amostra possua, ele será muito próximo da distribuição normal. Figura 5: Teoria do limite central Independência; Consideramos que uma amostra não está influenciando na outra. Se tivermos réplicas que não são independentes uma das outras, então consideramos como sendo pseudoréplicas. Pseudoreplicagem; Bio 1005 – Desenho amostral e experimental – PUC-Rio 20 A pseudoréplica é resultado do uso de estatística inferencial para testar efeitos de tratamentos de dados de experimentos cujos tratamentos não estão replicados ou cujas réplicas não são estatisticamente independentes. Este é um conceito recente e muitas vezes não é tão claro. A pseudoreplicagem pode ocorrer por conta do tempo ou então do espaço. Por exemplo, se estamos analisando a germinação de sementes de alguma espécie em diferentes substratos e sabemos que teremos grande quantidade de sementes germinadas de um dia para o outro, então devemos coletar todos os dados em um mesmo dia, não podemos deixar para coletar metade dos dados em um dia e outra metade em outro dia. Outro exemplo pode ser a amostragem colocando parcelas muito próximas ou muito distantes uma das outras. Em um caso teremos forte dependência e em outra teremos um caso de tratamentos diferentes, obviamente que cada caso irá variar. Figura 6: Replicação e pseudoreplicação por conta do espaço Figura 7: Pseudoreplicação causada pelo tempo Confundimento; Refere-se quando os fatores se confundem uns com os outros, não sendo possível esclarecer os efeitos por eles causados. Isso ocorre quando estabelecemos réplicas não aleatorizadas no ambiente, podendo estas ser influenciadas por um fator que não estamos controlando. Bio 1005 – Desenho amostral e experimental – PUC-Rio 21 Figura 8: Confundimento Tratamentos. Os diferentes tratamentos são aqueles que estamos contrastando em nosso trabalho de pesquisa. Por exemplo, se estamos analisando a diferença de crescimento de animais com uso de três dietas, estas três dietas serão os tratamentos em questão. A partir destas que vem a minha pergunta principal do projeto “existe diferença estatística entre as três diferentes dietas?”. Variáveis A variável é a característica que será mensurada no trabalho. Lembrando que podemos ter variáveis qualitativas e variáveis quantitativas, isso é um ponto básico para que possamos compreender o “n” amostral. Existem dois tipos de variáveis: Preditoras e resposta. Variáveis preditoras e respostas As preditoras são variáveis de onde tiramos os tratamentos e a partir destas teremos as variáveis respostas. Por exemplo, usando o exemplo anterior para tratamentos, as três dietas poderiam ser: Dieta com pouco proteína; Dieta com quantidade média de proteína; e Dietas proteicas. A quantidade de proteína será nossa variável preditora, assim estarão relacionadas com os diferentes tratamentos. Os dados coletados dos animais poderão ser, por exemplo, ganho de peso ou crescimento. Estas variáveis serão as respostas, de onde estamos mensurando para poder analisar os dados. Estimativas para o tamanho da amostra 1. Depende do tipo de pergunta do estudo 2. Depende do tipo de variável Estudos envolvendo variáveis qualitativas, geralmente, necessitam de amostras maiores. Dentre as variáveis numéricas, as que apresentam maior variabilidade dos dados também necessitam de amostras maiores. 3. Depende da magnitude do erro estatístico aceito pelo biólogo Quanto menos o biólogo aceitar errar nas suas conclusões, maior deverá ser o tamanho da amostra. Bio 1005 – Desenho amostral e experimental – PUC-Rio 22 4. Do tamanho da diferença entre as amostras Diferenças menores, ou seja, mais sensíveis, exigem amostras maiores. 5. Do poder desejado para o teste Indicado pela probabilidade de que a amostra identifique uma diferença ou um efeito real, quanto maior a probabilidade, maior o tamanho da amostra. 6. Do tempo, recursos humanos e recursos financeiros disponíveis. Muitas vezes a amostragem ideal não é realizada, mas sim a exequível, devido as limitações de tempo, pessoal disponível na pesquisa, alocação de recursos financeiros, da dificuldade de coleta de dados e complexidade do experimento. O ideal é que as coletas sejam acompanhadas de análises prévias, estas análises poderão ajudar no cálculo do erro e na busca do “n” ideal. A fórmula para cálculo de n é baseada no intervalo de confiança. Onde: n tamanho amostral mínimo a ser utilizado pelo biólogo S² variância estimada do parâmetro X - µ erro de estimação admissível Ta;gl valor tabelado de t de Student Suficiência amostral Está relacionada principalmente com o estudo da comunidade. A suficiência amostral serve para verificar a quantidade de espécies que há em um determinado local, ou seja, está relacionada à riqueza de espécies. Existem dois métodos para a verificação: Método do coletor e rarefação. Os dois métodos se baseiam na estabilidade do número de espécies por ponto de amostragem. A premissa é que, com o aumento do número de espécies coletadas, a curva tende a ficar mais paralela ao eixo “x”. O primeiro método requer o cálculo de um índice de riqueza de táxons, que, para exemplificar será apresentado o proposto por Whittaker (1975): 2 ; 2 _ 2 )( )( glt x s n Bio 1005 – Desenho amostral e experimental – PUC-Rio 23 O índice é calculado de forma acumulativa, obedecendo a implantação das parcelas amostrais, tendo no eixo y a riqueza acumulada em cada parcelas e no eixo x o nº de parcelas ou indivíduos, dependendo de qual é a unidade amostral em questão. Se o ajuste for significativo, assumindo α ≤ 0,01 indica que há necessidade de continuar o processo de amostragem, pois mais espécies poderão ser amostradas, caso contrário a suficiência amostral foi atingida. Bio 1005 – Desenho amostral e experimental – PUC-Rio 24 Analisando os dados do eixo y: Bio 1005 – Desenho amostral e experimental – PUC-Rio 25 Fazendo a verificação para compreender se houve suficiência amostral, através da regressãolinear: 0 1 2 3 4 5 6 1 2 3 4 5 __ xbya n x x n yx xy b n i n i n i n i n i 2 1 1 2 11 1 Bio 1005 – Desenho amostral e experimental – PUC-Rio 26 O método de whittaker possui diversos problemas. Primeiramente, a ordem de entrada de dados na análise faz com que a o gráfico mude, isso pode, inclusive, fazer com que em alguns pontos haja uma estabilização na reta. Para evitar o problema com a ordem entrada dos dados utiliza-se o segundo método, que é a curva de acumulação de espécies baseado em curvas de rarefação. Este método Consiste na aleatorização de entrada dos dados. Devido à complexidade dos dados gerada pela repetição das análises, o método somente pode ser realizado através de softwares. Bio 1005 – Desenho amostral e experimental – PUC-Rio 27 Ex: Teste de hipóteses e delineamento experimental Hipóteses estatísticas - Procedimento estatístico pelo qual se rejeita ou não uma hipótese; Toda hipótese está associada à um risco máximo de erro, sendo este risco máximo o valor de alfa estipulado. Quanto maior o valor de alfa, maior a chance de rejeitar H0, no entanto, menor será a confiança no trabalho. Devido à maneira como os testes são elaborados, a hipótese testada é sempre H0, o H1 é o oposto, sendo apenas hipotético, pois aceitamos ou rejeitamos H0, nunca H1. Mas, claro, se aceitamos a hipótese nula, automaticamente rejeitamos H1. Um ponto importante quanto à conclusão da hipótese é considerar que a mesma não é um dogma e aceitar H0 não faz com que o trabalho esteja errado, apesar de perder muito peso para publicações, é uma conclusão tão importante quanto rejeitá-la. • Hipótese nula (H0): estabelece a ausência de diferença entre os parâmetros. É sempre a primeira a ser formulada. • Hipótese alternativa (H1): é a hipótese contrária à hipótese nula. Geralmente, é a que o pesquisador quer confirmar. Etapas de um teste de hipótese: 1) Elaboração das hipóteses estatísticas 2) Escolha do nível de significância 3) Determinação do valor tabelado do teste 4) Determinação do valor calculado do teste 5) Decisão 6) Conclusão Tipos de erro Erro do tipo I e do tipo II Bio 1005 – Desenho amostral e experimental – PUC-Rio 28 Todo teste de hipóteses tem sua conclusão sujeita a erro. Os erros podem estar vinculados com a conclusão errônea no valor de “p” ou então o uso equivocado de algum teste. Erro do tipo I é o mais comum e está voltado para a rejeição do H0 quando deveria na realidade aceita- la. Este tipo de erro muitas vezes é cometido pela exigência científica de rejeitar H0. O Erro do tipo II é quando aceitamos o H0, quando realmente deveríamos rejeitar. Na maioria das vezes ocorre por conta do uso de testes errados. Níveis de significância Intuitivamente, somos levados a dizer que um valor p de 0,01 seria estatisticamente mais significante do que um valor “p” de 0,05, mas tal não é correto. A partir do momento em que é definido o nível de confiança, todos os resultados são "estatisticamente significantes" ou "estatisticamente não significantes". Estatística paramétrica e não-paramétrica: Paramétricos: Exigem que: 1 - As amostras tenham uma distribuição normal, especialmente se tiverem uma dimensão inferior a 30. 2 – As amostras sejam homocedásticas; 3 – Amostras sejam grandes; Em alguns casos pode-se aplicar uma transformação aos dados para que estes se ajustem à uma distribuição normal. Não-paramétricos: 1 - Amostras são pequenas; 2 - Amostra com uma distribuição não normal ou quando, apesar da amostra ter uma dimensão superior a 30, se opta por conclusões mais conservadoras. 3 - Amostras heterocedásticas A desvantagem destes testes é que não são tão potentes quantos os testes paramétricos, ou seja, com os testes não paramétricos não se encontram tantas diferenças entre os dados, quando essas diferenças realmente existem, havendo uma chance maior de cometer erro do tipo II. Delineamento experimental A experimentação existe desde os primórdios da humanidade. Através dela, o homem desenvolveu novas técnicas, domesticou plantas e animais e conseguiu descobrir novos medicamentos. Porém, a experimentação só teve um grande crescimento com o surgimento das técnicas estatísticas. A pesquisa teve início com a medicina e a astronomia. A experimentação teve origem agrícola e hoje é aplicada nas diversas áreas do conhecimento. Bio 1005 – Desenho amostral e experimental – PUC-Rio 29 Conceitos importantes – Os conceitos abaixo são de extrema importância para uma boa elaboração de um experimento. Unidade experimental → é a unidade física ou biológica utilizada para conduzir o experimento como, p. ex., um animal, uma parcela, uma peça fabricada, um canteiro, etc. Variável em análise → é a característica ou condição mensurada ou observada no experimento como, p. ex., altura das plantas, ganho de peso, produção de sementes, etc. Tratamento → indica o objeto em teste, ou seja, indicam os objetos com diferentes parâmetros a serem analisados, como níveis de adubação, desempenho de variedades agrícolas, eficácia de medicamentos, etc. Controle ou testemunha → é o objeto que serve de comparação aos tratamentos, ou ainda, para estudar os efeitos causados pelos tratamentos. Nele os parâmetros são mínimos ou nulos, como ausência de adubação para testar a produtividade de frutos sob diferentes níveis de adubação. Repetição → como a ideia da experimentação é comparar grupos e não indivíduos, é exigido certo número de réplicas. Quanto maior o número de réplicas, maior a acurácia dos testes, porém nem sempre um grande número de réplicas é possível. Para se calcular o número de repetições num experimento é preciso conhecimento da variabilidade dos dados a serem submetidos à experimentação. Com base nesse parâmetro é possível estimar o número mínimo de repetições para implantar o desenho experimental. Casualização → Deve ser aplicada para tirar o efeito da intencionalidade. Existem várias formas de aplicar a casualidade, uma delas é o método de sorteio, evitando assim as regras sistemáticas. Somente a casualização garante que as unidades com características diferentes tenham igual chance de serem designadas para dois grupos. Obviamente que na teoria a casualização é o método ideal, no entanto, em campo o mesmo não ocorre, muitas vezes não é possível ser completamente casual, tendo que agir de alguma forma sistemática. Experimentação cega → sendo as unidades experimentais objetos, plantas, animais, etc., é importante que o pesquisador mensure as unidades sem saber a que grupo pertence esta unidade, assim evita-se qualquer tipo de tendência por parte do pesquisador. Para que isso seja possível, os experimentos nunca são conduzidos por apenas uma pessoa. Logo, é necessário que um técnico ou outro pesquisador, retire a unidade experimental do grupo e entregue ao outro pesquisador que irá fazer a análise. Planejamento de experimentos →Antes de começar qualquer experimento é interessante que consiga responder as seguintes questões: 1. Qual o problema? 2. Qual a hipótese? 3. Qual a variável à ser analisada? Bio 1005 – Desenho amostral e experimental – PUC-Rio 30 4. Quais os tratamentos? 5. Quantas unidades experimentais serão usadas? 6. Tipo de delineamento experimental? Exemplo: Deseja-se comparar o efeito de diferentes níveis de adubação no desenvolvimento de uma espécie arbórea, Lecythis pisonis Cambess.. Neste caso, o experimento poderia ser planejado da seguinte forma: Unidade experimental: uma muda de L. pisonis; Variável em análise: volume (diâmetro à altura do solo x altura da planta); Tratamentos em comparação: controle e níveis baixo, médio e alto de adubo nostratamentos; Forma de designar os tratamentos às unidades: sorteio; Número de unidades experimentais: 10 mudas por grupo. Apesar da obrigatoriedade de se casualizar um experimento, as vezes, é necessário impor restrições à maneira de proceder o sorteio. As unidades experimentais precisam ser organizadas antes do início do sorteio. Esse procedimento define o tipo de delineamento ou desenho do experimento. Principais tipos de experimentos Na disciplina veremos três tipos básicos de delineamentos, no entanto, deve-se ficar claro que existem diversas outras formas de delineamento mais complexas, onde trabalhamos com fatoriais e repetições: Delineamento inteiramente ao acaso (DIC) – Quando somente um fator está variando. Neste caso o pesquisador deve designar os tratamentos às unidades por um sorteio simples, sem qualquer tipo de restrição. Delineamento em blocos ao acaso (DBC) - A utilização dos blocos dentro dos tratamentos é para reduzir a influência de uma variável externa na variável analisada ou, ainda, quando temos unidades experimentais muito heterogêneas. A palavra “bloco” teve origem na experimentação agrícola. Para evitar a influência da fertilidade dos canteiros na condução do experimento, cada canteiro era designado como um bloco e dentro dos blocos eram alocadas as parcelas. Só existe a necessidade de dividir o experimento em blocos se os mesmos apresentem variabilidade entre eles. Delineamento em quadrado latino (DQL) - Existem duas variações dentro de um mesmo experimento; Delineamento inteiramente ao acaso Bio 1005 – Desenho amostral e experimental – PUC-Rio 31 O delineamento inteiramente casualisado é o mais simples de todas as análises de variância (ANOVA), no entanto, cabe somente um fator variando. O ideal para esta análise é o uso de locais com terrenos uniformes, animais homogêneos e laboratórios. Ou seja, ambientes controlados. Algumas vantagens deste tipo de análise: O uso de blocos faz com que haja perda de graus de liberdade ao resíduo, diminuindo o valor tabelado e diminuindo a confiabilidade da análise. Qualquer número de tratamentos ou repetições pode ser utilizado; Pode haver variação entre o número de tratamentos e suas repetições; O número de graus de liberdade para o resíduo e o maior possível; É interessante utilizar o mesmo número de repetições, no entanto sempre há mortalidade de animais ou plantas; Na estatística experimental, todos os tratamentos são analisados ao mesmo tempo. Esta análise detecta se, pelo menos, um tratamento difere dos demais, isto é, compara a variação devido aos tratamentos com a variação devido ao acaso ou resíduo. No entanto, se for encontrada diferença estatística devemos usar um teste a posteriori, neste caso, o mais recomendável é o teste de Tukey. Se DIC permite que somente um fator varie, todos os outros fatores devem estar fixos. Exemplo 1: Variar os objetos e fixar o ambiente (variedades de milho, espécies diferentes de árvores nativas) Exemplo 2: Fixar os objetos e variar o ambiente (fertilidade do solo, sombreamento) Montando o experimento: Tendo um experimento em DIC com 20 unidades experimentais, podendo ser estes, por exemplo, vasos, onde iremos distribuir quatro tratamentos (A,B,C e D), cada um com números iguais de repetições, devemos fazer um sorteio e distribuir as unidades de forma aleatória. Assim como o esquema abaixo: Bio 1005 – Desenho amostral e experimental – PUC-Rio 32 A coleta destes dados deve ser colocada em uma tabela como abaixo: E as análises devem ser feitas utilizando as tabelas abaixo: As causas de variação representam todos os fatores que provocaram as diferenças no final. Se a análise em questão é um DIC, isso significa que temos apenas um fator variando. Em todos os experimentos um ponto importante é que a variação do tratamento não irá responder por 100% da variação total, havendo sempre uma porcentagem desta variação que não será possível de ser explicada, sendo então chamada de resíduo. Quanto mais bem controlado o experimento menor será o resíduo. O valor interessado para compreender se aceitamos ou rejeitamos H0 é o valor final de F calculado, para isso teremos que calcular o grau de liberdade (GL), soma de quadrados (SQ), quadrado médio (QM) e por fim o valor de F. GL – Os graus de liberdade serão calculados para cada um dos fatores de variação (tratamentos, resíduo e total), analisados da seguinte forma: Bio 1005 – Desenho amostral e experimental – PUC-Rio 33 SQ – Deverá ser calculado para cada um dos fatores de variação também. Inicialmente deve-se calcular o fator de correção. Iremos considerar cada um dos valores como sendo “y”. Para calcular as somas de quadrados para cada um dos fatores de variação iremos usar as seguintes fórmulas: QM – não existe quadrado médio para o total, sendo assim, iremos calcular para tratamentos e para resíduo, utilizando as seguintes fórmulas: F calculado – A partir do valore de F calculado, iremos comparar com o valor tabelado, da tabela de Fisher e caso o valor calculado seja maior que o tabelado rejeita-se H0. Exemplo: Com intuito de selecionar espécies de rápido crescimento para indicação para plantio em um projeto de restauração ambiental de uma área de restinga, um biólogo montou um experimento com quatro espécies arbóreas, utilizando para tanto, cinco mudas de mesmo Bio 1005 – Desenho amostral e experimental – PUC-Rio 34 tamanho de cada espécie, utilizando coo substrato solo de restinga em mesmas condições físicas nutricionais. Os dados coletados estão apresentados na tabela abaixo: N = 20 Tratamentos = 4 diferentes espécies Repetições = 5 de cada espécie Fixo = solo Passos para execução do exercício: 1. Hipótese; 2. Valor de alfa; 3. Valor de F Tabelado; 4. Valor de F Calculado; 5. Decisão; 6. Conclusão. 1 - Hipótese H0: Não há diferença entre os tratamentos; H1: Ao menos um dos tratamentos é diferente ; 2 – Valor de Alfa α=0,05 3 – Valor de f tabelado Graus de liberdade: Tratamentos K-1=4-1=3 Total N-1=20-1=19 Resíduo (n-1)-(k-1) = n-k = 20-4 = 16 Valor tabelado de F Alfa=0,05 Gltrat = 3 Glres = 16 Ftab = 3,24 4 – Valor de F calculado Bio 1005 – Desenho amostral e experimental – PUC-Rio 35 Bio 1005 – Desenho amostral e experimental – PUC-Rio 36 5 - Decisão 6 – Conclusão Através dos resultados da análise de variância, conclui-se que pelo menos um tratamento produziu resultados diferentes dos demais, ou seja, pelo menos uma das espécies apresenta taxa de crescimento superior às demais. Quando ao menos um tratamento for diferente do restante, devemos então analisar qual(is) foi(ram) o(s) tratamento(s) diferente(s). Este teste é feito através da comparação de médias ou Teste de Tukey; Teste de Tukey Em um experimento com 4 tratamentos existem 6 combinações, 2 x 2, possíveis. A fórmula é simples e todas as possibilidades devem ser testadas. Será necessário encontrar a diferença mínima significativa (DMS). Teste de Tukey Bio 1005 – Desenho amostral e experimental – PUC-Rio 37 Comparação de médias Médias dos tratamentos A 23 B 27 C 26 D 31 Teste de Tukey Bio 1005 – Desenho amostral e experimental – PUC-Rio 38 Tukey – conclusão Exercício: Um biólogo está trabalhando com alimentação de camundongos com quatro tipos de dietas (A, B, C, D). Cada tratamento possui cinco repetições cada, onde os animais foram escolhidos ao acaso. Os aumentos de pesos observados em gramas constam na tabela a seguir: Podemos dizer que os tratamentos obtiveram resultados? Delineamento em Blocos ao Acaso Este métodotalvez seja um dos mais importantes e utilizados dentre os testes ANOVA. Permite que amostras heterogêneas sejam analisadas dentro de um mesmo tratamento. Neste caso temos duas fontes de variação e estas irão contribuir de formas diferentes para se chegar ao resultado final. Basicamente, neste tipo de delineamento, todos os blocos devem conter todos os tipos de tratamentos. A perda de réplicas ou de blocos não dificulta a análise, pois existem formas simples de corrigir estes problemas. Pode ser utilizado qualquer número de tratamentos dentro dos blocos. A análise conduz à um menor erro experimental, no entanto reduz o número de graus de liberdade do resíduo, sendo assim, quanto maior o número de blocos, menor será o Bio 1005 – Desenho amostral e experimental – PUC-Rio 39 número de graus de liberdade dos resíduos, fazendo com que haja influência no valor de F calculado no final. Os princípios são os mesmos da análise em DIC, que são: casualização, repetições e controle local. A sequência para execução de um experimento é: 1. Montagem de um croqui; 2. Sorteio; 3. Repetições dos tratamentos; 4. Coleta dos dados; 5. Teste estatístico. Um exemplo de croqui está ilustrado pela imagem abaixo, onde cada bloco é formado por uma inclinação específica. Os dados serão coletados em campo e passados para uma planilha como a de baixo: Bio 1005 – Desenho amostral e experimental – PUC-Rio 40 Posteriormente, os dados compilados deverão ser analisados e colocados na tabela final: Causas da variação GL SQ QM F Tratamentos (K-1) SQTr QMTr Fcalc trat Blocos (r-1) SQB QMB F calc blocos Resíduo (K-1)*(r-1) SQR QMR Total K*r-1 SQT AS análises são muito parecidas com o que foi feito para DIC, desta forma, para calcular o grau de liberdade iremos usar: Para calcular o fator de correção iremos utilizar: Para calcular a soma de quadrados, usaremos as formulas abaixo: Para calcular o quadrado médio iremos usar as formulas abaixo: Bio 1005 – Desenho amostral e experimental – PUC-Rio 41 E, por fim, para calcular o valor de F, tanto para tratamentos quanto para blocos, iremos usar as fórmulas: F QMTr QMRes e F QMBl QMRes Etapas para desenvolvimento da análise: 1. Hipótese; 2. Valor de alfa; 3. Valor de f tabelado; 4. Valor de f calculado; 5. Decisão; 6. Conclusão 1 - Elaboração das hipóteses estatísticas H0: Não há diferença entre os tratamentos H1: Há diferença em pelo menos um dos tratamentos H0: Não há relação dos blocos no experimento H1: Os blocos influenciam no experimento 2) Escolha do nível de significância 3 – Determinação do F tabelado 05,0 Bio 1005 – Desenho amostral e experimental – PUC-Rio 42 3 – Determinação do F tabelado Tratamentos: Blocos: 4 – Determinação do valor de f calculado Bio 1005 – Desenho amostral e experimental – PUC-Rio 43 5 – Decisão: Bio 1005 – Desenho amostral e experimental – PUC-Rio 44 Tratamentos: Blocos: Teste de Tukey: Bio 1005 – Desenho amostral e experimental – PUC-Rio 45 Exercício: Bio 1005 – Desenho amostral e experimental – PUC-Rio 46 Delineamento em Quadrado Latino Possui duas fontes de variação além dos tratamentos. Dentre os princípios estão a casualização, sorteio, repetições e controle do efeito de dois fatores perturbadores que causam variabilidade entre as unidades experimentais. Em um experimento com seis tratamentos diferentes, mas com duas fontes de variação: Para controlar esta variabilidade, é necessário dividir as unidades experimentais em blocos homogêneos de unidades experimentais em relação a cada fator perturbador. Desta forma temos o total de linhas, total de colunas e os valores dos tratamentos dentro de cada unidade amostral. O número de blocos para cada fator perturbador deve ser igual ao número de tratamentos. Por exemplo, se no experimento estão sendo avaliados i tratamentos, deve ser formado para cada fator perturbador i blocos e cada um destes blocos deve conter i unidades experimentais. Ao final são necessários i² unidades experimentais. Cada uma destas i² unidades experimentais é classificada segundo cada um dos dois fatores perturbadores. Geralmente, na configuração de um experimento instalado segundo o DQL, os níveis de um fator perturbador são identificados por linhas em uma tabela de dupla entrada e os níveis do outro fator perturbador são identificados por colunas na tabela Dentre as vantagens: • Controle da heterogeneidade do ambiental; • Controle local com alta precisão; • Conduz a um menor erro experimental; Bio 1005 – Desenho amostral e experimental – PUC-Rio 47 Dentre as desvantagens: • Análise mais demorada; • Número de tratamentos = número de repetições; • Os quadrados devem estar localizados em um mesmo local; • Redução do número do grau de liberdade do resíduo. Exemplos de uso do DQL: Características do DQL: Casualização do delineamento em DQL: Bio 1005 – Desenho amostral e experimental – PUC-Rio 48 Neste caso teremos das fontes de variação a variável em linha, a variável em coluna e os tratamentos. Obviamente que teremos o erro ou resíduo completando o total de variação do trabalho. Bio 1005 – Desenho amostral e experimental – PUC-Rio 49 Formulário: Exemplo: Em um experimento foi avaliado o rendimento (t/ha) de quatro cultivares (A, B, C e D) de alho. Na escolha do delineamento, o bloqueamento de linhas foi em razão da heterogeneidade da fertilidade entre as curvas de nível (cada curva igual a uma linha) e o bloqueamento de colunas foi devido a heterogeneidade entre tamanhos dos bulbos de alho (Florão, Graúdo, médio e miúdo). Os resultados estão apresentados no esquema abaixo. Bio 1005 – Desenho amostral e experimental – PUC-Rio 50 Soma de quadrados: A) Linhas (curvas de fertilidade) SQ = (37² + 37² + 32² + 46²)/4 – (152)²/ (4x4) = 25,5 B) colunas (Tamanho dos bulbos) SQ = (48² + 27² + 38² + 39²)/4 – (152²)/ (4x4) = 55,5 C) tratamentos (Cultivares de alho) SQ = (31² + 39² + 53² + 29²)/4 – 152²/ (4x4) = 89,0 D) Total = (11² + 4² + 7²....+ 10²) – (152²)/(4x4) = 186 E) Resíduo = 186 – 55,5 – 25,5 – 89,0 = 16 Conclusões: • Linhas, aceitamos a hipótese nula, fertilidade não é heterogênea. Em um próximo trabalho, não seria necessário este tipo de bloqueamento; • Colunas, rejeitamos a hipótese nula, As classes de bulbo são heterogêneas. O uso de bloqueamento para as classes foi eficiente, em um próximo trabalho este tratamento pode ser feito em um DBA. Bio 1005 – Desenho amostral e experimental – PUC-Rio 51 • Tratamento, rejeitamos a hipótese nula. As cultivares não são iguais em nível de 5% de erro. • No mínimo um tratamento deve ser significativamente diferente dos demais. Exercícios: 1 - O objetivo desse experimento foi testar o efeito de quatro diferentes suplementos (A, B, C e D) sobre o consumo de feno em novilhos em terminação. O experimento foi delineado como um quadrado latino com 4 animais em 4 períodos de 20 dias. Os novilhos foram alocados individualmente. Cada período consiste de 10 dias de adaptação e 10 dias de mensuração. Os dados na tabela são as médias dos 10 dias: 2 - O artigo “The responsiveness of food Sales to shelf space requeriments”(J. Marketing Research, 1964, p. 63-67) descreve o uso do modelo em quadrado latino para investigar o efeito do espaço na prateleira sobre a venda de alimentos. O experimento, realizado no período de seis semanas, usando seis diferentes lojas, resultou nos dados a seguir sobre a vendade creme de café em pó (o índice do espaço na prateleira está entre parênteses): Bio 1005 – Desenho amostral e experimental – PUC-Rio 52 Kruskal-Wallis Este teste é utilizado para comparação de três ou mais tratamentos independentes cuja a distribuição de probabilidade é diferente de uma normal. • Foi desenvolvido por William Kruskal e W. Allen Wallis; • Extensão do Teste de Mann-Whitney para mais de duas amostras. • Ele é usado para testar a hipótese nula de que todas as populações possuem funções de distribuição iguais; • O equivalente paramétrico ao teste de Kruskal-Wallis é o teste F utilizado na ANOVA 1 fator (DIC). Etapas de execução: 1) Ordena-se, do menor para o maior, os valores das amostras e, ao lado de cada valor, atribui- se o valor do posto; kTTTH ...: 210 Bio 1005 – Desenho amostral e experimental – PUC-Rio 53 2) A seguir, determina-se os tamanhos amostrais, sendo designados por n1, n2, ... ni; 3) Obtém-se os valores de R1, R2, ..., Ri, que correspondem à soma dos postos para cada amostra. Se a ordenação estiver correta: 4) Em seguida, calcula-se o valor do teste (Hcalc) 5) Rejeitamos H0 se Hcalc ≥ Htab ao nível de significância. Obs: Se ocorrerem empates, a estatística H deve ser corrigida com a seguinte expressão: t: é o número de observações empatadas Exemplo de aplicação Em um experimento para avaliar o consumo de energia elétrica em kWh de três motores durante uma hora de funcionamento, foram analisadas três máquinas de reciclagem de garrafas pet, obteve-se os seguintes resultados: Resolução: 1) Elaboração das hipóteses estatísticas: 2) Escolha do nível de significância kk MMH MMMH : : 1 3210 Bio 1005 – Desenho amostral e experimental – PUC-Rio 54 3) Determinação do valor tabelado do test 4) Determinação do valor calculado do teste: Verificação: Cálculo do Hcalc: 5) Decisão: , aceita-se H0, Bio 1005 – Desenho amostral e experimental – PUC-Rio 55 6) Conclusão: Os motores não diferem no parâmetro consumo de energia. Teste a posteriori: Teste de Dunn Exemplo 2: Foi selecionada uma amostra aleatória de três diferentes tipos de lâmpadas e testadas para verificar quanto tempo as lâmpadas funcionavam, com os seguintes resultados: Resolução: 1) Elaboração das hipóteses estatísticas: 2) Escolha do nível de significância 3) Determinação do valor tabelado do teste 4) Determinação do valor calculado do teste: Bio 1005 – Desenho amostral e experimental – PUC-Rio 56 Verificação: Cálculo do Hcalc: 5) Decisão: , rejeita-se H0 6) Conclusão: As horas de funcionamento de cada tipo de lâmpada diferem em pelo menos um dos casos. Teste de Dunn Bio 1005 – Desenho amostral e experimental – PUC-Rio 57 Bio 1005 – Desenho amostral e experimental – PUC-Rio 58 Bio 1005 – Desenho amostral e experimental – PUC-Rio 59 Teste de Friedman O teste de Friedman é uma alternativa não paramétrica para o teste de experimentos em blocos ao acaso na ANOVA regular. Ele substitui o DBC quando os pressupostos de normalidade não estão assegurados, ou quando as variações são possivelmente diferentes de população para população. Este teste utiliza os ranks dos dados ao invés de seus valores brutos para o cálculo da estatística de teste. Como o teste de Friedman não faz suposições sobre a distribuição, ele não é tão poderoso quanto o teste padrão se as populações forem realmente normais. Milton Friedman publicou os primeiros resultados para este tipo teste. Ele recebeu o Prêmio Nobel de Economia em 1976 e uma das publicações sobre sua descoberta foi o artigo "O Uso de Ranks para evitar a suposição de normalidade implícita na análise de variância”, publicado em 1937. Resposta: H calc = 0,14, aceita-se H0 Bio 1005 – Desenho amostral e experimental – PUC-Rio 60 Exemplo: Vamos tomar como exemplo os dados da tabela abaixo, relativos a um ensaio com 3 tratamentos em 5 blocos casualizados: O primeiro passo é colocar os dados em ordem dentro dos blocos: O primeiro passo é colocar os dados em ordem dentro dos blocos: A partir destes dados já podemos calcular os rankings. Usando a fórmula de “K” encontraremos o valor calculado do teste. Bio 1005 – Desenho amostral e experimental – PUC-Rio 61 Usando a fórmula de “K” encontraremos o valor calculado do teste. Exemplo de aplicação Resolução: 1) Elaboração das hipóteses estatísticas: H0: T1=T2=T3 H1: Ao menos um dos tratamentos difere. 2) Escolha do nível de significância: 3) Determinação do valor tabelado do teste: 4) Bio 1005 – Desenho amostral e experimental – PUC-Rio 62 5) Decisão: O valor de p encontrado é maior que 0,05, ou seja, valor de alfa. Sendo assim aceitamos H0. 6) Conclusão: Não existem diferenças estatísticas entre os tratamentos. • Assim como em Kruskal Wallis, quando há empates nos postos devemos fazer uma correção; Teste a posteriori: • O teste a posteriori utilizado neste caso é o teste de Bonferroni. Exercício: Cinco espécies nativas foram testadas em quatro solos diferentes. Os dados não são paramétricos e não podem ser analisados através de ANOVA DBC. Bio 1005 – Desenho amostral e experimental – PUC-Rio 63 Tabelas Bio 1005 – Desenho amostral e experimental – PUC-Rio 64 Bio 1005 – Desenho amostral e experimental – PUC-Rio 65 Exercícios: Bio 1005 – Desenho amostral e experimental – PUC-Rio 66 Exercícios – Delineamento experimental Bio 1005 – Desenho amostral e experimental – PUC-Rio 67
Compartilhar