Baixe o app para aproveitar ainda mais
Prévia do material em texto
Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas Bioestatística Aplicada I EPR, conceitos e planejamento hierry R. Gasnier l do Amazonas 20 11 /1 T Universidade Federa Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas umário Introdução ............................................................................................ 3 1. Estatística intuitiva e estatística formal ....................................... 5 1.1 Uma ferramenta muito útil ..................................................... 5 1.2 Pergunta, coleta, medida, estatística e generalização ........... 6 1.3 Dois tipos de estatística ........................................................... 8 1.4 A estatística inferencial e a intuição estatística. .................... 8 1.5 Hipóteses, erros e grau de rigor. .......................................... 11 1.6 Considerações complementares. .......................................... 13 2. Do problema biológico ao estatístico. ......................................... 18 2.1 Entidades ................................................................................ 18 2.2 Propriedades .......................................................................... 19 2.3 Tabelas e gráficos EPR ......................................................... 20 2.4 Relações .................................................................................. 20 2.5 A estatística para estabelecer relações. ................................ 21 3. Conceitos para a escolha e uso de testes e gráficos ................... 23 3.1 Níveis de medida e tipos de variáveis. .................................. 23 3.2 Escalas de medidas. ............................................................... 23 3.3 Premissas dos testes paramétricos ....................................... 25 3.4 Transformação de dados ....................................................... 29 3.5 Contrastes com a variável independente categórica .......... 29 3.6 Número de variáveis em um teste ........................................ 29 3.7 Balanço ................................................................................... 30 3.8 A “tabela periódica” dos testes e gráficos com duas variáveis. .......................................................................................... 31 3.9 Considerações complementares. .......................................... 32 S Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas 4.1 Testes unicaudais e testes bicaudais ..................................... 33 5.6 Escolha a sua abordagem ...................................................... 56 6. 7. Anexo: sta apostila usada em disciplinas da UFAM continuará em processo de aperfeiçoamento. Versões mais recentes poderão r obtidas no site www.intertropi.ufam.edu.br/ docs.html. Neste site também estão as últimas versões das apostilas para colha de gráficos e testes e outros anexos. Sugestões poderão ser enviadas para o email tgasnier@ufam.edu.br. Os direi- s autorais desta apostila pertencem ao autor e à Universidade Federal do Amazonas. É permitida a cópia sem fins lucrati- s desde que a fonte seja citada 4. O poder do teste ........................................................................... 33 4.2 Testes pareados e testes em blocos ....................................... 34 4.3 Testes múltiplos ..................................................................... 36 4.4 Níveis fixos e níveis livres ...................................................... 36 4.5 Relações retilineares, curvilineares e monotonicidade. ...... 38 4.6 O poder e os tipos de teste ..................................................... 38 4.7 O poder e os níveis das variáveis em estudo ........................ 39 4.8 Perdas voluntárias de poder ................................................. 40 5. Planejamento Amostral ............................................................... 43 5.1 Independência entre Unidades Amostrais ........................... 43 5.2 A coleta parecia apropriada, mas... ..................................... 45 5.3 Tipos de variáveis dentro de mapas conceituais. ................ 47 5.4 Aleatório versus “ao acaso” .................................................. 50 5.5 Controle: tratamento, função e estratégia ........................... 51 5.7 O experimento como modelo na pesquisa de relações. ....... 57 5.8 Abordagens quase experimentais. ........................................ 58 5.9 Abordagens não experimentais ............................................ 59 5.10 Independência pela distância............................................. 61 5.11 Seus próximos passos. ........................................................ 63 Glossário ....................................................................................... 65 Bibliografia citada e recomendada ............................................. 68 Chaves e Guias para uso de testes e gráficos *E se es to vo Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas ntrodução plí qu É an tís c ma ic fis q tic av ma ta pr d tên pe st eiro ou um construtor de instrumentos musi- co d me o co p qu rim pr da las tõ dir a ap da co r tís q co ar çã m um e (engenheiros, um e a s). Ainda que muitos livros de bioestatística n 05) propõe uma ênfase ainda menor na ma- envolvidos na lógica e na escolha de teses e gráficos; “Pla- nejamento” é uma introdução ao planejamento amostral (também chamado de delineamento, plano ou desenho amostral). Além de ajudar na definição de problemas estatísticos, a aborda- utilizando programas diferentes, as apostilas gração para a Plataforma R. O último capítulo é ento amostral. Embora no cotidi- ano da pesquisa o planejamento venha antes parados para entender o que é planejamento amostral. . I O título “Bioestatística Aplicada” pede uma justi- ficativa, afinal, o termo “aplicada” não seria im- gem EPR é uma forma de ver a ciência como cito a alquer texto de bioestatística? uma atividade em que estamos estabelecendo relações e a ver a estatística como uma ferra- impor te se separar dois contextos da esta- tica, o ontexto da criação e fundamentação nossa ênfase é compreender como se estabe-t menta que ajuda neste trabalho. Por isto, a temát a e o contexto da aplicação. Há pro- lecem relações mais do que saber como funcio- na a ferramenta. sionais ue desenvolvem ferramentas estatís- as e aliam suas aplicações e limitações, s há mbém pessoas que sabem utilizar os A introdução à estatística formal do primeiro odutos estes profissionais com muita compe- capítulo pode ser vista como uma introdução ao estudo das relações que são estabelecidas com cia a nas com a base necessária para o o da e atística. O primeiro é como um enge- decisões a partir de um conjunto de dados e de critérios pré-estabelecidos. Neste capítulo, a us nh cais e o segundo é como um piloto ou um músi- estatística formal é apresentada como uma extensão da estatística intuitiva utilizada no . Quan o uma pessoa que conhece a funda- ã cotidiano. Embora a estatística intuitiva tenha ntaç e a aplicação vai ajudar outra pessoa m um roblema estatístico, não se espera suas limitações, já dominamos muito da lógica e a p eira explique noções de cálculo de da estatística, e a percepção disto nos ajuda a perder o medo dela. Nos capítulos 3º e 4º são obabilide e faça demonstrações de fórmu- s apresentados os conceitos necessários para (que es mecânicas), espera-se que ela vá eto ao ssunto e explique qual é a ferramenta escolher testes e gráficos em função de carac- ropria , quais suas premissas e limitações, terísticas dos dados, de premissas e de diferen- ças de poder de testes. Terminada a leitura mo se ealiza o teste em um programa esta- destes capítulos, é importante consolidar os tico e ual é o gráfico mais apropriado para munic os resultados (questões de condu- conceitos e praticar bastante usando programas o). É i portante se diferenciar o conteúdo de estatísticos com o auxílio de guias para testes e gráficos. Temos usado o programa MYSTAT12, livro d apoio na formação de estatísticos a versão livre do programa SYSTAT12, para o construtores de instrumentos) de livro d poio para usuários (pilotos, músi- qual as apostilas mostram como os testes e gráficos são realizados. Entretanto, mesmo co tenham esta proposta, alguns autores (e.g. ac aughton 2002, Magnusson & Mourão podem ser utilizadas na determinação de qual gráfico ou teste é utilizado em cada situação. M 20 temática e ainda maior nos conceitos associa- os ao uso da estatística. Esta diferença de Em função de uma demanda de maior flexibili- dade e outras vantagens, iniciaremos uma mi- d ênfase justifica o termo “Bioestatística Aplica- a”. sobre planejam d O subtítulo “EPR, Conceitos e Planejamento” resume o conteúdo: “EPR” (Entidade- Propriedade-Relação) é uma abordagem para transformar problemas biológicos em problemas estatísticos; “Conceitos” são aqueles da análise, optei por posicionar este capítulo depois dos capítulos 3º e 4º porque acredito que os estudantes ganham mais domínio dos con- ceitos após as aulas práticas, e ficam mais pre- Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas tica intuitiva e es- a formal esquisas e atividades em algumas áreas de prender a dirigir é importante, mas a questão os carros mudaram muito, quebram menos, são is e para preparar melhor os studantes para conhecer a diversidade (cres- . 1. Estatís tatístic 1.1 Uma ferramenta muito útil P atuação do biólogo podem ter pouco uso de estatística (e.g. anatomia, taxonomia, direito ambiental), mas, na maioria das áreas, o uso da estatística é generalizado e algumas vezes intenso e complexo. É importante entender que a estatística tornou-se parte essencial da for- mação do biólogo. A boa notícia é que dominar as principais análises básicas da estatística hoje pode ser bem menos traumático do que era até recentemente para quem não tem muita afini- dade com a matemática. A estatística serve para ajudar na descrição de fenômenos e na tomada de decisões. Por muito tempo descrevemos e tomamos decisões na ciência sem estatística ou com pouca ajuda da estatística. Entretanto, embora a estatística não seja critério de cientificidade, ela é uma ferra- menta poderosa, e neste sentido ela é necessá- ria ao pesquisador. Entenda por analogia: a rigor, não precisamos de carros para nos deslo- car, entretanto, poucas pessoas fariam longas viagens a pé se tiverem um carro à disposição. Os pesquisadores de hoje precisam tanto da estatística como as pessoas dependem de mei- os de transporte. Há situações na pesquisa em que a estatística é tão inútil como um carro no meio de um pântano. Entretanto, é preciso ter claro que não se pode deixar de usar estatística simplesmente porque não se gosta dela: é a situação que define a necessidade. Evitar a estatística pode restringir muito seu campo de trabalho. A é: como se aprende a dirigir? Qual seria a utili- dade de se ter um curso com ênfase em mecâ- nica de motores? Qual o interesse de sabermos como se monta um carro? Há poucas décadas a resposta seria que este conhecimento era fundamental, pois os próprios motoristas tinham que consertar os carros freqüentemente. Mas mais fáceis de serem utilizados e mais difíceis de serem consertados. Conseqüentemente, já não precisamos saber mecânica e podemos dar maior ênfase aos conceitos relacionados com o ato de dirigir. Da mesma forma, os cursos de estatística precisam se ajustar à nova realidade de computadores que realizam os cálculos. Com os ajustes nos cursos, haverá mais tempo (e paciência de estudantes) para reforçar os conceitos essencia e cente) dos testes. Algumas pessoas têm medo de aprender a dirigir e outras de aprender estatística. O “me- do” é uma das maiores barreiras para o apren- dizado de estatística. Cursos de estatística de- vem ser ajustados para reduzir este medo. Des- crever e tomar decisões são atividades intuitivas que realizamos em nosso cotidiano com natura- lidade. Portanto, em um curso de estatística, apenas estamos desenvolvendo algo que já sabemos. Esta concepção é importante para que o uso da estatística torne-se algo tão natu- ral como dirigir um carro. O objetivo deste livro é que, ao seu final, você sinta-se tão confortável com a estatística como uma pessoa se sente em um carro após apren- der a dirigir e, após um pouco mais de treino, que você esteja pronto (a) para enfrentar com confiança os caminhos mais difíceis da pesqui- sa. Neste capítulo veremos: a) que a aplicação correta da estatística é uma das quatro preocu- pações principais para a confiabilidade de um estudo; b) que a estatística pode ser dividida em dois tipos; c) que fazemos no cotidiano de forma natural e intuitiva o que a estatística formal faz na pesquisa, só que somos mais rápidos, me- nos acurados e menos precisos; d) que a esta- tística tem a ver com hipóteses, níveis de signi- ficância e cálculo de probabilidades. Ao final do capítulo faremos algumas considerações com- plementares sobre esta parte introdutória da estatística 5 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas i- damental ra ele a- ender a realizar análises válidas. Entretanto, lisamos e discutimos. ote que estas partes do trabalho coincidem s para estudantes se setos capturados em armadilhas como um na discussão e na generalização dos resultados. 1.2 Pergunta, coleta, medida, estatíst ca e generalização Um treinamento em estatística é fun na formação de um pesquisador pa pr uma análise estatística válida não garante uma pesquisa válida. Precisamos também aprender a perguntar, coletar, medir e generalizar, pois as nossas conclusões só serão convincentes se forem validadas em quatro etapas que apresen- taremos aqui. Pesquisas começam com perguntas. É impor- tante conhecer o assunto para fazer perguntas relevantes. Depois planejamos uma coleta de dados, escolhemos formas de medir variáveis, coletamos os dados, ana N com as partes de um artigo: Introdução, méto- dos, resultados e discussão. Em cada uma de- las podemos cometer erros, por isto, precisa- mos mostrar que nossas escolhas e nossas ações foram válidas. Não abordamos a fase de pergunta, pois ela é específica para cada traba- lho, mas podemos discutir as outras etapas. 1) Validação Interna. A forma como os dados foram coletados previne explicações alternati- vas à conclusão? Se eu pescar sempre muito peixe no lago A e você sempre pescar pouco peixe no lago B podemos afirmar com seguran- ça que no lago A tem mais peixes? Quem ga- rante que nós dois temos a mesma habilidade de pescar? Dúvidas deste tipo seriam inaceitá- veis em uma pesquisa científica. Quando não há um planejamento amostral, existe até o risco que todos os dados de um estudo precisem ser coletados novamente. A validação interna será discutida longamente no capítulo 5. 2) Validação da medida. Até que pontoa medida utilizada em nossa análise reflete fielmente aquilo que estamos discutindo? Quando você mede uma planta pequena ou conta ovos em um ninho, normal- mente não há com que se preocupar. Mas quando nós utilizamos um índice de inteligência (QI), estamos realmente medindo inteligência? Imagine que perguntamo eles sabem nadar (valores= sim ou não) e nós concluímos que os meninos sabem nadar com maior freqüência que as meninas. Os meninos nadam mais ou mentem mais? O número de pegadas de predadores em uma praia pode ser considerado um indicador de pressão de preda- ção sobre ovos de tartaruga? Você usa o peso de in índice de disponibilidade de alimentos para lagartos insetívoros, mas este é um bom índice? O que acontece se os insetos capturados não forem os mesmos que os lagartos consomem? A concentração medida de fósforo total no solo realmente reflete o fósforo disponível para uma planta? Podemos comparar dados de estudos de uma variável que é tão difícil de ser medida que tem diferentes valores em laboratórios dife- rentes? Se as incertezas sobre medidas são uma fonte de dúvida (e isto é bastante comum), seria um erro deixar de detalhar a forma da medida e de considerar sua eventual imprecisão e acuidade 6 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas clusão”: A abor- crever relação com variável de- ho mostral foi determinado considerando-se β). outras situações. Se eu concluo que machos da borboleta da espécie X são mais ativos que fêmeas da mesma espécie na Reserva Ducke baseado em coletas feitas em janeiro de 2006, o que é razoável se supor?: a) Os machos des- ta espécie são mais ativos que as fêmeas todos os anos? Durante o ano todo?; b) os machos são mais ativos que as fêmeas 1, 10, 100 ou 1000 km dali? c) outras espécies do mesmo gênero têm machos mais ativos em janeiro? Espécies desta família têm machos mais ativos em janeiro? Obviamente, quanto mais distante da situação estudada, maior o risco da extrapo- lação. Outro exemplo, estudos do comporta- mento desta borboleta feitos em laboratórios rva Ducke m janeiro de 2006 se não podemos generali- etar em outras épo- cas e outros locais, mas isto pode não ser prati- cável e permaneceria a limitação de não poder generalizar além das épocas e locais dos estu- dos. Portanto, quase todos os estudos generali- zam seus resultados, a questão é até onde podemos generalizar. A validação externa inclui argumentos, citações e dados adicionais que justifiquem a generalização. 3) Validação “Dados→Con agem matemático-estatística escolhida é real-d mente apropriada para a conclusão a que se chegou? Aqui entram os livros de estatística. Nos capítulos 3 e 4 apresentaremos as bases conceituais para a escolha e aplicação de tes- tes. Exemplos de erro: utilizar testes paramétri- cos sem considerar as premissas destes testes para os dados coletados; desbalanço amostral extremo entre os níveis da variável independen- te; utilização de regressão de mínimos quadra- os para desd pendente contínua com “níveis livres”. Concluir que “não há relação” ao invés de “não há evi- dência de relação ao aceitar Ho (exceto se o taman a Não efetuar ajustes em testes múltiplos; Base- ar-se apenas em gráficos de barras ou propor- ções para concluir algo que exige um teste. 4) Validação Externa. Até que ponto as con- clusões com base nos dados coletados podem ser extrapolados no tempo, no espaço e em realmente refletem o que seria o comportamen- to na natureza? Se restringirmos nossas gene- ralizações ao universo amostrado e utilizarmos medidas diretas, não há problema de validação externa. Entretanto, qual é o interesse do com- portamento de borboletas da Rese e zar? Bem, poderíamos col Embora as quatro validações sejam importan- tes, na prática, as duas primeiras são as mais críticas. Se você mediu ou coletou os dados de forma incorreta, possivelmente terá de medi-los novamente. Se você analisou os dados de for- ma incorreta ou realizou generalizações não apropriadas, ainda poderá se corrigir. Por isto, é importante ter em mente que o treinamento em análise de dados vai além do treinamento em estatística. No capítulo 5 discutiremos desenho amostral. V. dep? Binário (Categ. de 2) Categórico Ordinal ou Quantitativo Situação I* Quantitativo Situação II* V. ind.? Binário (cat. de 2) Teste de 2 prop., T. Exato de Fisher ou T.C. (j) Tabela de Contingência (TC) (k) Mann- Whitney (l1) Teste t (de 2 grupos) (m) Categórico Tabela de Contingência (k) Tabela de Contingência (k) Kruskal-Wallis ou Friedman (n) Análise de Variância (o) Ordinal Mann- Whitney; Cochrans TLT (l2) Dicotomizar VI ou VD e usar teste apropriado (Max. Balanço) (p) Correlação de Postos (q)/ RNL Correlação de Postos (q)/ RNL Quantitativo Regressão Logística (r) Dicotomizar VI ou VD (Max. Balanço) (p) Correlação de Postos (q)/ RNL Pearson/ Regressão Linear/ RNL (s) 7 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas Estatística pode ser dividida em dois tipos: é estatística descritiva. A estatística descritiva é a primeira estatística que se ensina nos cursos, mas não é necessa- riamente simples (e.g. modelagem matemática associada a estatística inferencial). A base de estatística descritiva já é dada no ensino médio, incluindo medidas centrais como média e medi- das de variação como desvio padrão. Por ser m conhecimento básico, não trataremos dele m- temos evidência para inferir sobre a população de onde a amostra foi tirada (se houver valida- ção interna) ou para uma população mais ampla (dentro das considerações da validação exter- na). Esta definição técnica ficará mais clara adiante. A função da estatística inferencial é medir a força da evidência em uma argumenta- ção (nas situações em que podemos medir probabilidades), isto é, medir a força de uma iência é con- encer aos outros (pesquisadores, população) e 1.3 Dois tipos de estatística A Estatística descritiva e Estatística inferencial. A estatística descritiva serve para sintetizar dados e mostrar formas de relações. Isto pode ser feito em diferentes graus de complexidade. Por e- xemplo, é difícil concluir alguma coisa de duas listas de comprimentos de besouros. Com duas médias podemos ver uma diferença, mas é uma síntese extrema. Podemos ter médias e desvios padrões ou erros padrões, o que nos dá uma idéia melhor. Podemos ter duas fórmulas de curvas de distribuição de comprimentos, que é uma descrição mais informativa, ou um gráfico com a curva de freqüência dos dados, na qual toda a informação poderia ser apresentada. Tudo isto u aqui, mas você pode fazer uma revisão nos primeiros capítulos de livros de estatística (ver lista de referências). Abordaremos um aspecto de estatística descritiva: a elaboração de gráfi- cos efetivos. Algumas análises descritivas co plexas estão sendo utilizadas cada vez mais em biologia, principalmente o uso de Análises Mul- tivariadas em estudos de ecologia de comuni- dades e de filogenia. Dada a sua complexidade, não podem ser incluídas em um texto de fun- damentos de estatística como este. Esta separação não é absoluta, pois as duas estatísticas são utilizadas juntas e interagem na análise de dados. Por exemplo, em um gráfico com ume linha de regressão, é a estatística inferencial que determina que a reta pode ser colocada no gráfico e a descritiva que nos per- mite desenhar a linha de regressão. Vejamos então o que é a estatística inferencial. 1.4 A estatística inferencial e a intuição estatística. O mundo é feito de idéias.Ter idéias novas é o começo na geração do conhecimento, mas para decidir quais são verdadeiras temos que olhar para o mundo. Nem tudo se decide com uma observação, a decisão pode se basear na fre- qüência com que algo ocorre. A estatística inferencial é a estatística em que você entra com uma hipótese e dados e ela responde com um sim ou um não. Tecnicamen- te, é a estatística da validação de hipóteses sobre valores de uma propriedade de uma po- pulação ou sobre uma relação entre proprieda- des de entidades de uma população. A partir de amostras (dados coletados), verificamos se "prova". Um momento crucial da c v até a nós próprios sobre a qualidade de uma "prova". É por isto que ela é tão importante. Nem sempre precisamos ou podemos utilizar estatística, pois esta não é a única forma de se obter provas. Mostrar uma determinada estrutu- ra em um animal seria uma "prova" que ele pertence a certo gênero. Um registro de um pesquisador que observou certo animal se ali- Fig. 1-1- Uma estrutura pode provar que uma espécie é nova 8 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas a" dentro d a discussão sobre cadeia alimentar. A foto- to foi a tripula- ão de Magalhães com a circunavegação com- as em um upermercado, número de pes- soas (regressão a (análise intuitiva de resí- tuição estatística ara mentando de outro seria uma "prov m e re u grafia de um vírus em uma pesquisa sobre as causas da AIDS em um doente seria a prova de que a doença seria transmissível por este agen- te. Cristóvão Colombo teria "provado" que a terra era redonda atingindo as Índias viajando para Leste, ao invés de ir para Oeste. O cotidia- no da investigação, da história e da vida envol- ve provas que não são estatísticas. Qualquer prova está sujeita a erros. A estrutura que seria característica do gênero pode ser resultado de uma anomalia rara. O pesquisador que fez o depoimento pode ter se enganado. Cristóvão Colombo estava certo e errado, a terra de fato é redonda, mas ele não atingiu as Índias. Quem realmente provou is ç pleta. A foto do vírus poderia ter sido um erro técnico, ou outro vírus que não fosse da AIDS. É possível tomarmos medidas preventivas para diminuir a chance de erros, mas é impossível calcularmos a probabilidade de um erro deste tipo acontecer. A estatística inferencial é usada para avaliações de idéias que dependem de várias observações. A estatística inferencial é um aperfeiçoamento da intuição estatística. É semelhante à nossa matemática intuitiva que usamos no cotidiano. Quando atravessamos uma rua: calculamos a velocidade do carro que vem e a velocidade que podemos correr e, se formos prudentes, che- gamos a salvo do outro lado. Imagine os cálcu- los instantâneos que fazemos quando rebate- mos uma bola durante um jogo de tênis. Quan- do terminamos de fazer as compr s se queremos ir logo para casa, baseados em nossas experiên- cias anteriores de compras, escolhemos um caixa com menor tilinear intuitiva), mas também levamos em conta quanto está cheio de mercadorias o carri- ho de cada pesson duos). É importante ter consciência que existe esta estatística intuitiva, porque uma das dificul- dades de se aprender estatística está em achar que é algo estranho à nossa forma de pensar. Não é. A estatística inferencial apenas dá mais precisão e poder à nossa forma cotidiana de pensar. Vamos apreciar a in com mais exemplos. Imagine que Cabral, em 1500, encontra um indiozinho de pele mais clara no meio de uma aldeia. Ele tinha percebido que o tom da pele dos índios era mais escuro que dos portugue- ses e que o indiozinho era claro demais. Ele conclui que homens brancos já estiveram aqui antes dele. Então, ele pede para Caminha es- crever ao rei que mande tropas para vigiar, porque outros europeus podem pensar em in- vadir. Com uma grande visão de futuro, o rei resolve transferir a sua corte para o Brasil, que cinco séculos depois torna-se a maior potência econômica do mundo, etc. Tudo bem, nada disto ocorreu. O que importa é que coisas assim ocorrem, e Cabral teria utilizado intuição estatís- tica para decidir que o indiozinho estava fora dos padrões (foi um teste Kolmogorov-Smirnov de duas amostras associado a um teste t uni- caudal para uma amostra). Ele teria utilizado o gráfico a seguir, sem realmente construí-lo, p sua conclusão. Outro exemplo. Seria impressão sua ou a cerve- ja no bar A tem um sabor estranho? Você toma cerveja no bar B e o sabor é melhor. Outro dia, novamente a cerveja no bar A parece pior. No Fig. 1-2- Representação gráfica da avaliação feita com estatística intuitiva de Cabral. Indiozinho Indios Portugueses 0 100 200 Concentraç 300 400 500 ão de melanina 9 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas antropólogo quer avaliar se o e fácil de aioria ó concor- o é con- nho a 800 ais que te critério, e uma proporção 300:500 eja tão improvável nesta situação. A chance bar B está boa. Passam-se semanas e o padrão se repete. Ai você finalmente decide que não tomará mais cerveja no bar A. O que você fez, sem pensar muito, foi uma operação de decisão estatística representada na figura a seguir. Em algumas culturas o cuidado aos filhos é maior do que o cuidado às filhas. Se as condi- ções sanitárias forem ruins, isto pode até levar a um desvio na razão sexual das crianças. Imagi- emos, que umn existe este fenômeno na Amazônia. Ele conta o número de meninos e de meninas que ele en- contra. Em diferentes momentos da pesquisa ele encontra os resultados da tabela 1. Em que momento o pesquisador pode concluir que a razão sexual de 63% de meninos está fora do esperado (50%)? (Em sala de aula é explicado o cálculo do Qui Quadrado, que não é o melhor para este caso, mas que é válid compreender.) Invariavelmente a m dos estudantes s da que a conclusã fiável com um tama amostral superior (alguns exigem m 80.000!). Com es alguns estudos ia ser considerados convincentes. O importante neste exercício é verificar a semelhança e a diferença de decisões com e sem estatística. A lógica nos dois casos é a mesma. Estamos decidindo se há ou não algo de anormal consi- derando freqüências esperadas. A estatística intuitiva é muito rápida, o que é bom para a maioria dos problemas cotidianos, entretanto, ela não é apropriada para situações que reque- rem um pouco mais de precisão e objetividade. Não fazemos idéia qu m levar uma vida inteira para s disto acontecer por acaso é tão baixa que des- cartamos a possibilidade de ter sido por acaso e aceitamos uma interpretação alternativa: há uma diferença de fato na população. Tab. 1- Probabilidades no a- estudo imaginário do texto com base em tam nhos amostrais crescent s-es para uma mesma proporção diferente do e perado de 1:1. Apesar do poder da estatística intuitiva para muitas ques- tões cotidianas, vimos em sala de aula que ela varia bastante entre pes- soas e que a maioria das pessoas subestima o poder do tamanho amos- tral prendendo-se a porcentagens. O exercício mostra ainda a essência dos testes estatísticos: tomar uma decisão calculando a chance de um resultado ocorrer ao acaso; se a probabilidade é muito baixa, podemos assumir que não foi por acaso e que algum fator determinou o resultado observado. Tempo Meninas Meninos χ2 Probabilidade 1 dia 3 5 0.5 0.48 3 dias 30 50 5 0,0253 1 mes 300 500 50 1,5x10 -32 1 ano 3000 5000 500 9.5x10-111 10 anos 30000 50000 5000 ?! 1 geração 300000 500000 50000 ?!!!!!!!!!! A B BAR 0 1 2 3 4 Q ua lid ad5 6 7 8 a ce rv ej a e d Fig. 1-3 Representação gráfica de uma decisão do cotidiano 10 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas ntre rgunta e hipótese no contexto da estatística inferencial. Prefiro a definição “Hipótese é uma possibilidade de resposta para uma pergunta com duas ou mais alternativas”. Uma caracterís- tica importante das hipóteses é que elas nunca vêm isoladas, pois se não houvesse alternativas elas seriam fatos ou tautologias. Quem comeu o bolo? Uma hipótese é “foi o gato”. Para cada outro suspeito teríamos uma hipótese, ou po- demos ter outra única hipótese alternativa com- plementar: “não foi o gato”. assemos a um caso biológico: bromélias ab- orvem fósforo da água que fica acumulada ntre suas folhas? A princípio, plantas absor- em nutrientes pela raiz; seriam as bromélias xceções, sendo capazes de absorver pelas lhas? A hipótese “da novidade” é chamada ipótese alternativa (Ha ou H1), e a hipótese ue não há novidade (bromélias também não bsorvem nutrientes pelas folhas) é chamada ipótese nula (Ho). Da forma como colocamos o roblema, uma, e apenas uma, das duas hipó- arcado na água acumulada e bast a nálise da presença de fósforo marcado nos as s o. E ia tatís ra rov - in s com omélias como controle e crescentamos um pouco de fósforo na água de também é lgo grave, ainda mais se pensarmos que um ia poderíamos ser nós mesmo em um banco de réus. Por isto, toda pessoa deve ser conside- in que um tanto, po elhor qu ja a justiç nun- será pe a e há tro resul ssí- s em u lgamen ) pode ar der pess ocent a); odem ndar er um a ssino; dem tar essoa e 1.5 Hipóteses, erros e grau de rigor. A definição comum “Hipótese é uma formulação provisória, com intenções de ser posteriormente demonstrada” não deixa clara a relação e pe P s e v e fo h q a h p teses está correta. Poderíamos co foro locar fós m aria um a tecidos da planta para provar que conseguem absorver este fósfor uma abordagem sem apoio es responder esta questão (isto é, “p tese alternativa). Entretanto, imag tenhamos acesso a esta téc mos usar uma abordagem e Neste caso, para usar uma tica temos de transformar um Não podemos ver o fósfor podemos prever que, se ela mais fósforo na água maior (considerando que fósforo co mento limitante para o cres criamos a hipótese (Ha) qu mais fósforo crescem mais. Como nenhuma hipótese nasce sozinha, automaticamente nas- ce também a hipótese nula complementar: as plantas com mais fósforo não vão crescer mais. Então, sorteamos 20 br bromélia sta ser tico pa ar” a hipó e que não a outras 20, e passados alguns meses, medimos as plantas e verificamos que todas as plantas do segundo grupo estão bem maiores que as plantas do primeiro grupo. Provamos, certo? Mas e se o resultado for menos evidente, diga- mos que as plantas do primeiro grupo foram em média maiores, mas nem tanto assim. Esta diferença na média já basta como prova? Qual a chance de estarmos cometendo um erro ao decidirmos que a hipótese proposta estava cor- reta? O julgamento de qual das duas é a hipótese correta em pesquisa é análogo ao julgamento de um possível assassino em um tribunal. Co- mo vimos muitos filmes sobre tribunais, deve ser mais fácil de entender, vejamos o que ocor- re. Um assassino solto é algo ruim e deve ser evi- tado. Entretanto, um inocente preso, a d s nica, então, pode- tatística. abordagem estatís- pouco a questão. o absorvido, mas absorver, quanto será o crescimento stuma ser um ele- cimento). Por isto, e as plantas 4) podemos libertar um assassino (impunidade). A tabela abaixo resume estas possibilidades. Realidade Î Inocente Culpado rada ocente até haja a evidência real- mente convincente de que ela é o culpada. En- tre r m e se a, ela ca rfeit qua tados po vei m ju to: 1 mos mand pren uma oa in e (injustiç 2) P os ma prend ssa 3) Po os liber uma p inocente Decisão Ð Culpado Injustiça Decisão Correta Inocente Decisão Correta Impunidade 11 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas ar a as chances de defesa para o réu. Por nservadorismo. Os ibunais justos devem ser conservadores quan- recebe- m fósforo na água acumulada cresceram mais e comparamos este valor com um valor ). “Extremamente improvável” significa um e tentar estimar matematicamente o tamanho da amostra para uma chance de erro tipo d tretan a- ções em que o erro tipo II é importante e então são os pro s dif ção Em rigor c e- ria s nte ele m a intuitiva (a probabilidade das testemunhas não estar mentindo) do que estatística formal (e.g. A justiça séria deve ser conservadora e d d sto outro lado, crimes deixam rastros. O governo deve investir dinheiro em uma polícia investiga- tiva, para obter dados que permitam incriminar ou inocentar o réu. É desta forma que podemos reduzir os erros ao mínimo possível, reduzindo tanto a injustiça quanto a impunidade. De qual- quer forma, não há como evitar totalmente am- bos os erros. Se formos conservadores demais (em termos de resistir em considerar suficientes as evidências de crimes), estaremos cometendo impunidades com maior freqüência; se formos apressados e aceitarmos provas questionáveis, estaremos arriscando mais casos de injustiças. Ë uma questão de grau de co tr to à inocência, mas não a ponto de ignorar evi- dências realmente muito convincentes. O mesmo princípio conservador se aplica na pesquisa (em geral, discutiremos exceções depois). Ao propor uma nova idéia, cabe ao pesquisador (a) encontrar evidências de que a idéia é correta, isto é, cabe a ele (a) rejeitar a hipótese nula (H0). No exemplo da bromélia, a princípio, a planta não absorveria o fósforo da água acumulada e o crescimento das bromélias dos dois grupos seria semelhante. Note que não basta uma diferença nas médias, pois, na au- sência de efeito, uma das médias seria maior (o empate é tão improvável como a chance de uma moeda cair em pé), de forma que a chance do segundo grupo ser maior é de aproximada- mente 50%. Ninguém desconfiaria que uma moeda está viciada com base em um único lance. Entretanto, se o estudo foi conduzido cuidadosamente e as 20 bromélias que ra que a média e as outras 20 que não receberam, cresceram menos que a média, temos uma prova indiscutível, pois a chance disto ocorrer ao acaso é bem menor que 1 em 1 bilhão (teste Exato de Fisher). O erro ainda é possível, e neste caso é chamado de erro tipo I, ou falso positivo, o erro de rejeitar a hipótese nula quan- do ela é verdadeira, e nós a rejeitamos porque é extremamente improvável. Mas o que concretamente podemos chamar de “extremamente improvável”? Difícil dizer quando usamos estatística intuitiva, mas somos bem precisos quando usamos estatística formal. Nós calculamos a probabilidade (P) que certo resul- tado (nossos dados) pudesse ter ocorrido ao caso Realidade Î H0 Verdadeira H0 Falsa a pré-estabelecido (a priori) como um limite (por- que regras tem que ser estabelecidas antes de um jogo). Este limite é a “probabilidade de erro tipo I e é representado pela letra grega α (e.g. α=0,05). Quando expresso como porcentagem, ele é chamado de Nível de Significância (e.g. %5 “P” calculado além de α, mais improvável que α. Se α=0,05, valores como P=0,01 ou P=0,00045 são extremos; valores como P=0,05 ou P=0,09 ou P=0,76 não são extremos. O erro oposto é aceitar a hipótese nula quando ela é falsa (erro tipo II ou falso negativo). É im- portante destacar que o falso negativo não é evidência de “inocência”, o efeito pode não tersido detectado por falta de dados. O predomínio em pesquisas é de situações análogas às des- critas acima, nas quais a preocupação maior é com o erro tipo I. Normalmente a preocupação com erro tipo II restringe-se a tentar controlar variáveis de ruído e de se obter uma amostra rosseiramente considerada como suficiente g sem sequer s II (β) defini a a priori. En to, há situ necessári 1.6). cedimento erentes (se- tribunais, o er) basta das evidên ias é (ou dev ais estatísticvado. Há DecisãoÐ Rejeita H0 Erro tipo I Decisão Correta Aceita H0 Decisão Correta Erro tipo II 12 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas tretanto, omo vimos no exemplo do antropólogo (seção plos: a) Você quer rovar que bromélias absorvem fósforo da água acumulada entre suas folhas (seção 1.5); b) eri e a- tório destinada a consumo humano está conta- minada por mercúrio após uma acusação que alguém contaminou o reserv apresentar o resultad xame de sangue no a conc elat a anterior, ações odem ter de preceder as coletas em problemas u ou não mudou. Digamos que a cusação foi que um galão de certo produto um teste de DNA). Qual é a chance das digitais de uma pessoa suspeita coincidirem com digi- tais de outra pessoa que estavam na arma do crime. Embora isto não seja logicamente impos- sível, é tão improvável que é considerada uma prova suficiente. Esta probabilidade dificilmente pode ser quantificada, entretanto, jamais foram encontradas duas digitais iguais de pessoas diferentes. A pesquisa científica tem a mesma lógica, mas tem algumas vantagens. Na investigação cientí- fica é mais comum encontrarmos situações em que podemos aplicar análises estatísticas, es- pecialmente em experimentos, de forma que podemos calcular a chance da hipótese nula com precisão. Normalmente o valor de α em estudos biológicos é de 0,05 ou 0,01, o que já é um critério razoavelmente rigoroso. En c 1.4), a estatística formal é mais objetiva e ge- ralmente menos conservadora que a estatística intuitiva costuma ser. 1.6 Considerações complementares. a) Entre o sim e o não existe um vão. Neste capítulo passamos a visão de tomada de decisões predominante nas análises estatísticas mais comuns em que temos duas opções: o “sim” e o “não”, como em um tribunal em que uma pessoa é considerada inocente ou culpada. Entretanto, nem sempre as decisões são assim. Podemos decidir em três categorias: o “sim”, o “não” e o “talvez” (indefinido). Podemos ainda decidir em mais categorias: o “sim forte”, o “sim fraco”, o talvez, o “não fraco” e o “não forte”. Para agentes de seguros, estas categorias po- dem até ser tratadas quantitativamente. Quando estamos lidando com duas categorias, “sim” e “não”, na realidade este “não” significa “talvez”. Aceitar a hipótese nula é um resultado de pouco valor na estatística tradicional. Por isto, há a- bordagens alternativas nos contextos em que é importante separar o “talvez” do “não”. Considere os seguintes exem p você quer v ficar se a água d um reserv atório; c) você vai o de um e rqual há um entração ivamente alt de uma substância que indica câncer. Em todos os casos, o princípio que deve nortear a análise é o da prudência, mas a ação diverge entre estes exemplos. No exemplo A, o erro tipo I é considerado o mais grave, porque não queremos afirmar coisas novas na ciência sem termos evidência forte. Podemos ir mais longe neste raciocínio: afirmações extraordinárias exigem provas extraordinárias. Por isto, embora α padrão seja de 0,05, para afirmar algo que contraria uma teoria bem estabelecida com uma idéia ousada, podemos exigir um α mais con- servador (e.g. 0,01 ou 0,001). Devido ao papel central do valor de α nesta abordagem, pode- mos denominá-la “alfacêntrica”. No exemplo b, primeiro, pode ser necessária a ação preventiva de fechar a fonte para o con- sumo. Diferente do exemplo p desta natureza. Agora pense na análise, se você pegar poucas amostras e não obtiver uma diferença significativa, você pode decidir que a água não está contaminada? Não, claro que não. Mas quantas amostras seriam necessá- rias? Lembre que há mercúrio naturalmente na natureza, detectar mercúrio não prova contami- nação. Como saber se o número de amostras é suficiente para comprovar se houve a contami- nação? Note que o erro tipo II aqui é mais gra- ve. Realmente não é possível definir se há con- taminação, a menos que você defina previa- mente quanto de aumento de mercúrio seria evidência de uma contaminação. Só se houver razões teóricas ou práticas para definir estes níveis não usuais que podemos comprovar que algo mudo a tóxico foi jogado e que calculamos que isto du- plicaria a quantidade de mercúrio do lago. Neste caso, podemos calcular o tamanho amostral necessário para detectar esta diferença consi- 13 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas necessário que você compreenda ue em uma situação destas, você precisa ir ocorrem ocasionalmente. ntretanto, se ele estiver efetivamente com a - se rea- mer se stragada pode estar errada se a fome for muita e a toxi- stá em permitir tomar decisões de forma simples e com menor derando um β definido a priori. Se não houver diferença significativa, então decidimos que não há mudança na qualidade de água que indique que houve esta contaminação. Há alternativas para se tratar a questão, como uma técnica chamada amostragem seqüencial ou uma avali- ação temporal dos níveis de mercúrio. Estas abordagens não serão tratadas neste livro, en- tretanto, é q atrás destas técnicas No exemplo c, tanto o erro tipo I como o erro tipo II são graves. O falso positivo, que é um erro tipo I, é grave porque uma pessoa saudável pode ficar extremamente deprimida sem motivo real, ou pode iniciar um tratamento inapropriado prejudicando sua saúde. O valor obtido no exa- me pode não ser tão alto para ser considerado uma prova da existência de um câncer. Por isto, com receio de traumatizar o paciente, você poderia não revelar o resultado, afinal, valores um pouco mais altos E doença, sua conduta equivaleria a dar um falso negativo, que pode adiar o tratamento e com prometer a possibilidade de cura. O que fazer? O procedimento neste caso deve ser de lizar novamente o mesmo teste ou um teste de outra natureza (e.g. uma radiografia). Desta forma, os falsos positivos serão eliminados, mas o poder de detecção de doentes em fase inicial será aumentado. Quando os dois erros são relevantes também deveríamos pensar na gravidade e nos riscos relativos do erro tipo I e tipo II para nossas deci- sões. Se você chega de viagem com muita fo- me, não encontra ninguém em casa e encontra um prato de comida na geladeira sem saber a quanto tempo está lá, você terá que decidir se arrisca comer ou não. A hipótese nula é que as bactérias ainda não tornaram a comida tóxica e a alternativa é que está tóxica. Com base no cheiro você avalia se a comida está estragada. A princípio, as decisões corretas seriam a) co- mer se não estiver tóxica e b) não co estiver tóxica, o erro tipo I teria como conse- qüência uma intoxicação e o erro tipo II teria como conseqüência a fome desnecessária. Entretanto, dependendo do grau da fome, da sensibilidade do seu estômago, da chance de obter outro alimento antes de morrer de fome, do grau de toxidade e dos riscos relacionados com a intoxicação, os custos e os prêmios dos erros tipos I e II mudam. A decisão será influen- ciada pelo balanço destes custos e prêmios. Até a decisão de não comer a comida e dade for baixa. De qualquer forma, quanto mais informação maior a chance de tomar a melhor decisão.É por isto que a natureza nos equipou com olfato, paladar e visão como testes com- plementares na decisão sobre ingerir alimentos. Problemas deste tipo dependem de técnicas de avaliação de riscos. Podemos dizer que na abordagem estatística tradicional alfacêntrica a chance de erro tipo II é tratada como risco irrelevante. Isto é uma sim- plificação da avaliação de riscos, em que tanto o erro tipo I como o erro tipo II são relevantes. O poder da estatística tradicional e quantidade de informação. Sua limitação é que não deveria ser utilizada em casos em que o erro tipo II tem conseqüências importantes. b) Dizer “rejeitou a hipótese nula” é diferente de dizer “provou a hipótese alternativa”? Tradicionalmente, a segunda frase é evitada e chega a ser considerada errada por alguns. Seria mesmo um erro? A hipótese alternativa é complementar à hipótese nula, logo, rejeitar uma implica necessariamente em provar a ou- tra. Então, qual é o problema se “dá na mes- ma”? Vejamos a origem deste mito na forma de expressar resultados estatísticos. Na estatística nas análises estatísticas mais comuns não calculamos diretamente a chance da hipótese alternativa ser verdadeira. O cálculo é feito com base na probabilidade de obtermos um determinado resultado admitindo que a hipó- tese nula fosse verdadeira. Caso esta probabili- dade seja pequena (P<α), rejeitamos a hipótese nula e ficamos com a alternativa, do contrário, aceitamos a hipótese nula. 14 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas acêntri- Ho. Entretanto, se você pode evidências para a existên- cia de uma relação são significativas. Não te- eito e irrelevante de uma variável so- Preferir a frase “rejeitou a hipótese nula” é justi- ficável do ponto de vista didático, pois é o que vem primeiro e reforça a essência da forma como testes estatísticos tradicionais são feitos. Entretanto, considerar errada a frase “provou a hipótese alternativa” é querer passar a didática por cima da lógica e da semântica, o que gera confusão e prejudica a própria didática. c) Existe “mais significativo”? Descrevemos a estatística tradicional alf ca e seu número mágico (mais comum) α=0,05 em que separamos os resultados em dois gru- pos: quando P≥α aceitamos a hipótese nula e quando P≤α rejeitamos Ho. Mas será que P=0,04 é um resultado tão significativo quanto P=0,0004? E o que fazer quando P=0,051? Não há mágica este é apenas um critério para se ter objetividade; o que importa é que ele é definido a priori. Para ser aprovado em um cur- so, temos que tirar nota 5,0. Em um curso mais rigoroso a exigência poderia ser 7,0. Seria com- plicado se a nota de corte fosse definida depois da prova final. Há sim diferença no significado em função da probabilidade obtida, da mesma forma como há diferença entre passar no curso com 5,0 e passar com 9,5. O que fazer se o resultado foi P=0,051? Se você não vai coletar mais dados, então não há alternativa, você tem que seguir a regra do jogo e dizer que aceita coletar mais dados, a situação muda. Você iria terminar uma pesquisa importante aceitando Ho com P=0,051? E como fica a sua confiança com um mero P=0,049? Não conheço nenhuma regra estatística formal para lidar com esta situ- ação, mas me parece mais razoável coletar mais dados se P estiver entre 0,04 e 0,06 do que aplicar a regra a ferro e fogo quando temos esta opção de coletar mais. Seria suspeito cole- tar apenas mais um dado, pois estamos em uma zona nublosa, eu coletaria mais 10 dados para acabar de definir a tendência. d) Significativo é sinônimo de relevante? O uso da estatística cresceu e as revistas cientí- ficas e bancas de avaliação passaram a exigir que testes fossem utilizados para mostrar que tendências tinham relevância estatística. Esta pressão pelo uso da estatística contribuiu para a qualidade da pesquisa, mas também levou a alguns desvios, como a busca pelo resultado significativo independente da questão. Alguns acreditam que o “melhor” teste dentro de um estudo é aquele que foi mais significativo. Um aspecto psicologicamente forte no teste de hipóteses é que ele responde categoricamente (com sim ou não) se mos um critério semelhante para atribuirmos o valor biológico para um teste. É uma questão de bom senso. A relação entre tamanho de qual- quer espécie e seu peso é sempre fortemente significativa, mesmo com poucos dados, de forma que não é nada surpreendente obter-se um P<0,001 para esta relação. Um efeito signi- ficativo obtido apenas com um tamanho amos- tral imenso pode significar variáveis de ruído interferindo muito ou simplesmente um ef biologicament bre outra. O valor calculado de “P” tem relação com a “força” da evidência, não tem relação com a relevância da questão. A definição a priori de quais testes serão reali- zados em um estudo é importante, entre outras coisas, para se definir o valor do teste antes de realizá-lo, para não cair na tentação de escolher como foco do trabalho finalizado os resultados que foram mais significativos, o que é uma de- turpação do uso da estatística. e) Efeitos específicos e efeitos colaterais. Em algumas situações, particularmente no de- senvolvimento de remédios, alimentos ou pro- dutos que possam oferecer riscos ambientais ou à saúde humana, temos de ir além das conside- rações sobre o erro tipo I e tipo II. Imagine uma substância com potencial para diminuir os enjô- os durante a gravidez. Podemos testar estatisti- 15 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas contra indicações. Um remédio chamado Talidomida ntra enjôo na eal, o os riscos ambien- camente se o remédio é efetivo fixando o erro tipo I e até o erro tipo II, definindo um tamanho amostral apropriado com base em coletas pre- liminares. Esta análise permitirá que se defina dentro dos critérios discutidos neste capítulo se o remédio é efetivo ou não para reduzir o enjôo. Entretanto, este teste só avalia o enjôo, não garante que este remédio não tenha foi usado na década de 1960 co gravidez e causou mal formações em muitos bebês. Ignorar efeitos colaterais não é cometer um erro tipo II, é um erro que extrapola o teste. Pelo princípio da prudência temos até que considerar provas circunstanciais, como uma amostragem sem os rigores de um desenho amostral id como uma evidência que a atenção deve ser redobrada. A análise de efeitos colaterais pode ser complexa. Não é possível se obter uma garantia que nenhum efeito colateral vá ocorrer, mas é essencial que se considere qualquer indício de problema e se faça um levantamento exaustivo de todas as possibilidades razoáveis de efeitos colaterais. Novas tecnologias, como a transgenia, já provaram que funcionam, entre- tanto, um acompanhamento é necessário pois ainda não sabemos quais sã tais e para a saúde. Os farmacêuticos têm muito mais trabalho com a análise de cada possível efeito colateral do que da comprovação dos efeitos positivos. É importante não se confundir o poder da estatística em avaliar efeitos especí- ficos com uma garantia sobre aspectos que extrapolam cada teste particular. 16 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas scussão. Em que parte normalmente ncontramos cada forma de validação do estu- dois exemplos de seu cotidiano que não tenham sido apresentados nesta apostila. 1.9- No exemplo do antropólogo: a) houve dife- rença entre os alunos ao utilizar a estatística intuitiva? Por quê?; b) houve muita diferença entre a atitude predominante da sala com esta- tística intuitiva e o esperado com estatística formal? Por quê?1.10-Explique, sem utilizar um exemplo do tex- to, um caso em que o erro tipo II seria mais grave que um erro tipo I. 1.11 O resultado de um teste estatístico foi P=0,0067. Considerando se α= 0,01, conclui-se: a) A probabilidade limite adotada para se aceitar Ho é de 0,01; abaixo disto rejeita-se Ho. b) A coleta de dados foi tendenciosa c) A coleta de dados foi apropriada. d) A chance de erro tipo I seria menor se α= 0,05. e) Aceita-se Ho, desde que a coleta de dados tenha sido apropriada. 1.12- O resultado de um teste estatístico foi P=0,09. Considerando se α= 0,05, conclui- se:(1,5 ponto) a) Há uma probabilidade de 9% de aceitarmos Ho. b) Há uma probabilidade de 9% de rejeitarmos Ho c) Podemos cometer erro tipo II se aceitarmos Ho neste caso. d) A chance de erro tipo I é alta e) O tamanho da amostra foi suficiente 1.13- Na seção 1.6 a, foram dados exemplos para 3 situações diferentes nas quais a impor- tância relativa dos erros tipo I e topo II variaram. Forneça exemplos diferentes para cada um dos três tipos de situação. 1.14- Por que os estatísticos preferem dizer “rejeitou a hipótese nula” a dizer “provou a hipó- tese alternativa”?; A última frase está errada? lguns anos a probabilidade em testes era apresentada de forma pouco precisa (P<0,05), mas hoje ela é apresentada mais frequentemente de forma exata (P=0,041). Ex- plique a vantagem da apresentação com mais precisão. 1.16- Por que na pesquisa científica predomina a abordagem que privilegia a preocupação com o erro tipo I? 1.17- Porque testar efeitos colaterais é mais difícil do que testar efeitos específicos? Exercícios: 1.1- O uso da estatística na pesquisa foi compa- rado com o uso de um carro no cotidiano. Expli- que a semelhança quanto à necessidade; com- preensão de detalhes do funcionamento para ser um usuário; e necessidade de confiança para uma utilização eficiente. 1.2- Um artigo científico divide-se geralmente em Introdução, Materiais e métodos, Resulta- dos, Di e do (Medida, Interna, D->C; Externa). 1.3- Qual é a diferença entre um problema de validação interna e um problema de validação externa? 1.4- Explique um exemplo de pesquisa em que as conclusões são suspeitas devido a incerte- zas na validade das medidas. 1.5- Por que os problemas de validação da me- dida e de validação interna são mais graves do que problemas de validação “dados-> conclu- são” e de validação externa quando se está redigindo um trabalho? 1.6- Qual a diferença entre as estatísticas des- critiva e inferencial? 1.7- O uso da estatística aumentou de forma explosiva nas últimas décadas. Entretanto, isto não significa que toda a descoberta científica tenha base estatística. Explique. 1.8- O que é estatística inferencial intuitiva? Cite 1.15- Há a 17 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas oblema biológico ao s em problemas estatísticos. Neste capítulo, abordaremos a ald Mac- naughton (2002). O que este autor mostrou foi ra se compreender como se “monta” priedades de entidades; predição científica. s de pensa- mentos cotidianos em um dado momento, deria estar pensando em um amigo ou em um compro- s de montanhas, florestas, alcatéias, alunos em uma classe; população; conjunto de elementos em um grupo, espé- cie?*); Objetos imaginários (fadas, universos ro, uma reunião, um beijo; um casamento; uma viagem, ” como iante) tidades têm um papel fundamental no concretos reais (monta- ção, indivíduos, unidades 2. Do pr estatístico. Os livros de estatística vêm com exemplos prontos de análise. Entretanto, uma das maio- res dificuldades dos estudantes é a transforma- ção de problemas biológico forma de construir tabelas conceituais mais apropriada para a aplicação dos testes. Este capítulo se baseia no no texto “The entity- property-relationship approach” de Don que há alguns conceitos tão básicos que pas- sam despercebidos pelas pessoas, e que são chaves pa um problema antes de se iniciar um planeja- mento de coleta de dados e a análise dos da- dos. Macnaughton trabalha cinco conceitos: (1) Enti- dades; (2) Propriedades; (3) O papel da pesqui- sa empírica é predizer e controlar os valores das propriedades das entidades; (4) Relações entre propriedades são chaves para predizer e controlar valores de pro (5) Técnicas estatísticas servem para o estudo das relações entre propriedades de entida- des, como meio para 2.1 Entidades Se você prestar atenção ao seu provavelmente concordará que estamos pen- sando sobre diversos tipos de “coisas”. Por exemplo, neste minuto você po misso que tem marcado para a tarde. Estas “coisas” são exemplos de entidades. Existem muitos tipos de entidades: Objetos físicos reais simples (montanhas, automóveis, lagos, pessoas, árvores, sites da internet, prótons?*) ou coletivos (cadeia paralelos, teorias, conceitos, prótons? espé- cies?*); Processos/ações um experimento, uma reação química, uma peça de teat a força necessária para levantar certo objeto, uma tempestade. (*às vezes é difícil decidir se alguns objetos são reais ou imaginários, como prótons e espécies. O caso de “Espécie entidade será discutido novamente ad As en pensamento. Na gramática são sempre subs- tantivos. Substantivos nhas, prótons) ou irreais (fadas) ou substantivos abstratos de ação (experimento, beijo, viagem), que são qualificáveis (montanha alta; viagem emocionante). Trata-se de um conceito tão bá- sico, que raramente é discutido em metodologia e estatística. Entretanto, como veremos, é útil deixá-lo explícito. As entidades também podem ser chamadas de casos, membros de uma popula itens, espécimens, objetos, coisas, amostrais, blocos, etc. Figura 2-1- Entidades são "coisas" em que pensamos, como árvores, beijos e Unidades Amostrais, às quais podemos atribuir propriedades 18 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas ada tipo de entidade tem associado a ele uma demos té não saber o valor, mas ele existe). ) ou com advérbios interrogativos Quan- ?, Como? Quando? Onde? e Por quê? Os e- adora, isto jetivo. Por exemplo, as ropriedades origem, local de formação e não ariam por serem fixas com um único valor es- belecido a priori entram na descrição dos 2.2 Propriedades C gama de atributos ou propriedades. Carros têm peso, cor e ano de fabricação. Árvores têm altura, nome de espécie, posição em um mapa. Bandos de passarinhos têm um nome da espé- cie, um número de indivíduos, uma razão sexu- al. Cada entidade tem um valor para cada pro- priedade (não existe carro sem peso, po a Propriedades também são chamadas de aspec- tos, atributos, características, fatores, qualida- des. Os nomes das propriedades na gramática, são normalmente substantivos abstratos qualifi- cadores (localização, cor, beleza, idade, veloci- dade, quantidade, valor de pH) que substituem perguntas com pronomes (qual a cor? etc; quem? to valores das propriedades são adjetivos (verme- lho, velho, rápido, grande, brasileiro, estudioso), advérbios (aqui, agora, longe, mal, sim, não, talvez, muito, pouco), numerais (números com funções quantitativas, ordinais ou de rótulo- planta no 135 e datas) e às vezes símbolos como ♂,☺, ♠ ou O+, e até substantivos. Quando os valores são substantivos, g ralmente eles têm função qualific é, tem papel de ad p espécie para a entidade pessoa tem os valores Brasil, USP e Homo sapiens que substituem os adjetivos brasileiro, “Uspia- no” e humano. Perceba que as palavras “brasileiro” e humano são substantivos nas frases “o brasileiro chegou sem documen- tos” e “os humanosnão conviveram com os dinossauros”, mas são adjetivos nas frases “ele é brasileiro” e “foram encontra- dos vestígios humanos numa caverna”. Apesar desta fonte de confusão, normal- mente fica claro no contexto se a palavra denota uma entidade ou uma propriedade (qualidade). “Espécie” normalmente é pro- priedade da entidade organismo nos estu- dos de ecologia ou fisiologia, mas pode ser entidade em um estudo sobre filogenia. Há propriedades de entidades que não variam em um estudo, como a espécie de árvores e o estágio do desenvolvimento dessas árvores em um estudo restrito a plantas adultas desta espé- cie. Outras, como o tipo de solo e a altura vari- am entre indivíduos. As propriedades que v ta métodos do estudo, mas não entram na análise. As propriedades que variam são as que entram na análise, sendo chamadas de propriedades variáveis ou simplesmente “variáveis”. Portan- to, o termo variável é um sinônimo do termo propriedade, mas implica mais fortemente um contexto de análise da variação de valores de propriedades relacionado com a variação em valores de outras propriedades. Figura 2-2- Propriedades são atributos das entidades. 19 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas icos EPR s tabelas ou planilhas EPR são as tabelas com eitual que su- ão re- resentadas, cada uma delas, por um ponto ores rola infecções, odemos predizer que ela baixa a febre e se ntirá melhor se tomar a sub tância y. Isto parece banal, mas esta ação aparentemente banal de estabelecer relações é um dos pila- res que sustenta a ciência. A explicação e com- preensão é outro objetivo da ciência, mas se pensarmos bem, elas estão intimamente ligadas ao estabelecimento de relações. Há dois tipos de relação, a relação conseqüen- te e a relação inconseqüente. Na figura 2.5, cada letra indica uma propriedade e as setas indicam relações. As relações “R” são conse- qüentes, pois são o resultado de seqüencias causais. A propriedade (A) está seqüencialmen- te relacionada com todas as outras. As relações “r” são inconseqüentes, porque não são se- qüencialmente causais, mas induzidas. A rela- ção r1 existe entre (C) e (E) porque tanto (C) como (E) são influenciados por (B). À medida que muda o valor de (B), tanto (C) como (E) mudam, por isto elas covariam, mesmo sem uma relação causal entre (C) e (E). Por exem- plo, a temperatura do dia (B) influi sobre o grau do derretimento do asfalto da rua (C) e sobre o número de crianças com insolação em hospitais (E). Por causa disto, quanto mais derretido esti- o número de crianças com insolação em hospitais (E). Natu- 2.3 Tabelas e gráf A nossos dados organizados em entidades (li- nhas), propriedades (colunas) e valores (células da tabela). Em uma tabela EPR cada entidade aparece apenas uma vez e as propriedades são variáveis que serão relacionadas ou que participarão da análise de outra forma. A tabela EPR é mais que um local para depositar os dados, ela é uma tabela con- c mariza o plane- jamento do nos- so projeto, de forma que deve ser planejada preferencialmen- te antes da cole- ta de dados, tendo em vista as relações que queremos veri- ficar. Os gráficos EPR são gráficos cartesianos cujos eixos são propriedades e as entidades s Tamanho Sexo 12 m 10 m 11 f 11 f p situado no gráfico em função dos seus val das proprieda- des (e.g. dia- grama de dis- persão e “dot density”). São gráficos mais ricos em infor- mação que mui- tos gráficos tra- dicionais utiliza- dos na apresen- tação de resul- tados. 2.4 Relações O papel da pesquisa empírica é predizer e con- trolar valores de propriedades. Neste lago pega- remos bastante peixe? Este paciente será cura- do? A plantação produzirá mais com este adu- bo? Neste local encontraremos cobras veneno- sas? Se não sabemos as respostas (pois não temos uma máquina de viajar no tempo ou um oráculo) e não podemos esperar o futuro para tomar decisões, o que fazer? Se conseguirmos identificar relações entre vari- áveis, podemos fazer previsões. Se soubermos que lagos de água brancos sempre têm muito peixe, e que este lago x tem água branca, então podemos prever que haverá muito peixe nele (previsão). Se soubermos que pessoas que têm temperatura alta geralmente estão com infec- ões, e que o substância y contç p rá se s Figura 2-3- Nas tabelas EPR, as linhas são entidades e as colunas são propriedades. Ta m an ho Machos Fêmeas Janeiro ( ) Julho ( ) Figura 2-4- Nos gráficos EPR variáveis (propriedades) são eixos dos gráficos e as entida são os pontos. Variáveis adicio , as os des nais podem ser apresentadas na de cores ou simbolos. forma ver o asfalto na rua (C), maior será 20 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas asfalto qu a as crianças a terem insolação. estes dados, mas espera- porque tanto a previsão tidos são influenciados pelo rico anterior à previsão. as relações conseqüentes entes estão associadas com item previsões e fazem parte tífica. Entretanto, é importante e isto nem sempre é muito - , undâncias de oindicadores ambientais de r a poluição), então não há roblema. Entretanto, quando achamos que há ausalidade direta entre duas variáveis envolvi- a para estabelecer rela- ções. blemas do cotidi- no em testes estatísticos e dá mais sentido ao fragmentação z o usuário perder a noção que os testes dis- ralmente, não é o derretimento do v e 2. le Se estudarmos o efeito de um fertilizante sobre o crescimento de uma planta adicionando fertili- zante no tratamento comparado a um controle sem fertilizante, estamos lidando com uma rela- ção causal ou conseqüente. Se estivermos veri- ficando a relação entre as previsões climáticas de chuva de um instituto meteorológico e os dados climáticos não temos uma relação causal conseqüente entre mos ter uma relação quanto os dados ob contexto atmosfé Como vemos, tanto como as inconseqü causalidade, perm da pesquisa cien distinguir entre elas, simples. Quando e tamos lidando com como em compara diferentes tipos de bi poluição (sem medi stamos conscientes que es uma relação inconseqüente ções entre ab p c das em uma relação inconseqüente, então te- mos uma “relação inconseqüente espúria”. Ve- remos este assunto novamente no capítulo 5. 5 A estatístic A função da estatística inferencial é nos ajudar a decidir sobre a existência de uma relação a partir de dados medidos e coletados de forma apropriada. A estatística é uma ferramenta po- derosa para detectar relações. O conceito que a estatística serve para ajudar no estabelecimento de relações contribui para o estudante compre- ender como se transforma pro a que é um teste. A abordagem EPR é mais do que uma técnica para ajudar a transformar problemas biológicos em problemas estatísticos. O conceito da esta- tística como ferramenta para estabelecer rela- ções é integrador. Os livros tradicionais de esta- tística tratam cada tipo de teste em capítulos ou seções diferentes e isto passa uma idéia que cada teste é algo distinto com uma lógica parti- cular. As diferenças nos algoritmos matemáticos justificam uma separação em capítulos em cur- sos direcionados à formação de estatísticos. Entretanto, em cursos voltados para usuários é mais importante tratar os testes de forma unifi- cada (ver apostila de testes). A fa poníveis são complementares e têm a mesma finalidade básica: calculam uma probabilidade associada a uma relação. Nos exercícios abaixo vamos treinar a monta- gem de tabelas EPR a partir de problemas bio- lógicos.É importante se perceber que não há uma única resposta correta para cada um des- tes exercícios, pois uma pergunta pode ser avaliadas de formas diferentes (planilhas EPR diferentes). Outra coisa a se perceber é que existem imagens de entidades equivalentes em alguns casos. Imagens de entidade equivalen- tes são aquelas que podem ser trocadas sem comprometer a interpretação da relação. Por exemplo, “tartaruga nº 4”, “ninho nº 4”, “conjunto de ovos nº 4” ou “registro nº 4” no segundo e- xemplo são imagens que representam de forma diferente uma mesma coisa cujas propriedades serão relacionadas. Figura 2-5- As relações entre propriedades podem ser Conseqüentes (R linhas diretas de ca (r1 a r4), qua direta. 1 a R5), quando pertencem à usalidades, ou Inconseqüentes o há uma relação de causalidadendo nã 21 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas ropriedades is os mes das entidades e as propriedades em seus carros costumam realizar maior número de contraversões em ambiente urbano. • A taxa de decomposição da serrapilhei- ra varia em função do ambiente (Cam- pinarana, Baixio e Platô) na Amazônia Central? • A temperatura na sala de aula influi so- bre o desempenho de estudantes em provas? la- de • Há dimorfismo sexual de tamanho nas borboletas Capronnieria abretia? • Bromélias absorvem Fósforo da água acumulada entre as suas folhas? do que de gafanhotos marrons na a na caatinga? ) Qual é a diferença entre relações conseqüen- Nos primeiros 6 exercícios as p estão explícitas no enunciado. Nos problemas seguintes é necessário se pensar em que pro- priedades poderíamos medir para responder o problema. Por exemplo, no caso de dimorfismo sexual, temos que lembrar que dimorfismo em tamanho significa machos maiores que fêmeas, logo, as propriedades são sexo e tamanho. . Exercícios: 1) Na lista a seguir há perguntas relacionadas a pares de propriedades, responda: a) Qua no consideração; b) Monte uma tabela EPR e um gráfico para ilustrar como esta relação pode ser; c) classifique as relações em conseqüentes ou inconsequentes; d) Pense em problemas de validação de medida, de validação interna e de validação externa que poderiam ocorrer em cada caso. • O comprimento da carapaça de indiví- duos da espécie de tartarugas Podoc- nemis expansa influi na taxa reproduti- va? • A temperatura afeta a razão sexual em ninhos artificiais de P. expansa ? • Motoristas que utilizam isofilme em • A sobrevivência de gafanhotos verdes é maior época chuvos • Cigarro causa câncer? • Passar por baixo da escada dá azar? • Olho gordo seca pimenteira? 2). Construa 3 tabelas EPR com exemplos de relações em seu campo de pesquisa e analise estas tabelas da mesma forma que fez no exer- cício anterior. 3 tes e inconseqüentes? Dê um exemplo e utilize esquemas para mostrar cada situação. • O pH de um locais com água acumu da de chuva afeta a sobrevivência mosquitos? 22 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas 3. Conceitos para a escolha níveis, pois a precisão da medida i de 1mm, o máximo foi 22 e o mínimo foi 4. eis quantitativas o núme- Pode haver níveis quantita- tivos sem valor entre o mínimo e o máximo. É ui um não é de 0,05. nte repre- elas cujos valo- i- xplicativas o a iá das pela letra “X”). Os termos “dependente” e o de dependência, o teste e a será tratado no capítulo 5, mas vamos utilizar os termos “dependente” e “independente” entre aspas quando não houver segurança se a rela- ção em estudo é causal. Outro tipo de variável envolvida nos estudos de relações são as Variáveis de Medidas Repeti- das (VMR), que existem em estudos com enti- dades pareadas ou em blocos. Nestes estudos temos variáveis dependentes e independentes implícitas, mas as relações são estabelecidas a partir de diferenças entre os valores medidos para um mesmo indivíduo ou objeto. Esta situa- ção será explicada na seção 4.2. 3.2 Escalas de medidas. Em função dos valores que uma variável pode assumir, elas podem ser divididas em: Binárias: São um caso especial de variável categórica com apenas duas categorias. Por exemplo: “sim” ou “não”; presença ou ausência; macho ou fêmea; estação seca ou chuvosa em 2007. Variáveis quantitativas (e.g. a quantidade uma substância), que assumem apenas dois valores em uma analise (e.g. 1 mg ou 2 mg) binárias e quantitativas ao mesmo tempo. Categóricas: Assumem valores qualitativos sem uma ordem ou relação hierárquica com sentido relevante para a análise. Por exemplo: e uso de testes e gráficos Neste capítulo, abordaremos os conceitos que são a base para entender todos os testes do curso em conjunto e para entender suas dife- renças em premissas e aplicações. 1 Níveis de medida e tipos de variá-3. veis. Medir é atribuir valor para uma propriedade de uma entidade. Os “níveis de medida” são os diferentes valores obtidos para uma variável dentro de uma base de dados particular ou em um estudo. Por exemplo, a variável “cor” das canetas da minha mesa no momento em que estou escrevendo tem três níveis de medida: “azul”, “preta” e “vermelha”. Na figura abaixo, a variável mês tem 6 níveis e a variável tamanho da aranha 19 fo Em variáveis categóricas basta contar as cate- gorias (efetivamente medidas, não todas as possíveis) e em variáv ro de níveis (NN) é calculado com esta fórmula simples: NN=(max-min+1)/precisão. No exem- plo NN= (22-4+1)/1. importante tomar cuidado com a verdadeira precisão. Se algumas vezes você atrib valor 4,95, mas ocasionalmente arredonda para 4,9 ou 5,0, então sua precisão é de 0,1, As Variáveis Dependentes (ou variáveis res- posta, variáveis “de saída”, geralme sentadas pela letra "Y") são aqu res hipoteticamente variam em resposta a Var áveis Independentes (ou variáveis e u v r eis “de entrada”, geralmente represen-v ta “independente” são apenas rótulos, não signifi- cam que já estejamos admitindo que uma influa sobre a outra, por isto utilizamos o termo “hipo- teticamente” acima. Há duas coisas que defini- o esta relaçãrã forma de coletar os dados. O teste deve ser significativo (P<α) e a coleta deve ser feita de forma a garantir que a relação encontrada foi causal. O problema da coleta e da causalidade Phoneutria reidyi Ago Out Jan Abr Ago 0 5 10 15 20 25 Ta m nh d a ha (m m ) o ar an Jun Meses 1998/9 Figura 3-1- Tamanhos de aranhas coletados em 6 ex-cursões. Há 6 níveis na variável independente e 19 níveis na variável dependente. 23 Bioestatística Aplicada 2011/1 © Thierry R. Gasnier/ Universidade Federal do Amazonas s matemáti- ertencem a outras escalas de medida, mas s de dependência - coleta; conjunto de coletas por uma pessoa; conjunto de coletas por várias pessoas). Esta relação pode ser considerada irrelevante (como a distribuição espacial e tem- poral de experimentos com ratos em biotérios climatizados), mas se for relevante, esta infor- mação deve ser considerada na análise. Há técnicas (Anova hierárquica; regressão filogené- tica) utilizadas para lidar com esta situação, mas não serão abordadas neste texto. a icas específicas (Zar, orrida chegou mais próximo do primeiro ou do de cavalos, a ordem e chegada é um nível ranqueado (1º, 2º , 3º o stada, mesmo ue elas ordenem de forma semelhante. Tanto nto como nos íveis aleatórios, a análise, quando possível, de erro eria concluir com base em uma pesquisa de ções e adição podem ser feitas (e.g. o valor
Compartilhar