Prévia do material em texto
https://www.passeidireto.com/perfil/maxilostudy COMO AVALIAR CRITICAMENTE ARTIGOS CIENTÍFICOS Tradução do artigo: Young, J.M.; Solomon, M.J. How to critically appraise an article. Nature Clinical Practice Gastroenterology & Hepatology. v.6, n. 2, p. 82-91, 2009. Resumo: Avaliação crítica é um processo sistemático usado para identificar os pontos fortes e fracos de um artigo de pesquisa, a fim de avaliar a utilidade e validade dos resultados da pesquisa. Os componentes mais importantes de uma avaliação crítica são uma avaliação da adequação do desenho do estudo para a questão de pesquisa e uma avaliação cuidadosa das principais características metodológicas. Outros fatores que também devem ser considerados incluem a adequação dos métodos estatísticos utilizados e sua interpretação subsequente, potenciais conflitos de interesse e a relevância da pesquisa para a própria prática. Esta revisão apresenta um guia de 10 etapas para avaliação crítica que visa auxiliar os clínicos a identificar os estudos de alta qualidade mais relevantes disponíveis para orientar sua prática clínica. Palavras-chave: viés, conflito de interesses, avaliação crítica, desenho do estudo. Introdução Para praticar a medicina baseada em evidências, os clínicos precisam aplicar os achados da pesquisa científica às circunstâncias de pacientes individuais como parte de seu processo de tomada de decisão clínica. Os clínicos, portanto, devem ser capazes de selecionar e avaliar a literatura científica que seja relevante para seu campo, compreender as implicações dos resultados da pesquisa para pacientes de formas individuais, elicitar as preferências dos pacientes e desenvolver um plano de manejo apropriado com base na combinação dessas informações. Cada uma dessas tarefas apresenta seus próprios desafios, mas o grande volume da literatura médica significa que o primeiro passo (o de selecionar e avaliar as evidências científicas) pode ser assustador. O número de novos artigos de pesquisa médica publicados a cada ano aumenta continuamente, e mais de 12.000 novos artigos, incluindo artigos sobre mais de 300 ensaios clínicos randomizados (ECRs), são adicionados ao banco de dados MEDLINE a cada semana. Uma maneira prática que os clínicos podem gerenciar essa 'sobrecarga de informação' é desenvolver habilidades eficientes em avaliação crítica, o que lhes permite enfocar apenas os estudos da mais alta qualidade que guiarão sua prática clínica e generalizar informações, quando necessário, a partir de estudos de desenho menos rigoroso, se estudos de alta qualidade não estiverem disponíveis. A avaliação crítica foi definida como a aplicação de regras de evidência a um estudo para avaliar a validade dos dados, a abrangência dos relatórios, métodos e procedimentos, conclusões, conformidade com padrões éticos, etc. As regras de evidência variam de acordo com as circunstâncias. Embora os critérios metodológicos pelos quais a validade de um estudo é avaliada variem de acordo com o seu desenho, alguns princípios gerais sustentam a avaliação de qualquer estudo de pesquisa. Várias diretrizes e ferramentas de avaliação foram desenvolvidas para fornecer uma abordagem estruturada ao processo de avaliação crítica para clínicos. Apesar da multiplicidade de documentos disponíveis para orientar o processo, não existe um instrumento "padrão-ouro" para avaliação crítica. Os critérios utilizados para avaliar a validade e relevância da literatura científica não são estáticos; eles devem evoluir com melhorias na compreensão das importantes fontes de parcialidade inerentes aos diferentes desenhos de estudo e maior conscientização da influência potencial de outros fatores não-metodológicos, como conflitos de interesse. Uma abordagem estruturada para avaliação crítica poderia melhorar a qualidade desse processo, e listas de verificação simples podem ser úteis para filtrar pesquisas que são de baixa qualidade ou de pouca relevância. Essa revisão apresenta um guia para o processo de avaliação crítica. SELEÇÃO E AVALIAÇÃO CRÍTICA DA LITERATURA DE PESQUISA Dez perguntas-chave (Quadro 1) podem ser usadas para avaliar a validade e relevância de um artigo de pesquisa. Essas perguntas podem ajudar os clínicos a identificar os estudos mais relevantes e de alta qualidade que estão disponíveis para orientar sua prática clínica. QUADRO 1: Dez perguntas a serem feitas ao avaliar criticamente um artigo de pesquisa: 1. A questão do estudo é relevante? 2. O estudo adiciona algo novo? 3. Que tipo de pergunta de pesquisa está sendo feita? 4. O desenho do estudo foi apropriado para a questão de pesquisa? 5. Os métodos do estudo abordaram as principais fontes potenciais de viés? 6. O estudo foi realizado de acordo com o protocolo original? 7. O estudo testa uma hipótese declarada? 8. As análises estatísticas foram realizadas corretamente? 9. Os dados justificam as conclusões? 10. Existem conflitos de interesse? A pergunta de pesquisa do estudo é relevante? Mesmo que um estudo tenha o mais alto rigor metodológico, é de pouco valor, a menos que aborde um tópico importante e acrescente ao que já se sabe sobre esse assunto. A avaliação se a questão da pesquisa é relevante é inevitavelmente baseada na opinião subjetiva, pois o que pode ser crucial para alguns será irrelevante para os outros. No entanto, a primeira pergunta a ser feita a qualquer artigo de pesquisa é se o tópico é relevante para o campo de trabalho da pessoa. O estudo adiciona algo novo? O esforço de pesquisa científica é muitas vezes comparado a "ficar de pé sobre os ombros dos gigantes", porque novas idéias e conhecimentos são desenvolvidos com base em trabalhos anteriores. Trabalhos de pesquisa seminais que fazem uma nova contribuição substantiva para o conhecimento são uma raridade relativa, mas pesquisas que fazem um avanço incremental também podem ser valiosas. Por exemplo, um estudo pode aumentar a confiança na validade de pesquisas anteriores, replicando seus achados, ou pode aumentar a capacidade de generalizar um estudo, estendendo os resultados da pesquisa original para uma nova população de pacientes ou contexto clínico. Que tipo de pergunta de pesquisa o estudo representa? A tarefa mais fundamental da avaliação crítica é identificar a questão de pesquisa específica que um artigo aborda, pois, esse processo determinará o desenho ideal do estudo e terá uma importância maior na importância e relevância dos resultados. Uma questão de pesquisa bem desenvolvida geralmente identifica três componentes: o grupo ou a população de pacientes, o parâmetro estudado (por exemplo, uma terapia ou intervenção clínica) e os desfechos de interesse. Em geral, as questões de pesquisa clínica se enquadram em duas categorias distintas, abaixo. Perguntas sobre a eficácia do tratamento Esses tipos de perguntas se referem a se um tratamento é melhor que outro em termos de eficácia clínica (benefício e dano) ou custo-efetividade. Perguntas sobre a frequência de eventos Tais questões referem-se à incidência ou prevalência de doença ou outros fenômenos clínicos, fatores de risco, diagnóstico, prognóstico ou predição de desfechos clínicos específicos e investigações sobre a qualidade da atenção à saúde. O desenho do estudo foi apropriado para a questão de pesquisa? Estudos que respondem a questões sobre eficácia têm uma hierarquia bem estabelecida de desenhos de estudo baseada no grau em que o design protege contra o viés. Meta-análises de ECR bem conduzidos e ECRs individuais fornecem as evidências mais robustas seguidas por ensaios controlados não randomizados, estudos de coorte, estudos de caso-controle e outros desenhos de estudos observacionais. No entanto, em algumas circunstâncias, os ECRs não são viáveis ou considerados eticamente inadequados. Essas questões são mais comuns em ensaios não-farmacêuticos, como os de procedimentos cirúrgicos. Uma revisão da pesquisa cirúrgica gastrointestinal descobriu que apenas 40% das questões de pesquisa poderiam ter sido respondidas por um ECR, mesmoquando o financiamento não era um impedimento. Preferências dos pacientes, a raridade de algumas condições e a ausência de equilíbrio entre os cirurgiões mostraram-se como os principais obstáculos para a realização de ECRs de cirurgia gastrointestinal neste cenário. Quando um ECR não é viável, os motivos específicos que impedem seu uso determinarão o tipo de projeto de estudo alternativo que pode ser usado. Estudos observacionais, em vez de ECRs, são o desenho de estudo mais apropriado para questões de pesquisa sobre a frequência de eventos. Os métodos do estudo abordaram as principais fontes potenciais de viés? Em termos epidemiológicos, a presença de viés não implica em um preconceito por parte do pesquisador, mas significa que os resultados de um estudo se desviaram da verdade. O viés pode ser atribuído ao acaso (por exemplo, um erro aleatório) ou aos métodos do estudo (viés sistemático). Erro aleatório não influencia os resultados em nenhuma direção específica, mas afetará a precisão do estudo; Por outro lado, o viés sistemático tem uma direção e resulta na superestimação ou subestimação da "verdade". Os vieses sistemáticos surgem da maneira como o estudo é conduzido, seja como os participantes do estudo foram selecionados, ou como os dados foram coletados: por meio da análise dos pesquisadores ou interpretação. Diferentes desenhos de estudo são propensos a diferentes fontes de viés sistemático. Uma vez que o desenho do estudo de um determinado artigo tenha sido identificado, recomendamos que os clínicos utilizem uma das listas de verificação de avaliação crítica específicas do projeto disponíveis para decidir se o estudo em questão é de alta qualidade. O Critical Appraisal Skills Program (CASP) inclui essas ferramentas e os coordenadores do programa desenvolveram listas de verificação separadas para a avaliação de revisões sistemáticas, ECRs, estudos de coorte, estudos de caso-controle, estudos de teste diagnóstico, avaliações econômicas e pesquisa qualitativa, cada um contendo 10 questões. Eles foram desenvolvidos a partir dos guias dos usuários para a série de artigos de literatura médica publicados originalmente no Journal of American Medical Association. Estes artigos estão agora disponíveis em forma de livro e são facilmente acessíveis na internet. REVISÕES SISTEMÁTICAS E METANÁLISES Um protocolo padronizado e meticuloso é usado em uma revisão sistemática para identificar, avaliar criticamente e sintetizar todos os estudos relevantes sobre um tópico em particular. Algumas revisões sistemáticas podem então proceder a uma meta-análise, na qual os resultados de estudos individuais são combinados estatisticamente para produzir um único resultado agrupado. Embora o planejamento para realizar uma revisão sistemática ou uma meta-análise prospectiva seja possível, a maioria desses tipos de artigos é retrospectiva e existe um risco de viés, que surge da seleção de estudos e da qualidade dessas fontes primárias. O viés de publicação, que resulta da publicação seletiva de estudos com resultados positivos, é particularmente preocupante, uma vez que distorce as percepções gerais dos resultados em um tópico específico. A declaração QUORUM (Qualidade de Relatórios de Meta-Análises) fornece uma estrutura abrangente para avaliações da qualidade do relatório em metanálises e revisões sistemáticas. Além disso, a ferramenta de avaliação AMSTAR29, que compreende 11 perguntas, foi desenvolvida para a avaliação de revisões sistemáticas, e essa ferramenta ou a lista de verificação CASP9 pode ser mais útil do que a declaração QUORUM para clínicos que desejam realizar uma avaliação rápida desses tipos de artigos. Os principais pontos metodológicos a serem considerados na avaliação de revisões sistemáticas e metanálises estão listados no Quadro 2. Revisões sistemáticas e metanálises não se restringem apenas aos ECRs. As diretrizes de MOOSE (Meta-Análise de Estudos Observacionais em Epidemiologia) foram desenvolvidas como um corolário da declaração QUORUM para meta-análises de não-ECRs. QUADRO 2: Principais pontos metodológicos a serem considerados na avaliação de revisões sistemáticas e meta-análises: · Todos os estudos relevantes foram incluídos (ou seja, a pesquisa foi abrangente, excluiu artigos com base no status ou na linguagem da publicação e o potencial de viés de publicação foi avaliado)? · Foram selecionados artigos avaliados e dados extraídos por dois revisores independentes? · Foram fornecidos detalhes suficientes sobre os estudos primários, incluindo descrições dos pacientes, intervenções e resultados? · A qualidade dos estudos primários foi avaliada? · Os pesquisadores avaliaram a adequação da combinação de resultados para calcular uma medida resumida? ENSAIOS CONTROLADOS RANDOMIZADOS Em um ECR, a alocação aleatória dos participantes deve garantir que os grupos de tratamento sejam equivalentes em termos de fatores de confusão conhecidos e desconhecidos; quaisquer diferenças nos resultados entre os grupos podem, portanto, ser atribuídas ao efeito do tratamento. O desenho do estudo, por si só, não protege contra o preconceito se os aspectos cruciais do protocolo do estudo forem sub-ótimos. O potencial de inscrição seletiva de pacientes no estudo pode ser uma fonte importante de viés se o grupo ao qual os indivíduos serão alocados for conhecido ou puder ser adivinhado. Métodos centralizados de randomização, por exemplo, uma alocação gerada por computador, são preferíveis a métodos menos ocultos, como o uso de formas codificadas por cores ou seqüências pseudo-aleatórias com base em números de registros médicos ou dias da semana. A falha em ocultar a sequência de alocação mostrou resultar em uma distorção maior dos resultados do que a falta de "duplo-cego" - outra importante fonte de viés nos ECRs. O fluxograma da declaração CONSORT (Normas Consolidadas de Ensaios de Relatórios) é funcionalmente equivalente ao QUORUM de declaração para revisões sistemáticas, e fornece uma ferramenta abrangente com a qual avalia o padrão de relato em ensaios randomizados. Pontos-chave a serem considerados na avaliação de um ECR estão listados no Quadro 3. QUADRO 3: Principais pontos metodológicos a serem considerados na avaliação de ensaios clínicos randomizados. · O processo de alocação de tratamento foi realmente aleatório? · Os participantes teriam sido capazes de saber ou adivinhar sua alocação de tratamento? · Os participantes e pesquisadores foram "cegados" para o grupo de tratamento dos participantes? · Os resultados foram avaliados objetivamente? · Todos os participantes que receberam aleatoriamente um tratamento foram considerados na análise final? · Os dados de todos os participantes foram analisados no grupo para o qual foram alocados aleatoriamente? ESTUDOS DE COORTE Estudos de coorte ou longitudinais envolvem o acompanhamento de dois ou mais grupos de pacientes para observar quem desenvolve o resultado de interesse. Estudos prospectivos de coorte foram comparados a experimentos naturais, já que os resultados são medidos em grandes grupos de indivíduos por longos períodos de tempo no mundo real. Estudos de coorte também podem ser realizados retrospectivamente; tais estudos geralmente envolvem a identificação de um grupo de pacientes e o acompanhamento de seu progresso, examinando registros que foram coletados rotineiramente ou para outra finalidade, como dados médicos, registros de óbitos e bancos de dados de internações hospitalares. A principal preocupação metodológica com estudos de coorte é o seu alto potencial para viés de seleção e fatores de confusão. Esses problemas são particularmente relevantes quando estudos de coorte (ou não-ECRs) são usados para avaliar intervenções terapêuticas. Nessa situação, o tratamento que alguém recebe é determinado pelas preferências do paciente ou do clínico, pelos padrões de referência, pelos paradigmas atuais de tratamento ou pela política local. É provável que existam diferenças importantes entre pacientes que recebemtratamentos díspares e essas diferenças, em vez do tratamento em si, podem ser responsáveis pelos resultados observados. Embora alguns potenciais fatores de confusão possam ser medidos e considerados na análise, tais ajustes são mais difíceis em retrospectiva do que estudos prospectivos, uma vez que os dados sobre importantes fatores de confusão potenciais podem não ter sido coletados, ou podem ser de baixa qualidade. A declaração STROBE (Reforçar o Relatório de Estudos Observacionais em Epidemiologia) é o corolário das declarações QUORUM e CONSORT para estudos observacionais, incluindo estudos de coorte, caso-controle e estudos transversais. As principais características metodológicas a serem consideradas na avaliação de estudos de coorte estão listadas no Quadro 4. QUADRO 4: Principais pontos metodológicos a serem considerados a avaliação de um estudo de coorte: · O estudo é prospectivo ou retrospectivo? · A coorte é representante de um grupo ou população definida? · Todos os importantes fatores de confusão foram identificados? · Todas as exposições e/ou tratamentos importantes, potenciais fatores de confusão e resultados foram medidos com precisão e objetividade em todos os membros da coorte? · Houve perdas importantes no acompanhamento? · Os participantes foram acompanhados por um período de tempo suficiente? ESTUDOS DE CASO-CONTROLE Os estudos de caso-controle são sempre retrospectivos por sua própria natureza - os pacientes selecionados são selecionados porque já desenvolveram o desfecho de interesse (por exemplo, uma doença). Os dados são então coletados sobre os fatores que podem ter influenciado esse resultado, e essas exposições são comparadas com as de um grupo de pessoas que diferem dos pacientes apenas por não terem desenvolvido o desfecho de interesse. Estudos de caso-controle são ideais para a investigação de fatores de risco quando o resultado do interesse é raro, pois levaria muito tempo para recrutar uma coorte prospectiva. As principais dificuldades metodológicas dos estudos de caso-controle são a seleção de indivíduos de controle apropriados e a possibilidade de "viés de memória" (a interpretação subjetiva do paciente sobre o que causou sua condição pode alterar a recordação de certos eventos ou experiências). Os controles devem ser retirados exatamente da mesma população que os casos, e a única diferença entre os controles e os casos deve ser que os controles não desenvolveram a condição de interesse. Embora medidas objetivas de possíveis fatores causais sejam preferíveis, os estudos de caso-controle geralmente dependem do retorno dos participantes, e os pacientes podem ter mais probabilidade de lembrar certos eventos ou experiências do que os controles. Os principais aspectos a serem considerados na avaliação de um estudo caso-controle estão listados no Quadro 5. QUADRO 5: Principais pontos metodológicos a serem considerados na avaliação de um estudo de caso-controle: · Os casos foram claramente definidos? · Os casos foram representativos de uma população definida? · Como os controles foram selecionados e foram retirados da mesma população que os casos? · Foram as medidas de estudo idênticas para casos e controles? · As medições do estudo foram objetivas ou subjetivas e o viés de recordação é provável se elas fossem subjetivas? ESTUDOS TRANSVERSAIS Estudos transversais fornecem um "instantâneo" no qual todos os parâmetros (exposições e resultados) são avaliados ao mesmo tempo; exemplos de projetos transversais incluem pesquisas pontuais e auditorias da prática. Os principais pontos metodológicos a serem considerados na avaliação de um estudo transversal estão listados no Quadro 6. QUADRO 6: Principais pontos metodológicos a serem considerados na avaliação de um estudo transversal: · A amostra do estudo foi claramente definida? · Foi obtida uma amostra representativa (por exemplo, a taxa de resposta foi suficientemente alta)? · Todas as exposições relevantes, potenciais fatores de confusão e resultados medidos com precisão? · Os pacientes com uma ampla faixa de gravidade da doença foram avaliados? SÉRIE DE CASOS Séries de casos fornecem evidências de baixo nível sobre eficácia terapêutica; no entanto, esses artigos são muito comuns na literatura médica. As principais questões metodológicas a serem consideradas na avaliação desses artigos estão listadas no Quadro 7. QUADRO 7: Principais pontos metodológicos a serem considerados na avaliação de um estudo de caso: · Os casos foram identificados prospectiva ou retrospectivamente? · Os casos são uma amostra representativa (por exemplo, uma série consecutiva de indivíduos recrutados em vários centros) e semelhantes aos pacientes em sua clínica? · Todas as exposições relevantes, potenciais fatores de confusão e resultados medidos com precisão? Estudos que avaliam a precisão dos testes diagnósticos Estes estudos são geralmente transversais no projeto, mas possuem um número de questões metodológicas específicas que devem ser consideradas além daquelas mencionadas acima. Para investigar a precisão de um teste de diagnóstico, ele é realizado em uma amostra de pacientes e os resultados são comparados com os de um teste de diagnóstico padrão de referência ou ouro. O nível de concordância entre o teste investigado e o teste de diagnóstico padrão-ouro pode então ser relatado em termos de sensibilidade e especificidade, ou razão de verossimilhança. O website STARD (Padrões para o Relatório de Estudos de Precisão Diagnóstica) fornece um fluxograma detalhado e lista de verificação de 25 itens para relatórios padronizados e avaliação de estudos que avaliam a precisão dos testes de diagnóstico. O CASP também fornece uma ferramenta semelhante, mas mais simples, para esse tipo de estudo. Características importantes a considerar ao avaliar um estudo de precisão diagnóstica estão listadas no Quadro 8. QUADRO 8: Principais pontos metodológicos a serem considerados na avaliação de um estudo de acurácia diagnóstica: · A amostra de pacientes representa o espectro completo de pacientes com e sem o diagnóstico de interesse? · Houve comparação com um teste apropriado de "padrão-ouro"? · Todos os pacientes receberam tanto o teste em avaliação quanto o mesmo teste "padrão-ouro"? · Os testes foram realizados de forma independente, com cegamento dos avaliadores para os resultados do teste de "padrão-ouro"? · Os pontos de corte usados para classificar os pacientes como tendo um resultado de teste positivo foram claramente descritos? Avaliações econômicas Os estudos de avaliação econômica enfocam a economia, ou qual tratamento pode proporcionar o maior benefício pelo menor custo. Existem vários tipos de estudos de avaliação econômica, incluindo análises de custo-benefício, custo-efetividade e custo-utilidade, os quais diferem na forma como medem os benefícios para a saúde. Uma característica importante da avaliação crítica de qualquer análise de custo é uma avaliação de como os vários custos e consequências de tratamentos individuais foram identificados e medidos. O CASP desenvolveu uma lista de verificação para auxiliar na avaliação de estudos de avaliação econômica. O estudo foi realizado de acordo com o protocolo original? Desvios do protocolo planejado podem afetar a validade ou relevância de um estudo. Um dos problemas mais comuns encontrados na pesquisa clínica é a falta de recrutamento do número planejado de participantes. Uma estimativa sugere que mais de um terço dos ECR recrutam menos de 75% da amostra planejada. Esse desvio do plano de estudo não só reduz potencialmente a extensão em que os resultados do estudo podem ser generalizados para situações do mundo real, porque aqueles que realmente foram recrutados podem ser diferentes daqueles que não estavam por algum motivo, mas também reduz o poder do estudo para demonstrar descobertas significativas. Outras diferenças no protocolo original podem incluir mudanças nos critérios de inclusão e exclusão, variação nostratamentos ou intervenções fornecidas, mudanças nas técnicas ou tecnologias empregadas e mudanças na duração do acompanhamento. O estudo testa uma hipótese declarada? Uma hipótese é uma afirmação clara do que os pesquisadores esperam que o estudo encontre e é central para qualquer pesquisa, uma vez que afirma a questão de pesquisa de uma forma que pode ser testada e refutada. Uma hipótese nula afirma que os resultados de um estudo não são diferentes daqueles que seriam esperados ocorrer por acaso. O teste estatístico de hipóteses envolve o cálculo da probabilidade de alcançar os resultados observados se a hipótese nula fosse verdadeira. Se essa probabilidade for baixa (convencionalmente menor que 1:20 ou P <0,05), a hipótese nula é rejeitada e os resultados são considerados "estatisticamente significativos" no nível aceito. As hipóteses do estudo devem ser crucialmente identificadas a priori (isto é, antes que o estudo seja conduzido e sejam desenvolvidas a partir de teoria ou experiência anterior). Se o estudo investigar a significância estatística de associações que não foram pré-especificadas na hipótese original (análise post-hoc), tais análises são propensas a resultados falso-positivos porque, a um nível de significância de 5% (P = 0,05), 1 em cada 20 associações testadas será significativo (positivo) por acaso sozinho. Quando um grande número desses testes é realizado, alguns resultados falso-positivos são altamente prováveis de ocorrer. Outra consideração importante é verificar se todos os dados relevantes para os objetivos do estudo declarados foram relatados e se os resultados selecionados não foram omitidos. Onde os tratamentos para uma condição médica já existem, os ensaios podem ser projetados para testar se uma nova terapia tem eficácia semelhante a uma existente. Esse tipo de tentativa é chamado de teste de equivalência ou de não inferioridade, pois seu objetivo é estabelecer que o novo tratamento não é pior do que o existente. Estudos de equivalência exigem que o grau de diferença de resultado em que os dois tratamentos não serão considerados equivalentes seja determinado antecipadamente. Por exemplo, os pesquisadores podem decidir que, se o desfecho primário para um novo tratamento não for maior que 5% pior do que o tratamento existente, os dois tratamentos serão considerados equivalentes. Estudos de equivalência determinam se um novo tratamento é pelo menos tão bom quanto um tratamento existente, de modo que as decisões sobre qual tratamento administrar a um determinado paciente podem ser tomadas com base em critérios, como custo ou facilidade de administração. A declaração CONSORT para estudos randomizados foi ampliada para incorporar diretrizes para relatar estudos de equivalência. Uma questão fundamental ao avaliar este tipo de estudo é se os resultados do estudo foram analisados adequadamente para um estudo de equivalência. Se um estudo é projetado para mostrar que um novo tratamento é pelo menos tão bom quanto um tratamento existente, métodos estatísticos, para testes convencionais de uma hipótese de que um tratamento é superior a outro, não devem ser usados. A análise apropriada dos resultados em um estudo de equivalência freqüentemente envolve o cálculo de intervalos de confiança para o efeito do tratamento e a determinação se esses limites estão dentro da margem predeterminada de não inferioridade. Outra questão fundamental é se o tamanho da amostra foi calculado corretamente para um estudo de equivalência, pois esses tipos de estudo geralmente requerem um tamanho de amostra maior do que um estudo de superioridade correspondente. As análises estatísticas foram realizadas corretamente? Avaliar a adequação das análises estatísticas pode ser difícil para os não estatísticos. No entanto, todos os artigos de pesquisa quantitativa devem incluir um segmento dentro de sua seção "Método" que explique as ferramentas usadas na análise estatística e a justificativa para essa abordagem, que deve ser escrita em termos que sejam apropriados para os leitores da revista. Em particular, a abordagem para lidar com dados perdidos e as técnicas estatísticas que foram aplicadas deve ser especificada; os pacientes perdidos no acompanhamento e os dados ausentes devem ser claramente identificados na seção "Resultados". Os dados originais devem ser apresentados de tal forma que os leitores possam verificar a precisão estatística do artigo. Uma consideração importante na análise estatística dos ECRs é se a intenção de tratar (ITT) ou análises por protocolo foram conduzidas. De acordo com o princípio do ITT, os dados dos participantes são analisados com referência ao grupo ao qual foram alocados aleatoriamente, independentemente de terem realmente recebido o tratamento alocado. As análises ITT são preferidas, porque mantêm a randomização e asseguram que os dois grupos de tratamento sejam comparáveis no início do estudo. No entanto, se muitos participantes forem não-aderentes ou uma grande proporção passar para outros tratamentos, uma análise do ITT será um pouco conservadora e os resultados poderão ser difíceis de interpretar. Nessa situação, uma análise por protocolo que inclui apenas os pacientes que cumpriram o protocolo do estudo podem ser usados para complementar a análise do ITT. Como as análises por protocolo correm maior risco de viés de seleção, elas geralmente não devem ser usadas como o principal método de análise, a menos que exista uma razão convincente para justificar essa abordagem. O fluxograma do CONSORT permite que o fluxo de participantes e os grupos utilizados na análise do estudo sejam claramente identificados. Os dados justificam as conclusões? A próxima consideração é se as conclusões que os autores apresentam são razoáveis com base nos dados acumulados. Às vezes, uma ênfase exagerada é colocada em achados estatisticamente significativos que invocam diferenças que são muito pequenas para terem valor clínico; alternativamente, alguns pesquisadores podem descartar diferenças grandes e potencialmente importantes entre os grupos que não são estatisticamente significativas, muitas vezes porque os tamanhos das amostras eram pequenos. Outras questões a serem cautelosas são se os autores generalizaram suas descobertas para grupos mais amplos de pacientes ou contextos do que era razoável, dada a amostra do estudo, e se associações estatisticamente significativas foram mal interpretadas para implicar uma causa e um efeito. Existem conflitos de interesse? Conflitos de interesse ocorrem quando fatores pessoais têm o potencial de influenciar papéis profissionais ou responsabilidades. Os membros de uma equipe de pesquisa devem fazer julgamentos que tenham o potencial de afetar a segurança dos participantes e a validade dos resultados da pesquisa. Os pesquisadores estão em posição de decidir quais estudos serão conduzidos em sua unidade, quais pacientes serão convidados a participar de um estudo e se certas ocorrências clínicas devem ser relatadas como eventos adversos. Essas decisões exigem que os pesquisadores ajam com integridade e não para ganho pessoal ou institucional. Potenciais conflitos financeiros de interesse incluem o recebimento de honorários de salário e consultoria da empresa que patrocinou a pesquisa e propriedade de ações ou outros interesses pecuniários, tais como patentes relacionadas à pesquisa. As unidades que recrutam participantes da pesquisa podem receber uma taxa per capita para cada paciente inscrito, o que pode ser maior do que as despesas envolvidas. Muitas fontes financeiras potenciais de conflitos de interesse, como o financiamento da indústria para eventos educacionais, viagens ou presentes, são cada vez mais reconhecidas, tanto no contexto da prática clínica diária como da pesquisa. No entanto, outros conflitos potenciais são inerentes ao ambiente de pesquisa. Um exemplo é que o status dos pesquisadores médicos e a renda futura da pesquisa dependem do sucesso de suas pesquisas. A identificação de um potencial conflito de interesses nãoé sinônimo de conflito de interesses real ou prática de pesquisa deficiente. Potenciais conflitos de interesse são extremamente comuns, e as questões mais importantes são se foram reconhecidas e como foram tratadas. Um mecanismo principal para lidar com potenciais conflitos de interesse é a divulgação aberta. No processo de avaliar criticamente um artigo de pesquisa, um passo importante é verificar se há uma declaração sobre a fonte de financiamento do estudo e, se um potencial conflito de interesses foi identificado para uma declaração sobre como esse conflito foi gerenciado. Por exemplo, os pesquisadores podem afirmar especificamente que a agência patrocinadora não participou do protocolo de pesquisa, análise de dados ou interpretação dos resultados. Muitas revistas agora rotineiramente exigem que os autores declarem qualquer potencial conflito financeiro ou de outro tipo de interesse quando um artigo é submetido. O leitor deve então decidir se os fatores declarados são importantes e podem ter influenciado a validade dos resultados do estudo. CONCLUSÕES Avaliação crítica é um processo sistemático através do qual os pontos fortes e fracos de uma pesquisa podem ser identificados. Esse processo permite que o leitor avalie a utilidade do estudo e se suas descobertas são confiáveis. O componente mais importante da avaliação crítica é a avaliação cuidadosa do desenho do estudo; no entanto, outras etapas, como avaliação dos métodos estatísticos utilizados, interpretação dos resultados e potenciais conflitos de interesse também são essenciais. Por fim, a consideração da importância da pesquisa para os próprios pacientes ajudará os médicos a identificar os estudos mais relevantes e de alta qualidade disponíveis para orientar sua prática clínica. 2