Baixe o app para aproveitar ainda mais
Prévia do material em texto
GRADE (Grading of Recommendations, Assessment, Development and Evaluations) Classificação de Recomendações, Avaliação, Desenvolvimento e Análises] GRADE (Grading of Recommendations, Assessment, Development and Evaluations) [Classificação de Recomendações, Avaliação, Desenvolvimento e Análises] E um arcabouço transparente para desenvolver e apresentar resumos de evidências que proporcionam uma abordagem sistemática para fazer recomendações de prática clínica. É a ferramenta mais adotada para classificar a qualidade da evidência e para fazer recomendações, com mais de 100 organizações do mundo inteiro endossando oficialmente a iniciativa GRADE. Como funciona? Como funciona? Primeiro, os autores decidem qual é a questão clínica, incluindo a população à qual ela se aplica, duas ou mais alternativas e os desfechos que interessam mais aos que se deparam com a decisão. Um estudo – de preferência uma revisão sistemática– fornece a melhor estimativa do tamanho do efeito de cada desfecho, em termos absolutos (por exemplo, uma diferença no risco). Depois, os autores classificam a qualidade da evidência, que é mais bem aplicada a cada desfecho, pois a qualidade da evidência costuma variar entre os desfechos. Uma classificação GRADE da qualidade geral pode ser aplicada a um corpo de evidências nos desfechos, geralmente tomando a menor qualidade de evidência de todos os desfechos que são fundamentais para a tomada de decisão. A GRADE tem quatro níveis de evidência – também conhecidos como certeza na evidência ou qualidade da evidência Classificações de certeza da GRADE NÍVEIS DE EVIDÊNCIA: DEFINIÇÕES, IMPLICAÇÕES E FONTES DE INFORMAÇÃO Nível Definição Implicação Fontes de informação Alto Há uma forte confiança de que o verdadeiro efeito esteja próximo do efeito estimado. É improvável que estudos adicionais modifiquem a confiança na estimativa do efeito. Estudos clínicos randomizados bem delineados com amostra representativa. Estudos observacionais bem delineados com achados consistentes. Moderado Há uma confiança moderada no efeito estimado. Estudos futuros podem ou não modificar a confiança na estimativa do efeito, inclusive alterando a estimativa. Estudos clínicos randomizados com limitações leves. Estudos observacionais bem delineados com achados consistentes. Baixo A confiança no efeito é limitada. Estudos futuros provavelmente terão um impacto importante na confiança na estimativa do efeito global. Estudos clínicos randomizados com limitações moderadas. Estudos observacionais comparativos (casos-controle e coortes). Muito baixo A confiança na estimativa do efeito é muito limitada. Há um importante grau de incerteza nos resultados. Qualquer estimativa do efeito é incerta. Estudos clínicos randomizados com limitações graves. Estudos observacionais comparativos com limitações. Estudos observacionais não comparativos. Opiniões de especialistas. Fonte: Adaptado de Brasil (2014 O sistema GRADE classifica a importância relativa dos desfechos em uma escala de 1 a 9, dividindo-os em três categorias Desfechos críticos para o processo de decisão; Desfechos importantes para o processo de decisão; Desfechos pouco importantes para o processo de decisão. A definição dos tipos de desfechos (crítico, importante ou pouco importante) é essencial no processo de desenvolvimento de recomendações e possibilita a hierarquia dos desfechos avaliados, assim como uma avaliação mais pragmática do balanço entre riscos e benefícios. A GRADE é subjetiva A GRADE é subjetiva A GRADE não pode ser implementada mecanicamente – necessariamente há uma quantidade considerável de subjetividade em cada decisão. Seria razoável que duas pessoas avaliando o mesmo corpo de evidência chegassem a conclusões diferentes a respeito de sua certeza. O que a GRADE oferece é um arcabouço reprodutível e transparente para classificar a certeza na evidência. O que torna uma evidência mais incerta? Níveis de evidência A partir da classificação inicial, critérios são definidos e o julgamento desses aspectos permitem reduzir ou elevar o nível de evidência. Os fatores responsáveis pela redução no nível de evidência são: • Limitações metodológicas (risco de viés) • Inconsistência • Evidência indireta • Imprecisão • Viés de publicação Risco de viés Domínios GRADE para reduzir a classificação Risco de viés O viés ocorre quando os resultados de um estudo não representam a realidade devido às limitações inerentes no desenho ou conduta de um estudo. Na prática, é difícil saber até que ponto os possíveis vieses influenciam os resultados e, portanto, a certeza é mais baixa nos efeitos estimados se os estudos que informam estes efeitos estimados puderem estar enviesados. A GRADE é usada para classificar o corpo de evidências a nível do desfecho e não a nível do estudo. FATORES LIMITANTES CONFORME O DELINEAMENTO DOS ESTUDOS Estudos clínicos randomizados Estudos observacionais Ausência de sigilo de alocação ou randomização inadequada. Ausência de cegamento. Seguimento incompleto ou perda de seguimento dos pacientes randomizados ou ausência de análise estatística adequada (p. ex., por intenção de tratar [intention-to- treat]). Relato seletivo de desfechos (p. ex., relato incompleto ou ausente de alguns desfechos com base nos resultados do estudo). Interrupção precoce do estudo. Utilização de medidas de desfecho sem validação (p. ex., desfecho relatado pelo paciente). Fontes de financiamento do estudo com presença de conflitos de interesse. Seleção e inclusão inadequada dos participantes (p. ex., pareamento inadequado em estudos de casos-controle, seleção de grupos expostos e não expostos em estudos de coorte a partir de diferentes populações). Ausência de cegamento. Falhas no controle das variáveis de confundimento (p. ex., ausência de medidas acuradas para os fatores prognósticos conhecidos, pareamento ou ajuste inadequado na análise estatística dos fatores). Seguimento incompleto. Inconsistência Inconsistência A certeza em um corpo de evidências é mais alta quando existem vários estudos que mostram efeitos consistentes. Quando se considera se a certeza deve ou não ser classificada para baixo pela inconsistência, os autores devem inspecionar a semelhança das estimativas pontuais e a sobreposição de seus intervalos de confiança, bem como os critérios estatísticos para a heterogeneidade. Inconsistência • O julgamento da inconsistência é baseado na similaridade das estimativas de efeito, na sobreposição dos intervalos de confiança e em critérios estatísticos, como o I2 • Efeitos de subgrupo devem ser interpretados com cuidado, devendo ser baseados em hipóteses determinadas a priori, com direção de efeito definida, plausibilidade biológica e principalmente se referendada por outros estudos. Inconsistência Diversos critérios podem nos auxiliar no julgamento sobre a inconsistência entre os estudos, entre eles: • Diferenças elevadas nas estimativas dos efeitos (ex.: risco relativo) dos estudos individuais; • Sobreposição dos intervalos de confiança; • Inconsistência (I2 ) e teste de inconsistência (TI2 ) e do teste de heterogeneidade [TG1]. Evidencia indieta A evidência é mais certa quando os estudos comparam diretamente as intervenções pertinentes na população de interesse e divulgam o(s) desfechos(s) fundamentais para a tomada de decisão. A certeza pode ser avaliada para baixo se os pacientes estudados forem diferentes daqueles aos quais a recomendação se aplica. Evidência indireta A evidência pode ser considerada indireta por quatro motivos, e os exemplos são apresentados no Quadro 8. • População: os participantes avaliados nos estudos não representam adequadamente a população de interesse (ex.: gravidade diferente). • Intervenção: as intervenções avaliadas nos estudos diferem daquelas de interesse (ex.: diferentes doses de um fármaco, ou diferentes técnicas psicoterápicas).Imprecisão A abordagem GRADE para classificar a imprecisão se concentra no intervalo de confiança de 95% em torno da melhor estimativa do efeito absoluto. A certeza é mais baixa se a decisão clínica tender a ser diferente, se o verdadeiro efeito estiver na extremidade superior versus na inferior do intervalo de confiança. Os autores também podem optar por reduzir a classificação da imprecisão se o feito estimado vier de apenas um ou dois estudos pequenos ou se ocorreram poucos eventos. Imprecisão • O principal critério utilizado pelo sistema GRADE para julgar a precisão das estimativas é a amplitude do intervalo de confiança de 95%; • Idealmente, o intervalo de confiança a ser avaliado é o referente ao efeito absoluto, e não ao relativo; • Quando observamos magnitude de efeito, baseado em um pequeno número de eventos, pode-se considerar reduzir o nível de evidência, mesmo se o intervalo de confiança for aparentemente estreito. Viés de publicação O viés de publicação talvez seja o mais irritante dos domínios GRADE, pois exige que se façam inferências sobre evidências ausentes. Vários métodos estatísticos e visuais são úteis na detecção do viés de publicação, apesar de terem graves limitações. O viés de publicação é mais comum com dados observacionais e quando a maior parte dos estudos publicados é financiada pela indústria. Viés de publicação • A não publicação de estudos com resultados “negativos”, quando parece ser uma prática frequente. O pesquisador deve suspeitar de viés de publicação quando os estudos são uniformemente pequenos, em especial quando em sua maioria possuem conflitos de interesse importante (por exemplo, patrocínio da indústria farmacêutica); • A avaliação empírica de padrão de resultados (por exemplo, gráfico em funil) pode sugerir viés de publicação, no entanto deve ser interpretado com cautela. Viés de publicação Entre os principais fatores que devemos considerar na avaliação de viés de publicação estão: Critérios estatísticos e gráficos podem indicar possibilidade de viés de publicação. Entre os mais utilizados estão a inspeção visual do gráfico em funil (funnel plot) e o teste de Egger.. É esperado que estudos maiores apresentem medida de efeito mais próxima ao efeito real da intervenção, enquanto estudos menores apresentem resultados variáveis, podendo, pelo acaso, apresentar efeito superior ou inferior ao efeito real, esperando que essa distribuição de estudo seja simétrica. Níveis de evidência Adicionalmente, caso o nível não tenha sido rebaixado devido aos fatores acima apresentados, a evidência procedente de estudos observacionais pode ser elevada considerando três fatores: • Grande magnitude de efeito; • Gradiente dose-resposta; • Fatores de confusão residuais, os quais aumentam a confiança na estimativa. GUYATT, G. H. et al. Journal of Clinical Epidemiology. 2011. Grande Magnitude de Efeito Para determinadas intervenções (por exemplo, adrenalina para prevenir mortalidade em anafilaxia, ou insulina para prevenir mortalidade em cetoacidose diabética), os profissionais de saúde estão, corretamente, confiantes de sua efetividade. Assim, nesses casos onde há redução dramática na incidência de um desfecho, ocorrendo em um intervalo curto de tempo após a intervenção, o nível de evidência deve ser considerado alto, mesmo caso a evidência tenha origem a partir de estudos observacionais. Presença de gradiente dose-resposta • A presença de gradiente dose-resposta é um achado que reforça a probabilidade da ocorrência de relação causa-efeito, assim aumentando a confiança na estimativa. • Dessa forma, frente a um consistente aumento do efeito associado a um aumento na exposição, a evidência do efeito torna-se mais robusta Fatores de confusão residuais que aumentam a confiança na estimativa Estudos observacionais com forte rigor metodológico irão contabilizar, de forma acurada, fatores associados com os desfechos de interesse, e conduzir análise ajustando para diferenças desses fatores entre os grupos de intervenção e controle. Fatores de confusão residuais que aumentam a confiança na estimativa A razão principal para considerar estudos observacionais com nível de evidência inicialmente baixo é que os fatores não mensurados ou desconhecidos provavelmente não estejam adequadamente balanceados entre os diferentes grupos, ao contrário do que acontece com o uso de randomização, o que se caracteriza como confundimento residual. Força de recomendação A força da recomendação expressa a ênfase para que seja adotada ou rejeitada uma determinada conduta, considerando potenciais vantagens e desvantagens. São consideradas vantagens os efeitos benéficos na melhoria na qualidade de vida, aumento da sobrevida e redução dos custos. São consideradas desvantagens os riscos de efeitos adversos, a carga psicológica para o paciente e seus familiares e os custos para a sociedade. O balanço na relação entre vantagens e desvantagens determina a força da recomendação. Força de recomendação A força da recomendação (forte ou fraca) pode ser a favor ou contra a conduta proposta. Geralmente, esse processo é realizado no desenvolvimento de diretrizes clínicas e pareceres técnicos, podendo ser específicas para o cenário avaliado (por exemplo, condicionadas à disponibilidade de recursos). Termos de risco RA (risco absoluto) = o número de eventos (bons ou ruins) em grupos tratados ou controle, dividido pelo número de pessoas naquele grupo RAC = o RA de eventos no grupo-controle RAT = o RA de eventos no grupo de tratamento RRA (redução do risco absoluto) = RAC – RAT RR (risco relativo) = RAT/RAC RRR (redução do risco relativo) = (RAC – RAT)/RAC RRR = 1 – RR NNT (número necessário para tratar) = 1/RRA Exemplos •RR de 0.8 significa um RRR de 20% (significando uma redução de 20% no risco relativo do resultado especificado no grupo de tratamento em comparação com o grupo-controle). •Em geral, a RRR é constante em vários riscos absolutos. Mas a RRA é maior e o NNT menor em pessoas com maiores riscos absolutos. •Se o RA de AVC de uma pessoa, estimado a partir de sua idade e outros fatores de risco, é de 0.25 sem tratamento, mas cai para 0.20 com o tratamento, a RRA é de 25% – 20% = 5%. A RRR é (25% – 20%) / 25% = 20%. O NNT é 1/0.05 = 20. •Em uma pessoa com um RA de AVC de apenas 0.025 sem tratamento, o mesmo tratamento ainda produzirá uma RRR de 20%, mas o tratamento reduzirá seu RA de AVC para 0.020, dando um RRA muito menor de 2.5% – 2% = 0.5% e um NNT de 200. Diferença significante •Se o RR (o risco relativo) ou a RC (razão de chances) = 1, ou o IC (intervalo de confiança) = 1, então não há diferença significativa entre os grupos de tratamento e controle. •Se o RR >1 e o IC não incluir 1, há maior probabilidade significativa de eventos no grupo de tratamento do que no grupo-controle. •Se o RR <1 e o IC não incluir 1, há menor probabilidade significativa de eventos no grupo de tratamento do que no grupo-controle. Nota •Para expressar decimais como porcentagens, multiplique por 100.
Compartilhar