Baixe o app para aproveitar ainda mais
Prévia do material em texto
Métodos de Investigação aplicados ao estudo dos testes diagnósticos: princípios básicos M4 - Isabella machado pessanha alves Epidemiologia - Aula 3 e 4 PROBLEMA CLÍNICO - Um adulto com tosse e febre há cerca de um mês compareceu a um posto de saúde. O médico examinou o paciente e solicitou uma radiografia de tórax. - Qual é o valor da radiografia de tórax para o diagnóstico de tuberculose pulmonar? *Tem que extrair os componentes PIRD (PICO) da pergunta de pesquisa - Você fez uma busca e encontrou um estudo que avaliou a acurácia do RX tórax em comparação à cultura do escarro em adultos. PARA QUE SERVE UM TESTE DIAGNÓSTICO? - O que os clínicos esperam ao solicitar um teste diagnostico? O que fazer diante de u resultado +? - Para informar a decisão médica -> para melhorar o prognostico do paciente - Para mudar a probabilidade de determinado desfecho - O tipo de estudo é um teste seccional ou longitudinal que pode acompanhar a evolução do paciente que testa paciente p/ aquele diagnostico mas no geral é um estudo em que tudo é coletado no mesmo dia (teste índice e teste de referencia) - O teste diagnostico delimita uma prevalecia previa antes daquele resultado e acrescenta uma probabilidade de você ter essa doença a partir do resultado negativo ou positivo, porque você vai poder confirmar ou descartar corretamente aquele diagnostico. CONCEITO - Os testes diagnósticos são ferramentas usadas na clínica médica. O conhecimento do seu valor diagnostico permite a escolha dos mais adequados. - Teste laboratoriais e de imagem - Sinais e sintomas na anamnese - Exame Físico - Métodos Propedêuticos - Regras de Predição Clínica - Os testes diagnósticos devem ter a propriedade de identificar indivíduos doentes e não doentes e seus resultados devem ser confiáveis. PROPRIEDADES DOS TESTES - Validade: capacidade de reconhecer a verdade, característica própria dos testes, isto é, capacidade de produzir diagnósticos corretos - Confiabilidade: capacidade de produzir resultou semelhantes se o teste for aplicados aos mesmos indivíduos em tempos diferentes ou por dois entrevistados. VALIDADE E CONFIABILIDADE - Os testes diagnósticos IDEAIS produzem resulto válidos e confiáveis - Validade são medidas de acurácia, ou seja, sensibilidade, especificidade e razões de verossimilhança de um resultado positivo ou negativo. - Confiabilidade são medidas de concordância (ajustado para o acaso) entre os resultados da aplicação de um teste duas os mais vezes ao mesmo indivíduo (reprodutibilidade): - Kappa: testes com reposta é dicotômica (positivo/negativo), não serve para testes contínuos - Coeficiente de Correlação Intraclasse para testes com reposta quantitativa e contínua. (EX. Níveis de pressão arterial para o diagnostico de hipertensão, glicemia de jejum para o diagnóstico de diabetes mellitus, ferritina sérica para o diagnóstico de anemia) FATORES QUE INFLUENCIAM A CONFIABILIDADE • Condições do paciente • Condições da técnica: pipetagem, mensurações, calibração, deterioração dos reagentes • Condições do observador: treinamento, experiência • Variabilidade inter-observador: o teste pode ter divergências na interpretação de dois observadores diferentes • Variabilidade intra-observador: o teste pode ter divergência na interpretação que realiza um observador em 2 ocasiões CRITÉRIOS METODOLÓGICOS É sugerido para que as pessoas usem como itens de um guideline para avaliarem criticamente um determinado tipo de artigo ou pesquisa publicada. • CASP foco em: - Seleção dos participantes (=POPULAÇÃO DE INTERESSE): critérios de inclusão/exclusão, amostragem, perfil clinico, desenho do estudo - Testes (ÍNDICE E REFERÊNCIA): critérios de escolha do padrão de referência, método de utilização, definição de pontos de corte e interpretação dos resultados, treinamento e perfil dos examinadores, mascaramento (inspirado em um ensaio clinico, como por ex. Simples cego é quando o paciente não sabe a medicação que está recebendo e no Duplo cego, os profissionais de saude estão fazendo o tratamento mas também não sabe porque a medicação está codificada. Ou seja, quem executa o teste índice desconhece o resultado ou o status para aquele paciente do teste índice que define o status (se deu positivo ou negativo) do doente, e é realizado para que um resultado não influencie o outro, para que não haja um viés de classificação, um erro) - Avaliação dos resultados: medidas de acurácia (ou validade) e de confiabilidade, e de precisão ou significância estatística (p- valor ou intervalo de 95% de confiança). Se o resultado é muito impreciso (a sensibilidade é 85% mas varia de 65% a 98%, é muita variação porque um teste que acerta 85% dos positivos mas que pode acertar de 65% a 98% é quase todo certo p/ bastante coisa errada, próximo do 50%) SELEÇÃO DOS PARTICIPANTES • Desenho do estudo - Preferencialmente, estudo prospectivos ou transversais - Os estudos caso-controle devem ser evitados porque -> os critérios diagnósticos podem mudar ao longo do tempo -> os métodos adotados para a realização dos exames e a expertise dos indivíduos que realizam os exames também mudam ao longo do tempo -> o mascaramento é mais difícil • Amostragem - Amostra aleatória - Amostra consecutiva de pacientes • Critérios de inclusão/exclusão - Devem atender a “pergunta" da pesquisa e estar claramente descritos Ex. Um estudo para validar um teste diagnostico de dengue deve incluir pacientes com suspeita clinica de dengue -> A seleção dos pacientes deve ser independente do resultado do padrão de referência e teste em estudo!! • Perfil clínico - A amostra deve incluir um espectro clínico variado (condizente com a prática clínica) -> Caso contrário, os bons resultados encontrados podem ser generalizávelis apenas a um perfil, p.ex. os mais graves (spectrum bias) TESTES - Padrões referência - Critérios: o melhor teste disponível, com acurácia comprovada A padronização das condições de realização e interpretação dos testes melhora a reprodutibilidade. - Padrão de referência e teste “novo” - Descrever detalhadamente o método de realização - Definição de pontos de corte e interpretação dos resultados - Treinamento e perfil dos examinadores claramente descritos - Objetivo: padronizar os procedimentos, isto é, ambos os testes devem ser realizados/aplicados da mesma forma em todos os pacientes - Mascaramento - O teste “novo" deve ser realizado sem o conhecimento do resultado do padrão de referência (e vice- versa) - Os testes índice e de referência devem ser realizados independente de qualquer outra informação clínica ou laboratorial MEDIDAS DE ACURÁCIA OU DE VALIDADE TESTE DIAGNÓSTICO *O + é quando está doente e o - é quando está saudável* - Quando o teste da positivo/negativo e é verdadeiro o padrão de referência, é dito na diagonal da esquerda p/ direita os verdadeiros positivo e negativo No grupo de pessoas acima, qual a probabilidade de: - Ser doente? É o a+c divido por a+b+c+d e pode ser denominado também de prevalência da doença. E de ser saudável? É o d+b divido por a+b+c+d - Ser doente e o teste ter detectado (acertado)? - Ser saudável e o teste ter descartado (acertado)? - O teste ter dado positivo e a pessoa ser doente? - A sensibilidade é o verdadeiro positivo sobre todos os pacientes que deveriam ser identificados quando doentes (verdadeiros positivos + falsos negativos) - A especificidade é o teste dar certo, identificar verdadeiro negativo sobre os falsos positivos + verdadeiros negativos - O valor preditivo positivo é a visão do doente, ou seja, se meu teste deu positivo, ele está certo, isto é verdadeiropositivo sobre todas as vezes que o teste deu positivo (verdadeiro/falso positivo). Se não for muito especifico vai dar muitos falsos positivo na bula e tem uma chance de receber o exame positivo e dar errado. - O valor preditivo negativo, é a situação que tem um verdadeiro negativo identificado corretamente, sobre a situação em que todas as vezes o teste deu negativo (falso negativo + verdadeiro negativo). VALIDADE DA RADIOGRAFIA DO TÓRAX (I) EM COMPARAÇÃO A CULTURA (R) PARA O DIAGNOSTICO DE TP (D) - A célula A é 90 que corresponde ao verdadeiro positivo, a célula B é o 30 que corresponde ao falso positivo (porque o teste está dando compatível com a tuberculose mas a cultura desse paciente é negativa). A Nos valores preditivos no denominador tem a situação do teste ter dado positivo/negativo mas o numerador sempre está contido no denominador, que é chamado de proporção. célula D é 70 que é quando o raio X deu normal ou não compatível com TP e a cultura da negativo (verdadeiro negativo). E a célula C é 10 porque é a situação me que o teste diz que está tudo normal, não compatível com o raio X mas a cultura vai dar negativa e ele tem TP (falso negativo), e essa situação pode atrasar o tratamento. E também ao contrario, propor para os pacientes que foram dados como radiologia compatível p/ aqueles 30 um esquema de 4 remédios até a cultura dar negativa. - Tem a faixa de pacientes que tem um pequeno percentual de diagnóstico - A zona de incerteza, que é entre as duas setas verdes, é o de 10 - 90 % de probabilidade de ter um diagnóstico que ainda está no limiar de investigação, pode ser que precise fazer um novo exame para que o paciente cruze a linha B e tenha um diagnostico estabelecido e passa do limiar de tratamento. - Na prática clínica frequentemente temos um resultado de um teste, e precisamos saber qual a probabilidade de o paciente ter ou não a doença pesquisada. - Tratam-se probabilidades pós- teste (positivo ou negativo) As perguntas de interesse clínico são: • Se um teste de uma pessoa é positivo, qual a probabilidade dela ser um doente? Valor preditivo positivo • Se um teste de uma pessoa é negativo, qual a probabilidade dela não ser doente? Valor preditivo negativo • Quantas vezes é mais provável que um teste positivo encontre uma pessoa doente do que uma pessoa não doente? Razão de verossimilhança positiva COMO INTERPRETAR OS RESULTADOS DOS TESTES NA PRÁTICA CLÍNICA? - O VPP de um teste aumenta com a prevalência da doença: o mesmo teste aplicado em situações de frequências diferentes da doença terá desempenho diferente. RAZÃO DE VEROSSIMILHANÇA (Likelihood ratio) Cálculo: Porcentagem (probabilidade) de pessoas doentes com determinado resultado em um teste diagnostico dividido pela porcentagem de saudáveis com o mesmo resultado. Ou seja, quantas vezes é mais provável no positivo encontrar um doente com resultado positivo Calcule: Prevalência = 90+10 / 90+30+10+70 = 50 (metade dessa população está doente) Sensibilidade = 90 / 90+10 = 90% Especificidade = 70 / 30+70 = 70% Valor preditivo += (a probabilidade de um exame positivo ser um resultado positivo), deu positivo 120 vezes mas acertou em 90 só e negativo 80 vezes, acertou em 70, ou seja, 90 / 90+30 = 0,75 = 75% (então o teste está correto, é verdadeiro) Valor preditivo - = Se o teste der negativo, as vezes que ele identificou corretamente sobre todas as vezes que ele deu negativo, 70 / 80 = 0,875 = 0,88 = 88% (das vezes que o teste der negativo ele está correto) do que um não doente com resultado também positivo. RV+: quantas vezes é mais provável um doente ter resultado positivo em comparação com não doente RV-: quantas vezes é menos provável um doente ter resultado negativo (normal) em comparação com um não doente VALIDADE • Qual o padrão de referência utilizado na pesquisa? Biópsia • Qual a sensibilidade e a especificidade do novo teste? Se = 65 / 65+35 = 0,68 (ou 68%) • E a especificidade? Esp = 30 / 70+30 = 0,3 (ou 30%) • E a razão de verossimilhança? 65% / 70% = menor que 1 (RV+ não é boa) e a negativa 35% / 30% = maior que 1 porque o numerador é maior que o denominador e precisava ser um valor p/ zero, então esse novo teste é ruim • Sensibilidade dele é maior que a especificidade mas erra muito em classificar • Se uma mulher teve o teste positivo quantas vezes é mais provável ela ter câncer do que não ter? Razão de verossimilhança positiva -> SE / 1 - E • Se uma mulher teve o teste negativo como é a probabilidade dela ter câncer comparada com a de não ter? Razão de verossimilhança negativa -> 1- SE/ Esp RAZÕES DE VEROSSIMILHANÇA PODEM SER UTILIZADAS QUANDO OS TESTES NÃO SÃO DICOTÔMICOS A medida que aumenta o valor de leucocitos, aumenta a verossimilhança. Não tem nenhum falso positivo. NOMOGRAMA DE FAGAN F e r r a m e n t a r á p i d a p a r a c a l c u l a r a probabi l idade pós-teste , a part i r da probabilidade pré-teste (prevalência) e da razão de verossimilhança. Bons testes tem RV+ alta e RV- baixa: os doentes dão resultados positivo (anormais) e os saudáveis dão resultados negativo (normais). RV= alta >10; RV- baixa < 0,1 Qual a prevalência de câncer de mama entre as participantes da pesquisa? Este valor é a probabilidade pré-teste de alguma mulher do grupo ter câncer de mama. - É uma régua que tem 3 linhas verticais. A primeira linha vertical é a probabilidade pré teste e representa a prevalência da doença daquele lugar, se é alta a probabilidade dele ter a doença é alta, se a prevalência é baixa a probabilidade dele ter a doença é baixa. - Por ex: a prevalência da doença é 10%, se a RV for 1, se a RV é +, a probabilidade pós teste é que representa o valor preditivo positivo. A probabilidade do resultado positivo no teste índice ser real. Se a prevalência for 40% e a RV for 1 vai continuar dando 40%. - Caso aumente a RV EM 10, o valor preditivo positivo aumentou bem, significa realizar esse teste ajuda a aumentar a probabilidade de acerto no diagnostico da doença. Quanto maior melhor até o limite, se a prevalência for alta, esse aumento do valor preditivo positivo vai mais alto ainda. A prevalência da 25%, a RV é maior que 10 e a probabilidade pós teste de o indivíduo ser doente é maior que 80%. Então esse teste diminuiu a incerteza, aumentou a probabilidade de acertar o diagnostico, entoa esse teste é útil. - Se a RV- é 0,1 a probabilidade do indivíduo ter a doença diminui muito, entoa significa que se o resultado der negativo é negativo mesmo Qual a probabilidade do paciente ter a doença? • Se o exame deu positivo usa-se a prob. pré-teste e a RV + • Se o exame deu negativo usa-se a prob. pré-teste e a RV – - Um exame laboratorial (ou de imagem) só t e m u t i l i d a d e q u a n d o a u m e n t a consideravelmente a probabilidade de doença no caso de dar positivo ou se também a reduz de forma expressiva, se der negativo. MEDIDAS DE ACURÁCIA - 3 TIPOS • SIMPLES: sensibilidade, especificidade e valores preditivos positivo e negativo. • COMBINADAS: 1. Razão de verossimilhança positiva e negativa – RV+ e RV- 2. Acurácia ou Eficiência = (VN+VP) / (VN+FN+VP+FP) = % de acertos no total 3. Índice de Youden, J = Se + Esp - 1 4. Odds ratio diagnóstica = (a/c) / (b/ d) ou ad / bc ou RV+/RV- • MEDIDA DERIVADA DA ANÁLISE da Curva ROC (para medidas contínuas): área abaixo da curva ROC (em inglês, AUC – Area Under the ROC Curve ) - Utiliza ela quando o resultado é de glicemia de jejum MEDIDAS DE ACURÁCIA: Receive- Operating Characteristic curve (curva ROC) - Só vale ara exames que o resultado é contínuo. - O ponto de corte é o que está mais perto do ponto de sensibilidade - Se essa curva ROC está em cima dessa diagonal, o teste é tão bom quanto a reta.Significa que se caso pegar um endivido que tem o teste positivo ou negativo, a probabilidade de o resultado dele estar correto é de 50%. - Caso faça abaixo da curva ROC, esse teste não servirá p/ nada, e se ficar acima da curva é melhor, quanto mais próximo do canto superior esquerdo, melhor. COMPARAÇÀO DE CURVAS ROC - A curva melhor é a da direita - A área sob a curva ROC oferece uma medida de acurácia que contempla a sensibilidade e a especificidade do teste EXEMPLO: IMMUNOENSAIO D. CHAGAS EXEMPLO: • Avaliando a validade da dosagem de ferritina sérica, comparada com dosagem de ferro na medula óssea para o diagnóstico de anemia ferropriva. (Richardson et al, 2007) a. Qual é o diagnóstico médico de interesse? b. Qual foi o padrão de referência utilizado? c. Qual é a relevância deste estudo? - Sensibilidade: Com que frequência ocorrem resultados de ferritina sérica <= 45 entre doentes? - Especificidade: Com que frequência ocorrem resultados de ferritina sérica > 45 entre pessoas com dosagem de ferro normal? d) Razão de verossimilhança: O quanto é mais provável que um resultado positivo (ferritina sérica <= 45 ocorra) entre doentes comparados a não doentes? O quanto é menos provável que um resultado negativo (ferritina sérica > 45) ocorra entre doentes comparados a não doentes? - Calcule e interprete as razões de verossimilhança positiva e negativa O USO DE MÚLTIPLOS TESTES - Raramente usamos um único teste diagnóstico para concluirmos sobre a presença de uma doença e iniciarmos o tratamento. Em geral os testes são usados em conglomerados. - Dois tipos básicos de testes múltiplos são usados: • Testes em paralelo - Aumentam a sensibilidade. Indicados para o início da investigação diagnóstica. Interpretação da AUC : uma AUC de 0,96, por exemplo, significa que um indivíduo aleatoriamente selecion ado do grupo positivo tem um valor de teste maior do que para um indivíduo escolhido aleatoriamente do grupo negativo em 96% das vezes. • Testes em série - Aumentam a especificidade. Indicados para fazer diagnóstico diferencial.
Compartilhar