Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Probabilidade e avaliação de testes diagnósticos Introdução: É conhecido que fumar causa câncer de pulmão e doenças do coração. Provavelmente você já ouviu alguém dizer: “Fulano fumou a vida toda e morreu velho sem câncer de pulmão”. Considere o seguinte estudo: dois grupos de indivíduos, um de fumantes e outro de não fumantes, são observados ao longo do tempo com relação à variável desenvolvimento da doença. Para cada indivíduo podemos observar duas respostas: desenvolveu a doença ou não desenvolveu a doença. O estudo deste tipo de situação requer tratamento probabilístico. Conceitos básicos: a) Experimento aleatório: Processo de coleta de dados relativos a um fenômeno que acusa variabilidade em seus resultados. Seus resultados possíveis são conhecidos, mas não se pode saber a priori qual deles ocorrerá. Vamos denotá-lo por ε. Exemplo: ε = diagnosticar um paciente resultado: doente ou sadio. b) Espaço amostral: Conjunto de todos os resultados possíveis de um experimento aleatório. Vamos denotá-lo por Ω. Exemplo: ε = diagnosticar um paciente Ω = {D, S}, onde D = doente e S = sadio c) Evento: Subconjunto do espaço amostral. São representados por letras maiúsculas e seus elementos por letras minúsculas Exemplo: ε = Classificar o grau de desnutrição de uma criança em grau I, II e III Ω = {I, II, III} Eventos: A = {I}, B = {II}, C = {III}, D = {I, II}, E = {I, III}, F = {II, III} Tipos de eventos: • Evento simples: contém apenas um elemento de Ω. • Evento certo ou certeza: contém todos os elementos de Ω. Se o evento A = Ω A é um evento certo. • Evento impossível: não contém elementos. É igual ao conjunto vazio. • Evento união (A U B): o evento “A união B” é formado pelos elementos que estão em A ou em B ou em ambos ( ocorrência de A, ou de B, ou de ambos). • Evento intersecção (A ∩ B): o evento “ A interseção B” é formado pelos elementos que estão em A e em B ao mesmo tempo (ocorrência simultânea de A e B). • Evento complementar: Complementar de A = negação de A, contém todos os elementos do espaço amostral que não pertencem ao evento A. É denotado por A ou AC • Eventos mutuamente excludente (disjuntos): quando não existir intersecção entre eles. A e B são disjuntos → (A∩B) = . Exemplo: Suponha que o espaço amostral seja formado pelos inteiros positivos de 1 a 10. Sejam os eventos: A = {2, 3, 4}, B = {3, 4, 5} e C = {5, 6, 7}. BA = = evento simples, BA = CA = o evento A intersecção C é um evento impossível. A e C são eventos disjuntos. CBA = 2 Diagrama de Venn De maneira informal, probabilidade é uma medida que quantifica a incerteza presente em determinada situação, ora usando um número, ora usando uma função matemática. No caso do câncer de pulmão, é conveniente dispormos de uma medida que exprima essa incerteza em termos de uma escala numérica que varie do impossível ao certo. Esta medida é a probabilidade. Definição clássica: Seja A um evento qualquer do espaço amostral. Se os eventos simples são equiprováveis, isto é, eles têm a mesma chance de ocorrer, podemos calcular a probabilidade de A como: Exemplo: Seja o experimento aleatório “ jogar um dado e observar a face de cima”. = {1, 2, 3, 4, 5, 6}. Seja o evento A “o número é par ”, A = {2, 4, 6} n() = 6 e n(A) = 3. Se o dado for honesto, todas as seis faces têm a mesma probabilidade de saírem para cima. Assim, a probabilidade do evento A é dada por P(A)= n(A) / n() = 3/6=0,5. Porém, na maioria das situações práticas, os eventos simples do espaço não são equiprováveis e não podemos calcular probabilidades usando a definição clássica. Neste caso vamos calcular probabilidades como a freqüência relativa de um evento. Definição frequentista: Proporção de vezes que um evento ocorre em uma série suficientemente grande de realizações de um experimento, em condições idênticas. Se A é o evento de interesse, a probabilidade de A é dada por: onde o número de repetições deve ser grande. )( )()( n AnAAP oexperiment do possíveis resultados de número evento do ocorrência à favoráveis resultados de número n AnAAP )()( oexperiment do repetições de total número que vezes de número 3 Exemplo 1: Uma amostra de 6800 pessoas de uma determinada população foi classificada quanto à cor dos olhos e à cor dos cabelos. Os resultados foram: Tabela 1: Classificação de uma amostra de 6800 pessoas quanto à cor dos olhos e dos cabelos Cor dos cabelos Cor dos olhos Loiro Castanho Preto Ruivo Total Azul 1768 807 189 47 2811 Verde 946 1387 746 53 3132 Castanho 115 438 288 16 857 Total 2829 2632 1223 116 6800 Considere o experimento aleatório que consiste em classificar um indivíduo quanto à cor dos olhos. Ω = {A, V, C}, onde: A = {a pessoa tem olhos azuis}, V = {a pessoa tem olhos verdes} e C = {a pessoa tem olhos castanhos}. Os eventos não são equiprováveis: P(A) = nº de pessoas de olhos azuis / nº de pessoas na amostra = 2811/6800 = 0,4134 Exemplo 2: suponha que desejássemos conhecer a probabilidade de uma pessoa estar infectada com a bactéria H. pylori . O experimento aleatório consiste em selecionar uma pessoa do grupo de interesse e verificar um dos resultados possíveis: está infectada ou não está infectada. Estes dois eventos do espaço amostral não têm a mesma probabilidade de ocorrência, o que impossibilita o uso da definição clássica de probabilidade. Através do exame de uma grande amostra de pessoas, usaremos a definição frequentista e estimaremos a probabilidade de uma pessoa estar infectada com a H. pylori usando a freqüência relativa de pessoas infectadas nessa amostra. Propriedades da probabilidade: 1) 0 ≤ P(A) ≤ 1 para qualquer evento A 2) P(Ω) = 1 3) Se A e B são disjuntos, então: P(A U B) = P(A) + P(B) 4) Se A e B são dois eventos quaisquer, então: P(A U B) = P(A) + P(B) – P(A ∩ B) 5) )(1)( APAP 4 Exemplo: Considerando os dados da Tabela 1, qual a probabilidade de um indivíduo ter olhos azuis ou cabelos loiros? P(A U L) = P(A) + P(L) – P(A ∩ B) = 2811/6800 + 2829/6800 – 1768/6800 = 3872/6800 = 0,5694 Probabilidade condicional: Muitas vezes, o objetivo é calcular a probabilidade de um evento restrito a determinada condição, ou seja, a probabilidade de um evento condicionada a ocorrência de outro. A probabilidade de um evento A ocorrer dado que se sabe que um evento B ocorreu, é chamada probabilidade condicional do evento A dado B. Ela é denotada por P(A|B) e calculada por: Esta expressão pode ser reescrita como: chamada de regra do produto e é muito usada no cálculo de probabilidades. A probabilidade de A ocorrer dado que o evento B ocorreu será: Exemplo: Um grupo de pessoas foi classificado quanto a peso e pressão arterial de acordo com as proporções mostradas abaixo: Tabela 2: Distribuição de um conjunto de pacientes segundo peso e pressão arterial Peso Pressão arterial Excesso Normal Deficiente Total Elevada 100 80 20 200 Normal 150 450 200 800 Total 250 530 220 1000 a) Qual a probabilidade de uma pessoa escolhida ao acaso naquele grupo ter pressão elevada? b) Considerando que a pessoa escolhida tem excesso de peso, qual a probabilidade dela ter pressão elevada? c) Considerando que a pessoa escolhida tem excesso de peso, qual a probabilidade dela não ter pressão elevada? Solução: Eventos: A = pressão elevada, B = pressão normal, C = excesso de peso, D = peso normal e E = peso deficiente 0)( se, )( )()|( BP BP BAPBAP ),()|()( BPBAPBAP )|(1)|( BAPBAP 5 a) P(A) = 200/1000 = 0,20, b) P(A|C) = 40,0 250 100 1000 250 1000 100 C) Eventos independentes: Dois eventos A e B são independentes se o fato de um deles ter ocorrido não altera a probabilidade de ocorrência do outro, isto é, Da regra do produto temos: ou ainda Exercícios 1) A probabilidade de que um homem esteja vivo daqui a 30 anos é 2/5; a probabilidade de que a mulher esteja viva daqui a 30 anos é 2/3. Determinar a probabilidade de que daqui a 30 anos, a) ambos estejam vivos; b) somente o homem esteja vivo; c) somente a mulher esteja viva; d) nenhum esteja vivo; e e) pelo menos um esteja vivo. Solução: Sejam os eventos a) ambos estejam vivos; b) somente o homem esteja vivo; c) somente a mulher esteja viva; d) nenhum esteja vivo; e) pelo menos um esteja vivo; Obs: 60,040,01)|(1)|( CAPCAP )()|()()|( BPABPAPBAP ou )()()()|()( BPAPBPBAPBAP )()()()|()( APBPAPABPBAP ( )P H M ( ). ( )P H P M 2 2 4 5 3 15 ( )P H M ( ). ( )P H P M 2 1 2 5 3 15 ( )P H M ( ). ( )P H P M 3 2 6 5 3 15 ( )P H M ( ). ( )P H P M 3 1 3 5 3 15 ( )P H M ( ) ( ) ( )P H P M P H M 2 2 4 6 10 4 12 5 3 15 15 15 1 ( )P H M 3 121 15 15 6 4 2 6 3( ) ( ) ( ) ( ) 1 15 15 15 15 P H M P H M P H M P H M 2) Sejam A e B eventos tais que P(A) = 0,2; P(B) = p; e P(A B) = 0,6. Calcular p considerando A e B: a) mutuamente exclusivos; b) independentes. Solução: a) mutuamente exclusivos b) independentes ( ) ( ). ( )P A B P A P B 5,0 8,0 4,0 2,08,0.6,0 2,02,016,0 p p p Partição do espaço amostral: Considere o espaço amostral particionado em i partes. Os eventos C1, C2, ..., Cn formam a partição do espaço amostral quando: a) Os eventos são disjuntos b) A união deles forma o espaço amostral Como exemplo, considere uma partição com 6 eventos como mostrado na Figura 01 a seguir. ( ) 0P A B ( ) ( ) ( )P A B P A P B ( ) ( ) ( )P B P A B P A ( ) 0,6 0,2 0,4P B ( ) ( ) ( ) ( ) ( ) ( ) ( ). ( ) ( ). 1 ( ) ( ) P A B P A P B P A B P A P B P A P B P B P A P A ,i jC C i j i j 1 n i i C 7 Probabilidade total: Seja um evento A qualquer contido em um espaço amostral particionado por Ci eventos. Por exemplo: Seja um evento A qualquer contido em um espaço amostral particionado por i, i = 1, 2, ..., 6, então, Exemplo: Das pacientes de uma Clínica de Ginecologia com idade acima de 40 anos, 60% são ou foram casadas e 40% são solteiras. Sendo solteira, a probabilidade de ter tido um distúrbio hormonal no último ano é de 10%, enquanto que para as demais essa probabilidade aumenta para 30%. Qual a probabilidade de uma paciente escolhida ao acaso ter tido um distúrbio hormonal? Solução: Eventos: C1 = paciente solteira, C2 = paciente é ou foi casada e A = paciente teve distúrbio hormonal no último ano Dados: P(C1) = 0,40, P(C2) = 0,60, P(A|C1) = 0,10 e P(A|C2) = 0,30 8 Teorema de Bayes: Suponha que os eventos C1, C2, ..., Cn, formam uma partição do espaço amostral e que suas probabilidades sejam conhecidas. Suponha ainda que para um evento A, se conheçam as probabilidades P(A | Ci) para todo i=1, 2, .., n. Então, para qualquer w, Pois, mas: , logo: Exemplo: 1) Considerando o exemplo da clínica ginecológica, se a paciente tiver distúrbio hormonal, qual a probabilidade de ser solteira? Solução: Eventos: C1 = paciente solteira, C2 = paciente é ou foi casada e A = paciente teve distúrbio hormonal no último ano Dados: P(C1) = 0,40, P(C2) = 0,60, P(A|C1) = 0,10 e P(A|C2) = 0,30 18,18% das mulheres que tiveram distúrbio hormonal são solteiras. 2) Duas imagens de duas épocas distintas foram classificadas em 3 classes: floresta (F), capoeira (C) e área agrícola (A). A fim de comparar as mudanças entre as épocas, fez-se a tabulação cruzada entre as imagens classificadas, obtendo-se a seguinte matriz de confusão (em ha): É p o c a 1 Floresta Capoeira Área Agrícola Floresta 100 0 0 Capoeira 0 150 50 Época 2 Área Agrícola 20 30 100 Selecionando-se um ponto aleatoriamente, calcule a probabilidade deste ponto: 22,030,0.60,010,0.40,0)|()()( 2 1 i ii CAPCPAP nw CAPCP CAPCPACP n i ii ww w ,...,2,1 )|()( )|()()|( 1 )|()()|()()( ACPAPCAPCPCAP wwww )( )|()()|( AP CAPCPACP www n i ii CAPCPAP 1 )|()()( n i ii ww w CAPCP CAPCPACP 1 )|()( )|()( )|( 1818,0 22,0 04,0 30,0.60,010,0.40,0 10,0.40,0 )()|( )|()()|( 2 1 11 1 i i i CPCAP CAPCPACP 9 a) ser floresta na época 1: 2667,0 450 120)( 1 FP b) ser floresta em ambas as épocas: 2222,0 450 100)( 21 FFP c) ser capoeira em qualquer época: 5111,0 450 230 450 150200180)( 21 CCP d) não ter mudado de classe entre as épocas analisadas: 212121 AACCFFP os eventos 212121 e ; AACCFF são disjuntos, logo 7778,0 450 350 450 100 450 150 450 100 212121212121 AAPCCPFFPAACCFFP e) ser capoeira na época 2, tendo sido área agrícola na época 1: 3333,0 150 50)|( 12 ACP f) ser capoeira na época 2, não tendo sido área agrícola na época 1: Teste diagnóstico A definição da doença é feita por outro teste ou critério, chamado padrão ouro. O padrão ouro tem baixíssima possibilidade de erro, mas, em geral, é um teste caro, difícil de ser feito ou causador de desconforto para o paciente. Se um teste não acerta sempre, como saber quão bom ele é? Qualidade de testes diagnósticos O bom uso de um teste diagnóstico requer, além de considerações clínicas, o conhecimento de medidas que caracterizam a sua qualidade intrínseca: a sensibilidade, a especificidade e os parâmetros que refletem a sua capacidade de produzir decisões clínicas corretas: valor da predição positiva e o valor da predição negativa. 2 1/P C A 0 150 150 120 180 300 10 Vamos usar a seguinte notação: D : o indivíduo é doente, D : o indivíduo não é doente, : o indivíduo do teste é positivo, : o indivíduo do teste é negativo. Sensibilidade: A sensibilidade, denotada por s, é definida como s = P(+ | D) ou seja, a probabilidade de o teste ser positivo sabendo- se que o paciente que está sendo examinado é doente. Que, na prática, é estimada pela proporção de resultados positivos do teste dentre os indivíduos sabidamente doentes. Especificidade: A especificidade, denotada por e, é definida como e = )|( DP , ou seja, a probabilidade de o teste ser negativo sabendo-se que o paciente examinado não é portador da doença. Que, na prática, é estimada pela proporção de resultados negativos do teste dentre os indivíduos sabidamente não doentes. Assim, um teste muito sensível é útil para detectar a presença da doença em indivíduos doentes: se o indivíduo está doente, ele vai indicar isto com alta probabilidade. Por outro lado, um teste muito específico é um teste útil para excluir a presença da doençaem indivíduos sadios: se o indivíduo não está doente, ele vai indicar isto com alta probabilidade. 904,0 809 731 2579 809 2579 731 )( )()|( DP DPDPs 848,0 1770 1500 2579 1770 2579 1500 )( )()|( DP DPDPe 11 Exemplo 2: Considere os resultados de um teste ergométrico de tolerância a exercícios entre indivíduos com e sem doença coronariana. O teste foi considerado positivo quando se observou mais de 1mm de depressão ou elevação do segmento ST, por no mínimo 0,08 s, em comparação com os resultados obtidos com o paciente em repouso. O diagnóstico definitivo foi feito através de angiografia. Os resultados encontrados seguem abaixo: Tabela 3: Resultados do teste ergométrico A sensibilidade e a especificidade são estimadas por: S = 815 / 1023 = 0,797; e = 327 / 442 = 0,740 Exemplo 3: O teste de Papanicolaou permite o diagnóstico precoce do câncer de colo de útero. Para avaliar a acurácia diagnóstica deste teste, realizou-se um estudo com 373 pacientes atendidas no Hospital das Clínicas de Botucatu (Pinho e Matos, 2002). O teste padrão-ouro utilizado em cada paciente para classificá-la em portadora ou não do câncer de colo de útero foi o exame histopatológico de uma amostra de tecido através de biópsia cervical. Os resultados são apresentados na Tabela 4. Tabela 4: Resultados do teste Papanicolaou na detecção de câncer de colo de útero S = 265 / 276 = 0,96 ou 96%; e = 50 / 97 = 0,515 ou 51,5%. Este teste tem alta sensibilidade, mas especificidade muito baixa. Valor de predição de um teste: Embora os índices sensibilidade, s, e especificidade, e, sintetizem bem a qualidade de um teste, o pesquisador em geral, não pode depender apenas de s e e, pois estes valores são provenientes de uma situação em que se tem certeza do diagnóstico. O pesquisador, diante de um resultado do teste, precisa decidir se considera o paciente doente ou não. A ele interessa conhecer as probabilidades: : valor de predição positiva : valor de predição negativa As probabilidades: )|( DPVPP pesp spVPP 11 )|( DPVPN p = prevalência da doença P = nº de doentes / nº de indivíduos pspe peVPN 11 )1( 12 Proporção de falso positivo Proporção de falso negativo Exemplo 1: Teste ergométrico VPP = 815 / 930 = 0,8763 e PFP = 1 – 0,8763 = 0,1237 VPN = 327 / 535 = 0,6112 e PFN = 1 – 0,6112 = 0,3888 No exemplo, VPP é maior que VPN, indicando que um resultado positivo no teste é mais confiável que um resultado negativo. Porém, esta afirmação é válida para um paciente de uma população semelhante à observada no exemplo, isto é, com a mesma prevalência da doença. Suponha agora um grupo maior de 2442 indivíduos dos quais 2000 com doença coronariana foram submetidos ao teste ergométrico. p = 2000 / 2442 = 0,8190 S = 0,797 e e = 0,740 Exemplo 2 (continuação): Vamos voltar ao teste Papanicolaou para diagnóstico do câncer de colo de útero apresentado anteriormente. Considerando uma população com uma prevalência de câncer de útero de 5% (p=0,05), os valores de predição positiva e negativa seriam calculados da seguinte forma: Assim, se aplicado a uma população com uma prevalência de câncer de útero de 5%, uma paciente com resultado negativo no teste Papanicolaou tem uma probabilidade muito alta (99,6%) de não ser portadora do câncer de colo de útero. No entanto, uma paciente com resultado positivo tem uma probabilidade muito pequena de ser realmente portadora da doença (9,4%). Desse modo, o resultado positivo do teste Papanicolaou é pouco conclusivo, mas o resultado negativo é muito confiável. VPPDPDPPFP 1)|(1)|( VPNDPDPPFN 1)|(1)|( 9327,0 819,01740,01819,0797,0 819,0797,0 11 pesp spVPP 4462,0 819,0797,01819,01740,0 819,01740,0 11 )1( pspe peVPN 094,0 05,01515,0105,096,0 05,096,0 11 pesp spVPP 996,0 05,096,0105,01515,0 05,01515,0 11 )1( pspe peVPN 13 Vamos considerar o VPP e o VPN do teste Papanicolaou aplicado a uma população com prevalência maior de câncer do colo do útero, digamos, p = 0,20: Note que há um aumento significativo no VPP e uma queda pequena no VPN. O Efeito da Prevalência nos Valores de Predição: Através das equações (1) e (2), reproduzidas abaixo, podemos ver que, para um determinado teste (ou seja, para valores fixos de sensibilidade e especificidade), quando maior a prevalência da doença maior será o VPP e menor será o VPN: O quadro abaixo mostra os valores de predição para prevalências de 1% e 90%. Quando a prevalência é baixa, o valor de predição positivo (VPP) é mais influenciado pela especificidade; O valor de predição negativo (VPN) é pouco influenciado, tanto pela sensibilidade quanto pela especificidade, e é alto, como era de se esperar; Para a prevalência alta, o valor de predição positivo (VPP) é próximo de 1, independente dos valores da sensibilidade e da especificidade; Além disso, o valor de predição negativo (VPN) é influenciado mais pela sensibilidade do que pela especificidade. Exemplo: Atualmente, a presença do HIV-AIDS é detectada rotineiramente pelo teste ELISA que tem sensibilidade de 95,0% e especificidade de 99,8% (Laboratório ABBOTT). Em novembro de 2002, o Laboratório OraSure lançou o teste OraQuick® (o resultado fica pronto em 20 minutos) com sensibilidade de 99,6% e especificidade de 100,0%. A Tabela 5 mostra os valores de predição positiva e negativa do diagnóstico do HIV-AIDS baseado nestes testes para crescentes níveis de prevalência da infecção. 664,0 20,01515,0120,096,0 20,096,0 11 pesp spVPP 981,0 20,096,0120,01515,0 20,01515,0 11 )1( pspe peVPN 2 11 1 1 11 pspe peVPN pesp spVPP 14 Como podemos notar, especialmente para o teste ELISA, à medida que a prevalência cresce, ocorre aumento no VPP e diminuição do VPN. Isso significa que o diagnóstico baseado no teste ELISA tem uma grande proporção de falsos positivos em populações com baixa proporção de infectados pelo HIV-AIDS, de modo que um resultado positivo deve ser investigada com repetições do teste ou com outro teste. Por outro lado, o resultado negativo tem um valor de predição muito alto mesmo em grupos de altíssima prevalência. Esta é uma característica dos testes de triagem, onde os resultados negativos devem ser altamente confiáveis, enquanto os casos positivos são triados para novos testes. No caso do teste OraQuick®, é possível observar somente um pequeno decréscimo no VPN para grupos de altíssimo risco. O VPP será sempre o valor máximo de 100% devido ao fato de que o teste identifica todas as pessoas não infectadas (especificidade igual a 100%). Tabela 5: Valores de Predição Positiva e Negativa no diagnostico do HIV-AIDSdo teste Elisa e do teste OraQuick®. Existem evidências para as seguintes conclusões: Um teste de alta especificidade deve ser usado quando a prevalência da doença é relativamente baixa (doença rara), mesmo que o teste tenha relativamente baixa sensibilidade; Um teste com alta sensibilidade deve ser usado quando a prevalência da doença é relativamente alta (doença comum), mesmo que o teste tenha relativamente baixa especificidade. Curva ROC A Curva ROC (Receive Operator Caracteristic Curve) é a melhor maneira de estabelecer o ponto de corte, otimizando a sensibilidade e especificidade do teste diagnóstico. O pesquisador deverá selecionar vários pontos ou níveis de alteração do teste e determinar a sensibilidade e especificidade em cada ponto. Ele então construirá um gráfico da sensibilidade em função da proporção dos resultados falsos-positivos. O teste ideal é aquele que alcança a extremidade mais superior e esquerda do gráfico. Uma das vantagens deste método é que as curvas de diferentes testes diagnósticos podem ser comparadas; quanto melhor o teste mais perto estará sua curva do canto superior esquerdo do gráfico abaixo. A curva ROC compara o desempenho do teste quanto aos seus valores de sensibilidade e especificidade, variando o valor de corte. Quanto mais a curva se aproxima do ponto (0,1) melhor é o exame. A área abaixo da curva pode ser uma medida do quão bom é o teste. 15
Compartilhar