Prévia do material em texto
BIOESTATÍSTICA E EPIDEMIOLOGIA FOTO CAPA RENATA CRISTOFANI MARTINS BIOESTATÍSTICA E EPIDEMIOLOGIA Renata Cristofani Martins 2021 PRESIDENTE Frei Thiago Alexandre Hayakawa, OFM DIRETOR GERAL Jorge Apóstolos Siarcos REITOR Frei Gilberto Gonçalves Garcia, OFM VICE-REITOR Frei Thiago Alexandre Hayakawa, OFM PRÓ-REITOR DE ADMINISTRAÇÃO E PLANEJAMENTO Adriel de Moura Cabral PRÓ-REITOR DE ENSINO, PESQUISA E EXTENSÃO Dilnei Giseli Lorenzi COORDENADOR DO NÚCLEO DE EDUCAÇÃO A DISTÂNCIA - NEAD Renato Adriano Pezenti GESTOR DO CENTRO DE SOLUÇÕES EDUCACIONAIS - CSE Fernando Rodrigo Andrian CURADORIA TÉCNICA Michele Lacerda Pereira Ferrer DESIGNER INSTRUCIONAL Paloma Larissa Souza Guimarães de Lima REVISÃO ORTOGRÁFICA Daniela Mandú PROJETO GRÁFICO Centro de Soluções Educacionais - CSE DIAGRAMADORES Daniel Luis Landucci Lucas Ichimaru Testa CAPA Daniel Luis Landucci © 2021 Universidade São Francisco Avenida São Francisco de Assis, 218 CEP 12916-900 – Bragança Paulista/SP CASA NOSSA SENHORA DA PAZ – AÇÃO SOCIAL FRANCISCANA, PROVÍNCIA FRANCISCANA DA IMACULADA CONCEIÇÃO DO BRASIL – ORDEM DOS FRADES MENORES RENATA CRISTOFANI MARTINS Renata Cristófani Martins possui Bacharel em Enfermagem pela Escola de Enferma- gem da Universidade de São Paulo (2005), Licenciatura Plena em Enfermagem pela Faculdade de Educação da Universidade de São Paulo (2010), mestrado e doutorado pelo Programa de Saúde Pública da Faculdade de Saúde Pública Universidade de São Paulo (2012 e 2017). Sua linha de pesquisa é epidemiologia, estatística vital e morta- lidade. Foi integrante da pesquisa “Uma nova ferramenta para a codificação e seleção automáticas da causa de morte: adequação do Software Iris para uso no Brasil” com financiamento da FAPESP. Trabalhou dois anos como enfermeira de uma Equipe de Saúde da Família e cinco anos como professora de curso técnico de enfermagem. Atu- almente é professora universitária na Universidade São Francisco nos diversos cursos da área da saúde ministrando os componentes curriculares Bioestatística aplicada à saúde, Epidemiologia, Saúde pública e Prática médica e sociedade IV. Em 2020, oi a pesquisadora responsável pelo inquérito populacional de prevalência de anticorpos para Sars-Cov-2 em Bragança Paulista (SP). A AUTORA SUMÁRIO UNIDADE 01: INTRODUÇÃO À BIOESTATÍSTICA E EPIDEMIOLOGIA ............8 1. Definição de bioestatística ..................................................................................8 2. Definição de epidemiologia .................................................................................9 3. Método de pesquisa ...........................................................................................11 4. Objeto de Aprendizagem .....................................................................................16 UNIDADE 02: COLETA, ORGANIZAÇÃO E DESCRIÇÃO DOS DADOS ............18 1. Coleta de dados ..................................................................................................18 2. Resultados ..........................................................................................................21 3. Objeto de Aprendizagem .....................................................................................28 UNIDADE 03: ESTATÍSTICA DESCRITIVA ............................................................32 1. Medidas de dispersão .........................................................................................32 2. Probabilidade ......................................................................................................38 3. Distribuição normal ..............................................................................................40 4. Anormalidades .....................................................................................................42 5. Objeto de aprendizagem .....................................................................................43 UNIDADE 04: EPIDEMIOLOGIA DESCRITIVA ......................................................48 1. Estudo transversal, de prevalência e seccional ..................................................48 2. Série ou relato de casos ......................................................................................50 3. Estudos ecológicos .............................................................................................50 4. Distribuição de eventos por pessoas, tempo e lugar ................................................. 52 5. Objeto de Aprendizagem .....................................................................................55 UNIDADE 05: INDICADORES DE SAÚDE ............................................................58 1. Conceito, histórico e características de um bom indicador ................................58 2. Incidência e prevalência ......................................................................................59 3. Indicadores de natalidade, fecundidade e morbidade .........................................64 4. Objeto de Aprendizagem .....................................................................................69 UNIDADE 06: TRANSIÇÃO DEMOGRÁFICA E EPIDEMIOLÓGICA ...................74 1. Indicadores de mortalidade ................................................................................74 2 Transição demográfica e epidemiológica .............................................................84 3. Objeto de Aprendizagem .....................................................................................88 UNIDADE 07: ESTUDOS OBSERVACIONAIS ANALÍTICOS ...............................90 1. Estudo Coorte .....................................................................................................90 2. Estudo de prognóstico .........................................................................................95 3. Estudo caso-controle ...........................................................................................97 4. Objeto de Aprendizagem .....................................................................................100 UNIDADE 08: MEDIDAS DE ASSOCIAÇÕES .......................................................102 1. Risco relativo e risco atribuível ............................................................................104 2. Razão de chances (odds ratio) ...........................................................................108 3. Análise de sobrevida ...........................................................................................111 4. Objeto de Aprendizagem .....................................................................................114 UNIDADE 09: ESTUDOS EXPERIMENTAIS .........................................................116 1. Ensaio clínico ......................................................................................................116 2. Objeto de aprendizagem .....................................................................................126 UNIDADE 10: ESTUDO DIAGNÓSTICO ................................................................128 1. Definição .............................................................................................................128 2. Medidas ...............................................................................................................131 3. Teste diagnósticos múltiplos ................................................................................141 4. Objeto de Aprendizagem .....................................................................................142 UNIDADE 11: RESULTADOS: ANÁLISE E APRESENTAÇÃO .............................144 1. Análise estatística ................................................................................................144 2. Uso de softwares .................................................................................................153 3. Apresentação dos resultados ..............................................................................1564. Objeto de Aprendizagem. ....................................................................................159 UNIDADE 12: CAUSALIDADE E SAÚDE BASEADA EM EVIDÊNCIA ................162 1. Causalidade ........................................................................................................162 2. Revisão sistemática ............................................................................................166 3. Saúde baseada em evidência .............................................................................169 4. Objeto de Aprendizagem .....................................................................................171 8 UNIDADE 1 INTRODUÇÃO À BIOESTATÍSTICA E EPIDEMIOLOGIA INTRODUÇÃO Muitas pessoas, mesmo sem saber, já usa- ram fundamentos e partes da estatística e da epidemiologia em seu dia a dia. Ao or- ganizar uma festa, por exemplo, usamos o conceito de estatística para preparar a lista de compras de comida. Se no churrasco teremos 20 convidados e, conforme as informações encontradas na internet, em média, o consumo de carne por pessoa é 100g, comprar 2kg de carne será suficiente para o evento? Saber o sexo e a idade dos convidados influencia na minha compra? Será que posso confiar na informação que eu encontrei na internet? Para responder essas perguntas, você utilizará conceitos de estatística e epidemiologia. “Estatística é a ciência que fornece os princípios e os métodos para coleta, organização, resumo, análise e interpretação de informações” (VIEIRA, 2016, p. 1). Im po rt an te ! 1. DEFINIÇÃO DE BIOESTATÍSTICA Contar, medir, comparar e resumir informações são ações que estão presentes no cotidiano de todas as pessoas, independentemente da profissão. No entanto, a forma com que esses processos são realizados influencia na qualidade da informação obtida. A mídia divulga que um em cada cinco brasileiros terão hipertensão arterial sistêmica, mas saber que essa infor- mação foi obtida em uma pesquisa com 50 indígenas no Canadá ou em uma população com 2.500 pessoas de todos os estados do Brasil mudaria o quanto você confia na informação? A estatística não se resume a números e cálculos, ela considera todo o processo desde o modo em que os dados são coletados e analisados até a forma com que eles são interpretados e divulgados. Figura 01. Estatística Fo nt e: 1 23 rf. 9 Bioestatística e Epidemiologia U1 Introdução à Bioestatística e Epidemiologia Epidemiologia é “[...] ciência que estuda o processo saúde-doença em coletividades humanas, analisando a distribuição e os fatores determinantes do risco de doenças, agravos e eventos associados à saúde, propondo medidas específicas de prevenção, controle ou erradicação de doenças, danos ou problemas de saúde e de proteção, promoção ou recuperação da saúde individual e coletiva, produzindo informação e conhecimento para apoiar a tomada de decisão no planejamento, administração e avaliação de sistemas, programas, serviços e ações de saúde”. (ROUQUAYROL; GURGEL, 2018, p. 9, grifos nossos) IM PO R TA N TE ! 2. DEFINIÇÃO DE EPIDEMIOLOGIA Historicamente, a epidemiologia conta sobre os eventos relacionados à saúde, como nas- cimentos, casos de doenças e mortes. Um exemplo clássico se refere a John Snow, o pai da Epidemiologia moderna, que, no século XIX, investigou a epidemia de cólera em Lon- dres, avaliando os casos e onde eles aconteceram para que, a partir dessas informações, conseguisse propor hipóteses causais e estratégias para reduzi-los. Esse marco amplia a atuação da epidemiologia para investigações sistemáticas de eventos com a finalidade de levantar hipóteses, definir meios de transmissão da doença e estratégias de ação Com o passar do tempo, a epidemiologia ampliou seu objeto de estudo para além das doenças transmissíveis, investigando o processo saúde-doença. Dessa forma, começa a busca por fatores de risco ou fatores determinantes para acontecimento de especí- ficas doenças, como o câncer, por exemplo. Nesse sentido, estrutura-se desenhos de estudos que possibilitam definir fatores causais. 2.1 CONCEITOS BÁSICOS Para responder uma questão de estudo, uma parte importante da pesquisa se refere à composição e definição das variáveis do estudo. Variáveis são valores ou informações obtidas diretamente ou podem ser resultado de um agrupamento, classificação ou cálculo de medidas coletadas. Elas podem ser características individuais, determinantes do processo saúde-doença, fatores de risco, eventos clínicos e desfechos, como morte, presença de doença, deficiência, sintomas e qualidade de vida. A epidemiologia classifica as variáveis de um estudo típico em três tipos, de acordo com Fletcher et al. (2014, p. 6), uma variável independente é o suposto fator de risco ou causa que se estuda, ela pode explicar a causa do problema; uma variável dependen- te, por sua vez, é o suposto desfecho ou efeito que se estuda, ela mede o fenômeno que se quer explicar, pode sofrer influência das variáveis independentes, como a rela- ção entre cigarro e câncer de pulmão. Segundo Pereira (2004, p. 46), nesse caso, a variável dependente seria o câncer de pulmão, pois sua presença pode ser influenciada pela variável independente cigarro. Por fim, uma variável externa não faz parte direta da questão principal, mas pode estar relacionada e afetar a relação entre a variável independente e dependente. Um fator de confusão é um exemplo de variável externa. U1 10Bioestatística e Epidemiologia Introdução à Bioestatística e Epidemiologia A qualidade de uma pesquisa é avaliada a partir da presença de erros cometidos. Nes- se contexto, viés é um erro sistemático e ao delinear o projeto é preciso pensar em estratégias metodológicas que diminuam a chance desse erro acontecer. Existem três principais tipos de vieses: o viés de seleção, viés de aferição e viés de con- fusão ou de confundimento. O primeiro, ocorre quando se comparam grupos com ca- racterísticas diferentes que não são as variá- veis principais, mas que influenciam no des- fecho. Isso acontece porque a seleção da amostra foi falha é que alguma característica não foi considerada, por exemplo, ao fazer uma pesquisa sobre uma possível medicação que emagrece, a pesquisa não considerou o grau de atividade física dos sujeitos. Então, aqueles que tomaram o remédio e emagreceram podem ser fisicamente ativos e os que não tomaram a medicação sejam sedentários. Como a seleção da amostra nos grupos não considerou a atividade física, não é possível considerar que o emagrecimento de fato foi por causa da medicação, pois foram comparados grupos com características diferentes. Figura 02. Variáveis e vieses de pesquisa Fo nt e: 1 23 rf. O viés de aferição ocorre quando o erro é na aferição de alguma variável, como usar uma balança não calibrada, realizar a técnica incorreta de aferição da pres- são arterial ou usar equipamentos diferentes para aferir alguma variável. O viés de confusão ou de confundimento ocorre quando duas variáveis po- dem influenciar o efeito que uma tem sobre um desfecho ou quando se con- funde qual variável influencia no desfecho. Desse modo, será que uma variável realmente causa o desfecho ou essa associação não existe e a verdadeira causa na verdade é outra variável? Um fator de confusão está associado à exposição, ele deve ter uma associação causal com o desfecho e não deve ser uma etapa do caminho da exposição gerar o desfecho. Por exemplo, uma pesquisa demonstra uma associação de depressão como fator cau- sal para ter câncer de pulmão. Nesse contexto, um fator de confundimento é o tabagismo, pois fumar causa câncer de pulmão e fumar está associado à depressão, pois esse é um hábito apresentado frequentemente em pacientes com câncer de pulmão. Portanto, o viés de confusão ocorre com a variável tabagismo, que impacta da associação principal da pesquisa, depressão e câncer de pulmão. 11 Bioestatística e Epidemiologia U1 Introdução à Bioestatística e Epidemiologia3. MÉTODO DE PESQUISA Uma pesquisa tem várias etapas, logo, ao desenvolver o método que será utilizado na coleta e análise dos dados devemos realizar diversas escolhas. Essas decisões devem ser feitas com o objetivo de melhorar a qualidade da pesquisa, mas, como nem sempre isso é possível, o pesquisador pode ser obrigado a escolher a opção mais viável e não a mais adequada. Para ajudar na decisão do pesquisador é importante saber as vantagens e desvan- tagem de cada possibilidade. Assim, ter o conhecimento de quais são os possíveis vieses que podem acontecer são conhecimentos essenciais para desenhar o estudo de maneira a contornar as dificuldades. IM PO R TA N TE ! 3.1 AMOSTRAGEM Uma das primeiras etapas ao realizar ou avaliar uma pesquisa é decidir quem serão os participantes. Por exemplo, considere que você se deseja realizar uma pesquisa sobre a frequência do uso de drogas, lícitas e ilícitas, nos universitários que moram no Brasil. Pela facilidade de acesso, você aplica um questionário com os estudantes da Univer- sidade São Francisco (USF) que estão cursando o componente curricular de Bioesta- tística e Epidemiologia. Nesse contexto, realizar a coleta de dados dessa maneira trará resultados confiáveis e compatíveis com o objetivo da pesquisa? Na pesquisa, considera-se população o grupo de pessoas que tem a característica que desejamos estudar, já a amostra é composta pelos indivíduos que foram selecionados para a pesquisa (VIEIRA, 2016, p. 91). No exemplo da pesquisa sobre drogas, a po- pulação é: todos os universitários que moram no Brasil e a amostra é: todos os alunos que responderam ao questionário. Uma amostra pode ser adequada se for capaz de fornecer resultados similares aos que existem na população. Na maioria dos casos, usa-se uma amostra principalmente pela economia do tempo e custo, como não é viável fazer exame laboratorial em todos os moradores da cidade para saber a proporção de munícipes que tem alguma doença. Segundo Viera (2016, p. 92-93), as pesquisas que realizam levantamento de dados de toda a população são chamadas de censo e não precisam de amostragem. Outro motivo para usar amostras é em ca- sos em que não é possível estudar toda a população. Por exemplo, você deixou uma embalagem de leite aberta a noite inteira fora da geladeira e, agora, precisa saber se o leite já estragou. Se a análise da qualidade for feita com todo o conteú- do do pacote, mesmo que o resultado seja que é possível consumir o leite, não seria possível realizar isso já que todo o produto foi utilizado no teste. Nesse caso, é obrigatório o uso de uma amostra de pequena quantidade do produto para que, se possível, utilizar o restante. Figura 03. Amostragem Fo nt e: 1 23 rf. U1 12Bioestatística e Epidemiologia Introdução à Bioestatística e Epidemiologia O uso de amostra tem um valor científico impactante, pois, ao usar menos sujeitos é possível coletar dados mais completos. Se a amostragem foi realizada corretamente, os valores reais que devemos encontrar na população estarão dentro de uma margem de erro do valor encontrado na amostra (VIEIRA, 2016, p. 93-94). As características das pessoas da amostra impactam na qualidade do resultado. Por isso, as descrições dos sujeitos da pesquisa e de todas as etapas de seleção desses indivíduos são essenciais para avaliar a qualidade dos resultados. IM PO R TA N TE ! Métodos amostrais É possível obter uma amostra por diversos métodos. Assim, escolher qual método utilizar é uma decisão dos pesquisadores a partir de suas características, vantagens e desvanta- gens. Logo, é de extrema importância que o método seja seguido exatamente como defi- nido e que sua descrição permita que ele seja reproduzido. Nesse sentido, muitas pessoas comparam os métodos de uma pesquisa com uma receita culinária, em que é preciso deixar claro todas as etapas para que outros consigam realizar e chegar no mesmo resultado. Uma amostra probabilística ou aleatória é quando a seleção dos sujeitos de pesqui- sa é feita ao acaso. Na prática, isso significa que a seleção foi feita por sorteio. Nessa técnica, um princípio importante é que todos os indivíduos da população têm a mesma probabilidade conhecida de participarem da amostra. Para que ela possa ser executada é necessário conhecer e identificar toda a população. Considere uma pesquisa da cidade de Votorantim (SP), com o objetivo de investigar quais são as medicações que os residentes com diabetes mellitus usam. Nesse caso, a população se trata dos diabéticos que moram na cidade. Seria possível ter conhecimento de quem são todos indivíduos da população antes de realizar o sorteio? Ainda não temos um cadastro obri- gatório e único com informações de saúde da população, independentemente de as pessoas serem ou não usuárias do Sistema Único de Saúde (SUS). Por não ser possível listar todos os diabéticos da cidade, não é possível obter uma amostra aleatória para essa pesquisa. A amostra pode ser aleatória simples quando o sorteio acontece a partir de toda a popu- lação. Esse método é utilizado quando a população é homogênea e não existem caracte- rísticas individuais que irão atrapalhar a análise dos dados. Porém, há casos que alguns subgrupos podem ter características diferentes que influenciem nos dados coletados. Ao fazer uma avaliação sobre a disciplina Estudo do Ser Humano Contemporâneo da USF, pode-se considerar que os estudantes terão avaliações similares independente do curso ou área de conhecimento que cursam? Nesse contexto, podemos supor que os alunos da área de humanas devem gostar mais da disciplina do que os alunos de exa- tas, portanto, a população não é homogênea. Em casos como o descrito anteriormente, a amostra pode ser aleatória estratificada. Esse método é usado quando a população tem subgrupos (estratos) que podem ter comportamentos diferentes. 13 Bioestatística e Epidemiologia U1 Introdução à Bioestatística e Epidemiologia Para selecionar a amostra, deve-se dividir a população nos subgrupos e sortear os su- jeitos em cada estrato, desse modo, podemos garantir a representação de cada subgru- po. Normalmente, os estratos são sexo, idade e/ou classe social, mas eles podem ser divididos conforme as características da população. A distribuição do número de partici- pantes da pesquisa em cada extrato deve ser proporcional a distribuição dos subgrupos na população. Se a população é distribuída com 30% sexo masculino e 70% feminino, uma amostra estratificada de 10 indivíduos deve selecionar 7 mulheres e 3 homens. Exemplo 1 Considere uma pesquisa com o objetivo de avaliar a proporção de pessoas com depressão entre os estudantes matriculados na Universidade São Francisco. Entre 10.350 estudantes, 33% são bolsistas. Para obter resultados significativos será necessária uma amostra com 75 pessoas. Uma amostra aleatória simples seria obtida a partir do sorteio de 75 pessoas entre os 10.350 estudantes. Já uma amostra aleatória estratificada seria obtida dividindo a população entre bolsistas e pagantes, depois sorteando 50 pessoas entre os pagantes e 25 entre os bolsistas para manter a proporção com a população. Uma amostra semiprobabilística tem parte do processo de seleção aleatório. A amostra sistemática tem regras pré-estabelecidas que devem ser seguidas sistematicamente. A parte aleatória acontece por meio de um sorteio que indica o valor que deve ser sor- teado e repetido sistematicamente. Para utilização desse método, é necessário que a população esteja distribuída em ordem e, por isso, esse é um método comum para seleção de prontuários. A primeira etapa é dividir a população em grupos, em que o número de grupos deve ser igual ao número de indivíduos na amostra. A segunda etapa se trada de sortear um número dentro de uma faixa de valor que é definida pelo número de pessoas em cada grupo. Após o sorteio, deve-se selecionar a pessoa que ocupa a posição sorteada em cada grupo. Se a população é de 250 pessoas e se desejauma amostra de 10 indivíduos, a amostra sistemática será a seleção da sétima pessoa de cada grupo considerando que o sorteio de 1 a 25 deu 7. A amostra por conglomerados seleciona grupos de pessoas definidos por algum moti- vo que são encontrados na população, como um município, uma clínica ou uma escola. Nesse caso, o sorteio não é dos sujeitos e sim dos conglomerados. Para utilização desse método, o pesquisador deve ter acesso a todos os conglomerados possíveis, ou o pesqui- sador corre o risco de ter uma amostra que não tem acesso. A vantagem dessa amostra é concentrar a coleta em menos locais, em vez de sortear entre todas as internações do município e correr o risco de ter que coletar dados em múltiplos hospitais, com esse mé- todo é possível sortear o conglomerado e realizar a pesquisa em um único local. Em alguns casos, mais de um método amostral é utilizado. Isso acontece frequente- mente quando o primeiro método é por conglomerado, pois, dentro de um conglome- rado pode ter uma quantidade maior do que a necessária. Então, utiliza-se de outro método para uma seleção dos indivíduos dento do conglomerado selecionado. A amostra por cotas seleciona com o objetivo de garantir representatividade e propor- ção igual a população, a lógica desse método é similar a cotas de vagas para acesso U1 14Bioestatística e Epidemiologia Introdução à Bioestatística e Epidemiologia aos processos seletivos. A amostra é dividida garantindo vagas para pessoas com ca- racterísticas diferentes, em que os grupos de cotas são similares aos estratos, frequen- temente divididos por sexo, idade e/ou classe social. O preenchimento das vagas é por acesso, desse modo, nesse método não existe sorteio. Nesse contexto, é comum que o entrevistador fique em locais de alto movimento para tentar encontrar pessoas que pre- encham as características das cotas. Essa é uma estratégia muito utilizada em razão de sua praticidade e baixo custo. Exemplo 3 Exemplo 2 Considere uma pesquisa com o objetivo de avaliar a proporção de pessoas com depressão entre os estudantes matriculados na Universidade São Francisco. Entre 10.350 estudantes, 33% são bolsistas. Para obter resultados significativos será necessária uma amostra com 75 pessoas. Uma amostra de conveniência seria obtida distribuindo o questionário on-line para todos os estudantes por meio de grupos de redes sociais. Considere uma pesquisa com o objetivo de avaliar a proporção de pessoas com depressão entre os estudantes matriculados na Universidade São Francisco. Entre 10.350 estudantes, 33% são bolsistas. Para obter resultados significativos será necessária uma amostra com 75 pessoas. Uma amostra sistemática seria obtida sorteando um número de 1 a 138 (considere que o resultado foi o número 84). A amostra será a octogésima quarta pessoa de cada grupo de 138 pessoas. Já uma amostra por conglomerados seria obtida sorteando uma sala de aula e os participan- tes da pesquisa seriam quem assiste aula nesse local. Uma amostra por cotas teria 50 vagas para pagantes e 25 vagas para bolsistas. Para realizar a pesquisa, o pesquisador poderia ficar na entrada principal da universidade e perguntar para cada aluno se eles eram bolsistas ou pagantes. As primeiras pessoas que preenchessem os critérios seriam selecionadas. A amostra de conveniência ou não probabilística é composta por pessoas que o pesquisador tem fácil acesso. Nesse método, não existe sorteio ou alguma etapa que garanta aleatoriedade e representatividade da população. Ele é similar ao método amostral por cotas, em que a diferença é que, por conveniência, não há os grupos de características específicas. Essa é uma das estratégias mais utilizadas por ser muito prática e barata, normalmente, os profissionais que desenvolvem pesquisa usam esse método ao fazerem a pesquisa somente com os seus pacientes. Pessoas leigas podem explicar esse método descrevendo que a seleção das pessoas ocor- reu ao acaso, conforme encontravam as pessoas na rua. Para estatística, o termo acaso está relacionado à aleatoriedade de um evento acontecer e não a ausência de método de coleta. 15 Bioestatística e Epidemiologia U1 Introdução à Bioestatística e Epidemiologia Tamanho da amostra A vantagem da amostra é não precisar avaliar a população inteira. Entretanto, o tama- nho da amostra tem que ser pequeno para otimizar tempo e recursos, mas grande o su- ficiente para ter significância estatística. Quanto maior o tamanho da amostra, maiores as chances dos valores encontrados (estimativas) serem próximos aos valores reais en- contrados na população (parâmetros). Para saber se um novo tratamento é eficaz, não se pode avaliar somente 10 pessoas, é preciso de um número suficiente que consiga garantir que o que foi observado não é uma exceção. Desse modo, para saber o tamanho ideal existem cálculos que definem o número ideal para a amostra ter significância e qualidade. De acordo com a situação, pode-se utilizar fórmulas diferentes. Normalmente, os critérios que precisam ser definidos ao fazer o cálculo são: margem de erro, nível de confiança e proporção na população. 3.2 INFERÊNCIA ESTATÍSTICA Uma vez que se obtém os resultados é preciso avaliar a qualidade deles e o quanto é possível usá-los para supor que é assim que eventos acontece na população. Então, primeiramente, avalia-se a validade interna que define a grau que os resultados represen- tam a amostra. Um bom estudo sem vieses e erros sempre tem alta validade interna. Por sua vez, a validade externa define o quanto o resultado pode representar a população. Nesse sentido, chama-se de inferência estatística a ação de generalizar os resultados da sua amostra para a população. Para fazer a inferência é necessário avaliar as carac- terísticas da amostra e refletir se ela é representativa da população. Uma amostra é tendenciosa quando suas características não são similares a popula- ção. Dessa forma, toda amostra tendenciosa ocorre por viés de seleção. Uma pesquisa sobre uso de drogas entre brasileiros teve uma amostra somente de alunos universitá- rios. Com os dados obtidos não é possível concluir que todos os brasileiros se compor- tam como na amostra. Portanto, para utilizar os resultados da pesquisa para embasar sua conduta profissio- nal, o estudo tem que ter alta validade interna e externa. Ela não pode ter vieses e uma amostra tendenciosa. Procure nos artigos científicos se os autores deixam claro o método amostral utilizado. Será que descrever como foi feita a seleção facilita a avaliação de validade da pesqui- sa e da presença de vieses? Sem a descrição do método amostral é possível definir a presença de viés de seleção? PA R A R EF LE TI R U1 16Bioestatística e Epidemiologia Introdução à Bioestatística e Epidemiologia 4. OBJETO DE APRENDIZAGEM Faça um quadro comparativos dos diferentes métodos amostrais MÉTODO AMOSTRAL CARACTERÍSTICA VANTAGEM DESVANTAGEM EXECUÇÃO Aleatória Simples Estratificada Sistemática Por conglomerados Por cotas Conveniência 17 Bioestatística e Epidemiologia U1 Introdução à Bioestatística e Epidemiologia REFERÊNCIAS BIBLIOGRÁFICAS FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. Epidemiologia clínica: elementos essenciais. 5. ed. Porto Alegre: ArtMed, 2014. PEREIRA, J. C. R. Análise de dados qualitativos: estratégias metodológicas para as ciências da saúde humanas e sociais. São Paulo: Edusp, 2004. ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia e saúde. 8. ed. Rio de Janeiro: Medbook, 2018. VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016. 18 UNIDADE 2 COLETA, ORGANIZAÇÃO E DESCRIÇÃO DOS DADOS Figura 01. Tipos de variáveis VARIÁVEIS QUALITATIVAS OU CATEGÓRICA NOMINAL ORDINAL DISCRETA CONTÍNUA QUANTITATIVA OU NUMÉRICA Fonte: elaborada pela autora. INTRODUÇÃO Uma parte importante para avaliar a qualidade da pesquisa é ter uma adequada coleta dos dados. Qual informação coletar, como aferir e qual instrumento utilizar sãodefini- ções importantes que um pesquisador deve fazer. Desse modo, toda escolha influencia na qualidade e nas análises utilizadas, mas não basta somente coletar corretamente, é preciso transmitir os dados e resumir as informações. 1. COLETA DE DADOS Ao desenhar uma pesquisa é preciso definir quais variáveis coletar e como conduzir esse processo. As variáveis são as informações de interesse que a pesquisa pretende estudar e suas características influenciam nas análises estatísticas que serão realiza- das que, por sua vez, definem os resultados. A classificação estatística das variáveis está esquematizada na Figura 1, em que as va- riáveis qualitativas ou categóricas são expressadas por categorias mutualmente exclu- dentes. Por exemplo, sexo é uma variável qualitativa porque a reposta é por categoria (masculino ou feminino) e só é possível ter uma resposta possível. A variável qualitativa pode ser ordinal quando as categorias possuem uma ordem na- tural. A ordenação é um consenso e não pode estar associada a juízo de valor pessoal. Uma pesquisa de satisfação que tem toda pergunta estruturada com as possibilidades de resposta: ruim, satisfatório e bom. Essa é uma variável qualitativa, pois as respostas são categorias e é ordinal porque as respostas têm uma ordenação. Um questionário fechado tem as possíveis respostas em ordem, mas isso não quer dizer que exista uma ordem natural nas respostas para classificá-la como ordinal. Nesse contexto, podemos 19 Bioestatística e Epidemiologia U2 Coleta, organização e descrição dos dados apresentar outros exemplos como escolaridade (ensino infantil, fundamental, médio e superior) e tamanho do edema (1+, 2+, 3+, 4+). A variável qualitativa pode ser nominal quando as categorias não têm uma distribuição ordinal. Uma grande parte das variáveis são desse tipo. Na declaração de nascido vivo, por exemplo, a variável tipo de parto é coletada com possibilidades de resposta: cesáreo, vaginal e ignorado. Apesar das evidências científicas e do juízo de valor que parto vaginal é melhor, a ordenação não é natural e, portanto, tipo de parto é uma variável qualitativa nominal. Além disso, são outros exemplos de variável qualidade nominal: município de residência ou droga ilícita utilizada (maconha, cocaína, crack, LSD, entre outras). Ademais, algumas variáveis qualitativas nominais podem, também, ser dicotômicas. Isto é, quando só há duas respostas possíveis e que elas são excludentes, por exemplo: faz uso de tabaco (sim/não), presença ou ausência de pressão alta. Normalmente, as respostas desse tipo de variáveis são sim e não. As variáveis quantitativas ou numéricas são expressas por números com intervalos entre os valores iguais, por exemplo, peso e altura. Por sua vez, o grau de estadiamen- to, apesar de ter respostas numéricas (estadiamento I, II, III e IV), não é uma variável quantitativa porque os intervalos entre os graus não são conhecidos. As variáveis quantitativas podem ser discretas quando as respostas são valores ou uma faixa de valores possíveis. Geralmente, essas respostas apresentam números in- teiros e resultados de uma contagem. Por exemplo, número de partos é uma variável quantitativa, em que o resultado é numérico, e é discreta, porque a pessoa contou quan- tos partos teve e não se pode ter metade de um parto. Por fim, a variável quantitativa contínua pode ter números decimais e resultados são obtidos por aferição. O peso de cada sujeito da pesquisa é aferido em uma balança e tem a possibilidade de um resultado decimal, 75,1 kg. Dessa forma, todo exame laboratorial de análises clínicas são variáveis quantitativas contínua, pois os resultados são sempre uma proporção. 1.1. DESEMPENHO DAS AFERIÇÕES Como e com quais instrumentos a coleta de dados foi realizada influencia na qualidade da pesquisa. Por isso, vários instrumentos têm seus desempenhos avaliados para jul- gar o quanto eles conseguem aferir. A validade avalia a capacidade de um instrumento medir o que se propõe a medir. Esse conceito, por sua vez, é similar ao conceito de acurácia que mede o quanto os dados aferidos representam a realidade. A confiabilidade está relacionada com a precisão e reprodutibilidade do instrumento, avaliando o quão próximos as aferições estão repe- tidas. A responsividade avalia se o instrumento consegue registrar mudanças após alteração clínica do quadro. Já a interpretabilidade avalia o grau de dificuldade de interpretar os dados e, também, avalia o intervalo de variação que o instrumento conse- gue medir e a capacidade de registrar alterações extremas. U2 20Bioestatística e Epidemiologia Coleta, organização e descrição dos dados Figura 02. Precisão e acurácia de quatro instrumentos diferente considerando que o local correto a ser acertado é o meio do desenho Fonte: elaborada pela autora. Os dois principais critérios para avaliar a qualidade de um instrumento são: a precisão e a acurácia. Para compreender melhor os conceitos, avalie a Figura 2. Considere que cada instrumento aferiu quatro vezes e que o valor que eles deveriam acertar está no centro do desenho, desse modo, quais instrumentos têm alta precisão e acurácia? Após analisar a Figura 2, o instrumento amarelo se mostra impreciso e tem baixa vali- dade; o instrumento verde, por sua vez, é preciso porque as aferições estão próximas, mas tem baixa validade já que estão longe do centro; o instrumento azul tem precisão e acurácia intermediárias; por fim, o instrumento vermelho tem alta precisão e acurácia. As escalas são ferramentas utilizadas por muitos profissionais da saúde para avaliar características dos indivíduos e os fatores determinantes de saúde, como o Mini Exame do Estado Mental (MEEM). Essas escalas ao serem criadas, traduzidas ou adaptadas para diferentes populações devem passar por uma avaliação de validade de conteúdo, de critério e de construto. A validade de conteúdo refere-se à capaci- dade que a escala tem de abranger todos os aspectos do problema a ser medido, assim como a clareza na medição do problema. A validade de critério, por outro lado, compara os resultados do teste em questão com outros exames ou características mensuráveis. Segundo Pasquali (2009), a validade de construto leva em consideração a consistência interna (correlação entre cada item e o restante dos itens da escala) e a capacidade do instrumento em medir uma variável latente (um construto que não pode ser medido diretamente). 21 Bioestatística e Epidemiologia U2 Coleta, organização e descrição dos dados 2. RESULTADOS Os dados são os valores ou as respostas obtidas. A análise dos dados começa com a estatística descritiva na qual a principal função é o resumo e a descrição das infor- mações obtidas. As variáveis qualitativas são resumidas com frequência absoluta e relativa de cada categoria de resposta. As variáveis quantitativas, normalmente, são resumidas com medidas de tendência central e medidas de dispersão. Frequência absoluta e relativa A frequência absoluta é a contagem dos casos de cada categoria da variável. Por exemplo, na variável sexo, a frequência absoluta é de 18 para os homens e 36 para as mulheres. A frequência relativa é uma proporção resultante de uma divisão. A frequ- ência relativa pode ser apresentada por coeficientes, taxas, porcentagens e índices. Ao resumir dados das variáveis qualitativas é comum expressar a frequência relativa em porcentagem após a menção da frequência absoluta. Fórmula de cálculo de frequência relativa por porcentagem: 1 00 frequencia absoluta tamanhoda amostra × 1 EX EM PL O Considere uma amostra de 54 pessoas, das quais 36 são mulheres e 18 são homens. O cálculo da frequência relativa em porcentagem para cada respos- ta dos homens é: 1 00 frequencia absoluta tamanhoda amostra × substituir a fórmula com os dados. 18 1 00 54 = × fazer a divisão (18 ÷ 54). 0,3333 1 00= × fazer a multiplicação. 33,33%= Já nas mulheres, temos: 36 1 00 100 0,6667 1 00 66,67% 54 frequencia absoluta tamanhoda amostra × = × = × = U2 22Bioestatística e Epidemiologia Coleta, organização e descrição dos dados Ao descrever variáveis quantitativas, a utilização da frequência para cada pos- sibilidade de resposta pode não resumir os dados. A dificuldade em realizar uma frequência simples é que dados quantitativos frequentemente têm diversas res- postas, não agrupando os dados e resumindo as informações. Para esses casos, recomenda-se a utilização de frequência agrupada, na qual criam-se agrupamen- tos de categorias de dados. Os agrupamentos de categorias de dados poder ser definidos, a partir da distri- buição dos dados da amostra ou de critérios predefinidos. Assim, é comum para idade de adultos distribuir em faixas de 20 a 29 anos ou de 30 a 39 anos. O inter- valo de valores deve ser igual em todas as faixas. Desse modo, é importante que as categorias criadas tenham uma sequência que garanta que todo número esteja incluso em somente uma única categoria. Por exemplo, se existem as categorias de 20 a 30 anos e de 30 a 40 anos, um sujeito com 30 anos pode erroneamente ser incluído em duas categorias. O exemplo a seguir mostra que a distribuição agrupada é mais adequada para variáveis quantitativas. Os dois tipos de frequência podem ser apresentados ao longo do texto, confor- me exemplo acima. Outra opção é descrever, no texto, usando o número abso- luto seguido da porcentagem entre parênteses, por exemplo, quanto a sexo 36 (66,67%) eram mulheres. Além disso, há a possibilidade de realizar uma tabela de distribuição de frequência, em que ela é organizada com três colunas, a primeira que terá as possibilidades de respostas, a segunda que terá a frequência absoluta (as vezes abreviada como “N”) e a terceira que terá a frequência relativa (normalmente, abreviada com “%”). A primeira linha da tabela mostra os títulos de cada coluna e a última linha é o Total, conforme a tabela a seguir. Tabela 01. Tabela de distribuição de frequência SEXO FREQUÊNCIA ABSOLUTA (N) FREQUÊNCIA RELATIVA (%) Feminino 36 66,67% Masculino 18 33,33% Total 54 100% Fonte: elaborada pela autora. 23 Bioestatística e Epidemiologia U2 Coleta, organização e descrição dos dados No cotidiano das secretarias de saúde, os dados do número de casos das doenças de notificações compulsórias são divulgados, portanto, é importante que em qualquer divulgação de dados seja utilizada frequência absoluta e relativa. Uma pesquisa entrevistou 8 universitários com os dados descritos na tabela a seguir. Crie uma tabela de distribuição simples e agrupada de frequência absoluta (N) e rela- tiva (%) da variedade idade. IDADE 20 21 57 40 23 20 21 21 Distribuição simples IDADE N % 20 2 2 100 0,25 100 25% 8 × = × = 21 3 3 100 0,375 100 37,5% 8 × = × = 23 1 1 100 0,1225 100 12,25% 8 × = × = 40 1 1 100 0,1225 100 12,25% 8 × = × = 57 1 1 100 0,1225 100 12,25% 8 × = × = Total 8 100% Distribuição agrupada IDADE N % 20 a 39 anos 6 6 100 0,25 100 75% 8 × = × = 40 a 59 anos 2 2 100 0,25 100 25% 8 × = × = Total 8 100% EX EM PL O U2 24Bioestatística e Epidemiologia Coleta, organização e descrição dos dados Ao realizar qualquer cálculo das medidas de tendência central é importante que todos os dados coletados sejam analisados. Então, mesmo que existam valores repetidos, todas as observações devem participar dos cálculos. IM PO R TA N TE ! Nesse sentido, a medida de tendência mais tradicional é a média aritmética. Por sua vez, ela é obtida somando todos os valores dos dados e depois dividindo a soma pelo número de dados observados. Fórmula da média: 2 xx n ∑ = ou soma dos dadosMédia númerodedados = A frequência absoluta tem como principal função demonstrar o impacto que aquele agravo, evento ou desfecho tem na sociedade. Outra aplicabilidade é que, a partir dos números de casos, os serviços de saúde podem planejar atendimentos e possíveis demandas. Sobre a pandemia de covid-19, por exemplo, divulgar o número de mortes diários causou uma comoção entre os brasileiros e, também, fez com que os municípios se preparassem para o suporte de estrutura e insumos que será necessário para os atendimentos. Já a frequência relativa tem como principal função comparar. O número de óbitos total por covid-19 em 9 de fevereiro de 2021 nos Estados Unidos da América (EUA) foi de 459.993 e no Reino Unido foi 112.798. Somente utilizando o número absoluto de casos, o EUA parece estar pior na pandemia por causa do maior número de casos. Agora ao complementar as informações com a frequência relativa, a comparação fica melhor. Com esse mesmo exemplo, a proporção de mortes por co- vid-19 por 1 milhão de habitantes no Reino Unido é de 1.661,58 e nos Estados Unidos da América é de 1.389,7. Por isso, cabe reforçar que para qualquer comparação é ne- cessário usar alguma frequência relativa. 2.2 MEDIDAS DE TENDÊNCIA CENTRAL Na descrição e resumo das variáveis quantitativas, frequentemente, utiliza-se no míni- mo uma medida de tendência central e uma medida de dispersão. As medidas de ten- dência central definem um ponto dentro do conjunto amostral que resume os dados. 25 Bioestatística e Epidemiologia U2 Coleta, organização e descrição dos dados Em que: x = um dado. ∑ = somatória. x∑ = somatória de todos os dados. n = número de dados. CÁLCULO MÉDIA Uma pesquisa entrevistou 8 universitários com os dados descritos na tabela a seguir. IDADE 20 21 57 40 23 20 21 21 Média: x soma dos dadosx n númerodedados ∑ = = 20 20 21 21 21 23 40 57 8 + + + + + + + = Portanto, a média desses dados é 27,88 anos. EX EM PL O – C Á LC U LO M ÉD IA Nesse exemplo, considere que, na amostra de 8 pessoas, o pesquisador seja incapaz de coletar a idade de um sujeito. Nesse caso, o número de dados é 7, que é a informações que se deve colocar na parte de baixo na fórmula, já que só tem idade de sete indivíduos. A mediana é a segunda medida de tendência central. O seu valor divide o conjunto de dados ordenados no meio, isso significa que metade das observações tem valores abaixo da mediana e metade acima. = 27,88 223 8 = substituir a fórmula com os dados. somar os valores. .......................................................... realizar a divisão. U2 26Bioestatística e Epidemiologia Coleta, organização e descrição dos dados Para calcular a mediana, a primeira etapa é organizar os dados em ordem crescente (do menor para o maior). A segunda etapa é en- contrar em qual local é o ponto de corte para dividir o conjunto ao meio. Quando o número de dados for ímpar, a mediana será um valor do conjunto. Conjunto A: {2,6,12,17,21} tem cinco observações (número ímpar), portanto, a mediana é valor do conjunto. Consideran- do que ele já está ordenado, o valor que está na posição central e consegue dividir o con- junto em dois grupos de dois é o 12. Logo, a mediana do conjunto A é 12. Quando o número de dados for par, a me- diana será a média dos dois valores centrais. Como será sempre uma média de dois valores, a conta será sempre igual, primeiro deve-se somar os valores centrais e depois dividir a soma por 2. Conjunto B: {7, 9, 13, 15} tem número quatro observações (número par), portanto, a mediana é a média dos dois valores centrais. Considerando que ele já está ordena- do, a posição central que consegue dividir o conjunto em dois grupos de dois é um valor entre 9 e 13. Para calcular a mediana, nesse caso, é preciso fazer a média entre 9 e 13. Assim, o cálculo da mediana será soma dos dados númerodedados = 9 13 2 + = 22 11. 2 = Ou seja, a mediana do conjunto B é 11. Figura 03. Distribuição de dados Fo nt e: 1 23 rf. Cálculo mediana Uma pesquisa entrevistou 8 universitários com os dados descritos na tabela a seguir. IDADE 20 21 57 40 23 20 21 21 Mediana 1) Colocar em ordem crescente: 20 20 21 21 21 23 40 57. 2) Número par de observações (oito).3) Achar os valores centrais: 21 e 21. 4) Realizar o cálculo: 21 21 2 + = 42 21 2 = . A mediana desses dados é 21 anos. EX EM PL O 27 Bioestatística e Epidemiologia U2 Coleta, organização e descrição dos dados A terceira medida de tendência central é a moda. A moda é o dado mais frequente, ou seja, dentro do conjunto é o valor que mais se repete. É possível que um conjunto tenha mais do que uma ou não tenha moda. Para facilitar reconhecer qual é a moda, pode-se fazer uma análise de frequência absoluta antes ou ordenar o conjunto para ficar mais fácil conseguir reconhecer os valores repetidos. Cálculo moda Uma pesquisa entrevistou 8 universitários com os dados descritos na tabela a seguir. IDADE 20 21 57 40 23 20 21 21 Moda: faça uma contagem (frequência absoluta) dos dados. A idade que mais se repete é 21, com três votos. IDADE 20 21 23 40 57 TOTAL N 2 3 1 1 1 8 Logo, a moda desses dados é 21 anos. EX EM PL O A média é influenciada pelos valores dos dados. Desse modo, se no conjunto de obser- vações tiverem valores extremos, ou seja, distante de onde a maioria dos valores está, a média será afetada. Essa desvantagem da média é a vantagem da mediana, que não é influenciada por valores extremos. Se analisarmos os exemplos de cálculo para essas duas medidas, podemos observar que a média está mais alta que a mediana por causa dos valores extremos (40 e 57). A vantagem da média é que ela pode sofrer manipulações matemáticas e é mais co- nhecida. Já a mediana não consegue sofrer muitas manipulações matemáticas. Quanto à moda, a vantagem é a praticidade de conhecer e calcular a medida. No entanto, a desvantagem é que os resultados não são significativos em grupos pequenos. A escolha de qual medida usar dependerá dos dados da pesquisa. As características, vantagens e desvantagens de cada medida influenciará na escolha da medida que descreverá melhor os dados. U2 28Bioestatística e Epidemiologia Coleta, organização e descrição dos dados 3. OBJETO DE APRENDIZAGEM Considere que uma sala de aula formou três grupos, cada um com 10 alunos. A tabela abaixo descreve as características dos alunos em cada grupo. IDENTIFICAÇÃO GRUPO TIME QUE TORCE NÚMERO DE IRMÃOS Aluno 1 A Santos 0 Aluno 2 A Santos 0 Aluno 3 A Guarani 3 Aluno 4 A Ponte Preta 2 Aluno 5 A Palmeiras 1 Aluno 6 A Ponte Preta 0 Aluno 7 A Ponte Preta 2 Aluno 8 A Guarani 1 Aluno 9 A Ponte Preta 2 Aluno 10 A Palmeiras 0 Aluno 11 B Bragantino 1 Aluno 12 B São Paulo 1 Aluno 13 B Santos 2 Aluno 14 B Bragantino 3 Aluno 15 B Palmeiras 0 Aluno 16 B Guarani 2 Aluno 17 B São Paulo 1 Aluno 18 B Bragantino 2 Aluno 19 B Guarani 4 Aluno 20 B São Paulo 2 Aluno 21 C Corinthians 1 Aluno 22 C Santos 3 Aluno 23 C Corinthians 2 Aluno 24 C São Paulo 0 Aluno 25 C Santos 5 Aluno 26 C São Paulo 3 Aluno 27 C Ponte Preta 2 Aluno 28 C Santos 4 Aluno 29 C Corinthians 2 Aluno 30 C Palmeiras 5 Fonte: própria autora 29 Bioestatística e Epidemiologia U2 Coleta, organização e descrição dos dados a. Monte uma tabela de frequência da variável Time que torce de todos os alunos da sala. A tabela deve conter frequência absoluta e frequência relativa. b. Calcule as medidas de tendência central da variável Número de irmãos de cada grupo de aluno. Reflita se existe diferença entre os grupos e se dentro de cada grupo qual é a medida de tendência central que melhor resume essa variável. U2 30Bioestatística e Epidemiologia Coleta, organização e descrição dos dados FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. Epidemiologia clínica: elementos essenciais. 5. ed. Porto Alegre: ArtMed, 2014. PASQUALI, L. Psicometria. Revista da Escola de Enfermagem da USP, São Paulo, v. 43, especial, p. 992- 999, 2009. Disponível em: http://dx.doi.org/10.1590/S0080-62342009000500002. Acesso em: 23 fev. 2021. VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016. REFERÊNCIAS BIBLIOGRÁFICAS about:blank 32 UNIDADE 3 ESTATÍSTICA DESCRITIVA INTRODUÇÃO O que é “normal”? Estar fora do “normal” faz alguém estar doente? Se uma pessoa chora todo dia por um mês após perder uma pessoa querida, isso é considerado normal ou é depressão? Como se definiu qual o limite entre febre e temperatura normal? Será que toda pessoa com temperatura de 37,3ºC está sem febre? Normal é um termo relativo, com base na sociedade e que varia ao longo do tempo, por isso, a saúde utiliza o termo padrão. Qual é a frequência cardíaca padrão de um adul- to? Aqui o termo padrão tem o significado de ser o que ocorre com maior frequência, o evento mais comum de acontecer. Dessa forma, as informações abordadas nessa unidade ajudarão a desvendar esses mistérios e a interpretar as informações. 1. MEDIDAS DE DISPERSÃO Para resumir e descrever um conjunto de dados de uma variável numérica, utiliza-se medidas de tendência central e medidas de dispersão. As medidas de tendência central informam um ponto que resume os dados, mas só ter um ponto central não descreve o quanto os dados variam. Considere o conjunto A {12,13,14,15,16} e o conjunto B {4,10,12,20,24}. Os dois conjun- tos têm média 14, mas eles não são similares. Os dados do conjunto A variam pouco, enquanto em B a variação é maior, pois, para descrever é preciso de no mínimo uma medida central e uma de dispersão. Uma medida de dispersão é a amplitude que é a diferença entre o valor máximo e o mínimo. Assim, é possível apenas citar o valor mínimo e máximo. Para facilitar o cálculo da amplitude, recomenda-se colocar os dados em ordem crescente para ajudar no re- conhecimento dos valores extremos. Fórmula da amplitude: 1 Amplitude Valor máximo Valor mínimo= − 33 Bioestatística e Epidemiologia U3 Estatística descritiva Cálculo de Amplitude Uma pesquisa entrevistou 6 universitários com os dados descritos na tabela a seguir. IDADE 20 21 57 40 23 18 Amplitude: 1) Colocar em ordem crescente: 18 20 21 23 40 57 2) Realizar o cálculo: 57 18 39− = A amplitude desses dados é 39 anos. Ex em pl o A segunda medida de dispersão é o quartil. O percentil é um ponto de corte que divide os dados ordenados, por exemplo, o percentil 85 divide as observações de modo que 85% dos dados estão entre o valor mínimo e o valor do percentil 85. Quartil são os pon- tos de corte que dividem o conjunto em quatro partes igual, portanto, o primeiro quartil é o percentil 25, o segundo é o percentil 50 e o terceiro é o percentil 75. O segundo quartil é sinônimo de mediana já que os dois dividem as observações na metade. A figura a seguir esquematiza os três pontos de corte no conjunto de dados. Figura 01. Esquema da localização dos quartis A 25% 25% 25% 25% B C Fonte: elaborada pela autora. Para calcular os quartis, a primeira etapa é organizar os dados em ordem crescente (do menor para o maior). A segunda etapa, por sua vez, é encontrar o segundo quartil. Quando o número de dados for ímpar, o segundo quartil será um valor do conjunto, e quando for par, ele será a média dos dois valores centrais. “A” é o primeiro quartil, “B” é o segundo quartil ou mediana e “C” é o terceiro quartil. U3 34Bioestatística e Epidemiologia Estatística descritiva A terceira etapa é dividir em dois grupos, de modo que o ponto de corte é a mediana. Quando o número de dados for ímpar, o segundo quartil será um valor do conjunto que deverá estar presente nos dois dos grupos. Quando o número de dados for par, todos os dados serão distribuídos nos grupos, independentemente dos dados centrais serem utilizados para calcular a mediana. A quarta etapa é encontrar o local do ponto de corte para dividir o grupo ao meio: o primei- ro quartil é o ponto que divide na metade o grupo de dados com as observações de menor valor; o terceiro quartil é o ponto que divide na metade o grupo de dados com as observa- ções de maior valor. Assim, no grupo, quando o número de dados for ímpar, o quartil será um valor do conjunto, mas quando for par será a média dos dois valores centrais. O conjuntoA: {2,6,12,17,21} tem número cinco observações (número ímpar), portanto, o ponto que divide esse conjunto na metade é uma observação. Considerando que ele já está ordenado, o valor que está na posição central e consegue dividir o conjunto em dois grupos de dois é o 12. O conjunto B: {7, 9, 13, 15} tem número quatro observações (número par), logo, o ponto que divide esse conjunto na metade é a média dos dois valores centrais. Como ele já está ordenado, a posição central que consegue dividir o conjunto em dois grupos de dois é um valor entre 9 e 13. Nesse caso, é preciso fazer a média entre 9 e 13, logo, soma dos dados númerodedados = 9 13 2 + = 22 11. 2 = Cálculo quartil número par de observações Uma pesquisa entrevistou seis universitários com os dados descritos na tabela a seguir: IDADE 20 21 57 40 23 18 Quartis: 1) Colocar em ordem crescente: 18 20 21 23 40 57 2) Número par de observações (seis). 2a) Achar os valores centrais: 21 e 23 2b) Realizar o cálculo do 2º quartil: 21 23 2 + = 44 22 2 = 3) Dividir em grupo: Grupo Z: 18 20 21 EX EM PL O 35 Bioestatística e Epidemiologia U3 Estatística descritiva EX EM PL O Grupo Y: 23 40 57 4) número ímpar de observações em cada grupo (três). 4a) Achar o 1º quartil no grupo Z: 20 4a) Achar o 3º quartil no grupo Y: 40 Desses dados, o primeiro quartil é 20 anos, o segundo quartil (mediana) é 22 anos e o terceiro quartil é 40 anos. Cálculo quartil número ímpar de observações Uma pesquisa entrevistou sete universitários com os dados descritos na tabela a seguir: IDADE 20 57 40 18 24 26 18 Quartis: 1) Colocar em ordem crescente: 18 18 20 24 26 40 57 2) Número ímpar de observações (sete). 2a) Achar o 2º quartil: 24 3) Dividir em grupo (no caso do 2º quartil ser uma observação, essa estará nos dois grupos): Grupo Z: 18 18 20 24 Grupo Y: 24 26 40 57 4) Número par de observações em cada grupo (quatro). 4a) Achar o 1º quartil no grupo Z: 18 20 2 + = 38 19 2 = 4a) Achar o 3º quartil no grupo Y: 26 40 2 + = 66 33 2 = Nesses dados, o primeiro quartil é 19 anos, o segundo quartil (mediana) é 24 anos e o terceiro quartil é 33 anos. EX EM PL O U3 36Bioestatística e Epidemiologia Estatística descritiva A terceira medida de dispersão é o desvio padrão, que descreve o quanto os dados estão distribuídos em torno da média. Então, toda vez que usar desvio padrão, deve-se usar também a média. O desvio padrão é calculado como a raiz quadrada de variância. SA IB A M A IS Para saber mais sobre o conceito de variância, leia a obra Introdução à Bioestatística (p. 47-51), de Sonia Vieira, lançado em 2016. Disponível na biblioteca digital em: https://integrada.minhabiblioteca.com.br/#/ books/9788595150911/epubcfi/6/20%5B%3Bvnd.vst.idref%3DaB9788535277166000 042%5D!/4/2/6/12/2/4/4%400:0. Acesso em: 15 mar. 2021. Fórmula de desvio-padrão de uma amostra: ( )22 2 1 x x ns n − = − ∑ ∑2 Em que: x é um dado; ∑ representa somatória; x∑ é a somatória de todos os dados; 2x∑ é a somatória dos quadrados dos dados; e n é o número de dados. Apesar de existir a possibilidade de realizar manualmente os cálculos de medidas de tendência central e de dispersão, a rotina do pesquisador é que softwares façam os cál- culos. Para utilizar a fórmula de desvio padrão para amostra, primeiramente, é necessário calcular as somatórias para obter todos os valores que devem ser inseridos na fórmula. EX EM PL O Cálculo de desvio padrão Uma pesquisa entrevistou quatro crianças com idades de 2, 6, 10 e 12 anos. Desvio Padrão: 1) Calcular os valores da somatória: 2 6 10 12 x 2x 22 4= 26 36= 210 100= 212 144= 2 284x =∑ 30x =∑ about:blank about:blank about:blank 37 Bioestatística e Epidemiologia U3 Estatística descritiva EX EM PL O 2) Coloque os valores na fórmula. Atente-se para não confundir onde colocar x∑ e 2x∑ , e para não sumir com a potência. Como n é o número de dados, nesse caso, 4n = . ( ) ( ) 2 2 2 2 2 30 284 4 1 4 1 x x ns n − − = = − − ∑ ∑ 3) Resolver a conta: ( )2 2 30 284 4 4 1 − = − realizar a potência 230 2 900284 4 4 1 − = − realizar a divisão 900 4 2 284 225 4 1 − = − realizar as duas subtrações 2 59 3 = realizar a divisão 2 19,67= realizar a raiz quadrada 4, 43= O desvio padrão é de 4,43 anos. 1.1 VANTAGENS E DESVANTAGENS A vantagem da amplitude ou da menção do valor mínimo e máximo é incluir todos os valores, mas, por outro lado, é uma medida muito afetada por valores extremos. Para descrever a idade dos óbitos ocorridos em um mês, o pesquisador relata que a idade variou de horas de vida até 106 anos. Com esse intervalo grande não é possível saber como de fato está a distribuição de óbitos. Os quartis conseguem fornecer mais dados da dispersão e não são afetados por va- lores extremos. A distância interquartílica, que é a distância entre o primeiro e terceiro quartil, é um valor consegue descrever se metade da amostra está afastada ou próxima a mediana. Uma desvantagem dos quartis é que existem métodos diferentes de calcu- U3 38Bioestatística e Epidemiologia Estatística descritiva lá-los, até mesmo entre os softwares, apesar da diferença entre eles ser pequena. Além disso, eles não são adequados para manipulações matemáticas. O desvio padrão é adequado para manipulações matemática e é utilizado para outras análises estatísticas. Ele é uma medida extremamente adequada para descrever vari- áveis com distribuição normal, no entanto, quando a amostra não tem uma distribuição normal, o desvio padrão não deve ser utilizado. 2. PROBABILIDADE A teoria clássica de probabilidade é aquela em que, normalmente, abordamos no Ensi- no Médio, em que calculávamos qual a probabilidade de se tirar uma carta de baralho específica ou de tirar um número no dado. As características dos fenômenos probabilís- ticos se mantem no campo da saúde. A probabilidade de um evento único acontecer é calculada pela definição básica, conforme a fórmula a seguir. Ela é somente para eventos mutualmente exclusivos e igualmente prováveis e eventos independentes ou condicionantes. Normalmente, ela é expressa por número entra 0 a 1, mas, frequentemente, usa-se a porcentagem para ficar mais fácil de compreender. Fórmula de probabilidade (evento único): númerodeeventos esperados númerodeeventos possíveis 3 No ensino médio, aprende-se que a probabilidade de se ter um filho do sexo masculino é de 50%. Para chegar a esse valor, utilizamos a seguinte Equação 3, logo: ( ) ( ) 1 2 eventoesperado nascer homemnúmerodeeventos esperados número deeventos possíveis eventos possíveis nascer homemou mulher = 1 2 = 0,5 x 100 = 50% Contudo, como podemos calcular a probabilidade de uma criança nascer com uma anomalia congênita? Nesse caso, podemos considerar que é 50% também, já que só existem dois eventos esperados (nascer com ou sem anomalia)? Na área da saúde, as probabilidades de eventos, como a chance de ficar doente ou de se curar, são calculadas a partir do que é observado na população. Então, pesquisas descritivas que contam os eventos são muito importantes para termos as probabilida- des. Logo, qual a probabilidade de ter uma criança com anomalia congênita? = 39 Bioestatística e Epidemiologia U3 Estatística descritiva Pelas informações divulgadas pelo Ministério da Saúde, em 2019, no Brasil nasceram 2.849.146 crianças, em que 24.838 nasceram com anomalias. Preenchendo a fórmula com esses valores, temos que: númerodeeventos esperados númerodeeventos possíveis = 24.838 2.849.146 = 0,00872 ×100 = 0,87%. O cálculo realizado é similar ao de frequência relativa. Portanto, dependendo de qual foi a amostra e como os dados foram coletados, pode-se considerar que a probabilidade de um evento acontecer é a frequência relativa que alguma pesquisa demostrou que ela acontece. PA R A R EF LE TI R Pelo ISA-Capital de 2008, a proporção de pessoas com mais de 20 anos quetinham Hipertensão Arterial Sistêmica (HAS) foi de 22%. Uma nutricionista atendeu em um dia 20 consultas de adultos ou idosos e nenhum deles tinha HAS. De acordo com a probabilidade, ela deveria ter atendido 4 hipertensos (22% de 20 consultas = 0,22 x 20 = 4,4). Considerando que a proporção de hipertensos na população está correta, o que será que aconteceu para a probabilidade errar? ` O número de pessoas atendidos é baixo e pode ter ocorrido um viés de seleção e a amostra não representar a população. ` Ao acaso, naquele dia, não houve hipertensos. Mas nos outros dias da semana, ela atendeu mais de 5 doentes. ` O público-alvo da nutricionista é específico para pessoas jovens e saudáveis e, portanto, a amostra não representa a população total. ` Existem pessoas que não estão diagnosticadas com HAS, mas já tem a doença e, provavelmente, alguns dos 20 pacientes estavam nessa situação. Para profissionais da saúde, a principal característica de probabilidade é que ela não é capaz de determinar resultados. Então, por mais que eu tenha o gene marcador de cân- cer, que me dá 95% de probabilidade de desenvolver a doença, isso não significa que eu de fato eu terei câncer. Além disso, pode-se soma a isso a interpretação da chance é subjetiva, isto é, alguém pode achar que 95% de chance de ter câncer é muito alta e querer, portanto, fazer tratamentos precoces e cirurgias para evitar a doença. Outra pessoa pode achar que uma sobrevida de 5% alta e que vai aproveitar esse resultado para aproveitar a vida. A reação das pessoas às probabilidades de eventos relaciona- dos a sua saúde é muito variável. Por isso, toda vez que se for discutir probabilidade de sucesso do tratamento, de voltar a andar ou de “voltar ao normal”, é importante deixar claro que probabilidade não garante um futuro. A longo prazo, por sua vez, é possível que a proporção de eventos observados se aproxime da probabilidade do evento acontecer. Nesse sentido, considere que a média de sobrevida após um diagnóstico de câncer de pulmão é de 1 ano. Um profissional começa seu trabalha em uma clínica de oncologia e, com o passar do tempo e de atendimentos, ele observará que a maioria dos casos de fato morrem próximo de 1 ano de diagnóstico. No entanto, ha- verá exceções, desde quem morreu dias depois ou de quem demorou 5 anos para falecer. U3 40Bioestatística e Epidemiologia Estatística descritiva Com a experiência, os dados vão cada vez mais se aproximar da distribuição normal. Contudo, sempre há a chance de alguém ser a exceção, que em estatística pode ser chamado de ponto fora da curva (outlier). Ao ter um diagnóstico, não é possível saber em qual parte da curva você ficará, mas é possível saber quais são as probabilidades. Portanto, as probabilidades devem ser usadas no cotidiano do profissional de saúde. O uso da probabilidade ocorre principalmente como referência para decisão de condutas e possíveis pré-conceitos que ajudam no atendimento. Dessa forma, é preciso ter um equilíbrio e saber quando usar e como transmitir a informação para pacientes ou usuários. 3. DISTRIBUIÇÃO NORMAL Os matemáticos no século XIX observaram que, em grande escala ou na natureza, os eventos bio- lógicos tendem a seguir uma mesma distribuição de frequência. Desse modo, pode-se pressupor que as variáveis de uma pesquisa tenham distri- buição normal ou testar estatisticamente se a cur- va dos dados observados é similar. A Figura 2 representa que os eventos tendem a se repetir próximo a posição central e que poucos casos acontecem longe do esperado. Portanto, a curva do gráfico representa a distribuição normal e, também, pode ser chamada de curva de Gauss. A distribuição normal tem características bem co- nhecidas que são iguais para todas as variáveis que apresentem a distribuição. O comportamento da variável será independente do valor das me- didas de tendência e dispersão e do que se está medindo (peso, tempo de sobrevida e tempera- tura corpórea). Dessa forma, variáveis contínuas tendem a formar curvas mais próximas à teórica por conseguir aferir os valores de forma contínua. A curva da distribuição normal é em formato de sino e é simétrica em torno da média, isso faz com que a mediana e a moda sejam iguais a média. Toda a população está sobe a curva, em que metade tem valores menores do que a média. A distribuição da frequência de eventos em torno da média é uma constante. Assim, por meio de cálculos matemático, chegou-se a proporção descrita na Figura 3. Figura 02. Esquema que descreve a distribuição normal Fo nt e: 1 23 rf. 41 Bioestatística e Epidemiologia U3 Estatística descritiva ` 68,26% dos dados estão a um desvio padrão (𝜎) da média (µ). � Fórmula limite inferior µ σ= − . � Fórmula limite superior .µ σ= + ` 95,44% dos dados estão a dois desvios padrões (2𝜎) da média (µ). � Fórmula limite inferior 2µ σ= − . � Fórmula limite superior 2µ σ= + . ` 99,72% dos dados estão a três desvios padrões (𝜎) da média (µ). � Fórmula limite inferior 3µ σ= − . � Fórmula limite superior 3µ σ= + . Figura 03. Frequência relativa dos eventos a partir de distâncias de desvios-padrões (𝜎) da média (µ) Fonte: 123rf. Para calcular os limites mínimos e máximos que estão na proporção de casos, é só somar ou subtrair do desvio padrão da média. Considere que, o tempo de duração de sintomas de uma doença febril tem distribuição normal, em que a média de duração dos sintomas é de 7 dias com um desvio padrão de 1,4 dia. Essas medidas foram calcula- U3 42Bioestatística e Epidemiologia Estatística descritiva das em uma amostra representativa com tamanho amostral adequado e o estudo não apresentou vieses. Pelas características da distribuição normal, temos: ` 68,26% dos casos dessa doença teriam de 5,6 a 8,4 dias de sintomas. � Fórmula limite inferior 7 1,4 5,6µ σ= − = − = . � Fórmula limite superior 7 1,4 8,4µ σ= + = + = . ` 95,44% dos casos dessa doença teriam de 4,2 a 9,8 dias de sintomas. � Fórmula limite inferior ( )7 2 1,4 7 2,8 4,2µ σ= − = − × = − = . � Fórmula limite superior ( )7 2 1,4 7 2,8 8,4.µ σ= + = + × = + = ` 99,72% dos casos dessa doença teriam de 5,6 a 8,4 dias de sintomas. � Fórmula limite inferior ( )7 3 1,4 7 4,2 0µ σ= − = − × = − = . � Fórmula limite superior ( )7 3 1, 4 7 4,2 11,2µ σ= + = + × = + = . Com as diversas frequências que a curva de distribuição normal fornece, pode-se pen- sar em probabilidades de eventos acontecerem e na definição de situações normais. 4. ANORMALIDADES Há várias estratégias para definir se um comportamento, resultado, sinal ou sintoma está dentro do padrão ou “normal”. Nesse sentido, a mais comum e mais utilizada é a definição de que é normal tudo que acontece com grande frequência. A principal refe- rência são os padrões da curva de distribuição normal, em que há um consenso de que tudo que está dentro de 2 desvios padrões da média (95,44%) é normal. Se a pessoa se encontra nos extremos da curva de Gauss, ela pode ser uma pessoa saudável com padrões de referência fora do comum ou pode ser uma pessoa doen- te. Desse modo, cabe julgar outras características, sinais e sintomas do paciente. Por exemplo, ao atender uma pessoa com temperatura de 37,3ºC que está com calafrios e dor no corpo, pode-se considerar que ela está com febre apesar de o valor da tem- peratura estar dentro do normal, ao mesmo tempo que uma pessoa com 38ºC e sem nenhum sintoma pode estar saudável. Com isso, outro critério que se pode usar para definir normalidade é apresentar uma forma clínica diferente do que é considerado um bom estado de saúde. O quanto de choro é considerado fora do normal para alguém de luto ou todo choro é patológico? Se ao tratar a provável anormalidade e a pessoa melhorar é possível definir que o quadro era anormal. 43 Bioestatística e Epidemiologia U3 Estatística descritiva 5. OBJETO DE APRENDIZAGEM A definição de normalidade ou alteração de peso nas crianças foi feita a partir dos con- teúdosaprendidos na unidade de hoje. A Organização Mundial da Saúde (OMS) dispo- nibiliza as curvas de crescimento (peso, altura e índice de massa corpórea por peso) com pontos de corte, a partir de percentis ou de escore z (1). A Figura 4 é um exemplo de curva de peso por idade, em que as curvas com escore z usa como base o desvio padrão, em que 1 escore significa 1 desvio padrão. Peso-por-idade MASCULINO De 0 a 2 anos (escore z) Pe so (K g) Idade (meses e anos completos) 0 1 2 3 4 5 6 7 8 9 10 11 1 ano Meses 2 anos 1 2 3 4 5 6 7 8 9 10 11 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Fonte: OMS ([s.d.], [n. p.]). A caderneta de saúde da criança (BRASIL, 2017) é a carteira de vacinação com diver- sas outras informações sobre o crescimento e o desenvolvimento dela. Entre as infor- mações disponíveis nesse impresso temos a Figura 5, que compara pontos de corte em percentis e em desvio padrão (escore z). Figura 04. Gráfico da curva de crescimento de peso por idade de crianças do sexo masculino de 0 a 2 anos com ponto de corte a partir do escore z U3 44Bioestatística e Epidemiologia Estatística descritiva Figura 05. Medidas de dispersão escores z e percentis +3,0 escores z +2,0 escores z +1,881 escore z +0,674 escore z -0,674 escore z 97º percentil 75º percentil 25º percentil +1,645 escore z 95º percentil +1,282 escore z 90º percentil +1,0 escore z Média 99,85º percentil 97,72º percentil 84,2º percentil 50º percentil 15,8º percentil 2,28º percentil 0,15º percentil = mediana ( 110% A/I 120% P/I)~= ~= -1,0 escore z -2,0 escore z -3,0 escore z ( 90% A/I 80% P/I)~= ~= -1,282 escore z 10º percentil -1,645 escore z 5º percentil -1,881 escore z -2,67 escore z 3º percentil 0,4º percentil Fonte: Brasil (2017, p. 52). Pela OMS ([s.d.]), a definição de normalidade do peso é a partir de onde a criança está no gráfico. Logo, as definições variam conforme a idade e variável (peso, altura ou ín- dice de massa corpórea). Tabela 01. Pontos de corte e classificação do peso para a idade para crianças de 0 a 10 anos PONTO NO GRÁFICO CLASSIFICAÇÃO DO PESO > +2 escores z Peso elevado para idade. ≥ -2 e ≤ +2 escores z Peso adequado para idade. ≥ -3 e ≤ -2 escores z Peso baixo para idade. < -3 escores z Peso muito baixo para idade. Fonte: Brasil (2011, p. 15). Uma criança brasileira do sexo masculino que fará 2 anos de idade daqui dois dias pesa 16,5kg. Após colocar esses valores na curva de crescimento (Figura 4), o que tem mais chance de ser real: 45 Bioestatística e Epidemiologia U3 Estatística descritiva a. A criança tem padrões fora do frequente, então, aquele peso é adequado para ela; ou b. A probabilidade desse menino ter uma anormalidade é baixa, então, pode-se considerar que o peso não é adequado para a idade? Comentário: O mais provável é que a criança esteja com peso elevado para a idade e, portanto, algum tipo de orientação dietética deve ser realizada. A probabilidade é baixa (menor de 4,56%) da criança estar com peso adequado e ter características diferentes da maioria da população e, por isso, estar fora da faixa de normalidade da curva. Nesse sentido, as informações sobre a altura e o índice de massa corpórea (IMC), que também tem seus gráficos, pode ajudar na interpretação do dado. Se só no peso a criança está acima da curva de 2 escores z, significa que a criança está acima do peso. Outra estra- tégia que contribui para a avaliação é acompanhar o peso da criança ao longo do tempo, a fim de saber se ela está seguindo as inclinações das curvas de referência ou teve um aumento fora do esperado. U3 46Bioestatística e Epidemiologia Estatística descritiva REFERÊNCIAS BIBLIOGRAFICAS BRASIL. Ministério da Saúde. Caderneta de saúde da criança: menino. 11 ed. Brasília, DF: Ministério da Saúde, 2017. Disponível em: http://bvsms.saude.gov.br/bvs/publicacoes/caderneta_saude_crianca_meni- no_11ed.pdf. Acesso em: 9 fev. 2021. BRASIL. Ministério da Saúde. Secretaria de Atenção à Saúde. Departamento de Atenção Básica. Orienta- ções para a coleta e análise de dados antropométricos em serviços de saúde: Norma Técnica do Sis- tema de Vigilância Alimentar e Nutricional - SISVAN. Brasília, DF: Ministério da Saúde, 2011. Disponível em: http://189.28.128.100/dab/docs/portaldab/publicacoes/orientacoes_coleta_analise_dados_antropometricos. pdf. Acesso em: 9 fev. 2021. FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. Epidemiologia clínica: elementos essenciais. 5. ed. Porto Alegre: ArtMed, 2014. ORGANIZAÇÃO MUNDIAL DA SAÚDE (OMS). Curva de crescimento peso por idade meninos de 0 a 2 anos – escore z. Disponível em: https://www.who.int/docs/default-source/child-growth/child-growth-standards/indicators/weight-for-age/cht-w- fa-boys-z-6-2.pdf?sfvrsn=ec5b30eb_6. Acesso em: 9 fev. 2021. ORGANIZAÇÃO MUNDIAL DA SAÚDE (OMS). Documentos com padrões de crescimento de crianças. Dispo- nível em: https://www.who.int/tools/child-growth-standards/standards. Acesso em: 9 fev. 2021. VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016. about:blank about:blank about:blank about:blank about:blank about:blank 48 UNIDADE 4 EPIDEMIOLOGIA DESCRITIVA INTRODUÇÃO É possível saber a proporção de pessoas que tem diabetes ou que usam drogas ilíci- tas? Ao longo do tempo, será que o número de casos de AIDS reduziu no Brasil? Neste país, será que há regiões que têm mais ou menos casos que as outras? A AIDS é mais frequente em algum tipo de população? As informações abordadas nessa unidade aju- darão você a entender como essas informações podem ser obtidas. Nesta unidade, abordaremos os tipos de estudos epidemiológicos, que são classifica- dos como descritivos ou analíticos. Os estudos analíticos buscam associações entre variáveis, como fatores de risco para doença ou desfechos possíveis de um evento. Enquanto os estudos descritivos têm como objetivo principal descrever características da doença, pessoas, locais ou tempo, como também para identificar casos, analisar tendências, fazer diagnóstico situacional da população e gerar hipóteses. Além disso, há outra classificação quanto a intervenção estudada, por exemplo, os estudos observacionais têm as intervenções decididas por profissionais de saúde que não pertencem a equipe da pesquisa. A pesquisa, por sua vez, só observa o que foi realizado. Já nos estudos experimentais, a decisão de qual intervenção o participante da pesquisa será submetido é realizada pelos pesquisadores. 1. ESTUDO TRANSVERSAL, DE PREVALÊNCIA E SECCIONAL O estudo transversal é descritivo e observacional. Esse nome tem origem da definição que as informações são coletadas em um único ponto do tempo, como se a linha do tempo sofresse um corte transversal ou como uma fotografia, ele também pode ser chamado de estudo sec- cional ou de prevalência. A principal característica do estudo transversal é que as informações das variáveis dependentes e independentes são coletadas simultaneamente. Figura 01. Esquema do desenho de estudo transversal Pessoa com presença de uma ou mais variáveis independentes. Pessoa com presença de uma ou mais variáveis independentes. Pessoas com presença da variável dependente Pessoas com presença da variável dependente Fonte: elaborada pela autora. 49 Bioestatística e Epidemiologia U4 Epidemiologia descritiva Dessa forma, a principal finalidade desse tipo estudo é medir e descrever frequências de doenças e fatores de risco. Normalmente, ele é utilizado para descrever doenças comuns e de longa duração, como levantamentos de dados que descrevem dados já registrados e os inquéritos populacionais de saúde que buscam as informações para complementar os dados coletados por outros meios. A Pesquisa Nacional de Saúde (PNS) é o inquérito de saúde da população brasileira, por meio de entrevistas com amostra de base domiciliar e de âmbito nacional, realizada em parceria com o Instituto Brasileirode Geografia e Estatística (IBGE). A PNS de 2019 aborda a percepção do estado de saúde, estilos de vida, doenças crônicas e saúde bucal. Em um de seus resultados, observa-se que entre as pessoas de mais de 18 anos, no Brasil, 66,1% auto avaliam sua saúde como boa ou muito boa, 26,4% consomem bebida alcoólica uma vez ou mais por semana, 23,9% afirmam ter o diagnóstico para hipertensão arterial e 93,6% escovam os dentes pelo menos duas vezes por dia. (IBGE, 2020, p. 28; 41; 54; 73). As vantagens do estudo transversal são: pratici- dade, simplicidade, rapidez e baixo custo bene- fício. No entanto, isso depende do tamanho e da população amostral, mas comparado com os ou- tros tipos de estudos, ele é fácil de ser executado. Como todas as variáveis são coletadas no mesmo tempo, não há necessidade de segmento evitando assim perdas amostrais. Em contrapartida, nesse estudo não é adequado estabelecer causas entre variáveis, pois, como as informações foram coletadas simultaneamen- te não é possível distinguir a temporalidade e garantir que um fator veio antes do outro. Por exemplo, uma pesquisa em idosos relata que 20% fumantes ativos têm câncer de pulmão, enquanto 10% dos não fumantes têm câncer de pulmão. Com essas informa- ções não é possível definir que fumar causa câncer, já que a pessoa pode ter começado ou parado de fumar após o diagnóstico de câncer. Nesse sentido, as pesquisas transversais são capazes de sugerir associações ou hipóte- ses para possíveis relações causais entre variáveis. Por isso, é comum que elas conclu- am que estudos longitudinais devem ser feitos para avaliar se de fato existe associação. Figura 02. Estudo Fo nt e: 1 23 R F. Não é possível definir fatores determinantes de eventos ou relações causais nos estudos transversais (ROUQUAYROL; GURGEL, 2018, p. 120-121). IM PO R TA N TE ! Outra limitação é o alto risco de presença de vieses. Isto é, toda vez que uma associação é sugerida, há sempre um risco de ter viés de confusão, ou seja, outra variável é responsável pelo evento que não aquela proposta. Outro viés possível é o de sobrevivente, por exemplo, uma pesquisa sobre qualidade de vida para pacientes oncológicos pode ser tendenciosa, pois, provavelmente, grande parte da amostra é de casos menos graves e com melhor prognóstico. U4 50Bioestatística e Epidemiologia Epidemiologia descritiva Os resultados desses estudos são utilizados para ter um diagnóstico situacional da popu- lação e, com isso, planejar ações e serviços a partir das demandas levantadas. Por exem- plo, se um levantamento entre os adultos do território de uma Unidade Básica de Saúde encontra que 66% dessas pessoas têm sobrepeso ou obesidade, a equipe desse serviço pode planejar ações para reduzir essa proporção e prevenir doenças cardiovasculares. ` Viés é um erro sistemático e ao delinear o projeto é preciso pensar em estratégias metodológicas que diminuam a chance dele acontecer. BORGES, A. L. V.; SCHOR, N. Início da vida sexual na adolescência e relações de gênero: um estudo transversal em São Paulo, Brasil, 2002. Cadernos da Saúde Pública, Rio de Janeiro, v. 21, n. 2, p. 499-507, mar./abr. 2005. Disponível em: http:// dx.doi.org/10.1590/S0102-311X2005000200016. Acesso em: 25 fev. 2021. G LO SS Á R IO EX EM PL O 2. SÉRIE OU RELATO DE CASOS O relato de caso é uma descrição detalhada do quadro de um único paciente. Uma série de casos são descrições do curso de uma doença ou condição em um número pequeno de pessoas (ROUQUAYROL; GURGEL, 2018, p. 145), normalmente, elas são utilizadas para descrever doenças e quadros raros ou situações que a doença teve uma evolução diferente. Esse é o principal meio de comunicação de novas doenças e, portanto, é comum que sejam escritos por profissionais da saúde para descrever um ou poucos pacientes que apresentam características similares. A partir das séries de casos incomuns, que estavam ocorrendo em diversos lugares, iniciou-se uma investigação de uma nova doença que viria a ser a AIDS. Para saber mais sobre o primeiro relato de caso da AIDS, leia o artigo referenciado a seguir: CENTERS FOR DISEASE CONTROL - CDC. Pneumocystis pneumonia – Los Angeles. MMWR, [s. l.], v. 30, n. 21, p. 250-252, 5 jun. 1981. Disponível em: https://www.cdc. gov/mmwr/preview/mmwrhtml/june_5.htm. Acesso em: 25 fev. 2021. C U R IO SI D A D E 3. ESTUDOS ECOLÓGICOS O estudo ecológico é um estudo descritivo em que a unidade análise é um grupo e não um indivíduo, por isso, segundo Rouquayrol e Gurgel (2018, p. 125-126), ele pode ser classificado com estudo agregado. As proporções e taxas das variáveis serão analisa- das por grupos populacionais, esse é o delineamento mais comum para pesquisas com dados secundários, como aqueles disponibilizados pelo DATASUS. 51 Bioestatística e Epidemiologia U4 Epidemiologia descritiva Esse tipo de estudo utiliza três tipos de medidas. As medidas agregadas resumem os dados dos indivíduos, não sendo possível saber informação de cada indivíduo da população. Assim, não é possível saber se uma pessoa que é hipertensa também consome bebida alcoólica mais do que uma vez na semana ou se realiza atividade física. Elas são representadas por médias, proporções ou frequências dos eventos em uma determinada população e local. Já as medidas ambientais representam as características físicas do ambiente, como qualidade do ar e índice de radiação ultravioleta (UV). Por fim, as medidas globais representam características sociais que não existem no nível individual, como nível de desigualdade social de uma população e local. As finalidades dos estudos ecológicos são de gerar novas hipóteses, assim como o estudo transversal, e de avaliar interven- ções comunitárias ou impactos de leis. ` DATASUS é a sigla do Departamento de Informática do Sistema Único de Saúde. Uma de suas funções é manter o acervo das bases de dados dos sistemas de informações em saúde e disponibilizar esses dados. Então, nessa plataforma, con- seguimos dados agregados de mortalidade, natalidade, doenças transmissíveis, assistência à saúde, entre outros. G LO SS Á R IO Um estudo ecológico avaliará se houve redução de mortes em acidentes de trânsito após a lei que obrigou o uso do cinto de segurança. Esse delineamento é adequado para quando não se interesse em avaliar características dos indivíduos, quando a variabilidade de uma variável é baixa dentro da população e quando só se consegue obter dados agregados (FLETCHER; FLETCHER; FLETCHER, 2014, p. 216-217).E XE M PL O Além disso, as vantagens são: baixo custo, rapidez e praticidade, já que, em alguns ca- sos, os dados já estão disponíveis em plataformas. Por outro lado, como desvantagens, esse estudo leva em conta a média e não a variabilidade da característica dentro da po- pulação, tem dificuldade em estabelecer temporalidade e fluxos migratórios ou eventos específicos podem mudar a característica da população, atrapalhando a análise. Dessa forma, o principal viés que pode ocorrer é a falácia ecológica ou viés de agre- gação, que acontece ao interpretar o resultado e tentar inferir os resultados para o nível individual. Ou seja, os estudos ecológicos só demonstram associação entre dados agregados. Para confiar que essa associação também ocorre em nível individual preci- samos de estudos com dados individuais. Por exemplo, um estudo ecológico observa uma associação que quanto maior o Índi- ce de Desenvolvimento Humano (IDH) do município, maior a quantidade de exames preventivos de câncer de colo uterino (Papanicolau) são realizados. Cometer o erro de falácia ecológica seria pensar que a causa de a Sra. Maria não fazer o exame de Papa- nicolau, há mais de cinco anos, é porque ela tem poucas condições socioeconômicas. U4 52Bioestatística e Epidemiologia Epidemiologia descritiva 4. DISTRIBUIÇÃO DE EVENTOS POR PESSOAS, TEMPO E LUGAR Os estudos descritivos relatam, detalhadamente, os padrões de distribuição das variá- veis. Com isso, pode-se medira frequência de algum evento entre pessoas de caracte- rísticas diferentes, entre locais diferentes ou ao longo do tempo. Assim, analisar eventos por características da população tem como objetivo propor hipóteses de possíveis grupos de risco e características demográficas, comportamentais e socioeconô- micas que possam influenciar na frequência do evento. No exemplo da Figura 3, a proporção de usuários atuais de produtos derivados do tabaco é maior em homens, em pessoas de 40 a 59 anos e em pessoas de baixa escolaridade (ensino médio incompleto ou inferior). Figura 03. Exemplo de comparação de características individuais CECCON, R. F. et al. Suicídio e trabalho em metrópoles brasileiras: um estudo ecológi- co. Ciência & Saúde Coletiva, Rio de Janeiro, v. 19, n. 7, p. 2225-2234, 2014. Disponível em: https://doi.org/10.1590/1413-81232014197.09722013. Acesso em: 25 fev. 2021. EX EM PL O Gráfico 24 - Proporção de pessoas de 18 anos ou mais de idade usuárias de produtos derivados do tabaco, com indicação do intervalo de confiança de 95%, por sexo, grupos de idade, cor ou raça e nível de instrução - Brasil - 2019. Total 12,8 16,2 9,8 10,8 12,0 14,9 11,9 11,8 13,7 13,5 17,6 15,5 9,6 7,1 0,0 5,0 10,0 15,0 20,0 25,0 30,0 35,0 40,0 De 18 a 24 anos Homem De 25 a 39 anos Branca Sem instrução e fundamental incompleto Mulher De 40 a 59 anos Preta Fundamental completo e médio incompleto De 60 ou mais Parda Médio completo e superior incompleto Superior completo Fonte: IBGE. Diretoria de Pesquisas, Coordenação de Trabalho e Rendimento. Pesquisa Nacional de Saúde 2019. Pesquisa Nacional de Saúde 2019, proporção de pessoas com 18 anos ou mais usuárias atuais de produtos derivados do tabaco. Fonte: IBGE (2020, p. 50). 53 Bioestatística e Epidemiologia U4 Epidemiologia descritiva Historicamente, a análise de dados por lugar foi o primeiro estudo epidemiológico, em que na epidemia de cólera procurou-se associação entre os locais em que os casos residiam e a frequência da doença. Nesse sentido, a análise com geoprocessamento é importante para definir se a doença está confinada a uma região, quais são as carac- terísticas dos conglomerados de casos e se eles estão associados a outras variáveis. Figura 04. Exemplo de comparação de locais GRÁFICO 181 Coeficiente de incidência de tuberculose. * São Paulo, 2012 Fonte: Sinan/SVS-MS e IBGE. *Por 100 mil habitantes. 0 1 | --- 20 20 | --- 40 40 | --- 60 60 e mais Distribuição de proporção de casos novos de tuberculose nos municípios do Estado de São Paulo em 2012. Fonte: Brasil (2014, p. 55). Desse modo, analisar a distribuição de um evento ao longo do tempo permite acompanhar a evolução da doença e associá-la a outros acontecimentos que, em algum período, fizeram com que a proporção do evento alterasse a tendência. Por exemplo, na Figura 5 podemos perceber uma tendência a estabilizar o número de casos novos de AIDS. Dessa forma, po- de-se associar esse fato com a introdução da terapia antirretroviral de alta potência em 1997. U4 54Bioestatística e Epidemiologia Epidemiologia descritiva Figura 05. Série histórica da proporção de dos casos novos notificados de AIDS por 100.000 habitantes no Brasil de 1980, 1982-2019 0,00 5,00 10,00 15,00 20,00 25,00 Série1 Fonte: http://www2.datasus.gov.br/DATASUS/index.php?area=02. Acesso em: 25 fev. 2021. Além das séries ou tendência históricas, é possível determinar variações sazonais na frequência de casos. Em outras palavras, sabe-se que o número de casos de dengue aumenta nos meses de verão, assim como os casos de gripe nos meses de inverno. A partir da análise da distribuição de casos ao longo do tempo é possível definir se a ocorrência da doença em tempos atuais é uma epidemia ou não. No entanto, para isso, é necessário definir anteriormente o que é uma faixa endêmica. Endemia é a presença constante de determinada doença em populações e espaços específicos, normalmente, ela acontece depois que a doen- ça é introduzida em um local e o número de casos se estabilizam ao longo dos anos. Uma doença endêmica apresenta taxas constantes de casos novos podendo ou não ter variação sazonal. A malária é endêmica no Região Amazônica, apresen- tando, de forma geral, um aumento de casos no período de transição entre as estações úmidas e secas. A faixa endêmica é uma previsão estatística do possível número de casos que devem ser encontrados em um período. Para criá-la, primeiramente, fazemos a média dos números de casos no período e depois consideramos como um intervalo dentro do normal dois desvios padrões de distância do valor da média. Na Figura 6, as linhas verdes represen- tam os limites inferiores e superiores da faixa endêmica, já a linha azul apresenta a média de casos nos últimos anos. No mês de julho, a média de casos dos últimos anos foi de 30, mas é esperado que nesse ano a quantidade de doentes varie entre 21 e 39. 55 Bioestatística e Epidemiologia U4 Epidemiologia descritiva Quando o número de casos excede o que é esperado pela faixa, temos uma epidemia. Ela pode ser definida também como um aumento de doentes que excede o que se espera, normalmente com velocidade rápida e descontrolada. Na Figura 6 é possível perceber a epidemia a partir de maio, quando os casos ultrapassam o limite. Figura 06. Gráfico da faixa endêmica 0 10 20 30 40 50 60 jan fev mar abr mai jun jul ago set out nov dez média superior inferior casos Com limites inferiores e superiores, e média da proporção de casos de uma doença fictícia além da frequência dos casos que ocorreram de janeiro a junho de 2021. Fonte: elaborada pela autora. Popularmente, as pessoas usam surto como sinônimo de epidemia, contudo, para a epidemiologia, surto é uma concentração de casos delimitados a locais específicos. Por exemplo, 15 crianças apresentaram conjuntivite em uma escola específica, nesse caso, pode-se dizer que a escola apresentou um surto de conjuntivite. Outro termo semelhan- te é a pandemia, que consiste na disseminação e no número excessivo de casos da doença no mundo inteiro. 5. OBJETO DE APRENDIZAGEM O DATASUS desenvolveu o TABNET, um tabulador das informações de saúde. Com ele é possível consultar de forma rápida os dados dos sistemas de informações em saúde e tabulá-los conforme necessário. Todos os exemplos utilizados nessa unidade foram obtidos por meio desse aplicativo. U4 56Bioestatística e Epidemiologia Epidemiologia descritiva A partir do seu domicílio, busque quantos novos casos de tuberculose tivemos nos úl- timos anos, quantas crianças nasceram de parto cesárea e quantas pessoas morreram antes dos 50 anos de idade. Explore a plataforma TABNET disponível em: http://www2.datasus.gov.br/DATASUS/index. php?area=02. Acesso em: 15 mar. 2021. 57 Bioestatística e Epidemiologia U4 Epidemiologia descritiva BRASIL. Ministério da Saúde. Panorama da tuberculose no Brasil: indicadores epidemiológicos e operacio- nais. Brasília: Ministério da Saúde, 2014. FLETCHER, R. H; FLETCHER, S. W.; FLETCHER, G. S. Epidemiologia clínica: elementos essenciais. 5. ed. Porto Alegre: ArtMed, 2014. INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA – IBGE. Pesquisa nacional de saúde 2019: percepção do estado de saúde, estilos de vida, doenças crônicas e saúde bucal: Brasil e grandes regiões. Rio de Janeiro: IBGE, 2020. Disponível em: https://biblioteca.ibge.gov.br/visualizacao/livros/liv101764.pdf. Acesso em: 25 fev. 2021. ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia e saúde. 8. ed. Rio de Janeiro: Medbook, 2018. REFERÊNCIAS BIBLIOGRÁFICAS 58 INTRODUÇÃO Quantos pessoas são diagnosticadas com AIDS por ano no Brasil? Quantas pessoas estão com tuberculose neste momento? Como saber qual o impacto que as doenças têm na saúde e na expectativa de vida da população? Nesta unidade, você aprenderá como essas informações podem ser obtidas e como interpretá-las. 1. CONCEITO, HISTÓRICO E CARACTERÍSTICAS DE UM BOM INDICADOR Segundoa Ripsa (2008, p. 13), o indicador de saúde é uma medida que resume infor- mações de saúde e os determinantes de uma população e do desempenho dos serviços de saúde de um local. Essa é uma ferramenta para realização de um diagnóstico popula- cional, o que permite elaborar e avaliar ações, propor hipóteses e descrever a situação. Desse modo, um indicador de saúde para ser satisfatório, ele deve ser acessível para a população, de fácil compreensão, capaz de sintetizar as condições de saúde comparadas as outras realidades, capaz de propor ações de saúde adequadas a partir do acesso aos dados. Por isso, no mundo inteiro, os indicadores são calculados da mesma maneira, a partir de regras e consensos internacionais da Organização Mundial da Saúde (OMS). A estratégia tradicional e mais antiga utilizada para avaliar a qualidade de vida da população é a análise dos óbitos. A análise estatística das mortes começou no século XVII, na Inglaterra, quando John Graunt tabulou as principais cau- sas de morte a partir dos registros de igrejas (LAURENTI, 1991, p. 408-410). Nos séculos seguintes, a contagem e a análise dos dados foram se aprimorando até que outros eventos, como nascimento e doenças transmissíveis, fo- ram incluídos. Assim, a análise dos óbitos e de nascimento é denominada de estatística vital. Um indicador de saúde é uma razão, ou seja, uma divisão entre valores de duas variáveis. Na maioria dos casos, trata-se de proporções em que o numerador está incluso no denominador, assim como a frequência relativa. Quando o valor do indicador é expresso com um número de 0 a 1, o chamamos de co- eficiente, já a taxa é expressa por uma potência de base 10. UNIDADE 5 INDICADORES DE SAÚDE Figura 01. Indicador de saúde Fo nt e: 1 23 R F. 59 Bioestatística e Epidemiologia U5 Indicadores de Saúde O coeficiente de mortalidade geral é 0,007 e a taxa de mortalidade é de 7 óbitos por 1.000 habitantes. As taxas têm fácil compreensão e, por isso, elas são mais usadas. Para calculá-las, na maioria das vezes, é só multiplicar o coeficiente por 1.000 ou 100.000.EX EM PL O 1 100 númerode pessoas acometidas coma doença emuma populaçãoeumdeterminado períodoPrevalência númerototal de pessoas emuma populaçãoeumdeterminado período = × 2. INCIDÊNCIA E PREVALÊNCIA Os indicadores mais frequentes para descrever uma doença são a incidência e a pre- valência. A prevalência é uma proporção que descreve a frequência relativa em que o evento aconteceu durante um p eríodo de tempo. No entanto, ela não considera se a doença se iniciou e/ou terminou durante o período. Sendo assim, o que importa é contar quantos casos de doentes ocorreram. A principal função da prevalência é medir a magnitude da doença e o impacto que ela tem na população, sendo utilizada para gestores dos serviços e sistemas para planejar atendimentos e cuidados específicos. Esse indicador não é capaz de medir risco de alguém contrair uma doença. Fórmula da prevalência: O numerador contém pessoas com diferentes tempos de duração da doença, mas o que importa é que todos os casos ativos da doença – seja ele novo ou antigo – estão contados. A população e período devem ser os mesmos para o numerador e para o de- nominador. A prevalência não tem unidade de medida e, normalmente, é expressa em porcentagem, logo, na fórmula, após a divisão, deve-se multiplicar por 100. A prevalência pode ser de ponto, de período ou de toda a vida, dependendo do período considerado. A prevalência de ponto expressa a situação em um único dia, por exem- plo, quem está com a gripado hoje? A de período avalia quem, em algum momento des- se período, ficou com a doença (que ficou gripado nesse último mês?). A prevalência de toda a vida – como o próprio nome remete – avalia quem teve a doença em algum momento da vida. Nos três tipos não importa se a pessoa acabou de ser diagnosticada ou se está com a doença há anos. O sujeito deve entrar no numerador quando em al- gum momento do período estipulado para prevalência a pessoa apresentou a doença. U5 60Bioestatística e Epidemiologia Indicadores de Saúde EX EM PL O Cálculo de prevalência Em uma cidade fictícia “X” com 3.000 habitantes, em 1º de janeiro de 2019, havia 12 pessoas em tratamento por Hanseníase. Ao longo do mês de janeiro foram diagnosticados mais 3 casos, e até 31 de junho de 2019 houve 5 altas por cura no mês de maio e não foram identificados mais novos casos da doença. A partir do princípio de que todo caso da doença está em tratamento, qual é a prevalência de hanseníase na cidade “X” no primeiro dia de janeiro de 2019; em janeiro de 2019 e no primeiro semestre do mesmo ano? ` Prevalência em 1 de janeiro de 2019 (prevalência de ponto): númerode pessoas acometidas coma doença emuma populaçãoeumdeterminado períodoPrevalência númerototal de pessoas emuma populaçãoeumdeterminado período = 12 3.000 = 0,004 100 = × 0,4%. = .................................................................. ............. ............. .................................................................. substituir a fórmula substituir a fórmula dividir. multiplicar. ............................................................ Logo, a prevalência de hanseníase em 1 de janeiro de 2019, na cidade “X”, é de 0,4%. ` Prevalência em janeiro de 2019 (prevalência de período): númerode pessoas acometidas coma doença emuma populaçãoeumdeterminado períodoPrevalência númerototal de pessoas emuma populaçãoeumdeterminado período = 12 3 3.000 + = 15 3.000 = 0,005 100 = × 0,5%. = .................................................................. ............................................................. .................................................................. somar. dividir. por fim, multiplicar. 61 Bioestatística e Epidemiologia U5 Indicadores de Saúde EX EM PL O A prevalência de hanseníase em janeiro de 2019, na cidade “X”, é de 0,5%. ` Prevalência no primeiro semestre de 2019 (prevalência de período): ............. substituir a fórmula ............................................................... ............................................................. .................................................................. .................................................................. somar. dividir. por fim, multiplicar. númerode pessoas acometidas coma doença emuma populaçãoeumdeterminado períodoPrevalência númerototal de pessoas emuma populaçãoeumdeterminado período = 12 3 5 3.000 + − = 10 3.000 = 0,0033 100 = × 0,33%. = Portanto, a prevalência de hanseníase no primeiro semestre de 2019, na cidade “X”, é de 0,33%. Alguns fatores influenciam no cálculo da prevalência e devem ser considerados na hora de interpretar o resultado. Primeiramente, pode ser que o indicador esteja subestimado, visto que os casos graves podem não ter sido diagnosticados antes do óbito, e os casos leves e assintomáticos ainda não procuraram assistência. Desse modo, toda variação que aconteça desse indicador, ao longo do tempo, precisa ser levada em consideração. Nesse contexto, a prevalência pode ter aumentado porque, de fato, estão entrando ca- sos novos e há mais pessoas doentes ou porque surgiu uma intervenção que aumenta a sobrevida do paciente e, portanto, as pessoas estão vivendo mais tempo com a doença. Em segundo lugar, a incidência é a proporção e descreve o número de novos casos de uma doença em uma determinada população. Ela só pode ser medida se no início do acompa- nhamento das pessoas for garantido que todos estão saudáveis, ou seja, sem a doença. Ela pode contar qualquer evento, como caso de doença, de morte e de deficiência. Fórmula da incidência: 100 númerodecasos novos deuma doença emuma populaçãoeumdeterminado períodoIncidência númerototal de pessoasemuma populaçãoeumdeterminado período = ×2 U5 62Bioestatística e Epidemiologia Indicadores de Saúde Ela é expressa pelo número de casos por 1.000 a 100.000 habitantes, dependendo da frequência do evento. Essa decisão tem o objetivo de deixar o número de fácil com- preensão. Normalmente, em uma análise de populações de cidades, estados e países usamos a cada 100.000 pessoas. Todo indivíduo que está no denominador pode ser um caso e, também, participar do numerador. Esse indicador é o único que pode avaliar risco de se ter a doença. Portanto, ele é capaz de medir o impacto e a magnitude da doença na população, sendo usada para avaliar relações causais entre as variáveis. EX EM PL O Cálculo de incidência 01. Em uma cidade fictícia “X” com 3.000 habitantes, em 1 de janeiro de 2019, havia 12 pessoas em tratamento por Hanseníase. No mês de janeiro foram diagnosticados mais 3 casos, até 31 de junho de 2019 houve 5 altas por cura no mês de maio e não houve mais casos novos. Parta do princípio de que todo caso da doença está em tratamento. Qual é a incidência de hanseníase na cidade “X” no primeiro semestre do mesmo ano? A incidência de hanseníase no primeiro semestre de 2019 é de 1 caso para cada 1.000 habitantes. 02. No Brasil, em 2019, foram diagnosticados 37.308 casos de AIDS. Conside- rando que a população estimada para o ano de 2019 é de 210.661.032, qual foi a incidência da doença em 2019? .................................................................. ............. ............. ......................................................................... substituir a fórmula substituir a fórmula dividir. multiplicar. ............................................................ númerodecasos novos da doença emuma populaçãoeumdeterminado períodoIncidência númerototal de pessoas emuma populaçãoeumdeterminado período = 3 3.000 = 0,001 1.000 = × 1. = númerodecasos novos da doença emuma populaçãoeumdeterminado períodoIncidência númerototal de pessoas emuma populaçãoeumdeterminado período = 63 Bioestatística e Epidemiologia U5 Indicadores de Saúde EX EM PL O No Brasil, a incidência de AIDS em 2019 é de 17,71 casos para cada 100.000 habitantes. dividir. multiplicar. .................................................................................. ..................................................................37.308 100.000 210.661.032 = × 17,71. = A prevalência está associada com a incidência e a duração da doença, em situações es- táveis, a prevalência é diretamente proporcional a esses dois fatores. A Figura 2 ajudará você a entender essa associação das variáveis. Nesse caso, considere uma pia com a torneira aberta, a água que entra é a incidência e o volume de água parada é a preva- lência (número de casos ativos da doença). Os casos só saem da prevalência por óbito ou cura, isto é, na figura, a água só sai pelo ralo. Assim, se o ralo da pia aumentar de tamanho, por exemplo, com a resistência do agente etiológico ao tratamento, o volume da pia aumentará, assim como a prevalência. Figura 02. Esquema sobre a associação da prevalência, incidência (casos novos) e tempo de duração da doença Casos novos Cura, óbito Prevalência Fonte: elaborada pela autora. U5 64Bioestatística e Epidemiologia Indicadores de Saúde Nesse sentido, doenças de longa duração têm prevalência alta, pois os casos acabam sendo super-representados, já que a cura e o óbito demoram mais tempo para acon- tecer do que o aparecimento dos casos novos. Assim, outras situações, como realizar diagnóstico precoce e a melhora no tratamento, aumentam o tempo da doença e, por- tanto, aumentam a prevalência. Para as doenças crônicas não transmissíveis, a prevalência é a única medida a ser utilizada. Na maioria dos casos, ela pode ser obtida por meio de estudos transversais. Já para as doenças transmissíveis de notificação compulsória, pode-se calcular a inci- dência e a prevalência dos casos. 3. INDICADORES DE NATALIDADE, FECUNDIDADE E MORBIDADE Apenas contar o número de casos da doença não é suficiente para avaliar a gravidade. Por exemplo, a dengue tem alta taxa de incidência, mas em poucos casos há morte. A letalidade, por sua vez, é a proporção de casos da doença que vão ao óbito, sendo expressa em porcentagem. Fórmula da letalidade: Se descobrirmos um novo método diagnóstico que é mais sensível a doença, a incidên- cia aumentará devido ao aumento do número de casos novos, assim como a prevalên- cia. Na lógica do esquema da Figura 2, o novo diagnóstico abrirá ainda mais a torneira e, portanto, a pia ficará cheia de água, já que o ralo continua do mesmo tamanho.EX EM PL O 100 númerototal deóbitos pela doença emuma populaçãoeumdeterminado períodoLetalidade númerototal decasos pela doença emuma populaçãoeumdeterminado período = ×3 Enquanto a incidência representa o risco de ficar doente, a letalidade expõe o risco de morrer uma vez que se está doente. Em 2019, o Brasil tinha uma população total de 210.659.013 habitantes. Nesse período, o país apresentou o total de 1.349.802 óbitos, entre eles, 1.434 pessoas tinham como causa básica a meningite. Em 2019, foram diagnosticados 16.159 casos da doença. Qual é a letalidade de meningite em 2019, no Brasil?EX EM PL O 65 Bioestatística e Epidemiologia U5 Indicadores de Saúde Letalidade EX EM PL O 100 númerodeóbitos pela doençaLetalidade total casos pela doença = × 1.434 100 16.159 Letalidade = × 8,87.Letalidade = Em 2019, a letalidade no Brasil para meningite é de 8,87%, ou seja, 9% dos casos da doença irão a óbito. substituir os valor .................realizar a divisão e a multiplicação. A taxa bruta de natalidade é a proporção de crianças nascidas vivas em uma determina- da população, tempo e local. Ela é utilizada para estimar o crescimento da população, sendo expressa pelo número de nascidos vivos a cada 1.000 habitantes. Fórmula da taxa bruta de natalidade: O indicador é influenciado pela característica da população, pois em uma população mais idosa há poucos nascimentos de crianças, e pelas condições socioeconômicas. A taxa de fecundidade total indica o número médio de filhos que uma mulher tem no seu período reprodutivo (de 15 a 49 anos). Essa taxa é utilizada, principalmente, para avaliar o crescimento populacional, indicando a possibilidade de reposição populacional, em que a fecundidade menor do que 2,1 indica uma reposição populacional insuficiente. As con- dições sociais e econômicas podem influenciar no aumento ou na redução da taxa. A taxa específica de fecundidade indica a média do número de filhos que uma mulher tem em uma determinada faixa etária. A fórmula é o número de nascidos vivos de mu- lheres com uma faixa de idade específica dividindo pela população total feminina da faixa etária. Normalmente, essa análise é observada a cada cinco anos, por exemplo, fecundidade de mulheres 15 a 19 anos, 20 a 24 e assim sucessivamente até a faixa 45 a 49 anos. Podem ser expressas a cada 1.000 mulheres de determinada faixa etária. 1.000 númerototal denascidos vivos deresidentes emumdeterminado períodoetempoNatalidade númerototal de pessoas emuma populaçãoeumdeterminado períodoetempo = ×4 % U5 66Bioestatística e Epidemiologia Indicadores de Saúde Para isso se multiplica o resultado por 1.000. Fórmula da taxa de fecundidade específica (TFE): EX EM PL O Natalidade e fecundidade específica e total Em 2019, o Brasil tinha uma população total de 210.659.013 habitantes, em que 57.055.184 pessoas eram mulheres de 15 a 49 anos. Nesse ano, o país teve 2.849.146 nascidos vivos. O cálculo da taxa de fecundidade total é feito primeiramente somando as taxas especí- ficas de fecundidade de períodos idade (15 a 19, 20 a 24, 25 a 29, 30 a 34, 35 a 39, 40 a 44 e 45 a 49 anos) de mulheres residentes em determinado local. Os valoresa serem somados são o resultado da divisão antes de multiplicar por 1.000. Depois da soma se multiplica o valor por 5 já que a faixa etária das fecundidades específicas é de cinco anos. Fórmula da taxa de fecundidade total: 5 ( )1 5 1 9 20 24 25 29 30 34 35 39 40 44 45 49 5 Fecundidade TFE a anos TFE a anos TFE a anos TFE a anos TFE a anos TFE a anos TFE a anos Total = + + + + + + × ( )1 5 1 9 20 24 25 29 30 34 35 39 40 44 45 49 5 Fecundidade TFE a anos TFE a anos TFE a anos TFE a anos TFE a anos TFE a anos TFE a anos Total = + + + + + + × Tabela 01. Distribuição de nascidos vivos por faixa etária materna e população feminina residente no Brasil em 2019 conforme faixa etária NASCIDOS VIVOS POPULAÇÃO FEMININA 15 a 19 anos 399.922 8.338.727 20 a 24 anos 697.478 8.415.846 25 a 29 anos 674.427 8.424.527 30 a 34 anos 597.119 8.587.322 35 a 39 anos 364.105 8.700.521 40 a 44 anos 90.968 7.727.483 45 a 49 anos 5.310 6.860.758 Fonte: elaborada pela autora. 67 Bioestatística e Epidemiologia U5 Indicadores de Saúde EX EM PL O Nesse contexto, quais são as taxas brutas de natalidade e taxas de fecundidade espe- cíficas e total em 2019 no Brasil? Taxa de bruta de natalidade: 1.000 númerodenascidos vivosNatalidade númerototal de pessoas = × 2.849.146 1.000 210.659.013 Natalidade = × 13,52. Natalidade = ...................substituir os valores. ...............realizar a divisão e a multiplicação. No Brasil, a taxa de bruta de natalidade em 2019 é de 13,52 nascidos vivos a cada 1.000 habitantes. Taxa de fecundidade específica: 1 5 1 9 1 5 1 9 1 5 1 9 nascidos vivos de mulheres de a anosTFE a anos mulheres de a anos = 399.9221 5 1 9 8.338.727 TFE a = 1 5 1 9 TFE a anos = ...................substituir os valores. .....................realizar a divisão e a multiplicação. 0,0480 697.478 20 24 20 24 0,0829 20 24 8.415.846 nascidos vivos de mulheres de a anosTFE a anos mulheres de a anos = = = 674.427 25 29 25 29 0, 25 29 8.424.527 nascidos vivos de mulheres de a anosTFE a anos mulheres de a anos = = = 597.119 30 34 30 34 0,0695 30 34 8.587.322 nascidos vivos de mulheres de a anosTFE a anos mulheres de a anos = = = 364.105 35 39 35 39 0,0418 35 39 8.700.521 nascidos vivos de mulheres de a anosTFE a anos mulheres de a anos = = = = 0,0829 = 0,0801 = 0,0695 = 0,0418 U5 68Bioestatística e Epidemiologia Indicadores de Saúde EX EM PL O 90.968 40 44 40 44 0,0118 40 44 7.727.483 nascidos vivos de mulheres de a anosTFE a anos mulheres de a anos = = = 5.310 45 49 45 49 0,0008 45 49 6.860.758 nascidos vivos de mulheres de a anosTFE a anos mulheres de a anos = = = = 0,0118 = 0,0008 Taxa de fecundidade total: ( )1 5 1 9 20 24 25 29 30 34 35 39 40 44 45 49 5Fecundidade TFE a TFE a TFE a TFE a TFE a TFE a TFE a= + + + + + + × ( )1 5 1 9 20 24 25 29 30 34 35 39 40 44 45 49 5Fecundidade TFE a TFE a TFE a TFE a TFE a TFE a TFE a= + + + + + + × ...................substituir os valores. ...................................................... realizar a multiplicação. (0,0480 0,0829 0,0801 0,0695 0,0418 0,0118 0,0008 5Fecundidade = + + + + + + × (0,0480 0,0829 0,0801 0,0695 0,0418 0,0118 0,0008 5Fecundidade = + + + + + + × Em 2019, a taxa de fecundidade total no Brasil é de 1,67 nascidos vivos a cada mulheres de 15 a 49 anos, sendo que a faixa etária de mulher que mais tem filho é a de 20 a 24 anos. Por fim, a esperança (ou expectativa) de vida ao nascer é o número médio de anos que a pessoa vive, conforme o ano de nas- cimento. Esse indicador é muito utilizado para avaliar e comparar a saúde de um país, nesse sentido, seu valor é utilizado na construção do Índice de Desenvolvimento Humano (IDH). Contudo, embora a expec- tativa de vida ao nascer no Brasil seja maior do que 75 anos, isso não significa que todas as pessoas viverão, em média, até os 75 anos. A estatística serve para estimar o tempo de vida das crianças nascidas naquele ano, logo, para saber qual é sua esperança de vida ao nascer, é necessário buscar o valor a partir do seu ano de nascimento. Com isso, é possível comparar a esperança de vida para faixas etárias. Por exemplo, em 2015, quem tem 10 anos e quem tem 65 anos tem expectativas de vidas diferentes. As- Figura 03. Expectativa de vida Fo nt e: 1 23 R F. % 69 Bioestatística e Epidemiologia U5 Indicadores de Saúde sim, à medida que se envelhece, a expectativa de vida aumenta. Então, uma pessoa com 10 anos naquele ano terá uma expectativa de vida maior do que 65 anos, uma vez que já sobreviveu e superou a mortalidade esperada para a mortalidade infantil, por exemplo. Dessa forma, estimar o tempo de vida não é suficiente, pois não se avalia a quali- dade da vida. Por isso, uma iniciativa internacional que o Brasil participa começou a avaliar o peso das doenças na longevidade da população. Os estudos da Carga Global de Doenças (em inglês GBD – Global Disease Burden) tiveram início no final dos anos 1990. Eles desenvolveram ou difundiram os indicadores: anos potenciais de vida perdidos (em inglês YLL – years life lost), anos de vida saudáveis perdidos (em inglês DALY – disability adjusted life years) e expectativa de vida saudável (em inglês HALE – healty life expectancy). O YLL avalia o impacto que a doença pode ter na vida da pessoa a partir de quantos anos de vida foram perdidos pela morte precoce. O DALY avalia qual o tempo que a pessoa viveu com alguma deficiência em decorrência de uma doença, aferindo o impac- to da doença no sobrevivente. Já o HALE avalia a expectativa de vida antes de desen- volver uma doença ou condição grave incapacitante, sendo muito útil para avaliar se o aumento da esperança de vida está associado com mais tempo de vida saudável ou se esse tempo a mais será com um baixo nível de saúde e qualidade de vida. 4. OBJETO DE APRENDIZAGEM 0,00 10,00 20,00 30,00 40,00 50,00 60,00 70,00 80,00 90,00 100,00 Incidência média de COVID-19 por 100.000 habitantes de 01/03/20 a 20/04/21 Peru Itália EUA Reino Unido Brasil Espanha Comentário No final do ano de 2020 as novas variantes começaram a circular e por isso pode-se observar um aumento do número de casos novos. U5 70Bioestatística e Epidemiologia Indicadores de Saúde Comentário Perceba que o eixo vertical tem duas escalas diferentes já que as duas variáveis (casos e óbitos) tem grandezas diferentes Comentário A curva de mortalidade do Brasil no final do gráfico é de mesma intensidade que a curva da Itália no começo da pandemia. Esses dois picos estreitos do Peru provavelmente são explicados por atualiza- ção de dados atrasados. 0 5 10 15 20 25 Taxa de Mortalidade média por COVID-19 por 1.000.000 habitantes de 01/03/20 a 20/04/21 Peru Itália EUA Reino Unido Brasil Espanha 0 500 1000 1500 2000 2500 3000 3500 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 N úm er o de ó bi to s N úm er o de c as os n ov os Média de casos novos e média de óbitos diários de COVID-19 no Brasil de 01/03/2020 a 20/04/2021 casos óbitos 71 Bioestatística e Epidemiologia U5 Indicadores de Saúde PAÍS POPULAÇÃO CASOS TOTAIS ÓBITOS TOTAIS LETALIDADE INCIDÊNCIA (POR 100.000 HAB) TAXA DE MORTALIDADE ESPECÍFICA (POR 100.000 HAB) Peru 32.510.450 1.697.626 56.797 3,35% 5.221,79 174,70 Itália 60.302.090 3.870.131 116.927 3,02% 6.417,91 193,90 EUA 328.239.520 31.311.941 561.616 1,79% 9.539,36 171,10 Reino Unido 66.836.330 4.387.824 127.270 2,90% 6.565,03 190,42 Brasil 211.049.530 13.900.091 371.678 2,67% 6.586,17 176,11 Espanha 47.133.520 3.396.685 76.882 2,26% 7.206,52 163,12 Fonte de todos os gráficos e tabela: - Dados COVID-19 coletados na Organização Mundial da Saúde (OMS) Disponível em https://portal.who.int/report/eios-covid19-counts/#display=Countries_and_ Territories&nrow=2&ncol=3&arr=row&pg=1&labels=&sort=cur_case_who;desc&filter=&sidebar=4&fv=Acessado em 20 abr 2021. - Dados de população: Banco Mundial Disponível em: https://data.worldbank.org/indicator/SP.POP. TOTL . Acessado em: 15 Maio 2021 Tabela 02. Informações sobre a pandemia de COVID-19 em países no período de 04/01/2020 a 20/04/2021 U5 72Bioestatística e Epidemiologia Indicadores de Saúde DEPARTAMENTO DE INFORMÁTICA DA FUNDAÇÃO NACIONAL DE SAÚDE DO SUS - DATASUS. In- formação de Saúde. Brasília, DF: Ministério da Saúde, 2020. Disponível em: http://www2.datasus.gov.br/ DATASUS/index.php?area=02. Acesso em: 25 fev. 2021. FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. Epidemiologia clínica: elementos essenciais. 5. ed. Porto Alegre: ArtMed, 2014. LAURENTI, R. Análise da informação em saúde: 1893 – 1993, cem anos da Classificação Internacional de Doenças. Revista Saúde Pública, São Paulo, v. 25, n. 6, p. 407-417, 1991. Disponível em: https://www.scie- losp.org/pdf/rsp/1991.v25n6/407-417. Acesso em: 15 mar. 2021. REDE INTERAGENCIAL DE INFORMAÇÃO PARA A SAÚDE – RIPSA. Indicadores básicos para a saúde no Brasil: conceitos e aplicações. 2. ed. Brasília: Organização Pan-Americana da Saúde, 2008. Disponível em: http://www.ripsa.org.br/2014/10/30/indicadores-basicos-para-a-saude-no-brasil-conceitos-e-aplicacoes- -livro-2a-edicao-2008-2/. Acesso em: 3 mar. 2021. ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia e saúde. 8. ed. Rio de Janeiro: Medbook, 2018. REFERÊNCIAS BIBLIOGRÁFICAS about:blank about:blank about:blank about:blank about:blank about:blank 74 UNIDADE 6 TRANSIÇÃO DEMOGRÁFICA E EPIDEMIOLÓGICA INTRODUÇÃO Quantas pessoas morrem por essa doença? Do que as pessoas morrem? Qual é a principal causa de morte do estado de São Paulo e do município de Curitiba? Ao longo do tempo, as causas de morte e a expectativa de vida mudaram? As informações abordadas nesta unidade ajudarão você a entender como essas infor- mações podem ser obtidas e como interpretá-las. 1. INDICADORES DE MORTALIDADE A análise das causas de morte é um indicador de saúde. Essa é uma referência para saber quais doenças mais acometem a população ao ponto de levar as pessoas a óbito. As informações são obtidas na declaração de óbito, que se trata de um documento igual em todo o país e segue um padrão internacional de descrever as causas da morte, a fim de possibilitar uma comparação entre países. A principal análise da mortalidade considera apenas uma única causa. Desse modo, considere que uma pessoa que tinha câncer de mama há seis anos, com metástase hepática há dois anos, e que teve insuficiência hepática seguida de falência múltipla dos órgãos, que a levou a óbito. Qual dessas doenças seria o mais adequado para entrar na estatística? A causa que irá para a análise de mortalidade é a causa básica de morte, ou seja, a doença ou evento que iniciou a cadeia de eventos que levou a óbito. Portanto, nesse caso descrito, seria o câncer de mama. Por causa desse raciocínio, algumas doenças podem apresentar uma baixa taxa de mortali- dade, mesmo sendo frequentemente citadas nos atestados de óbito, como a diabetes e a hipertensão arterial sistêmica. Essas doenças são muito prevalentes na população adulta, no entanto, raramente são definidas como a causa básica nos atestados de óbito. Logo, há prejuízo na identificação do impacto dessas doenças na mortalidade da população. Há vários indicadores de mortalidade, no entanto, tradicionalmente, a análise ocorre pelos óbitos de residentes do local (município, estado, região ou país) e não a partir dos óbitos ocorridos no local. Como algumas informações sofrem ajustes após a notificação, normalmente, os indicadores demoram de um a dois anos para serem concluídos. Por sua vez, os dados brutos para realizar os cálculos podem ser encontrados no DATASUS. Figura 01. Taxas e indicadores Fo nt e: 1 23 R F. 75 Bioestatística e Epidemiologia U6 Transição demográfica e epidemiológica As causas das estatísticas de mortalidade são contadas a partir do código Classificação Es- tatística Internacional de Doenças e Problemas Relacionados com a Saúde (CID) de cada doença. Essa classificação é internacional, desenvolvida pela Organização Mundial da Saúde (OMS) e, em 2019, foi lançada a sua 11ª edição (CID-11). Com isso, em 2022, espera-se que os países da OMS iniciem o uso da nova versão. Na CID-10, as doenças estão organizadas por aparelhos e agrupadas por similaridades, por exemplo, o capítulo IX se refere a doenças do aparelho circulatório, em que o código I10 se trata da hipertensão arterial sistêmica. A taxa de mortalidade geral é o principal indicador, pois, ela resume qual a proporção de pessoas que morrem em um determinado período e local. Esse indicador é expresso por 1.000 habitantes e essa taxa é utilizada para avaliar a condição geral de saúde. Fórmula da taxa de mortalidade geral (TMG): 1 Além da mortalidade geral, é possível calcular grupos específicos de causas ou de idades. Para indicadores de causa, pode-se avaliar apenas uma causa ou um grupo. Tradicionalmente, as causas são agrupadas por capítulos ou agrupamentos previamen- te previstos pela CID-10. A taxa de mortalidade específica por causa calcula a proporção de óbitos por uma causa ou o grupo de causas específicas na população. Esse indicador, por sua vez, é expresso por 100.000 habitantes. A taxa de mortalidade específica por neoplasias malignas expressa a proporção de pessoas, de um determinado período e local, que tiveram como causa básica de morte uma neoplasia maligna. EX EM PL O Fórmula da taxa de mortalidade específica por causa (TM específica): 2 Essa taxa mede a intensidade e magnitude da doença. Ela é uma incidência de morte e, portanto, avalia risco de a população ir a óbito por uma causa, podendo ser utilizado para ajudar na avaliação das condições de saúde e de planejamento do sistema e serviços. U6 76Bioestatística e Epidemiologia Transição demográfica e epidemiológica Já a mortalidade proporcional por causa calcula a proporção de óbitos por uma cau- sa ou o grupo de causas específicas entre todos os óbitos. Por exemplo, mortalidade proporcional por doenças cardiovasculares expressa a proporção dos óbitos de um de- terminado período e local que tiveram como causa básica uma doença cardiovascular, sendo expressa por porcentagem de óbitos. Nesse indicador, observe que o denomina- dor é o número total de óbitos. Fórmula da mortalidade proporcional por causa (M Proporcional): 3 A mortalidade proporcional mede a participação da causa no total de óbitos, podendo ser utilizada para ajudar na avaliação das condições de saúde e de planejamento do sistema e serviços. Ela depende das características da população e sofre influência pela frequência das outras causas. Uma mortalidade proporcional baixa não significa, necessariamente, que exista um bai- xo risco de óbito por uma causa específica. Nesse contexto, pode ser que a mortalidade proporcional esteja baixa porque, naquele período, houve um aumento de outros casos. Já a taxa de mortalidade específica não é influenciada pelas outras causas. Na Figura 2, ao comparar os óbitos por causas externas (capítulo XX), a taxa de mortalidade pro- porcional no Amazonas é maior quando comparado com o Brasil, mas a taxa de morta- lidade específica pelo mesmo capítulo é similar. Figura 02. Gráficos comparando a taxa de mortalidade específica (A) por 100.000 habitantes e a mortali- dade proporcional (B) por capítulos da CID-10 no Brasil, Amazonas e São Paulo em 2019 77 Bioestatística e Epidemiologia U6 Transição demográfica e epidemiológica Nota: cap. II: neoplasmas [tumores]; cap. IV: doenças endócrinas, nutricionais e metabólicas; cap. IX: doenças do aparelho circulatório; cap. X: doenças do aparelho respiratório; cap. XVIII: sintomas, sinais e achados anormais de exames clínicos e de laboratório, não classificados em outra parte; e cap. XX: causas externas de morbidade e de mortalidade. Fonte: DATASUS (2019, [n. p.]). TMG, TM específica e mortalidadeproporcional Em 2019, o Brasil tinha uma população total de 210.659.013 habitantes. Nesse perío- do, o país apresentou 1.349.802 óbitos totais, em que 364.132 desses óbitos ocorre- ram devido às doenças do aparelho circulatório e 235.301 por neoplasias. Quais são as taxas de mortalidade geral, taxa de mortalidade específica por neoplasias e a taxa de mortalidade proporcional por doenças do aparelho circulatório, no Brasil, em 2019? Taxa de mortalidade geral: EX EM PL O S ......................substituir os valores. .........................................dividir e multiplicar. Logo, a taxa de mortalidade geral no Brasil em 2019 é de 6,41 mortes a cada 1.000 habitantes. U6 78Bioestatística e Epidemiologia Transição demográfica e epidemiológica EX EM PL O S Taxa de mortalidade específica por neoplasia: ...................................substituir os valores. ...............................................................dividir e multiplicar. A taxa de mortalidade específica por neoplasia no Brasil em 2019 é de 111,7 mortes a cada 100.000 habitantes. Mortalidade proporcional por doenças do aparelho circulatório: ...........substituir os valores. .........................................dividir e multiplicar. Por fim, a mortalidade proporcional por doenças do aparelho circulatório no Brasil em 2019 é de 26,98%. Ou seja, 26,98% dos óbitos têm como causa básica uma doença do aparelho circulatório. Fonte: DATASUS (2019, [n. p.]). A mortalidade proporcional por faixa etária consegue indicar o nível de saúde da popu- lação, a qualidade dos serviços e o grau de desenvolvimento do local. Por sua vez, os dois indicadores mais comuns são a Razão de Mortalidade Proporcional e a curva de Mortalidade Proporcional. A curva de Mortalidade Proporcional é também chamada de curva de Nelson de Mo- raes, autor da classificação de quatro tipos de curvas relacionadas ao nível de saúde da população, foi descrita em 1959. EX EM PL O A Figura 3 apresenta a representação gráfica dos quatro tipos de curvas (A) e a curva do Brasil, Amazonas e São Paulo em 2019. 79 Bioestatística e Epidemiologia U6 Transição demográfica e epidemiológica Fonte: (A) Rouquayrol e Gurgel (2018, p. 54) e (B) DATASUS (2019, [n. p.]). Figura 03. Curva mortalidade proporcional por faixa etária. (A) Representação dos quatro tipos de níveis de saúde diferentes descrito por Nelson de Moraes. (B) Informações do Brasil, Amazonas e São Paulo em 2019 U6 80Bioestatística e Epidemiologia Transição demográfica e epidemiológica A Razão de Mortalidade Proporcional, ou o Índice de Swaroop & Uemura, se trata da proporção de óbitos que ocorreram em pessoas com 50 anos ou mais em um determi- nado período e local. Ela é expressa em porcentagem. Fórmula da razão de mortalidade proporcional: 4 Nesse indicador, criado em 1955, quanto maior seu valor, melhores as condições de saú- de do local, pois, espera-se que a grande maioria dos óbitos ocorram em pessoas com mais de 50 anos de idade. Com isso, ele é utilizado para avaliar as condições de países. Para ajudar a interpretá-lo, criaram-se quatro grupos: índice de 75% ou mais, em que se considera o país desenvolvido; índice de 50 a 74%, país com certo desenvolvimento eco- nômico e bom serviços de saúde; índice de 25 a 49%, país com atraso econômico e social; por fim, índice inferior a 25%, considera-se o país com alto grau de subdesenvolvimento. EX EM PL O S Razão de mortalidade proporcional: O Brasil, em 2019, tinha uma população total de 210.659.013 habitantes. Nesse pe- ríodo, o país apresentou 1.349.802 óbitos totais, em que 1.084.425 desses óbitos ocorreram em pessoas com 50 anos ou mais. Razão de mortalidade proporcional: ...........substituir os valores. .........................................dividir e multiplicar. No Brasil, a razão de mortalidade em 2019 foi de 80,34%, no estado de São Paulo foi de 84,28% e no Estado de Amazonas de 64,35%. Fonte: DATASUS (2019, [n. p.]). 81 Bioestatística e Epidemiologia U6 Transição demográfica e epidemiológica Além disso, outro indicador que consegue fazer uma associação com as condições de saúde de um local é a mortalidade infantil. A taxa de mortalidade infantil é como uma mortalidade específica para uma faixa etária, estimando o risco de morte das crianças com menos de 1 ano (de 0 a 364 dias de vida). Para estimar esse risco, o correto seria o denominador do cálculo da taxa ser a população menor de 1 ano do determinado local e período em que se pretende avaliar. No entanto, como não é possível ter esse valor real, usamos o número de nascidos vivos como estimativa. Fórmula da taxa de mortalidade infantil (TMI): 5 Esse indicador é muito utilizado para comparar países e, normalmente, é considerado alto se o valor for 50 ou mais óbitos por mil habitantes, médio se apresenta de 20 a 49 e baixo se menor que 20. Para conseguir um detalhamento das razões que levaram as crianças a óbito, pode-se utilizar um indicador de mortalidade com faixas etárias mais reduzidas. A taxa de mortalidade neonatal utiliza os óbitos de crianças de 0 a 27 dias. A taxa de mortalidade neonatal precoce utiliza os óbitos de crianças de 0 a 6 dias de vida, enquanto a neonatal tardia de 7 a 27 dias. Fórmula da taxa de mortalidade neonatal (TMN): 6 7 8 Fórmula da taxa de mortalidade neonatal precoce (TMN precoce): Fórmula da taxa de mortalidade neonatal tardia (TMN tardia): U6 82Bioestatística e Epidemiologia Transição demográfica e epidemiológica 9 A mortalidade neonatal está associada a qualidade da atenção à saúde, pois, normal- mente, os óbitos que acontecem nesse período são em decorrência da qualidade da assistência nos períodos de pré-natal, parto e perinatal. Para avaliar as condições so- cioambientais é adequado utilizar a taxa de mortalidade pós-neonatal. Essa taxa, por sua vez, utiliza os óbitos de crianças com 28 a 364 dias de vida. Nesse período, as prin- cipais causas de morte são questões nutricionais ou doenças transmissíveis. A Figura 4 apresenta um esquema com as divisões dos períodos da mortalidade infantil. Fórmula da taxa de mortalidade pós-neonatal (TMPN): Figura 04. Esquema das divisões das faixas etárias da mortalidade infantil Mo rta lid ad e n eo na tal pr ec oc e ( 0 a 6d ) Mo rta lid ad e n eo na tal ta rdi o ( 7 a 27 d) Mortalidade neonatal (0 a 27d) Mortalidade pós-neonatal (28 a 364d) Mortalidade infantil 0d 7d 28d 1a Fonte: elaborada pela autora. EX EM PL O S Taxa de mortalidade infantil e suas subdivisões Em 2019, o Brasil tinha uma população total de 210.659.013 habitantes. Nesse pe- ríodo, o país apresentou 1.349.802 óbitos totais, entre eles, 35.293 ocorreram em crianças menores de 1 ano de idade, 18.402 entre crianças com 0 a 6 dias de vida, 6.102 entre 7 e 27 dias e 10.789 entre 28 e 364 dias. Nesse ano, o país teve 2.849.146 nascidos vivos. Quais as taxas de mortalidade infantil, neonatal, neonatal precoce, neonatal tardia e pós-neonatal, em 2019, no Brasil? 83 Bioestatística e Epidemiologia U6 Transição demográfica e epidemiológica EX EM PL O S Taxa de mortalidade infantil (TMI): 1 1.000 númerodeóbitos em anoTMI total denascidos vivos < = × 35.293 1.000 2.849.146 TMI = × 1 2,39TMI = ...........substituir os valores. ...........substituir os valores. ...........substituir os valores. .......................................dividir e multiplicar. .......................................dividir e multiplicar. .......................................dividir e multiplicar. A taxa de mortalidade infantil no Brasil em 2019 é de 12,39 mortes a cada 1.000 nas- cidos vivos. Taxa de mortalidade neonatal (TMN): 0 27 1.000 númerodeóbitos de a diasTMN total denascidos vivos = × 24.504 1.000 2.849.146 TMN = × 8,60. TMN = A taxa de mortalidade neonatal no Brasil em 2019 é de 8,6 mortes a cada 1.000 nas- cidos vivos. Taxa de mortalidade neonatal precoce (TMN precoce):0 6 1.000 númerodeóbitos de a diasTMN precoce total denascidos vivos = × 18,402 1.000 2.849.146 TMN p = × 6, 46. TMN p = Já a taxa de mortalidade neonatal precoce no Brasil em 2019 é de 6,46 mortes a cada 1.000 nascidos vivos. U6 84Bioestatística e Epidemiologia Transição demográfica e epidemiológica EX EM PL O S Taxa de mortalidade neonatal tardia (TMN tardia): Então, em 2019, a taxa de mortalidade neonatal tardia no Brasil foi de 2,14 mortes a cada 1.000 nascidos vivos. Taxa de mortalidade pós-neonatal (TMPN): 7 27 1.000 númerodeóbitos de a diasTMN tardia total denascidos vivos = × 6.102 1.000 2.849.146 TMN t = × 2,14.TMN t = ...........substituir os valores. .......................................dividir e multiplicar. 28 364 1.000 númerodeóbitos de a diasTMPN total denascidos vivos = × 10.789 1.000 2.849.146 TMPN = × 3,79.TMPN = ...........substituir os valores. .......................................dividir e multiplicar. Portanto, a taxa de mortalidade pós-neonatal no Brasil em 2019 é de 3,79 mortes a cada 1.000 nascidos vivos. Fonte: DATASUS (2019, [n. p.]). 2 TRANSIÇÃO DEMOGRÁFICA E EPIDEMIOLÓGICA Há outros indicadores que ajudam na avaliação e na descrição da população de um lo- cal, como: razão de sexo, proporção de idosos ou de menores de 5 anos e índice de en- velhecimento (RIPSA, 2008, p. 70-71). Assim, ao analisar uma série histórica de todos os indicadores, é possível contar a história da população e suas condições de saúde. Por exemplo, considere a primeira metade do século XX no Brasil, pense na família dos seus avós, normalmente, as famílias tinham mais do que 5 filhos e, frequentemente, uma criança não chegava a fase adulta, as pessoas morriam jovens e existiam muitos casos e mortes por doenças transmissíveis (como sarampo e tuberculose). Historica- mente, o Brasil é uma república recente com grande participação econômica da agricul- tura, mas as cidades cresceram consideravelmente com a industrialização. 85 Bioestatística e Epidemiologia U6 Transição demográfica e epidemiológica Ao pensar nos indicadores de saúde, a taxa de fecundidade total e natalidade eram altas naquela época, a proporção de idosos era muito baixa enquanto a de crianças era alta, a taxa de mortalidade infantil era alta e a principal causa de morte eram doenças trans- missíveis. As condições de vida eram precárias, as casas não tinham saneamento bási- co, pessoas moravam em cortiços e espaços pequenos e aglomerados, elas passavam fome e o salário era baixo. Consequentemente, essas situações favoreceram as doenças transmissíveis e mortalidade infantil por fome, desnutrição e doenças diarreicas. Conforme o tempo passou, as condições das pessoas melhoraram, houve a criação dos direitos trabalhistas, o investimento no saneamento básico e a melhoria no acesso e nos serviços de saúde com campanhas sanitaristas e vacinas. Isso fez reduzir o nú- mero de óbitos por doenças transmissíveis, a taxa mortalidade geral e infantil. Dessa forma, a população começou a sobreviver por mais tempo com aumento da prevalência de doenças crônicas. Nesse período, as taxas de fecundidade e natalidade ainda são altas, e isso, associado ao aumento da expectativa de vida, fez a população crescer. A redução da mortalidade infantil diminuiu a necessidade de se ter muitos filhos para garantir que al- guns cheguem a idade adulta. Com o passar do tempo, as pessoas mi- graram para as cidades que são ur- banizadas e com saneamento e as melhorias das condições de vida, trabalho e serviços de saúde se mantiveram. Só depois dessas di- versas e extensas melhoras é que as taxas de fecundidade total e na- talidade começaram a reduzir. No Brasil, especificamente, isso aconteceu a partir de 1980, e nessa fase houve uma aceleração da transição demográfica. No Brasil no século XXI, as mulheres estão trabalhando e não têm “tempo” para ter e cuidar de filhos; há aumento no número de famílias com um ou nenhum filho; e com o advento da reprodução assistida, casais com idade avançada conseguem ter filhos. A população está em processo de envelhecimento. As crianças, fruto das altas taxas de fecundidade da dé- cada de 1950 e 1960, estão se tornando idosos e, com o aumento da expectativa de vida, esse grupo etário só deve aumentar de tamanho. Por outro lado, no futuro, caso a situação se mantenha, teremos um contingente menor de adultos e crianças. Figura 05. Aumento da expectativa de vida Fo nt e: 1 23 R F. SA IB A M A IS O artigo a seguir descreve a mudança populacional no Brasil: MIRANDA, G. M. D.; MENDES, A. da C. G.; SILVA, A. L. A. da. O envelhecimento popu- lacional brasileiro: desafios e consequências sociais atuais e futuras. Revista Brasileira de Geriatria e Gerontologia, Rio de Janeiro, v. 19, n. 3, p. 507-519, jun. 2016. Dispo- nível em: https://doi.org/10.1590/1809-98232016019.150140. Acesso em: 1 mar. 2021. about:blank U6 86Bioestatística e Epidemiologia Transição demográfica e epidemiológica Esse processo de transformação das características da população é chamado de tran- sição epidemiológica ou demográfica. A transição epidemiológica se refere a mudanças dos padrões de morbimortalidade da população como a alteração da principal causa de morte e das doenças mais prevalentes. A transição demográfica, por sua vez, refere-se às mudanças das características da população, que passa de uma população jovem para uma população envelhecida. Portanto, esse processo é alavancado pela diminui- ção da mortalidade e queda nas taxas de fecundidade e natalidade. Uma ferramenta para avaliar a transição demográfica é o gráfico de pirâmide populacional em que é possível visualizar a proporção de pessoas por faixa etária e sexo para um de- terminado local e período. Para países e locais que ainda não passaram pelas transições, o contorno do gráfico parece uma pirâmide com base larga e baixa com uma ponta final. Esses locais têm alta natalidade e baixa expectativa de vida, como é o caso da pirâmide na Figura 6b. Já os países que já passaram pelo processo de transição têm o gráfico com um desenho que se assemelha a um barril. A proporção de crianças e idosos são similares, com alta expectativa de vida e baixa natalidade, esse desenho ocorre em lo- cais desenvolvidos. Na Figura 6a é possível observação uma pirâmide durante a transi- ção demográfica, a base está reduzindo enquanto o topo está aumentando de tamanho. Figura 06. Pirâmide populacional de Porto Alegre/RS (A) e Autazes/AM (B), em 2010, comparada com a do Brasil no mesmo período A 87 Bioestatística e Epidemiologia U6 Transição demográfica e epidemiológica B Fonte: https://cidades.ibge.gov.br/brasil/panorama. Acesso em: 1 mar. 2021. As transições acontecem em períodos diferente para cada país ou região. Logo, os mar- cos sociais que causam a transição podem ainda não ter ocorrido. No Brasil do século XXI, há locais com uma pirâmide populacional com desenho de pirâmide e locais que estão mais próximos do desenho de barril. Dessa forma, a análise do envelhecimento da população possibilita prever ou programar uma sociedade que esteja preparada para essa mudança de demanda. No futuro não ha- verá tanta necessidade de pediatras e escolas, mas, em contrapartida, necessitaremos de um aumento de gerontólogos, da aposentadoria e de instituições de longa permanência. SA IB A M A IS O vídeo: Hans Rosling em crescimento populacional (título original Hans Rosling: Glo- bal population growth, box by box), do canal TED, descreve a distribuição e caracte- rísticas ao longo dos anos da população mundial e quais são os futuros desafios que teremos no futuro. Disponível em: https://youtu.be/fTznEIZRkLg. Acesso em: 1 mar. 2021. about:blank U6 88Bioestatística e Epidemiologia Transição demográfica e epidemiológica 3. OBJETO DE APRENDIZAGEM Visite o site disponível em: https://cidades.ibge.gov.br/brasil/panorama (acesso em: 4 abr. 2021) e observeos indicadores de saúde e a pirâmide populacional. 89 Bioestatística e Epidemiologia U6 Transição demográfica e epidemiológica REFERÊNCIAS BIBLIOGRÁFICAS DEPARTAMENTO DE INFORMÁTICA DA FUNDAÇÃO NACIONAL DE SAÚDE DO SUS - DATASUS. Portal de Saúde. Brasília, DF: Ministério da Saúde, 2020. Disponível em: http://www2.datasus.gov.br/DATASUS/ index.php?area=02. Acesso em: 25 fev. 2021. FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. S. Epidemiologia clínica: elementos essenciais. 5. ed. Porto Alegre: ArtMed, 2014. REDE INTERAGENCIAL DE INFORMAÇÃO PARA A SAÚDE – RIPSA. Indicadores básicos para a saúde no Brasil: conceitos e aplicações. 2. ed. Brasília: Organização Pan-Americana da Saúde, 2008. Disponível em: Erro! A referência de hiperlink não é válida.http://www.ripsa.org.br/2014/10/30/indicadores-basicos-pa- ra-a-saude-no-brasil-conceitos-e-aplicacoes-livro-2a-edicao-2008-2/. Acesso em: 3 mar. 2021. ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia & saúde. 8. ed. Rio de Janeiro: Medbook, 2018. about:blank about:blank about:blank about:blank 90 UNIDADE 7 ESTUDOS OBSERVACIONAIS ANALÍTICOS INTRODUÇÃO Como são definidos quais são os fatores de risco para uma doença ou, ainda, quais são os fatores que significam uma melhor evolução do quadro clínico do indivíduo? Consu- mir bebida alcóolica durante a gestação faz mal para a criança? Essa unidade abordará os tipos de estudos que conseguem responder a essas pergun- tas. Para tanto, serão abordados os estudos observacionais, analíticos e longitudinais, o que significa que o pesquisador observa os eventos sem definir a qual intervenção o sujeito será submetido, que é possível provar associações e causalidade entre as vari- áveis e a coleta de dado acontece em mais de um momento. Esses três tipos de estudo conseguem medir o risco de um evento acontecer. Contudo, o que os difere são os desfechos, se os grupos comparados foram divididos com base na exposição ou desfecho e a precisão da avaliação do risco. ` Variáveis independentes são fatores estudados que podem estar associados com a variável independente. Trata-se das causas presumíveis ou possíveis fatores de risco, em que pode ser chamada de exposição, já que é a exposição ao fator de risco pode causar alguma doença (ROUQUARYOL, 2018, p. 705). Por exemplo: fumar, bebida alcóolica e aleitamento materno. ` Já a variável dependente é o efeito presumível da variável independente. Ela pode ser chamada de desfecho ou variável de interesse. (ROUQUARYOL, 2018, p. 705). Além disso, normalmente, ela é dicotômica, ou seja, só tem duas possibilidades de resposta, como ter ou não ter uma doença. Por exemplo: cân- cer de pulmão, incapacidade e óbito. G LO SS Á R IO 1. ESTUDO COORTE Entre os estudos observacionais, o estudo do tipo coorte é o que melhor consegue avaliar o risco. Isso se deve porque, no início da pesquisa, todos os sujeitos não têm desfecho, sendo assim possível avaliar quantos casos novos aparecerão. Esse estudo compara dois grupos, um que tem exposição ao fator de risco a ser estudado e outro grupo que não é exposto. Os sujeitos, por sua vez, são acompanhados ao longo do tempo para contar o surgimento do desfecho (ROUQUARYOL, 2018, p. 123-125). O desenho desse tipo de estudo (Figura 1) iniciará pela exposição e, após uma quantidade determinada de tempo, o desfecho é aferido. Desse modo, uma característica que diferencia o estudo de coorte de outros estudos longitudinais é a pesquisa dividindo os grupos pela exposição. 91 Bioestatística e Epidemiologia U7 Estudos observacionais analíticos Figura 02. Esquema do desenho de estudo coorte Pessoas com presença de uma ou mais variáveis independentes Pessoas com ausência de uma ou mais variáveis independentes EXEMPLO FUMANTE NÃO FUMANTE Pessoas com presença da variável dependente Pessoas com presença da variável dependente Pessoas com ausência da variável dependente Pessoas com ausência da variável dependente Pessoas com câncer de pulmão Pessoas com câncer de pulmão Pessoas sem câncer de pulmão Pessoas sem câncer de pulmão Fonte: elaborada pela autora. U7 92Bioestatística e Epidemiologia Estudos observacionais analíticos O termo coorte se refere a um grupo de pessoas com uma característica em comum. Por isso, um estudo coorte tem em seu desenho o acompanhamento de grupo de pes- soas. Há coortes que são estudadas desde 1950, como a corte de nascidos vivos em Pelotas (RS) que acompanha as pessoas há 30 anos, desde o nascimento até sua fase adulta. Por exemplo, esses estudos conseguem avaliar qual o impacto do aleitamento materno na saúde das crianças ao longo dos anos até a idade adulta. Os estudos de coorte acompanham indivíduos sadios divididos em grupos de quem possui uma característica e de quem não possui. Normalmente, o objetivo é avaliar quais consequências essa exposição pode gerar. Nesse sentido, alguns estudos acom- panham um grupo de pessoas ao longo de vários anos para avaliar a morbidade de uma exposição ou a associação entre ela e um desfecho. Um marco nos estudos epidemiológicos é o estudo de Doll e Hill com o acompanha- mento dos médicos britânicos, em que essa coorte conseguiu provar as complicações causadas pelo fumo. O artigo indicado a seguir resume a trajetória da pesquisa citada e seus resultados. DI CICCO, M. E.; RAGAZZO, V.; JACINTO, T. Mortality in relation to smoking: the British Doctors Study. Breathe (Sheff), [s. l.], v. 12, n. 3, p. 275-276, set. 2016. Dis- ponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5298160/. Acesso em: 10 abr. 2021. Uma pesquisa acompanha quem fuma ou não, o pesquisador não influencia na de- cisão de qual participante deverá fumar. Ou, então, uma pesquisa acompanhar os pacientes internados que tiveram abordagens terapêuticas diferentes para avaliar a cura de uma doença, conforme a abordagem terapêutica. Nesse último caso, a variá- vel independente é a abordagem terapêutica e o desfecho é a proporção de cura da doença. Para alguns tipos de exposição, esse é o melhor desenho de pesquisa, pois, não é possível fazer estudo experimental. De acordo com a ética, um pesquisador não pode oferecer a gestantes bebidas alcoó- licas, em razão do risco que isso pode causar à criança. No entanto, ele pode observar quais são os efeitos encontrados em gestantes que consumiram a bebida. C U R IO SI D A D E EX EM PL O S No começo do estudo, os participantes não podem apresentar o desfecho. Contudo, na avaliação inicial é comum testar se a pessoa já apresenta o desfecho, ainda que ele esteja na fase inicial da doença e seja assintomático. Por isso, esse é o único estudo observacional capaz de medir incidência, somente a pesquisa pode monitorar esse indicador de saúde. A duração e a periodicidade do acompanhamento da pesquisa dever ser estabelecido a partir da História Natural da Doença da variável dependente. Por exemplo, para avaliar se o fumo está associado ao câncer de pulmão, a coleta de dado não precisa ser anual ou após um ano de ter começado a fumar, já que a doença demora para se manifestar. Por- tanto, dependendo das variáveis de interesse, um estudo coorte será de longa duração. Por ser um estudo observacional, a decisão de que sujeitos serão expostos às variáveis independentes não é do pesquisador. 93 Bioestatística e Epidemiologia U7 Estudos observacionais analíticos A temporalidade é uma característica importante dos estudos coorte. Ela garante a certeza de que o fator de risco existiu antes do desfecho, o que é fundamental porque, muitas vezes, consegue-se perceber uma associação estatística entre duas variáveis, mas não se sabe dizer qual é a causa e o efeito. Por exemplo, um estudo descritivo, que coleta todas as informações, mostra uma associação entre ser sedentária e ter depres- são. Para definir se de fato uma variável é fator de risco para outra é preciso um estudo longitudinal de coorte que garanta, no começo, o acompanhamento dos sedentários e daquelesque praticam atividades físicas. Nesse caso, no acompanhamento se avalia quantas pessoas apresentaram depressão. Há dois tipos de estudo coorte, o prospectivo e o retrospectivo. Na coorte retrospec- tiva, os grupos são selecionados no passado e acompanhados até o presente. A título de exemplo: uma pesquisa que quer avaliar se o uso de antibiótico em pessoas com gripe previne que o paciente necessite de ventilação mecânica. Com levantamento de prontuário do último ano de todos os casos internados por gripe, o pesquisador separa quem usou de quem não usou antibiótico e, em seguida, avalia quais precisaram de entubação. O acompanhamento é realizado com as informações do prontuário e é pos- sível que, no tempo atual, os sujeitos já tenham o desfecho. As vantagens da coorte retrospectiva são de que é possível ter um alto número de sujeito de pesquisa e ela são de curta duração. Isso ocorre porque, como os fatos estão no passado, não há necessidade de ficar esperando o evento acontecer desde o início da exposição. Em contrapartida, a grande desvantagem é de que, ao utilizar registros e informações de prontuário, não é possível garantir a qualidade dos dados e como as informações foram coletadas. Isto é, quando os dados são coletados em prontuários que não se pode garantir a qualidade da informação, a pesquisa apresenta um viés de registro de informação. Já a coorte prospectiva se trata do acompanhamento em tempo atual, como acompa- nhar atletas profissionais e avaliar o risco de lesões osteomioarticulares. Nesse caso, a partir de hoje, por exemplo, atletas de diversas modalidades que não tenham lesão serão acompanhados e avaliados, a fim de identificar quais e quantas lesões aparecem ao longo dos anos. Por um lado, a vantagem é a coleta das informações ser padroni- zada e, assim, garantir a confiabilidade dos dados. Além disso, outra vantagem se trata de medir outras variáveis que podem influenciar na associação e avaliar fatores de con- fusão. Por outro lado, as desvantagens são que essas pesquisas são caras e de longa duração, o que pode gerar a desistência de participantes no meio do acompanhamento. A perda de segmento é uma desvantagem de qualquer tipo de estudo, mas é mais fre- quente em estudos longos, como a coorte prospectiva. A perda do acompanhamento do sujeito da pesquisa pode ter várias causas, como migração, aderência, desistência e outro desfecho que inviabilize a continuidade na pesquisa. Isso pode gerar impacto na análise estatística e resultado. Desse modo, a primeira informação a se avaliar é a proporção da perda, se ela for maior do que 10% do número total da amostra da pesquisa, a qualidade dos resultados é questionável; mas, se ela for maior do que 30%, a validade interna fica prejudicada. Em seguida, é necessário avaliar as causas e se os grupos se mantêm comparáveis ou se as pessoas que saíram tinham características diferentes. U7 94Bioestatística e Epidemiologia Estudos observacionais analíticos Esse tipo de estudo não é adequado para avaliar doenças de baixa prevalência. Como a frequência do evento é baixa, é necessário ter uma amostra muito grande para conse- guir poucos desfechos, o que, consequentemente, aumentaria o custo sem ter a certeza de que a quantidade de desfecho seria adequada para análise. Para doenças que tem um longo período de latência, esse desenho também não é adequado. Uma pesquisa para avaliar se consumir bebida alcoólica na gestação faz mal para a criança, na qual 100 mulheres foram acompanhadas em dois grupos. Ao longo do segmento, 20 mulheres desistiram de participar ou mudaram de endereço, entre as desistentes, 18 eram usuárias de bebida alcoólica e tinham menos de 20 anos. Com a perda do segmento, o grupo de expostos apresenta características e tamanho dife- rentes do grupo de não expostas. Na pesquisa, qualquer pessoa que não saiba dizer a qual grupo o participante perten- ce, se ele faz parte do grupo controle, intervenção, caso, exposto ou não exposto, é considerada “cego”. O problema de não ter o participante “cego” é que ele pode mudar o seu comportamento, o que poderá influenciar na avaliação. Dessa forma, apesar de continuar ingerindo bebida alcoólica enquanto grávida, a mulher pode começar a comer de forma mais saudável para garantir que o filho não tenha problemas. Assim, o resultado da pesquisa pode não representar a realidade. No caso da coorte, o volun- tário sabe qual é o objetivo da pesquisa e, portanto, sabe se ele está no grupo exposto ou não. O ideal é que todo sujeito de qualquer pesquisa seja cego, contudo, no estudo coorte, dificilmente o sujeito da pesquisa é “cego”. EX EM PL O S Como em toda pesquisa, é possível que erros sistêmicos ocorram e que enfraqueçam a validade do resultado. Assim, o viés de amostragem pode acontecer se o grupo exposto e o grupo não exposto tiverem características diferentes. Isto é, é preciso que eles sejam similares com exceção pela exposição ou, ainda, pode acontecer quando os participantes não representam todos as situações de exposição. ` As principais vantagens de qualquer estudo coorte são: ` Ter relação temporal (exposição sempre veio antes do desfecho); ` Calcular incidência, não expõe o paciente ao risco (é um estudo observacional); ` Avaliar os múltiplos efeitos de uma exposição e é bom para avaliar exposição rara. Tendo em mente o exposto até aqui, reflita: será que a pesquisa sobre fumo tem alguém que fuma desde 1 a mais de 40 cigarros por dia, que fuma cigarro de palha ou elétrico, ou ainda têm pessoas de todos os sexos e idades? PA R A R EF LE TI R 95 Bioestatística e Epidemiologia U7 Estudos observacionais analíticos O viés de migração ocorre nos casos de perda de segmento quando os grupos ficam dife- rentes do que que eram no início da pesquisa e já não são mais comparáveis. Por isso, no planejamento do estudo é importante programar estratégias que diminuam as perdas, como ligações telefônicas para manter. Ele ocorre com mais frequência na coorte prospectiva. O viés de aferição, por sua vez, pode acontecer sempre, mas ocorre com mais frequência na coorte retrospectiva. Nele, é importante que todos os indivíduos sejam avaliados da mes- ma maneira e de preferência pelo mesmo equipamento. Por isso, o ideal é criar protocolos para definir as técnicas e as frequências com que os sujeitos devem ser avaliados. Para os estudos retrospectivos é importante garantir a confiança das informações registradas. As análises estatísticas principais para esse estudo são: o risco relativo e o risco atribu- ível, além da incidência. Com elas, é possível avaliar o impacto que se exposto tem o risco de desenvolver o desfecho. Para saber mais, leia o artigo sobre Estudo coorte, disponível a seguir: TSAO, C. W.; VASA, R. S. Cohort profile: the framingham heart study (FHS): overview of milestones in cardiovascular epidemiology. International Journal Epidemiology, [s. l.], v. 44, n. 3, p. 1800-1813, dez. 2015. Disponível em https://www.ncbi.nlm.nih.gov/ pmc/articles/PMC5156338/. Acesso em: 10 abr. 2021.S A IB A M A IS 2. ESTUDO DE PROGNÓSTICO O estudo de prognóstico prediz quais são os resultados possíveis de um evento. Por exemplo, o prognóstico de quem sofre um acidente de carro é 45% de chance da pes- soa sair ilesa, 25% de sair com alguma lesão que será curada, 15% de ficar com alguma sequela e 15% de ir a óbito em um mês do acidente. No estudo de prognóstico, todos os participantes, desde o início da pesquisa, têm a doen- ça a ser estudada. O objetivo é acompanhar a evolução da doença comparando grupos com característica diferente (presença ou ausência de fator prognóstico) e avaliar se ela influencia no desfecho a ser avaliado. Como o caso de uma pesquisa que pretende ava- liar se o tamanho do tumor do câncer de mama influencia na chance de a mulher estar viva depois de 5 anos. O desenho do estudo está esquematizado na Figura a seguir. Figura 01. Esquema do desenho de estudo prognóstico Pessoas doentescom presença de um ou mais fatores prognósticos Pessoas com presença do desfecho. Pessoas com ausência do desfecho. U7 96Bioestatística e Epidemiologia Estudos observacionais analíticos EXEMPLO Pessoa com câncer com idade maior que 40 anos Pessoa com câncer com idade menor que 40 anos Pessoas vivas, após 5 anos Pessoas vivas, após 5 anos Pessoas mortas, após 5 anos Pessoas mortas, após 5 anos Fonte: elaborada pela autora. Essas pesquisas comparam como alguns fatores influenciam na história natural da do- ença. Por exemplo, iniciar o tratamento nas primeiras seis horas de um Acidente Vas- cular Cerebral (AVC) altera a história natural da doença com aumento da sobrevida e redução das sequelas. Os fatores prognósticos podem ser características do indivíduo, como idade, caracte- rísticas da doença (tipo histológico do câncer ou intervenções realizadas, como realizar inicialmente quimioterapia em vez da cirurgia). Os desfechos do estudo podem ser morte, deficiência ou incapacidade, sofrimento ou, ainda, redução da qualidade de vida. Os es- tudos prognósticos mais comuns são os de sobrevida, que avaliam quais são as chances de a pessoa estar viva após 5 anos do diagnóstico. Nesse caso, o desfecho é morte. Quando se usa a gravidade da doença como fator prognóstico, um possível problema que pode acontecer é, no meio da pesquisa, surgir um método diagnóstico. Se após essa novidade, os novos casos começarem a serem classificados de maneira diferente, a pesquisa fica comprometida. Pessoas doente com ausência de um ou mais fatores prognósticos Pessoas com presença do desfecho. Pessoas com ausência do desfecho. 97 Bioestatística e Epidemiologia U7 Estudos observacionais analíticos Um novo método tomográfico consegue identificar tumores menores e faz com que o que antes seria uma classificação grau II, agora seja grau III. Por sua vez, esse processo se chama migração de estágio e altera a análise estatística de cada fator prognóstico. Assim, as probabilidades de sobrevida de cada fator prognóstico aumentam (FLETCHER; FLETCHER; FLETCHER, 2014, p. 103).E XE M PL O O início do acompanhamento é denominado tempo zero, trata-se do diagnóstico, do início dos sintomas, do início do tratamento, entre outras opções. O importante é que todos os parti- cipantes entrem na pesquisa no mesmo tempo zero. Para a gestão do sistema de saúde é im- portante avaliar o impacto que a demora para o início do tratamento tem sobre o prognóstico. Esse estudo é similar ao coorte, no entanto, uma diferença é que, no prognóstico, todos os indivíduos têm a doença. A coorte investiga fatores de risco que podem causar uma doença, já o prognóstico investiga fatores que alteram a evolução da doença. Ainda, no pri- meiro estudo, o principal desfecho é desenvolver uma doença, já no segundo, o desfecho é avaliar as complicações da doença que são muito mais frequentes. Além disso, na coorte, os vieses que mais frequentemente acontecem são de amostragem, migração e aferição. A análise estatística principal para esse estudo é a análise de sobrevida que calcula as probabilidades dos desfechos acontecerem a partir dos grupos de fatores prognósticos. Para doenças com estigmas associados é comum o paciente perguntar para algum profissional de saúde qual é o seu prognóstico. Nesse contexto, a oncologia tem grande quantidade de estudos para avaliar as associações de diversos fatores para dar uma resposta correta ao paciente e familiares. Contudo, é importante ressaltar que o prog- nóstico é uma probabilidade e isso não necessariamente acontecerá. Com o intuito de ampliar seus conhecimentos acerca do Estudo prognóstico, reco- mendamos a leitura do material disposto a seguir: SCHNEIDER, I. J. C.; D’ORSI, E. Sobrevida em cinco anos e fatores prognósticos em mulheres com câncer de mama em Santa Catarina, Brasil. Cadernos de Saúde Públi- ca, Rio de Janeiro, v. 25, n. 6, p. 1285-1296, jun. 2009. Disponível em: http://www.scie- lo.br/scielo.php?script=sci_arttext&pid=S0102-311X2009000600011&lng=pt&nrm=i- so. Acesso em: 10 abr. 2021. SA IB A M A IS 3. ESTUDO CASO-CONTROLE O estudo de caso-controle é, também, observacional e longitudinal. A diferença com o estudo coorte é o modo em os grupos de comparação são divididos. Na coorte se com- para os grupos a partir da presença ou ausência de exposição. Já no caso-controle, os grupos são presença ou ausência da variável dependente, ou seja, do desfecho. O desenho do estudo caso-controle é dividir a amostra conforme a presença do desfecho e depois avaliar quais são os fatores que as pessoas estavam expostas. Por exemplo, uma pesquisa sobre a associação entre câncer de pulmão e cigarro. Inicialmente, sepa- ra-se quem tem e não tem câncer de pulmão e depois investiga por questionário ou pron- tuário quais pessoas fumavam. O desenho do estudo está esquematizado na Figura 3. U7 98Bioestatística e Epidemiologia Estudos observacionais analíticos Figura 02. Esquema do desenho de estudo caso-controle EXEMPLO Pessoas com câncer de pulmão Pessoas sem câncer de pulmão Fumante Fumante Não fumante Não fumante Fonte: elaborada pela autora. Pessoas com presença da variável dependente Pessoas com ausência da variável dependente Pessoas com presença de uma ou mais variáveis independentes Pessoas com presença de uma ou mais variáveis independentes Pessoas com ausência de uma ou mais variáveis independentes Pessoas com ausência de uma ou mais variáveis independentes O objetivo do estudo é avaliar, a partir da doença, quais são os possíveis fatores de risco e qual é a frequência que cada exposição ocorreu. Ele é ideal quando a doença é rara ou tem um longo período de latência. 99 Bioestatística e Epidemiologia U7 Estudos observacionais analíticos Uma pesquisa que quer avaliar estresse de professores do ensino fundamental. Os casos foram professores que, em uma escala de estresse, pontuaram alto, enquanto os con- troles são os professores que pontuaram baixo. A amostra foi selecionada em uma única escola de ensino fundamental, com o objetivo das condições de trabalho serem similares.EX EM PL O Assim, é possível parear o controle com o caso. Normalmente, o pareamento é por idade e sexo, mas ele pode ser por outras características que não a exposição. Nor- malmente, a quantidade de controle pode ser igual a de casos. Então, nas situações em que há poucos casos, é possível selecionar de duas a três vezes mais controles do que caso. Exemplificando: um estudo sobre quedas de pacientes no hospital teve pare- amento feito em relação ao sexo, data de internação e clínica. Se um homem internado na clínica cirúrgica em 05/01/2015 sofreu uma queda, o controle deveria ser um homem internado na clínica cirúrgica em 05/01/2015 que não caiu. A vantagem desse desenho é a praticidade e ser de curta duração. A principal desvanta- gem é ser um estudo retrospectivo, o que significa que a informação sobre a exposição pode não ser correta. Portanto, frequentemente, ocorre o viés de registro de informa- ção. Dessa forma, é importante utilizar fontes seguras, confiáveis e que relatem a expo- sição antes de saber da existência da doença. No entanto, a avaliação de exposição só é possível a partir de entrevista com os sujeitos ou análise de prontuário. Os participantes podem lembrar de maneira diferente um fato, em que normalmente os casos vão tender a lembrar de mais detalhes do que o controle. Pense: você consegue lembrar o que comeu há dois dias? Provavelmente não, mas se foi um dia com um evento importante, isso o ajudará a se lembrar. Ainda, se um dia você teve episódios de diarreia é mais provável que você lembre que alimentos ingeridos no dia. Esse erro possível de acontecer em todo estudo caso-controle tem o nome de viés de memória ou de lembrança (FLETCHER; FLETCHER; FLETCHER, 2014, p. 92). Os participantes são selecionados em dois grupos, o caso e o controle. Essa divisão ocorre a partir da presençaou ausência do desfecho e é independente da exposição. A definição do que é um caso deve ser precisa e adequada, assim, o pesquisador deve estabelecer critérios rigorosos para não haver dúvida se uma pessoa se enquadra no grupo caso. A amostra dos casos deve conter quem acabou de ser diagnosticado e quem foi há mais tempo, que faz ou não acompanhamento e/ou tratamento e os diversos graus da doença. A definição do controle deve ser alguém da mesma população do caso e que poderia se tornar um se ficasse doente. Os controles podem ser outras pessoas internadas no mesmo hospital, mas com outro diagnóstico ou, ainda, pessoas próximas da residência do caso ou parentes. U7 100Bioestatística e Epidemiologia Estudos observacionais analíticos Os profissionais de saúde, contudo, só poderão investigar sobre exposições que estão associadas com a hipótese diagnóstica. Então, para esses casos é mais provável que se tenha uma avaliação completa e, nos controles, a avaliação ser mais simples. O estudo caso-controle é comum por ser rápido e prático de realizar. Além de permitir explorar múltiplas exposições para uma mesma doença e de não precisar de muitos indivíduos para provar associações. Apesar de parecer prático e simples, ao fazer uma pesquisa rápida, deve-se ter cuidado para que a qualidade não seja adequada por apresentar diversos vieses. A análise estatística principal para esse estudo é a razão de chances ou, em inglês, odds ratio (OR). Com ela é possível estimar o risco que a exposição desenvolva o desfecho. Para saber mais a respeito sobre o Estudo caso-controle e sua aplicação, leia: GAMBA, M. A. et al. Amputações de extremidades inferiores por diabetes melli- tus: estudo caso-controle. Revista de Saúde Pública, São Paulo, v. 38, n. 3, p. 399- 404, jun. 2004. Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pi- d=S0034-89102004000300010&lng=en&nrm=iso. Acesso em: 10 abr. 2021.S A IB A M A IS 4. OBJETO DE APRENDIZAGEM Preencha o quadro resumo sobre as principais características dos diversos desenhos de estudo: Coorte prospectivo Coorte retrospectivo Prognóstico Caso-controle Grupos divididos a partir Da exposição Duração Longo Principal uso Avaliar consequência de uma exposição Desvantagem Caro e longo Vantagem Temporalidade Possíveis vieses Aferição, migração e amos-tragem 101 Bioestatística e Epidemiologia U7 Estudos observacionais analíticos REFERÊNCIAS BIBLIOGRÁFICAS ALMEIDA FILHO, N. de; BARRETO, M. L. Epidemiologia e saúde: fundamentos, métodos e aplicações. Rio de Janeiro: Guanabara Koogan, 2011. FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. S. Epidemiologia clínica: elementos essenciais. 5. ed. Porto Alegre: ArtMed, 2014. ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia e saúde. 8. ed. Rio de Janeiro: Medbook, 2018. 102 UNIDADE 8 MEDIDAS DE ASSOCIAÇÕES INTRODUÇÃO Fumar 10 ou 30 cigarros por dia faz com que o indivíduo tenha riscos diferentes de ter câncer de pulmão? Qual é a chance de uma pessoa infartar se for hipertensa? Essa unidade abordará sobre como calcular e interpretar as análises estatísticas que medem a intensidade da associação entre diversas variáveis. Entre duas variáveis podem acontecer comparações, sendo uma variável independente e outra dependente, ou entre múltiplas variáveis, em que várias variáveis são indepen- dentes e uma é dependente. Geralmente, as variáveis independentes são as exposi- ções ou fatores, e a variável dependente é o desfecho, que pode ser desde deficiência, complicação, morte ou doença. Para a análise entre duas variáveis é comum organizar os dados em uma tabela de con- tingência 2 x 2 (Figura 1). Nessa tabela, nas linhas estão descritas as possibilidades da variável independente e nas colunas as da variável dependente. Como de preferência a exposição e o desfecho são dicotômicos (presentes ou ausentes), a tabela fica com duas linhas e duas colunas, por isso, ela tem esse nome. As casas da tabela são nomeadas como “a”, “b”, “c” e “d” para depois facilitar as fórmulas das medidas de associações. Tabela 01. Tabela de contingência 2 x 2 DESENHO DESFECHO PRESENTE DESFECHO AUSETE TOTAL EXPOSIÇÃO PRESENTE a b a+b EXPOSIÇÃO AUSENTE c d c+d TOTAL a+c b+d a+b+c+d 103 Bioestatística e Epidemiologia U8 Medidas de associações EXEMPLO COM CÂNCER DE PULMÃO SEM CÂNCER DO PULMÃO TOTAL FUMANTES 67 9 76 NÃO FUMANTES 5 114 119 TOTAL 72 123 195 Fonte: elaborada pela autora. A Figura 1 exemplifica uma pesquisa para avaliar a associação entre fumo e câncer de pulmão. Nesse caso, primeiramente, deve-se definir que o fumo é a variável indepen- dente e o câncer de pulmão a variável dependente. Então, pode-se designar que a = 67, b = 9, c = 5 e d = 114 e que os valores totais foram obtidos por uma soma simples. É interessante observar que independentemente do tipo de estudo, se é transversal, caso-controle ou coorte, a tabela é montada da mesma maneira. Tabela de contingência 2 x 2 Em uma pesquisa para avaliar a associação do sexo com a chance de ter depressão, no início do acompanhamento, nenhum dos participantes eram depressivos. Contudo, depois de 10 anos, das 452 mulheres 79 foram diagnosticadas com depressão, enquan- to 39 homens foram diagnosticados do total de 908 participantes do sexo masculino. Como os dados estão distribuídos em uma tabela? Tabela 2 x 2 Para montar a tabela, deve-se considerar que ter depressão é o desfecho e o sexo é a exposição. Como desejamos saber o risco de uma mulher ter a doença, podemos definir que ser mulher é ter a exposição. Então, preencha a tabela com os valores descritos no enunciado: EX EM PL O U8 104Bioestatística e Epidemiologia Medidas de associações ` Incidência, ou coeficiente de incidência, é a proporção que descreve o número de casos novos de uma doença em uma determinada população. O resultado pode ser expresso em coeficiente com os números decimais resultantes da divisão ou em taxa a cada 1.000 pessoas, ou qualquer outra proporção que for adequada. G LO SS Á R IO EX EM PL O Tabela 02. Índices de depressão por sexo COM DEPRESSÃO SEM DEPRESSÃO TOTAL MULHERES 79 (a) (b) 452 HOMENS 39 (c) (d) 908 TOTAL (a+c) (b+d) (a+b+c+d) COM DEPRESSÃO SEM DEPRESSÃO TOTAL MULHERES 79 373 452 HOMENS 39 869 908 TOTAL 118 1242 1360 Fonte: elaborado pela autora. Para calcular “b”: do total de mulheres subtraia aquelas que tiveram depressão = 452 – 79 = 373. Para calcular “d”: do total de homens subtraia aqueles que tiveram depressão = 908 – 39 = 869. Some as colunas para preencher a linha “Total.” Tabela 03. Tabela completa Fonte: elaborado pela autora. 1. RISCO RELATIVO E RISCO ATRIBUÍVEL As medidas de associação risco relativo e risco atribuível estão associadas a incidência de um evento. Por serem dependentes da incidência, essas medidas só podem ser calculadas em estudos do tipo coorte, pois ele é o único que consegue avaliar o número de casos novos de um desfecho. Fonte: Rouquayrol; Gurgel (2018, p. 682). 1 105 Bioestatística e Epidemiologia U8 Medidas de associações As duas medidas avaliam o risco de se ter o desfecho quando temos a exposição ao fator de risco comparando com o risco nas pessoas não expostas. risco relativo é uma razão das incidências do desfecho do grupo exposto contra o grupo não exposto (ROU- QUAYROL; GURGEL, 2018, p. 138). A partir desse resultado, é possível saber quantas vezes maior é o risco do desfecho ao comparar os dois grupos (expostos e não expostos ao fator de risco). Um resultado alto favorece a causalidade da associação das variáveis. Fórmula do risco relativo (RR): 2 Em que: a, b, c e d são as casas de referência da tabela 2 x 2. Risco relativo Em uma pesquisa para avaliar a associação do sexo com a chance de ter depressão, no início do acompanhamento, nenhum dos participantes tinham a doença. Porém, das 452 mulheres analisadas, depois de 10 anos, 79 foram diagnosticadas com de- pressão; enquanto apenas 39 homens foram diagnosticadoscom a doença em um total de 908 participantes do sexo masculino. Qual é o risco relativo de mulheres terem depressão após 10 anos? EX EM PL O Considere que, um estudo coorte acompanhou 95 pessoas entre fumantes e não fu- mantes e, depois de 15 anos, avaliou quantas delas desenvolveram câncer de pulmão. A distribuição hipotética dos casos nos grupos está no exemplo da Figura 1. Para cal- cular o risco relativo, inicialmente, é preciso calcular a incidência do desfecho nos dois grupos (expostos e não expostos). Nessa pesquisa, a exposição é o fumo e o desfecho é o câncer. Ao fazer o cálculo, identifica-se que incidência de câncer de pulmão em fumantes é de 0,8816 e em não fumantes é de 0,2632. Como usaremos os valores da incidência, podemos mantê-los na forma de coeficiente. Então, para calcular o risco relativo é preciso dividir as incidências, na qual se obtém o resultado de 3,35. Como interpretar esse resultado? Esse valor de risco relativo significa que, o risco de ter câncer de pulmão entre fumantes é 3,35 vezes maior do que entre os não fumantes ou, ainda, pode-se dizer que fumar está associado a um risco de 3,35 vezes maior de desenvolver câncer de pulmão. U8 106Bioestatística e Epidemiologia Medidas de associações EX EM PL O Tabela 03. Tabela 2 x 2 completa COM DEPRESSÃO SEM DEPRESSÃO TOTAL MULHERES 79 373 452 HOMENS 39 869 908 TOTAL 118 1242 1360 Fonte: elaborado pela autora. Risco relativo Ou pela outra fórmula realizar a divisão. substituir o valor. dividir no numerador e no denominador. realizar a divisão. Logo, o risco relativo é de 4,07. Isso significa que as mulheres têm um risco 4,07 maior do que os homens de desenvolver depressão. Caso o risco relativo seja 1,0, a exposição não altera o risco de desenvolver o desfe- cho. Quando o risco relativo é menor do que 1,0, pode-se dizer que a exposição é um fator protetor, pois, a presença dela reduz o risco de ter a doença. Por exemplo, uma pesquisa sobre aleitamento materno e infecções respiratórias na primeira infância cujo RR=0,2. Isso significa que, aleitamento materno protege quanto a infecções respirató- rias na primeira infância ou que não aleitamento é um fator de risco para a doença. 107 Bioestatística e Epidemiologia U8 Medidas de associações Quando o risco relativo é menor do que 1,0, é possível fazer uma conta para avaliar o quanto a exposição reduz o risco. A fórmula, simplesmente, divide 1 pelo valor do risco relativo. No exemplo , ou seja, o aleitamento materno reduz em 5 vezes o risco de infecções respiratórias na primeira infância. Já o risco atribuível se trata do quanto a incidência aumentou por causa da exposição, ou seja, ele avalia o risco que pode ser atribuído a exposição. Por sua vez, o cálculo é realizado a partir da subtração das incidências do desfecho entre os dois grupos (ex- postos e não expostos) (FLETCHER; FLETCHER; FLETCHER, 2014, p. 73-75). Fórmula do risco atribuível (RA): 3 Em que: a, b, c e d são as casas de referência da tabela 2 x 2. Assim, analisando a Figura 1, é possível que um não fumante tenha câncer de pulmão, mesmo que o risco seja bem menor. Ao usar o risco atribuível, você avaliará o quanto fumar acrescentou no risco de desenvolver câncer. Para ficar mais fácil de interpretar o resultado é melhor transformá-lo em taxa a cada 1.000 pessoas, ou qualquer outra proporção que se achar adequada. Risco atribuível Em uma pesquisa para avaliar a associação do sexo com a chance de ter depressão, no início do acompanhamento, nenhum dos participantes eram depressivos. Contudo, depois de 10 anos, das 452 mulheres 79 foram diagnosticadas com depressão, enquan- to 39 homens foram diagnosticados do total de 908 participantes do sexo masculino. Qual é o risco atribuível de mulheres terem depressão após 10 anos? Tabela 04. Tabela 2 x 2 completa EX EM PL O COM DEPRESSÃO SEM DEPRESSÃO TOTAL MULHERES 79 373 452 HOMENS 39 869 908 TOTAL 118 1242 1360 Fonte: elaborado pela autora. U8 108Bioestatística e Epidemiologia Medidas de associações EX EM PL O Risco atribuível subtrair. realizar a multiplicação para transformar em taxa. Com isso, o risco de ter depressão atribuível a ser mulher é de 131,8 casos para 1.000 pessoas. 2. RAZÃO DE CHANCES (ODDS RATIO) Para estudos que não são coorte e, portanto, não se sabe a incidência do desfecho, o risco relativo não pode ser calculado. Para esses casos, existe a razão de chances ou odds ratio (OR), em inglês, que significa estimativa de risco. Essa medida pode ser usada em qualquer tipo de estudo. Chances, no inglês Odds, é uma medida utilizada que avalia a chance de um even- to acontecer contra a chance de não acontecer. Essa medida é popularmente usada em eventos esportivos e apostas. Ela se assemelha a probabilidade, com a diferença de que o denominador na probabilidade é a totalidade de possibilidades, enquanto na chance é a frequência do evento não acontecer. Por exemplo, qual é a chance e a pro- babilidade e sair o número 6 no dado? ` Na probabilidade a conta é ` Na chance a conta é 109 Bioestatística e Epidemiologia U8 Medidas de associações A razão de chances é a divisão das chances (odds) do desfecho acontecer nos dois grupos (expostos e não expostos). Matematicamente, a fórmula pode ser simplificada pela divisão dos produtos cruzados. Fórmula da razão de chances ou odds ratio (OR): 4 Em que: a, b, c e d são as casas de referência da tabela 2 x 2. DESENVOLVIMENTO DA FÓRMULA DA RAZÃO DE CHANCES OU ODDS RATIO Considere a tabela 2x2 de uma pesquisa de caso-controle. Tabela 05. Exemplo de pesquisa de caso-controle COM DESFECHO SEM DESFECHO TOTAL COM EXPOSIÇÃO a b a+b SEM EXPOSIÇÃO c d c+d TOTAL a+c b+d a+b+c+d Fonte: elaborado pela autora. Para calcular a razão de chances, primeiramente, é necessário calcular a chance de o desfecho acontecer em cada um dos grupos. Nesse caso, os grupos são: com exposição e sem exposição. 5 6 A razão de chances ou odds ratio é a divisão da chance do desfecho no grupo dos expostos pela chance do desfecho no grupo dos não expostos: 7 U8 110Bioestatística e Epidemiologia Medidas de associações Uma divisão de frações pode ser solucionada multiplicando a primeira fração pelo inverso da segunda (o numerador vira o denominador e vice-versa), como na equação a seguir: 8 Já a multiplicação de frações é solucionada multiplicando os numeradores e multiplicando os denominadores. Com isso, obtemos a fórmula final (Equação 9). A interpretação do resultado é muito similar ao do risco relativo, mas a diferença é que o RR mede o risco, enquanto o OR estima o risco. Portanto, razão de chances maior do que 1,0 indica aumento no risco do desfecho. Se for igual a 1,0, não existe associação entre as variáveis e se for menor do que 1,0 indica que a exposição reduz o risco. Razão de chances ou OR Em uma pesquisa para avaliar a associação do sexo com a chance de ter depressão, no início do acompanhamento, nenhum dos participantes eram depressivos. No entanto, depois de 10 anos, das 452 mulheres 79 foram diagnosticadas com depressão, enquan- to 39 homens foram diagnosticados do total de 908 participantes do sexo masculino. Qual é a razão de chances de mulheres terem depressão após 10 anos? Tabela 06. Tabela 2 x 2 completa EX EM PL O COM DEPRESSÃO SEM DEPRESSÃO TOTAL MULHERES 79 373 452 HOMENS 39 869 908 TOTAL 118 1242 1360 Fonte: elaborado pela autora. 9 111 Bioestatística e Epidemiologia U8 Medidas de associações EX EM PL O Razão de chances substituir os valores. multiplicar. dividir. Logo, estima-se que ser mulher aumenta o risco de ter depressão em 4,72 vezes. O risco relativo e a razão de chances têm valores aproximados quando a prevalência do desfecho for inferior a 10% (FLETCHER; FLETCHER; FLETCHER, 2014, p. 106). Nos exemplos da unidade sobre a pesquisa de depressão, nota-se que os valores es- tão próximos, RR=4,07 e OR=4,72. Isso ocorre porque a prevalência de depressãona amostra foi de 8,7%. Para chegar nesse resultado de prevalência, divide-se o total de pessoas com depressão pelo total de pessoas (= 118/1360) e, em seguida, o resultado é multiplicado por 100. Já no exemplo da pesquisa sobre fumo e câncer, em que os valores estão descritos na Figura 1, a prevalência da doença é 75,8%. Nesse caso, o RR=3,35 está bem distante do OR=20,84. Como o risco relativo mede o risco enquanto a outra medida apenas estima, toda vez que for um estudo de coorte e for possível, deve-se dar preferência as medidas de risco relativo em vez da razão de chances. 3. ANÁLISE DE SOBREVIDA As análises de sobrevida são gráficos que descrevem as probabilidades de o desfecho acontecer ao longo do tempo, podendo ou não ser estratificada em grupos de fatores prognósticos. Trata-se da medida mais completa dos estudos prognósticos, pois é pos- sível avaliar a probabilidade do desfecho em cada ponto do tempo. Porém, ela só pode ser calculada se o desfecho é dicotômico e só ocorre uma vez. O evento dicotômico é quando só há duas possibilidades presente/ausente ou sim/não. Se o desfecho não for morte/vida, mas seguir os mesmos pressupostos, pode-se usar o termo análise de tempo ou evento. Para fazer estimativa, o método estatístico mais habitual é a análise de Kaplan-Meier (Figura 2). Nessa análise, a probabilidade de sobreviver é calculada em intervalos de tempo. As pessoas que saem da pesquisa por perda de segmento são chamadas de censurados e saem da conta do denominador naquele período em diante. U8 112Bioestatística e Epidemiologia Medidas de associações Figura 01. Representação gráfica de uma curva de sobrevida com a análise de Kaplan-Meier estratificada pelos fatores prognósticos de câncer. Os valores são fictícios. 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 0 6 12 18 24 30 36 42 48 54 60 Pr ob ab ili da de d e so br ev id a Tempo (meses) sem metastase metastase em outros órgãos metastase em ganglionar Fonte: elaborada pela autora. Para calcular a probabilidade de sobrevida em um maior de tempo, é necessário multiplicar a probabilidade de cada intervalo. Por exemplo, para saber qual é a probabi- lidade de sobreviver após um ano do diagnóstico do câncer, é preciso multiplicar a pro- babilidade de ter sobrevivido a cada mês desse primeiro ano. Então, com o passar do tempo, a probabilidade se reduz cada vez mais. Na representação gráfica, as probabili- dades já estão calculadas considerando a chance de sobreviver a todo aquele período. A Teorema do Produto de Probabilidade fala que, quando se quer saber a probabilida- de de dois ou mais eventos acontecerem simultaneamente, é necessário multiplicar a probabilidade de cada evento acontecer individualmente (VIEIRA, 2016, p. 177). Por exemplo, acertar um número na loteria é mais fácil do que acertar três, que é mais fácil do que acertar seis, porque quanto mais eventos entrarem na conta, menor fica a probabilidade. SA IB A M A IS A interpretação da cauda da curva deve ser feita com cuidado. Isso se deve pelo fato de que, quando a probabilidade está baixa, o número de pessoas vivas é baixo e qualquer al- teração terá um impacto muito maior, mas essa mudança não necessariamente represen- ta o que pode acontecer. Por exemplo, a probabilidade de morrer quando se tem 1 morte: 113 Bioestatística e Epidemiologia U8 Medidas de associações ` Em 100 pessoas acompanhadas é de 1%. ` Em 50 pessoas acompanhadas é de 2%. ` Em 25 pessoas acompanhadas é de 4%. ` Em 10 pessoas acompanhadas é de 10%. ` Em 5 pessoas acompanhadas é de 20%. No entanto, continua sendo uma única morte, mas dependendo da amostra ela tem um impacto muito maior na estatística. Por isso, no final da curva, em que o número de pessoas é baixo, é importante utilizar a probabilidade com cautela. Essa é a análise estatística principal dos estudos de prognósticos. Por ser comum o paciente perguntar para algum profissional de saúde qual é o seu prognóstico, deve-se refletir o que isso significa para o indivíduo e seus familiares. Nesse contexto, é impor- tante ressaltar que a resposta é uma probabilidade e que isso não, necessariamente, acontecerá. Desse modo, pode ser que a média de sobrevida das pessoas, após o diagnóstico de câncer de mama bilateral, seja de 1,5 ano. Na maioria dos casos, as pessoas irão viver um tempo próximo a esse, mas é possível que o seu paciente sobre- viva 1 mês ou 7 anos. As exceções são raras, mas elas podem acontecer. Ao conversar com o paciente e familiar é importante considerar diversos fatores e não só números. Estes artigos mostram curvas de sobrevidas: CENTEMERO, M. et al. Avaliação comparativa do valor prognóstico de quatro marca- dores bioquímicos de lesão miocárdica pós intervenções percutâneas utilizando stents coronarianos. Arquivos Brasileiros de Cardiologia, São Paulo, v. 83, n. especial, p. 53- 58, dez. 2004. Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pi- d=S0066-782X2004001900010&lng=en&nrm=iso. Acesso em: 10 abr. 2021. MIGOWSKI, A.; SILVA, G. A. Sobrevida e fatores prognósticos de pacientes com cân- cer de próstata clinicamente localizado. Revista de Saúde Pública, São Paulo, v. 44, n. 2, p. 344-352, abr. 2010. Disponível em: http://www.scielo.br/scielo.php?script=sci_art- text&pid=S0034-89102010000200016&lng=en&nrm=iso. Acesso em: 10 abr. 2021. SA IB A M A IS U8 114Bioestatística e Epidemiologia Medidas de associações 4. OBJETO DE APRENDIZAGEM Considerando as duas pesquisas fictícias, calcule as medidas de associações para cada uma delas e interprete o resultado. Uma pesquisa tem como objetivo avaliar o consumo de cocaína e o desenvolvimento de esquizofrenia. Para esse estudo foram acompanhados 50 usuários de cocaína e 200 pessoas que não faziam uso da droga. No início do acompanhamento, todos os partici- pantes passaram por uma avaliação que definiu que nenhum deles tinham diagnóstico de esquizofrenia. Após 5 anos uma nova avaliação foi feita, na qual foram diagnosti- cados com esquizofrenia 4 usuários de cocaína e 6 pessoas que não usaram a droga. Pesquisa 1: Pesquisa 1: Pesquisa 2: Pesquisa 2: RESPOSTA Uma pesquisa tem o objetivo de avaliar possíveis fatores causais para obesidade em adolescentes. Nessa pesquisa foram investigados 80 adolescentes obesos e 100 com peso adequado. No inquérito, avaliou-se a alimentação no primeiro ano de vida. Hou- ve relato de consumo de alimentos ultraprocessados, como refrigerante e bolachas recheadas, em 35 obesos e em 12 adolescentes com peso adequado. Nesse caso, as principais medidas de associações são risco relativo e risco atribuível, pois o desenho de estudo é coorte. O risco relativo foi de 2,67, o que significa que usar cocaína aumenta em 2,67 vezes o risco de desenvolver esquizofrenia. O risco atri- buível foi de 0,05, o que significa que 5 casos a cada 100 pessoa com esquizofrenia podem ser atribuídos ao uso de cocaína. A principal medida de associação é a razão de chances ou odds ratio, já que o de- senho do estudo é caso-controle. O odds ratio foi de 5,70, significando que consumir alimentos ultraprocessados no primeiro ano de vida aumenta em 5,7 vezes a chance de desenvolver obesidade na adolescência. 115 Bioestatística e Epidemiologia U8 Medidas de associações REFERÊNCIAS BIBLIOGRÁFICAS ALMEIDA FILHO, N. de; BARRETO, M. L. Epidemiologia e saúde: fundamentos, métodos e aplicações. Rio de Janeiro: Guanabara Koogan, 2011. FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. S. Epidemiologia clínica: elementos essenciais. 5. ed. Porto Alegre: ArtMed, 2014. ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia e saúde. 8. ed. Rio de Janeiro: Medbook, 2018. VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016. 116 UNIDADE 9 ESTUDOS EXPERIMENTAIS INTRODUÇÃO Já se perguntou se a acupuntura é uma boa ação para redução de dor? Vacina funciona? Grupos educativos conseguem ajudar no controle das doenças crônicas? Comosaber se um tratamento é eficaz? Como definir se uma nova estratégia terapêutica funciona? Essa unidade abordará o tipo de estudo que responde às perguntas feitas anteriormen- te. Abordaremos os estudos experimentais, isso significa que o pesquisador é quem decide qual conduta ou intervenção o sujeito da pesquisa será submetido. 1. ENSAIO CLÍNICO Os ensaios clínicos são estudos experimentais que avaliam benefícios, malefícios, eficácia e efetividade de alguma intervenção. Considera-se como intervenção qualquer feito que tenha o objetivo de melhorar o quadro do paciente, seja uma medicação, um procedimento ou um atendimento. O desenho desse estudo (Figura 1) é a comparação de dois grupos, a intervenção e o controle. Os grupos devem ser os mais similares possíveis, sendo que a única diferença é a intervenção. Esse é um estudo longitudinal, depois de algum tempo avalia-se os resultados. O desfecho pode variar conforme a intervenção, podendo ser ausência de complicação, estabilidade da doença, entre outros fatores. Grupo intervenção Pessoas que realizaram a intervenção Grupo controle Pessoas que não reali- zaram a intervenção Pessoas com presença do desfecho Pessoas com presença do desfecho Pessoas com ausência do desfecho Pessoas com ausência do desfecho DESENHO Figura 01. Esquema do desenho de estudo de ensaio clínico 117 U9 Estudos experimentais Bioestatística e Epidemiologia Vacinados com princípio ativo Vacinados com placebo Pessoas com a doença Pessoas com a doença Pessoas sem a doença Pessoas sem a doença EXEMPLO Fonte: elaborada pela autora. O grupo controle pode ter outra intervenção diferente da estudada. Por princípios éti- cos de que devemos tratar o paciente, raramente o controle não tem intervenção. Se a pesquisa é de um medicamento novo para uma doença que não tem tratamento, nor- malmente se administra um placebo para que o sujeito não reconheça qual grupo ele faz parte. Entende-se como placebo uma substância que não tem princípio ativo, mas que apresente características como cor, cheiro e formato semelhantes à intervenção. EX EM PL O Ao testar uma vacina contra malária, o controle deverá ser com placebo, já que não existe outra medicação preventiva. Se a vacina é vermelha, com via de administração intramuscular, dose testada de 0,5 ml e disponibilizada em frasco único, o placebo deve ter essas mesmas características. Se já existe um tratamento preconizado da doença, é importante que este seja a inter- venção do grupo controle. Pode-se comparar com o melhor tratamento disponível ou com o tratamento convencional da doença dependendo do objetivo do estudo. Exem- plificando: ao testar um novo quimioterápico para câncer de mama, o grupo controle pode ser a primeira droga de escolha do protocolo do serviço ou pode ser a droga que na literatura é mais eficaz. Se a melhor medicação não é disponível para a maioria da população brasileira, fazer essa comparação não ajudará o médico na hora de decidir qual remédio prescrever. Por isso, em algumas situações é melhor comparar com o tratamento convencional. Existem dois tipos de ensaio clínico: ele pode ser de superioridade ou de não inferiori- dade. É de superioridade quando o objetivo do estudo é avaliar se a intervenção testada é melhor do que o controle. Ele é de não inferioridade quando o objetivo é somente com- parar se uma intervenção tem um efeito minimamente igual ao do controle. Normalmente, estudos sobre medicamentos genéricos ou com um custo inferior são de não inferioridade, já que o objetivo é garantir que o novo remédio não seja pior que a medicação comercial. U9 118 Estudos experimentais Bioestatística e Epidemiologia Fo nt e: A da pt ad o de F le tc he r; Fl et ch er ; F le tc he r ( 20 14 , p . 1 47 ). EX EM PL O SA IB A M A IS Para conhecer mais acerca dos tipos de ensaio clínico, recomendamos as leituras de: Superioridade RUELA, L. de O.; et al. Efetividade da acupuntura auricular no tratamento da dor oncológica: ensaio clínico randomizado. Rev. esc. enferm. USP, São Paulo, v. 52, 2018. Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pi- d=S0080-62342018000100477&lng=en&nrm=iso. Acesso em: 28 abr. 2021. Não inferioridade LUNA, E. J. de A.; et al. Eficácia e segurança da vacina brasileira contra hepatite B em recém-nascidos. Rev. Saúde Pública, São Paulo, v. 43, n. 6, p. 1014-1020, dez. 2009. Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pi- d=S0034-89102009000600013&lng=en&nrm=iso. Acesso em: 28 abr. 2021. Uma característica importante desse estudo é o controle e o gerenciamento das variá- veis com a finalidade de reduzir o viés de confundimento. Os grupos devem ser os mais semelhantes possíveis em suas características e tratamento, exceto pela intervenção pesquisada. Esse controle rigoroso das diversas variáveis aumenta a validade interna da pesquisa. Se a pesquisa é sobre um novo tratamento para emagrecer, é preciso controlar nos dois gru- pos a realização de atividade física e a ingesta de alimentos para garantir que não são essas variáveis que causaram a redução de peso. Para isso, é possível medir essas variáveis para depois, na análise estatística, os ajustes serem realizados ou ser solicitado que os sujeitos da pesquisa cumpram um regime, bem como orientações específicas. Uma possibilidade é internar os pacientes, assim, todos participantes irão comer a mesma comida. Figura 02. Fatores associados com a melhora do quadro do paciente no grupo controle e no grupo intervenção 0 10 20 30 40 50 60 70 Grupo Controle Grupo intervenção Título do Gráfico Efeito da intervenção Efeito Placebo Cuidado convencional Efeito Hawthorne História Natural da doença 119 U9 Estudos experimentais Bioestatística e Epidemiologia Vários fatores estão associados à melhora do quadro de um paciente, como descri- to na Figura 2 (FLETCHER; FLETCHER; FLETCHER, 2014, p. 147). A melhora pode acontecer pela história natural da doença, ou seja, o quadro gripal melhora depois de sete dias, independentemente da medicação em uso. O efeito Hawthorne refere-se à mudança de comportamento e ao cuidado com a saúde que o sujeito tem por participar de uma pesquisa ou por estar recebendo um cuidado especial. Ou seja, só pelo fato de alguém ligar para você todos os dias perguntando como você está, pode te fazer melho- rar, não importando a medicação que está sendo usada. O efeito placebo é a melhora do quadro por fazer algum tratamento independentemente de ser um princípio ativo. Esses três fatores associados com a melhora do quadro do paciente devem ser iguais nos grupos controle e intervenção. Dessa forma, é ideal que todo o cuidado seja se- melhante nos dois grupos para que o único fator diferente seja o efeito da intervenção. Então, ao desenhar o estudo e o protocolo do cuidado é preciso levar em conta esses efeitos a fim de que o resultado terapêutico seja o único diferente entre os grupos. 1.1AMOSTRAGEM NOS ENSAIOS CLÍNICOS A amostra do ensaio clínico segue as mesmas etapas de qualquer outra pesquisa com cri- térios de inclusão e exclusão, ou seja, quem está no grupo controle poderia estar no grupo intervenção. É importante manter a homogeneidade dos grupos. Para facilitar esse proces- so, é comum que o grupo controle seja selecionado pareado com o grupo intervenção. EX EM PL O Se foi incluído um homem de 35 anos com peso adequado para idade no grupo inter- venção, no grupo controle deve ser incluído também uma pessoa com essas mesmas características. O pareamento pode ter uma ou mais variáveis em comum, normal- mente o sexo e a idade, mas, dependendo da característica do estudo outras podem ser incluídas. Normalmente, o número de pessoas no controle é a mesma que na intervenção, mas, às vezes, a proporção pode ser de 1:2, sendo que o grupo controle tem o dobro de pessoas que a intervenção Denomina-se alocação o processo de definição de quem fará parte do grupo controle e quemserá intervenção. O ideal é que esse processo seja randomizado, ou seja, a deci- são é feita por meio de um sorteio, em que todos os participantes têm a mesma chance de serem selecionados para o grupo intervenção. A alocação pode ser randomizada estratificada quando o sorteio ocorre dentro de estratos. A título de exemplificação: dentro das faixas etárias (estratos) será sorteado quem irá para determinado grupo, ou a alocação pode ser randomizada por conglome- rados, na qual o sorteio é o local da pesquisa. Por exemplo, quatro unidades de saúde vão participar da amostra, o sorteio irá definir as duas unidades serão controle e as duas que serão intervenção. A estratégia por conglomerado é boa por questões logísti- cas, já que não é preciso treinar os profissionais nos dois procedimentos. Como o ensaio clínico é um estudo experimental, é necessária uma padronização dos critérios de avaliação e do processo de intervenção. Para isso, é comum a criação de protocolo da pesquisa com descrição de cada etapa. Esses protocolos reduzem os vie- ses e aumentam a validade interna da pesquisa. U9 120 Estudos experimentais Bioestatística e Epidemiologia Para reduzir o viés de confundimento, a amostra pode ser bem controlada, como em algumas etapas de estudos clínicos cuja população da pesquisa seja somente indivíduos adultos saudáveis sem comorbidades e com hábitos de vidas saudáveis. Ao restringir par- ticipantes com possíveis fatores de confusão é mais fácil garantir a eficácia do tratamento. Para reduzir o viés de migração, são necessárias estratégias que garantam adesão ao tratamento e que o sujeito siga os cuidados corretamente. É importante assegurar que o sujeito não esteja realizando outro tratamento além do protocolado na pesquisa. Por exemplo, uma pesquisa de uma nova medicação para de ansiedade: é preciso garantir que o único tratamento que os participantes estejam recebendo para ansiedade seja a medicação proposta. Então, é preciso reforçar que práticas complementares, como me- ditação e uso de plantas medicinais não podem ser realizadas. Essas cointervenções podem influenciar no resultado da pesquisa. Outro risco que se corre é de o participante trocar de grupo por conta própria. Se ele sabe que está no grupo controle e tem acesso ao grupo intervenção, é possível que ele busque o tratamento experimental em vez de manter com o que foi solicitado. Para reduzir o viés de aferição, o avaliador é treinado para o preenchimento do ques- tionário, e os equipamentos utilizados são os mesmos. Tomemos como exemplo uma pesquisa sobre tratamento de ferida que irá acompanhar a cicatrização com fotos da lesão. O avaliador treinado irá tirar as fotos sempre na mesma máquina, no mesmo local, com a mesma iluminação, na mesma distância da lesão. Outra estratégia de redução de vieses é o cegamento na pesquisa. Isso significa que a pes- soa “cega” não sabe dizer qual sujeito está em qual grupo (intervenção ou controle). Existem quatro momentos ou pessoas que podem ser “cegas” no ensaio clínico: a alocação, o pacien- te, o profissional que executa a intervenção e o profissional que faz a avaliação (Figura 3). Figura 03. Esquema com as diversas pessoas que podem ser “cegas” na pesquisa Alocação Controle Avaliação Intervenção Fo nt e: e la bo ra da p el a au to ra . 121 U9 Estudos experimentais Bioestatística e Epidemiologia O sigilo da alocação é o cegamento nesse processo. Isso ocorre quando quem faz a alocação não sabe dizer qual indivíduo foi para qual grupo. Logo, ao fazer o processo, a pessoa não pode saber que está decidindo onde essa pessoa vai estar. Saber quem é o sujeito pode influenciar na decisão de escolher qual grupo alocar. Para facilitar o sigilo desse processo, a seleção é feita com frequência com a ajuda do computador. O sujeito da pesquisa também deve ser cego para que ele não seja tendencioso nas suas condutas. É possível que a pessoa busque outras intervenções ou mude para hábitos mais saudáveis para querer ajudar o resultado da pesquisa. Já para os sujeitos que sabem que estão no grupo controle isso pode estimular a não adesão ao tratamen- to ou a uma maior taxa de desistência. IM PO R TA N TE EX EM PL O Uma dificuldade em cegar o sujeito da pesquisa é a obrigatoriedade do Termo de Con- sentimento Livre e Esclarecido (TCLE) que todo participante deve ler e assinar para poder participar do estudo. No TCLE está descrito o objetivo da pesquisa, o que pode fazer com que a pessoa saiba qual é o grupo que ela está. O profissional que realiza o cuidado também precisa ser cego para que ele preste a mesma atenção, independentemente do grupo que o paciente está. Esse profissional pode ser alguém do serviço onde a pesquisa está realizada ou mesmo algum pesqui- sador. Mas é importante que o cuidado seja o mesmo para que o efeito Hawthorne seja igual nos dois grupos. Uma estratégia que ajuda no cegamento do profissional é a alocação por conglomera- do. Nesse caso, os sujeitos daquele serviço de saúde são do mesmo grupo, isso impe- de que o profissional compare as pessoas e faça atendimento diferenciado. Para facilitar o cegamento do sujeito e do cuidador é importante que o placebo ou a outra intervenção do grupo controle seja muito similar à intervenção do estudo. Assim, eles não serão capazes de diferenciar um do outro. Se a pesquisa é sobre técnicas de curativo, as duas pomadas devem ser embaladas no mesmo frasco e quem fez a alocação deve nomear o tudo por paciente e não por produto. Mas se as características são diferentes, o cuidador que deveria ser cego vai conseguir descobrir qual grupo o sujeito está. É essencial o profissional que faz a avaliação ser cego, já que a avaliação pode ser tendenciosa e muito mais detalhada no grupo intervenção. O avaliador pode ser alguém do serviço onde a pesquisa está sendo realizada ou pode ser algum pesquisador. Mas é impor- tante que ele siga o protocolo de avaliação da mesma maneira para todos os indivíduos. Na pesquisa de curativo em que a avaliação é por fotos, quem faz a análise das imagens deve realizá-la sem saber qual foi a pomada aplicada. Assim, a pessoa não será tenden- ciosa em procurar algum critério de melhora ao saber que o sujeito é do grupo intervenção. U9 122 Estudos experimentais Bioestatística e Epidemiologia IM PO R TA N TE Tradicionalmente se classifica um estudo duplo cego usando como referência que o sujeito da pesquisa e o cuidador ou avaliador são cegos. É possível que a alocação, a intervenção e a avaliação sejam feitas pela equipe de pesquisa e, por isso, sejam con- sideradas como um ponto cego. Mesmo sendo o termo mais tradicional, é importante estar claro no estudo quais são os pontos cegos e quais foram as estratégias utilizadas para garantir isso. Quando um ensaio clinico não é cego, ele é classificado como aberto. Um estudo pode ser cego em um ou mais momentos: na alocação, com o sujeito da pesquisa, o profissional que realiza o cuidado e o profissional que realiza a avaliação. Um estudo randomizado é quando a alocação dos sujeitos nos grupos, intervenção ou controle é aleatória. Quando isso acontece, o estudo é cego no momento da alocação. Um estudo duplo cego tradicionalmente indica que o sujeito e o pesquisador são ce- gos. Nesses casos, normalmente o pesquisador será o cuidador e o avaliador. O ideal é o pesquisador deixar claro as estratégias para cegar as pessoas. 1.2. ANÁLISE DA PESQUISA A análise dos resultados pode ser feita com testes estatísticos e com medidas sumárias, que são Redução do Risco Relativo (RRR), Redução do Risco Absoluto (RRA) e Núme- ro Necessário para Tratar (NNT) (ROUQUAYROL, 2018, p. 155). Como o desenho do estudo é semelhante ao estudo coorte, a análise de dados também é similar. É possível calcular a incidência do desfecho nos dois grupos. A RRR é a diferença das incidências do desfecho entre os grupos dividido pela incidên- cia do grupo controle. A RRA representa o risco absoluto coma diferença da incidência do desfecho entre cada grupo. O NNT informa quantas pessoas são necessárias para tratar para evitar um desfecho ruim. Fórmula da Redução do Risco Relativo (RRR): 1 Incidência desfechoControle Incidência desfecho IntervençãoRRR Incidência desfechoControle − = A medida que as pessoas comumente vão utilizar no ensaio clínico é a eficácia do tratamento, que é a redução do risco relativo em porcentagem. Para fazer esse cál- culo, basta multiplicar por 100 o valor de RRR. 123 U9 Estudos experimentais Bioestatística e Epidemiologia EX EM PL O Um ensaio clínico para avaliar a efetividade de uma vacina na prevenção de CO- VID-19 utilizou como desfecho as possíveis classificações de gravidade da doença. A pesquisa acompanhou 724 pessoas do grupo intervenção e 706 do grupo placebo. No grupo intervenção 85 foram sintomáticos e 7 tiveram casos mais graves que neces- sitaram de assistência. No grupo placebo 167 foram sintomáticos e 31 tiveram casos mais graves que necessitaram de assistência. Calcule a eficácia da vacina na prevenção de casos sintomáticos e na prevenção de casos mais graves que necessitaram de assistência. Casos sintomáticos Tabela 01. Tabela 2 x 2 completa SINTOMÁTICOS ASSINTOMÁTICOS + NÃO DOENTES TOTAL INTERVENÇÃO 85 639 724 PLACEBO 167 539 706 TOTAL 252 1178 1430 Fonte: elaborada pela autora. 85 0,1174 724 númerode sintomáticos na IntervençãoIncidência na Intervenção total de Intervenção = = = 167 0, 2365 706 númerode sintomáticos noControleIncidência noControle total deControle = = = Incidência desfechoControle Incidência desfecho IntervençãoRRR Incidência desfechoControle − = substituir os valores 0,2365 0,1174 0,2365 RRR −= realiza a subtração 0,1191 0,2365 RRR = realiza a divisão 0,5036RRR = multiplica por 100 Eficácia = 50,36% A vacina reduz em 50,36% a chance de uma pessoa ser caso sintomático de CO- VID-19, quando comparado a pessoas não vacinadas. U9 124 Estudos experimentais Bioestatística e Epidemiologia A análise dos dados pode ocorrer pela intenção de tratar ou pelo tratamento que de fato os sujeitos receberam (denominada análise explanatória). Essa escolha deve ser definida e ser clara nos resultados da pesquisa. É uma decisão que acontece quando há cruzamento de grupos, ou seja, apesar de a pessoa estar no grupo con- trole ela recebeu o tratamento intervenção. Normalmente, a análise é pela intenção de tratar, já que é esse o olhar que importa para o profissional de saúde. Por exemplo, um médico precisa saber qual é a eficácia do remédio que ele prescreve para o paciente, mesmo que se tenha o risco de o paciente usar outros tratamentos e não fazer uso da medicação indicada. A análise explanatória é importante para saber, de fato, quão eficaz é tratamento quando o paciente realmente o realiza. O grande problema dessa análise é que a amostra pode estar enviesada, uma vez que a análise dos grupos não segue a alo- cação definida no início da pesquisa. Os ensaios clínicos avaliam a eficácia e a efetividade do tratamento. Define-se efi- cácia a avaliação da intervenção em condições ideais. Ela ocorre em ensaios clíni- cos com uma população de saudáveis e com o controle rigoroso das variáveis. Por conta disso, essa pesquisa tem baixo viés de confundimento e alta validade interna. Em contrapartida, há baixa capacidade de generalização, já que a amostra é tão restrita e, portanto, não representa a população geral. Ao restringir a população da pesquisa para somente pessoas saudáveis, a validade interna aumenta, mas a capacidade de generalização dos resultados diminui, visto que no mundo real são poucas as pessoas que são saudáveis. Para conseguir me- lhorar a validade externa sem alterar a população, pode-se aumentar o número de participantes e os locais de coleta de dados. Já a efetividade é definida como a avaliação da intervenção em condições normais. Ela ocorre em ensaios clínicos com uma população com características diferentes, como presença de comorbidades. Essa pesquisa tem maior chance de viés de confundimen- to e, portanto, pode apresentar validade interna baixa. Contudo, se for possível controlar os fatores de confusão, a pesquisa terá uma alta capacidade de generalização. G O SS Á R IO Eficácia refere-se ao impacto que uma ação tem, por exemplo, condições ótimas ou experimentais (ROUQUAYROL, 2018, p. 688). Efetividade avalia o efeito que uma ação alcança em aplicação prática ou condições habituais (ROUQUAYROL, 2018, p. 688). A validade externa define o quanto o resultado pode representar a população. Está associada à capacidade de generalização da pesquisa (ROUQUAYROL, 2018, p. 161). 125 U9 Estudos experimentais Bioestatística e Epidemiologia A pesquisa clínica para avaliar novos tratamentos medicamentosos passa por qua- tro fases. Antes dessas etapas são realizados estudos pré-clínicos em laboratórios e com animais. O ensaio clínico de fase I avalia a faixa terapêutica de segurança e os possíveis efeitos colaterais. Ela descreve as características do fármaco como qual é a via de eliminação e a meia-vida da substância. O número de participantes é muito pequeno, com menos de 100 pessoas, e não é necessário um grupo controle. A fase II é um ensaio clínico de avaliação de eficácia, avaliação entre doses e efi- cácia e investigação de efeitos colaterais. Dessa forma, a população é de pessoas saudáveis. Há um grupo controle e a amostra é pequena de algumas centenas. A fase III é um ensaio clínico de efetividade randomizado e avalia os reais efeitos do tratamento na população. Tem grupo controle e a amostra é grande, com mais de 1.000 pessoas. Com o resultado da fase III publicado a droga pode ser utilizada para uso comercial a depender da aprovação do órgão regulador. A fase IV do estudo clínico é a vigilância pós-comercialização. Nessa etapa, a co- leta de dados é feita a partir de notificação de efeitos adversos que só serão detec- tados com um uso amplo da medicação. Alguns medicamentos já foram retirados do mercado após a fase IV avaliar efeitos colaterais que não compensavam os benefícios da medicação. Por ser um estudo experimental, as duas principais desvantagens são o custo ele- vado e a logística complexa. O gasto é alto, já que tudo deve ser fornecido pela equipe da pesquisa. A logística é maior do que nos estudos observacionais, uma vez que é preciso realizar a intervenção e não somente avaliar o que já foi feito. Outro fator que influencia é as diversas etapas necessárias para manter as pessoas “cegas”. Além disso, outro motivo que dificulta a execução é a participação das pes- soas. Se for um estudo de eficácia, atualmente é difícil conseguir pessoas saudá- veis. Também, as pessoas podem ter medo de fazerem parte do grupo intervenção ou não quererem participar se for controle. Em alguns casos, os estudos experimentais não são possíveis de serem realizados. Uma das justificativas para isso é o princípio ético da não maleficência, ou seja, não se pode causar mal para o sujeito da pesquisa. Por exemplo, quando se investigava uma possível associação de fumo com câncer de pulmão, não foi possível fazer um ensaio clínico, já que não se podia incentivar o consumo de uma substância que podia fazer mal às pessoas. Em outros casos, os estudos observacionais conse- guem respostas mais rápidas e com um custo menor. G O SS Á R IO O ensaio clínico randomizado duplo cego é considerado o padrão-ouro dos estudos científicos. Entende-se como padrão-ouro a indicação mais robusta, que é um padrão de referência, seja ele um estudo, método diagnóstico ou tratamento (FLETCHER; FLETCHER; FLETCHER, 2014, p. 117). Então, deve-se sempre almejar realizar um ensaio clínico para avaliar uma intervenção em vez de estudos observacionais. U9 126 Estudos experimentais Bioestatística e Epidemiologia 2. OBJETO DE APRENDIZAGEM Julgue a pesquisa descrita abaixo. Qual é o tipo de estudo? Quais pessoas são“ce- gas”? Existem vieses? Quais estratégias melhorariam a pesquisa? C A SO D E PE SQ U IS A R EF LE XÃ O Uma pesquisa realizada por duas pessoas tinha como objetivo avaliar se o uso de fita adesiva terapêutica melhorava a dor lombar em pacientes com lombalgia crônica. Os dois grupos fizeram exercícios específicos para o quadro três vezes na semana. A du- ração do tratamento foi de duas de quatro semanas, sendo que o grupo intervenção trocava a fita adesiva uma vez por semana. Os sujeitos de pesquisa, ao lerem o TCLE, sabiam quais eram os dois grupos. Foram convidados a participar da pesquisa quem es- tava na fila de espera de atendimento fisioterápico pelo SUS (Sistema Único de Saúde). No primeiro atendimento, o pesquisador fez uma avaliação inicial e depois sorteou qual era o grupo que o participante iria ser incluído. O mesmo pesquisador era quem aplicava a fita terapêutica e orientava os exercícios. Como a sessão de atendimento e exercícios eram em grupos, os sujeitos sabiam que tinha algumas pessoas que colo- cavam faixa e outras não. Entre os participantes teve quem estava fazendo atividade física em academias, que realizava tratamento fisioterápico particular ou que fazia em casa os exercícios aprendidos nos outros dias da semana. Ao final das quatro sema- nas o mesmo pesquisador fez a avaliação final. I. A pesquisa é um ensaio clínico de superioridade. II. Houve sigilo de alocação, já que a alocação foi randomizada. O sujeito da pesqui- sa não era cego, porque ele sabia se estava no grupo da fita adesiva terapêutica ou só do exercício. Como quem fez a alocação é a mesma pessoa que aplicou a intervenção e fez a avaliação final, não houve cegamento nos outros momentos. III. Houve viés de confundimento, já que houve participantes que não seguiram o protocolo de atendimento, que era fazer somente os exercícios prescritos três vezes por dia. O ideal seria excluir as pessoas que faziam academia ou fisioterapia em outro serviço, por isso, também houve viés de amostragem. IV. Como a equipe era de dois pesquisadores, um poderia fazer a avaliação e o outro a alocação e a intervenção. Era preciso enfatizar que durante o período de pesquisa não se podia realizar outros exercícios. Era necessário avaliar a realização de outras atividades físicas e decidir se compensava excluir os sujeitos ou se deveria alocar as pessoas nos grupos a partir da quantidade de exercício que era realizado (fazer uma alocação estratificada pelo grau de atividade física). 127 U9 Estudos experimentais Bioestatística e Epidemiologia REFERÊNCIAS BIBLIOGRÁFICAS FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. S. Epidemiologia clínica: elementos essenciais. 5. ed. Porto Alegre: ArtMed, 2014. ROUQUAYROL, Maria Zélia; GURGEL, Marcelo. Rouquayrol: epidemiologia & saúde. 8. ed. Rio de Janeiro: Medbook, 2018. 752 p. 128 UNIDADE 10 ESTUDO DIAGNÓSTICO INTRODUÇÃO As variáveis têm distribuição normal na população, mas nem sempre o limite entre o sadio e o doente é bem definido. Uma pessoa com 37,8 °C está com febre ou ela só tem uma temperatura corpórea maior do que a maior parte da população? Qual é a propor- ção que você acha aceitável em um teste de falso positivo ou falso negativo? Uma pesquisa investiga se um novo exame de sangue consegue diagnosticar câncer de mama de uma maneira menos invasiva do que a biópsia. Como avaliar qual o valor definirá se a pessoa tem ou não a doença? Como conduzir essa pesquisa? Nesta unidade, responderemos a essas perguntas e abordaremos as características dos testes diagnósticos. 1. DEFINIÇÃO Os estudos diagnósticos são pesquisas que avaliam testes desse tipo. Considera-se como teste diagnóstico qualquer exame, escala ou procedimento cujo objetivo é avaliar e definir um diagnóstico. A pesquisa descreve as características do teste como capacidade de medir corretamente e quantidade de acertos e erros com proporções de verdadeiro e falso positivo. Além disso, o estudo é capaz de ajudar na interpretação do resultado. EX EM PL O A pesquisa calcula a probabilidade de um exame acertar ou errar e, a partir dessas informações, o profissional de saúde pode escolher qual exame é melhor para o seu paciente. Também, o estudo auxilia o profissional a interpretar o resultado ao avaliar qual é a chance de o resultado ser verdadeiro ou falso. Esse desenho de estudo é proposto quando se quer implantar ou desenvolver um novo teste em uma população, aplicando este teste entre a população sadia e doente. Para definir o grupo sadio e doente, um outro método diagnóstico será utilizado. Normalmente, a comparação é com o método padrão-ouro, ou seja, o teste com evi- dências mais sólidas, de maior acurácia e precisão; às vezes pode-se comparar com o exame mais frequente a ser realizado nos casos de o padrão-ouro não ser aces- sível. Por exemplo, uma pesquisa quer avaliar se um marcador tumoral sorológico é um bom teste de diagnóstico precoce de câncer colorretal, a comparação pode ser feita com o teste padrão-ouro, que é a colonoscopia, ou com o convencional, que é o sangue oculto nas fezes. 129 U10 Estudo diagnóstico Bioestatística e Epidemiologia SA IB A M A IS Para aprofundar ainda mais seus conhecimentos acerca do tipo de pesquisa, confira o artigo abaixo: DUARTE, Geraldo; et al. Teste rápido para detecção da infecção pelo HIV- 1 em gestantes. Rev. Bras. Ginecol. Obstet., v. 23, n. 2, p. 107-111, mar. 2001. Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pi- d=S0100-72032001000200008&lng=en&nrm=iso. Acesso em: 1 maio 2021. As informações obtidas na pesquisa são descritas na tabela 2 x 2 (tabela 1) que com- para, nas linhas, os resultados do novo método diagnóstico e nas colunas os grupos de pessoas sadias e doentes. Quatro possibilidades de desfecho são possíveis. ` Verdadeiro positivo (VP): quando os doentes testam positivo; ` Verdadeiro negativo (VN): quando os sadios testam negativo; ` Falso positivo (FP): quando os sadios testam positivo; ` Falso negativo (FN): quando os doentes testam negativo. Tabela 01. Cruzamento do resultado do novo teste nos grupos doente e sadio com as possibilidades dos quatro desfechos DOENTE SADIO TOTAL RESULTADO POSITIVO Verdadeiro Positivo (VP) Falso Positivo (FP) VP + FP RESULTADO NEGATIVO Falso Negativo (FN) Verdadeiro Negativo (VN) FN + VN TOTAL VP + FN FP + VN VP + FP + VN + FN Fonte: elaborada pela autora. Métodos diagnósticos quantitativos, como exames de sangue, têm distribuição normal na população. Então, uma pessoa sadia pode ter uma faixa de valores que o exame pode alterar e ela ainda ser “não doente”. O ideal com qualquer método diagnóstico é que a curva de distribuição dos resultados dos sadios e dos doentes sejam indepen- dentes (Figura 1A). Mas isso raramente ocorre, normalmente, as curvas se sobrepõem (Figuras 1B e 1C) e com isso fica difícil saber qual valor se deve definir como o limite entre um exame normal ou alterado. Considere na Figura 1 a representação gráfica da frequência de cada valor de resultado de um exame sorológico que pode ser um novo método diagnóstico para câncer. Na Figura A, as curvas dos sadios e doentes são independentes, ou seja, não existe um valor que tanto indivíduos sadios como os doentes apresentaram como resultado. Na Figura B, existe um pouco de sobreposição e em alguns valores há indivíduos sadios e doentes. Na Figura C, a sobreposição é total e, portanto, o exame não é adequado como método diagnóstico. U10 130 Estudo diagnóstico Bioestatística e Epidemiologia Fo nt e: e la bo ra da p el a au to ra . Figura 01. Gráficos da frequência de cada valor de resultado de um novo exame sorológico comparando o grupo sadio e doente 131 U10 Estudo diagnóstico Bioestatística e Epidemiologia Na Figura A, o ponto de corte entre o exame normal e o alterado pode ser 10 ou 11. Na Figura B, é mais difícil decidir apenas graficamente. Já na Figura C, o teste diagnóstico não é eficaz e, portanto,não necessita decidir. Para ajudar na definição de qual é o me- lhor ponto de corte, algumas medidas de testes diagnósticos são necessárias. Além dis- so, o objetivo e as consequências do teste também contribuirão na tomada de decisão. 2. MEDIDAS Os testes diagnósticos têm duas medidas intrínsecas, a sensibilidade e a especificidade. Além delas, a pesquisa consegue avaliar os valores preditivos positivo e negativo. Essas quatro medidas são probabilidades e são expressas normalmente em porcentagem. 2.1. SENSIBILIDADE E ESPECIFICIDADE A sensibilidade e a especificidade são características do teste diagnóstico que não sofrem alteração com mudanças de outras variáveis, como a prevalência da doença. São informações importantes a serem consideradas antes de solicitar o exame para o paciente. Dependendo do objetivo do exame pode ser interessante escolher um teste com alta sensibilidade ou com alta especificidade. A confiabilidade dos valores das medidas depende da amostra. A população deve ser representativa e com um número amostral grande para que o valor real esteja perto do valor estimado pelo cálculo. A sensibilidade é a proporção de pessoas do grupo doente que testaram positivo (ROUQUAYROL, 2018, p. 151). Seu valor está associado à quantidade de falsos nega- tivos. Quanto menor o número de falsos negativos, maior o valor da sensibilidade. Fórmula da Sensibilidade (S): ( ) Verdadeiro PositivoS total dedoentes Verdadeiro Positivo Falso Negativo = + ou VPS VP FN = + 1 Para transformar o valor em porcentagem é só multiplicar o resultado por 100. Um teste com alta sensibilidade significa que ele irá detectar a grande maioria dos do- entes. Por essa característica, exames com alta sensibilidade são utilizados quando se quer garantir que todos os doentes sejam identificados. É comum para doenças trans- missíveis, porque se quer ter certeza de que não existe algum doente com exame falso negativo e que continuará transmitindo a doença. Outra característica dos testes com alta sensibilidade é que se confia no resultado ne- gativo. Isso acontece uma vez que a proporção de falsos negativos é baixa e, portanto, um exame negativo tem grande chance de ser um verdadeiro negativo. U10 132 Estudo diagnóstico Bioestatística e Epidemiologia 2 Os testes de rastreamento e os testes iniciais no processo diagnóstico têm alta sensibi- lidade, sendo que o objetivo nesses dois casos é confirmar a ausência de determinada doença. Por isso que exames de rastreamento não determinam a presença de doença e é necessária a realização de novos exames para fechar o diagnóstico. Essa caracterís- tica é importante ser ressaltada, já que muitas pessoas ao terem o teste rápido de HIV positivo já consideram que são verdadeiros positivos e portadores do vírus, quando, na verdade, o teste rápido só consegue garantir o exame negativo. A especificidade é a proporção de pessoas do grupo sadio que testaram negativo (ROU- QUAYROL; GURGEL, 2018, p. 151). Seu valor está associado à quantidade de falsos positivos. Quanto menor o número de falsos positivos, maior o valor da especificidade. Fórmula da Especificidade (E): ( ) Verdadeiro NegativoE total de sadios Verdadeiro Negativo Falso Positivo = + ou VNE VN FP = + Pa transformar o valor em porcentagem é só multiplicar o resultado por 100. Um teste com alta especificidade detectará a grande maioria dos sadios, ou seja, rara- mente se classificará alguém como doente sendo que, de fato, a pessoa é sadia. Sua principal característica é que se confia no resultado positivo, uma vez que a proporção de falsos positivos é muito baixa. O principal uso de testes com alta especificidade é para confirmação diagnóstica. Ele também é utilizado quando um resultado positivo pode ser nocivo para o indivíduo. Por exemplo, se um exame positivo significa que a pessoa deverá passar por uma cirurgia, é importante ter certeza que o paciente não sofrerá uma intervenção desnecessária, já que o resultado era, na verdade, um falso positivo. EX EM PL O Cálculo de sensibilidade e especificidade Uma pesquisa com o objetivo de avaliar se um novo marcador sorológico é capaz de identificar precocemente o câncer de mama realizou 200 testes e comparou com os achados da mamografia. Dos 100 casos positivos na mamografia, 95 foram posi- tivos no novo exame. Dos 100 casos negativos na mamografia 20 foram negativos no novo exame. Qual é a sensibilidade e a especificidade desse novo teste? 133 U10 Estudo diagnóstico Bioestatística e Epidemiologia Tabela 2 x 2 completa DOENTE (MAMOGRAFIA +) SADIO (MAMOGRAFIA -) TOTAL TESTE POSITIVO 95 80 175 TESTE NEGATIVO 5 20 25 TOTAL 100 100 200 Sensibilidade VPS VP FN = + substituir o valor 95 95 5 S = + fazer a soma do denominador 95 100 S = realizar a divisão 0,95 S = 0,95 1 00S = × . realizar a multiplicação para transformar em porcentagem 95% S = . Especificidade VNE VN FP = + substituir o valor 20 20 80 E = + fazer a soma do denominador 20 100 E = realizar a divisão 0, 20E = 0, 20 1 00E = × . realizar a multiplicação para transformar em porcentagem U10 134 Estudo diagnóstico Bioestatística e Epidemiologia 20% E = A sensibilidade desse teste é de 95% e a especificidade é de 20%. Como tem alta sensibilidade, pode ser um teste de rastreamento adequado. Como mencionado no final do tópico anterior, para decidir qual é o melhor ponto de cor- te entre exame normal e alterado é preciso calcular a sensibilidade e a especificidade de cada ponto e, a partir disso, decidir qual é o melhor ponto. Uma representação gráfica denominada curva ROC (receiver operator characteristics) pode auxiliar nessa definição (FLETCHER; FLETCHER; FLETCHER, 2014, p. 121). A curva é um gráfico de correlação entre as proporções da sensibilidade (eixo y) e do falso positivo (eixo x) nos diversos pontos de cortes possíveis (pontos na curva). A proporção de falso positivo é a parte complementar da especificidade e, às vezes, é mencionada no gráfico como “1 - Especificidade”. Por exemplo, se a especificidade for de 40%, primeiro devemos transformar ela novamente em número decimal dividindo por 100 (40% ÷ 100 = 0,4), depois fazer a subtração (1 - 0,4 = 0,6) para por último transformar novamente em porcentagem multiplicando por 100 (0,6 × 100 = 60%). Figura 02. Curva ROC de três testes diagnósticos diferentes Fo nt e: e la bo ra da p el a au to ra . A Figura 2 representa a curva ROC de três testes diagnósticos diferentes. A curva 1 é de um teste diagnóstico que tem distribuição dos resultados de sadios e doentes com poucas sobreposições. A curva 2 tem a distribuição conforme a imagem 4. O teste da curva 3 apresenta sobreposição completa entre os resultados dos dois grupos e, por- tanto, não é um exame capaz de diferenciar doentes de sadios. 135 U10 Estudo diagnóstico Bioestatística e Epidemiologia Figura 03. Distribuição da frequência de cada valor de resultado de um novo exame sorológico comparando o grupo sadio e doente Fo nt e: e la bo ra da p el a au to ra . Normalmente, a definição do limite de resultado positivo ou negativo é o valor que repre- senta um ponto na curva ROC em que há mudança na inclinação. Na curva 1 é claro o momento em que o trajeto passa de vertical para horizontal, que é o primeiro ponto do gráfico com sensibilidade de 90%. Na curva 2, seria possível usar três pontos, os que têm sensibilidade de 65%, 80% ou 85% Considerando o exame da curva 2 (Figura 2) descrito na Figura 3, calcularemos a sen- sibilidade e a especificidade de dois pontos de corte com definição de doente para resultados ≥ 11 ou ≥ 13. EX EM PL O Cálculo da curva 2 – diversos pontos de corte Considere que a pesquisa analisou 100 sadios e 100 doentes e realizou o novo teste sorológico. Qual é a sensibilidade e a especificidade desse novo teste se o ponto de definição de positivo e negativo for ≥ 11 ou ≥ 13? Ponto decorte ≥ 11 DOENTE SADIO TOTAL TESTE POSITIVO 85 40 125 TESTE NEGATIVO 15 60 75 TOTAL 100 100 200 Sensibilidade 85 85 0,85 0,85 1 00 85% 85 15 100 VPS VP FN = = = = = × = + + . U10 136 Estudo diagnóstico Bioestatística e Epidemiologia DOENTE SADIO TOTAL TESTE POSITIVO 65 10 75 TESTE NEGATIVO 35 90 125 TOTAL 100 100 200 Especificidade 60 60 0,60 0,60 1 00 60% 60 40 100 VNE VN FP = = = = = × = + + Ponto de corte ≥ 13 Sensibilidade 65 65 0,65 0,65 1 00 65% 65 35 100 VPS VP FN = = = = = × = + + Especificidade 90 90 0,90 0,90 1 00 90% 90 10 100 VNE VN FP = = = = = × = + + Com os cálculos, usar a definição de exame positivo com resultados ≥ 11, significa que o teste diagnóstico terá alta sensibilidade, ou seja, ele será capaz de detectar quase todos os doentes e será possível confiar no resultado negativo. Caso a definição seja ≥ 13, o teste diagnóstico terá alta especificidade, ou seja, ele será capaz de detectar quase todos os sadios e será possível confiar no resultado positivo. Para escolher qual desses pontos utilizar, é preciso pensar qual é o objetivo do teste. Se o pro- pósito for um teste de rastreamento ou avaliação inicial, deve-se escolher um padrão com alta sensibilidade que, nesse caso, é definir como positivo ≥ 11. Também se escolhe esse ponto caso um resultado positivo, mesmo que falso positivo, não tenha impacto na vida do sujeito. Agora, se o objetivo for um teste de confirmação diagnóstica, deve-se escolher um padrão com alta especificidade, que nesse caso é definir como positivo ≥ 13. Também se escolhe esse ponto caso resultado positivo signifique uma intervenção cirúrgica ou algum estigma que irá impactar na vida da pessoa. SA IB A M A IS Conheça mais sobre a Análise de ponto de corte e sua aplicação no artigo abaixo: INFANTINO, M. et al. Diagnostic accuracy of an automated chemiluminescent im- munoassay for anti-SARS-CoV-2 IgM and IgG antibodies: an Italian experience. J Med Virol., v. 92, n. 9, p. 1671– 1675, 2020. Disponível em: https://doi.org/10.1002/ jmv.25932. Acessado em 12 jun. 2021. 137 U10 Estudo diagnóstico Bioestatística e Epidemiologia 2.2 VALOR PREDITIVO POSITIVO E NEGATIVO Os valores preditivos auxiliam na interpretação do resultado e avaliam a probabilidade de confiar no resultado obtido. São medidas que avaliam a probabilidade pós-teste (ROUQUAYROL; GURGEL, 2018, p. 152). O valor preditivo positivo (VPP) é a proporção de pessoas do grupo que testaram po- sitivo que são doentes. Seu valor está associado à quantidade de falsos positivos e com o valor da especificidade. Essa é a probabilidade de se confiar no resultado positivo. Fórmula do Valor Preditivo Positivo (VPP): ( ) Verdadeiro PositivoVPP total de positivos Verdadeiro Positivo Falso Positivo = + ou VPVPP VP FP = +3 4 Para transformar o valor em porcentagem é só multiplicar o resultado por 100. O valor preditivo negativo (VPN) é a proporção de pessoas do grupo que testaram negativo que são sadias. Seu valor está associado à quantidade de falsos negativos e com o valor da sensibilidade. É a probabilidade de se confiar no resultado negativo. Fórmula do Valor Preditivo Negativo (VPN): ( ) Verdadeiro NegativoVPN total denegativos Verdadeiro Negativo Falso Negativo = + ou VNVPN VN FN = + Para transformar o valor em porcentagem é só multiplicar o resultado por 100. EX EM PL O Cálculo de Valor Preditivo Positivo e Negativo Uma pesquisa com o objetivo de avaliar se um novo marcador sorológico é capaz de identificar precocemente o câncer de mama realizou 200 testes e comparou com os achados da mamografia. Dos 100 casos positivos na mamografia, 95 foram posi- tivos no novo exame. Dos 100 casos negativos na mamografia 20 foram negativos no novo exame. Qual é o Valor Preditivo Positivo e o Valor Preditivo Negativo desse novo teste? Tabela 2 x 2 completa U10 138 Estudo diagnóstico Bioestatística e Epidemiologia DOENTE (MAMOGRAFIA +) SADIO (MAMOGRAFIA -) TOTAL TESTE POSITIVO 95 80 175 TESTE NEGATIVO 5 20 25 TOTAL 100 100 200 Valor Preditivo Positivo (VPP) VPVPP VP FP = + substituir o valor 95 95 80 VPP = + fazer a soma do denominador 95 175 VPP = realizar a divisão 0,5429 VPP = 0,5429 1 00VPP = × realizar a multiplicação (transformar em porcentagem) 54,29% VPP = Valor Preditivo Negativo (VPN) VNVPN VN FN = + substituir o valor 20 20 5 VPN = + fazer a soma do denominador 20 25 VPN = realizar a divisão 0,80VPN = 0,80 1 00VPN = × realizar a multiplicação (transformar em porcentagem) 80% VPN = O valor preditivo positivo desse teste é de 54,29% e o valor preditivo negativo é de 80%. 139 U10 Estudo diagnóstico Bioestatística e Epidemiologia Os valores preditivos variam conforme a sensibilidade e a especificidade dos testes. Testes com alta sensibilidade costumam ter um alto valor preditivo negativo por possu- írem baixa proporção de falsos negativos. É por isso que nesses testes se confia mais no resultado negativo. Os testes de alta especificidade têm alto valor preditivo positivo, já que a frequência de falsos positivos é baixa. Os valores preditivos também variam se um mesmo teste for aplicado em populações com prevalências diferentes (FLETCHER; FLETCHER; FLETCHER, 2014, p. 126). Por isso, mesmo em um teste com alta especificidade, um resultado positivo pode não ser confiável se a prevalência da doença na população for baixa. Quanto menor a pre- valência da doença, menor o valor preditivo positivo e maior o valor preditivo negativo. Como a prevalência da doença pode variar muito, ao avaliar o resultado esse fator é mais importante do que a sensibilidade e a especificidade do teste. EX EM PL O Cálculo dos Valores Preditivos em populações com prevalências diferentes da doença Considere que a pesquisa realizou um novo teste sorológico para câncer de prósta- ta em duas populações diferentes. A primeira população era de pessoas que faziam acompanhamento com o urologista e apresentavam alguma queixa de alteração ao urinar. A segunda população era de pessoas que faziam acompanhamento com o mé- dico generalista na Unidade Básica de Saúde e não tinham queixas. Qual é a prevalência de doentes com câncer de próstata em cada grupo? Quais são os Valores Preditivos Positivos e Negativos para cada população? Grupo urologista com queixa urinária DOENTE SADIO TOTAL TESTE POSITIVO 179 19 198 TESTE NEGATIVO 25 101 126 TOTAL 204 120 324 Prevalência 204 0,6300 0,6300 1 00 63,00% 324 total decasos ou doentesP total da amostra = = = = × = Valor Preditivo Positivo 179 179 0,9040 0,9040 1 00 90,40% 179 25 198 VPVPP VP FP = = = = = × = + + U10 140 Estudo diagnóstico Bioestatística e Epidemiologia DOENTE SADIO TOTAL TESTE POSITIVO 79 36 115 TESTE NEGATIVO 11 198 209 TOTAL 90 234 324 Valor Preditivo Negativo 101 101 0,8016 0,8016 1 00 80,16% 101 19 126 VNVPN VN FN = = = = = × = + + . Grupo generalista sem queixa urinária Prevalência 90 0, 2778 0,2778 1 00 27,78% 324 total decasos ou doentesP total da amostra = = = = × = . Valor Preditivo Positivo 79 79 0,6870 0,6870 1 00 68,70% 79 36 115 VPVPP VP FP = = = = = × = + + Valor Preditivo Negativo 198 198 0,9474 0,9474 1 00 94,74% 198 36 209 VNVPN VN FN = = = = = × = + + O grupo do urologista que tem uma prevalência maior que o grupo do generalista. O Valor Preditivo Positivo (VPP) é maior no grupo com maior prevalência (urologista) enquanto o Valor Preditivo Negativo (VPN) é maior no grupo com menor prevalência (generalista). A sensibilidade e a especificidade são iguais nos dois grupos já que elas são inerentes ao exame. A sensibilidade é de 87,78% e a especificidade é de 84,61%. Para aumentar a prevalência da doença e conseguir confiar mais no resultado positivo, várias estratégias são possíveis, como mostra o exemplo acima. Pacientes com sinais e/ou sintomas, histórico familiarda doença, presença de antecedentes pessoais ou outras características individuais têm um risco maior de desenvolver a doença. Isso significa que a prevalência dela em grupos com alguma dessas características é maior do que na população geral. Pacientes que passam com especialistas, muito provavelmente, já apresentam sintomas, por isso os resultados positivos são mais confiáveis. Por outro lado, em situ- 141 U10 Estudo diagnóstico Bioestatística e Epidemiologia ações de alta prevalência, o resultado negativo não é confiável, já que o VPN é baixo e as chances de falso negativo são maiores. Em casos em que a prevalência da doença é muito baixa, os resultados positivos não são confiáveis, por isso que a realização indiscriminada de exames de rotinas em pes- soas assintomáticas é questionável. A chance de falsos positivos é alta e isso pode levar a tratamentos desnecessários. É por essa razão que não existe um consenso na literatura sobre a realização de dosagem sorológica de PSA indiscriminada para a população geral. Mesmo que exista artigos com VPP altos, é preciso avaliar qual foi a amostra da pesquisa. 3. TESTE DIAGNÓSTICOS MÚLTIPLOS Uma estratégia para melhorar os valores de sensibilidade e especificidade dos testes é realizar diversos exames diferentes. Os múltiplos testes diagnósticos podem acontecer simultaneamente ou sequencialmente. Quando acontece em série, o próximo exame só é solicitado quando o anterior for positivo. Os testes em paralelos referem-se a quando os exames diagnósticos são realizados simultaneamente. Normalmente, eles ocorrem em situações de emergência ou quan- do o paciente tem dificuldade de locomoção e se pretende reduzir a ida a serviços de saúde. Eles aumentam a sensibilidade e o VPN, além de reduzirem a especificidade e o VPP de cada teste se ele tivesse sido realizado isoladamente. Uma vantagem é melhorar a sensibilidade quando os testes disponíveis não são pouco sensíveis, logo, são úteis quando se quer garantir que todos os casos de doença serão detectados. A desvantagem é a maior probabilidade de falsos positivos que leva a um diagnóstico errado e tratamento desnecessário do paciente. (FLETCHER; FLETCHER; FLETCHER, 2014, p. 135) Os testes em séries são quando os exames acontecem em sequência a depender do resultado positivo do exame anterior. Eles aumentam a especificidade e o VPP, bem como reduzem a sensibilidade e o VPN. Eles ocorrem em atendimento ambulatorial para aumentar a confiança do resultado positivo. Uma vantagem é melhorar a especifi- cidade do teste quando os exames disponíveis são pouco detalhados. Uma desvanta- gem é o maior número de falsos negativos, que faz com que alguns doentes não sejam diagnosticados. (FLETCHER, FLETCHER; FLETCHER, 2014, p. 136). Esses testes são usados quando há testes caros ou com maior risco de complicações. A realização do teste caro ou com maior risco só acontece caso um exame prévio tenha sido positivo. Por ser condicionante ao exame anterior positivo, quando se realiza testes em séries, menos testagens são realizadas. U10 142 Estudo diagnóstico Bioestatística e Epidemiologia 4. OBJETO DE APRENDIZAGEM Uma pesquisa validou um novo teste diagnóstico para HIV com a população adulta. Na amostra de 363 pessoas, 178 tiveram resultado positivo. Entre os 139 doentes, somen- te 2 testaram negativo. Calcule a sensibilidade, especificidade e os valores preditivos positivo e negativo. Avalie o teste: em que situação ele deve ser utilizado? Um familiar do sexo masculino com 85 anos te encaminhou o laudo do exame com resultado positivo para HIV. Como explicar o resultado e sua interpretação para o paciente. 143 U10 Estudo diagnóstico Bioestatística e Epidemiologia REFERÊNCIAS BIBLIOGRÁFICAS FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. Epidemiologia clínica: elementos essenciais. 5. ed. Porto Alegre: ArtMed, 2014. ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia & saúde. 8. ed. Rio de Janeiro: Medbook, 2018. 752 p. 144 UNIDADE 11 RESULTADOS: ANÁLISE E APRESENTAÇÃO INTRODUÇÃO Considere uma pesquisa que avalia se a acupuntura reduz o tempo de duração de uma crise de enxaqueca. Como resultado, obteve-se que quem fez acupuntura teve uma crise de 2,5h, em média, enquanto quem não fez teve uma crise de, em média, 3,5h. É possível apontar que acupuntura reduz o tempo de duração das crises? Para um leigo e pessoas que sofrem de enxaqueca essa redução de uma hora pode ser significativa, mas nem sempre para as estatísticas esses dados mostram uma associação. Nesta unidade, abordaremos quais estratégias são utilizadas para avaliar a associação de variáveis a partir de dados coletados e como os resultados de uma pesquisa podem ser organizados e demonstrados. 1. ANÁLISE ESTATÍSTICA Dentre as funções do conceito de bioestatística está a característica de analisar os da- dos coletados da amostra da pesquisa. Esse processo acontece comparando variáveis coletadas para avaliar possíveis associações e comparando os resultados encontrados com o que é esperado ou o que foi encontrado em outras pesquisas. A principal ava- liação ao ler os resultados de uma pesquisa é indagar se o que foi encontrado de fato representa a realidade. EX EM PL O Uma pesquisa avaliou a nota dos alunos em uma disciplina teve como resultado a taxa de reprovação de 50%, e que os alunos do sexo masculino reprovam muito mais do que os do sexo feminino. A conclusão dessa pesquisa foi que o sexo influencia na aprovação da disciplina. Ao ler esses resultados é preciso avaliar a probabilidade de eles serem representativos ao que acontece na população total e, portanto, generali- zar as informações obtidas. Existe a possibilidade de o resultado encontrado na pesquisa ser decorrente de um erro sistêmico ou viés. Os vieses podem acontecer em diversos momentos da pesquisa, desde a amostragem, na aferição ou coleta de dados, na utilização de informações de eventos que aconteceram há muito tempo e talvez o paciente já não se lembre corre- tamente. É por isso que, ao definir os métodos de coleta de dados da pesquisa a partir do desenho de estudo, diversas estratégias podem ser realizadas a fim de reduzir ou impossibilitar a ocorrência de vieses. Outra possibilidade é que o erro da pesquisa seja em decorrência ao acaso. Define-se como acaso um erro aleatório que é inerente a qualquer observação. Não existe estra- 145 U11 Resultados: análise e apresentação Bioestatística e Epidemiologia tégia capaz de eliminar a ocorrência do acaso (FLETCHER; FLETCHER; FLETCHER, 2014, p. 189). SA IB A M A IS Se quiser se aprofundar sobre o acaso, uma dica de leitura é O andar do bêbado, de Leonard Mlodinow. Esse livro é um best-seller internacional que aborda o quanto os eventos e acontecimentos da nossa vida podem ser explicados pelo acaso. MLODINOW, L. O andar do bêbado. Rio de Janeiro: Zahar, 2008, p. 207. Todo resultado de pesquisa deve sempre ser questionado se ele ocorreu, pois, de fato, é o que acontece no mundo real (natureza) ou se o que foi encontrado é justificado pelo acaso, como no caso de uma pessoa morre após utilizar uma medicação. A estatística consegue ajudar na definição que a morte foi em decorrência do tratamento ou ela pode ser justificada pelo acaso, ou seja, a pessoa iria morrer independentemente da adminis- tração da medicação. Toda análise estatística tem a incerteza inerente do acaso. Para decidir se os resultados são confiáveis e que se pode generalizá-los, existem méto- dos que conseguem avaliar o acaso, os quais estimam os efeitos da variação aleatória. Os dois métodos mais utilizados são os testes de hipóteses e os intervalos de confiança. 1.1 TESTES DE HIPÓTESES O teste de hipótese avalia, utilizando testes estatísticos, se uma diferença ou uma as- sociação está presente. Por exemplo, para avaliar se existe uma diferença no tempo de duração de uma crise de enxaqueca em pessoas que realizaram tratamentos diferen- tes, um teste de hipótese podeser realizado. Para avaliar se existe diferença entre a proporção de doentes ao comparar pessoas que foram vacinadas ou não, um teste de hipótese pode ser feito. Um teste de hipótese tem, inicialmente, duas possibilidades de resposta: o que é tes- tado é diferente ou ele é igual. Isso também acontece ao testar a associação entre as variáveis, ela pode existir ou não. Define-se como hipótese nula a hipótese que sempre se refere a não existir diferença ou associação (VIEIRA, 2016, p. 128). Ela é abreviada como H0 (lê-se “agá zero”). No exemplo do teste que compara o tempo da enxaqueca dependendo do tratamento realizado, a hipótese nula é que não há diferença entre os tempos de tratamento. A hipótese alternativa refere-se à existência de diferença ou associação do que se está testando (VIEIRA, 2016, p. 128). Ela é abreviada como H1 (lê-se agá um). No exemplo do teste que compara o tempo da enxaqueca dependendo do tratamento reali- zado, a hipótese alternativa é que há diferença entre os tempos de tratamento. Ao final do teste, se a conclusão é aceitar a hipótese alternativa, pode-se dizer que o resul- tado do teste foi significativo ou que a diferença é estatisticamente significante, sendo possí- vel associar H1 com um resultado positivo do teste. Mas se a conclusão é aceitar a hipótese nula, pode-se dizer que o resultado do teste foi não significativo ou que a diferença não é estatisticamente significante, associando então H0 com um resultado negativo do teste. U11 146 Resultados: análise e apresentação Bioestatística e Epidemiologia Como qualquer teste, é possível que o resultado dele esteja errado. Logo, cada teste de hipótese tem quatro possibilidades de resultado (Figura 1): a hipótese nula é correta, a hipótese alternativa é correta, a ocorrência o erro tipo I e ocorrência do erro tipo II. Figura 01. Possibilidades de resultados em um teste de hipótese Diferença na natureza ou na população Presente Ausente Teste estatístico significativo Correto Erro tipo I Teste estatístico não significativo Erro tipo II Correto Diferença na natureza ou na população Presente Ausente Teste estatístico significativo Correto Erro tipo I Teste estatístico não significativo Erro tipo II Correto Fonte: adaptada de Fletcher; Fletcher; Fletcher (2014, p. 189). O erro tipo I refere-se aos resultados falsos-positivos, ou seja, o teste mostra uma diferença, só que na realidade ela não existe (FLETCHER; FLETCHER; FLETCHER, 2014, p.189). Assim, é afirmar que existe diferença entre o que se compara quando na verdade não existe diferença. Por exemplo, é concluir seu estudo afirmando que a acu- puntura altera o tempo de duração da crise de enxaqueca da pessoa quando, no mundo real, esse tratamento não altera o tempo de duração da crise. O erro tipo II refere-se aos resultados falsos-negativos, ou seja, o teste não mostra uma diferença, quando, na realidade, ela existe (FLETCHER; FLETCHER; FLETCHER, 2014, p. 189). É afirmar que não existe diferença entre o que se compara quando, na verdade, existe sim. Por exemplo, é concluir seu estudo afirmando que a acupuntura não altera o tempo de duração da crise de enxaqueca da pessoa quando, no mundo real, esse tratamento altera o tempo de duração da crise. EX EM PL O Definição de hipóteses e erros Pense que uma pesquisa deseja avaliar se a vacina reduz o número de óbitos de CO- VID-19. A análise dos dados foi feita comparando a proporção de óbitos no grupo de pessoas que tomou a vacina com o grupo de quem tomou placebo. ` A hipótese nula deste teste é que a proporção de óbitos nos vacinados não é dife- rente da proporção de óbitos nas pessoas que tomaram placebo. Ou seja, não há diferença da proporção de óbito entre os grupos. ` A hipótese alternativa deste teste é que a proporção de óbitos nos vacinados é dife- rente da proporção de óbitos nas pessoas que tomaram placebo. Ou seja, há dife- rença nas proporções de óbitos. ` O erro tipo I é afirmar que as proporções de óbitos são diferentes quando, na verdade, elas são iguais. ` O erro tipo II é afirmar que as proporções de óbitos são iguais quando, na verdade, elas são diferentes. 147 U11 Resultados: análise e apresentação Bioestatística e Epidemiologia A conclusão do teste de hipótese é decidir se aceita H0 ou se rejeita H0 e aceita H1. Para tomar essa decisão, utiliza-se a probabilidade de algum dos erros acontece- rem. Denomina-se α (lê-se alfa) a probabilidade de cometer um erro tipo I e β (lê-se beta) a probabilidade de cometer o erro tipo II. Como um resultado significativo tem mais impacto, porque pode promover altera- ções em protocolos e em cuidados, o número de falsos-positivos deve ser baixo. É por isso que na maioria dos casos utiliza-se α, que é a probabilidade de existir falsos-positivos. Um teste estatístico tem como principal resultado o p-valor (ou p-value, em inglês). O p-valor é a probabilidade do erro tipo I acontecer, ou seja, de o resultado positivo ter sido ao acaso e não pelo fato de que ele acontece na natureza. Probabilidade é expressa, preferencialmente, em número decimais, mas, para facilitar a compreen- são, ela pode ser transformada em porcentagem. R EF LI TA Tendo em mente uma pesquisa do tempo de crises de enxaqueca que compara o tratamento somente com acupuntura com o tratamento padrão, que é exclusiva- mente medicamentoso. O resultado do teste estatístico foi um p-valor de 0,123. Isso significa que a probabilidade de cometer o erro tipo I é de 12,3%, ou seja, existe 12,3% de probabilidade de que a acupuntura tenha na realidade o mesmo tempo de duração da crise de enxaqueca. Qual valor de probabilidade de um erro que seria aceitável? Você, profissional da saúde, a partir desse resultado trocaria o tratamento padrão e a partir desse momento só prescreveria acupuntura para seus pacientes com enxaqueca em vez de medicamento? Existe um consenso na comunidade científica que considera como aceitável um p-valor menor ou igual que 0,05. Se a probabilidade de acontecer um erro tipo I for menor do 5%, pode considerar que o resultado do teste é de fato significativo. Chama-se de nível de significância o teste do valor máximo que se aceita de pro- babilidade de ocorrer o erro tipo I. Portanto, o nível de significância que a maioria das pesquisas utilizam é de 5% (VIEIRA, 2016, p. 133). A Figura 2 resume como interpretar o p-valor considerando um nível de significân- cia de 5%. Quando o p-valor for menor ou igual do que 0,05, considera-se que a probabilidade de a significância estatística não existir é, na realidade, baixa. Por isso, aceita-se uma hipótese alternativa. Já quando o p-valor é maior do que 0,05, a probabilidade da não associação de fato acontecer é alta, o que leva a aceitar a hipótese nula. U11 148 Resultados: análise e apresentação Bioestatística e Epidemiologia Figura 02. Árvore de interpretação do resultado do teste estatístico a partir do p-valor Fo nt e: e la bo ra da p el a au to ra . Considere, novamente, o exemplo da acupuntura na crise de enxaqueca. Se o p-valor for 0,078, deve-se aceitar a hipótese nula: o tempo das crises não é diferente, inde- pendentemente do tratamento. Se o p-valor for de 0,032, deve-se rejeitar H0 e aceitar a hipótese alternativa: dependendo do tratamento, o tempo da crise é diferente. Nesse segundo caso há uma probabilidade de 3,2% de o resultado ser ao acaso e, na realida- de, não existir diferença. IM PO R TA N TE O p-valor não mede magnitude ou intensidade da diferença ou associação. O teste de hipótese e o p-valor medem apenas presença ou ausência, diferente ou igual, sendo associação ou não. Por exemplo, um teste de hipótese fictício compara o tempo de ventilação mecânica com o peso do paciente. O p-valor < 0,0001 não significa que o tempo de ventilação me- cânica está muito associado com o peso do paciente. Um p-valor de 0,042 ou < 0,0001 terá a mesma conclusão, que é a associação das variáveis. A diferença de a chance do resultadoser ao acaso e não acontecer na realidade é maior no caso de 0,042. Teste estatístico O teste estatístico não impede o acaso, ele só calcula qual é a probabilidade de o erro acon- tecer. Existem vários testes que devem ser usados em situações específicas. Para decidir qual realizar, é preciso primeiro saber algumas informações dos grupos e das variáveis que serão comparados. A primeira parte é classificar as variáveis. A variável qualitativa ou categórica é expressa em categorias mutualmente excludentes, enquanto a variável quantitativa ou numérica é expres- p-valor ≤ 0,05 p-valor > 0,05 Rejeitar H0 Aceitar H1 Aceitar H0 Há diferença ou associação Não há diferença ou associação Teste estatisticamente significante Teste sem significância estatística 149 U11 Resultados: análise e apresentação Bioestatística e Epidemiologia sa em números com intervalos iguais entre os valores (VIEIRA, 2016, p. 1). Para as variáveis quantitativas será também necessário saber se ela tem distribuição normal ou não. A definição se a variável tem distribuição normal pode ser por meio de um teste estatístico ou pressupor, teoricamente, qual é a distribuição dos dados observados se é próxima da curva de normalidade. Testes não paramétricos são quando uma ou mais das variáveis quantitati- vas têm distribuição não normal. Para as variáveis qualitativas também será necessário contar quantas categorias de res- posta existe. EX EM PL O A variável peso pode ter somente duas categorias de resposta (normal ou fora do normal) ou ter quatro (baixo peso, peso adequado, sobrepeso e obesidade). Quanto menos categorias tiverem melhor será a análise. Perceba na Tabela 1 a comparação entre duas tabelas que exemplificam que muitas ca- tegorias reduzem o número de observações em cada célula da tabela, o que influencia na confiança dos resultados. Tabela 01. Exemplo de distribuição dos dados conforme categorias das variáveis estudadas (peso e profissão) CATEGORIA BAIXO PESO PESO ADEQUADO SOBREPESO OBESIDADE TOTAL Técnico (A) de enfermagem 4 10 16 8 38 Auxiliar em saúde bucal 8 9 5 22 Técnico (A) em nutrição E dietética 1 2 3 Farmacêutico (A) 10 6 4 20 Fisioterapeuta 3 1 4 Médico (A) 7 3 1 11 Psicólogo (A) 2 4 6 Total 7 44 35 18 104 U11 150 Resultados: análise e apresentação Bioestatística e Epidemiologia FORMAÇÃO ADEQUADO NÃO ADEQUADO TOTAL Curso superior 20 43 63 Curso técnico ou auxiliar 24 17 41 Total 44 60 104 Fonte: elaborada pela autora. O número de variáveis que serão analisadas influencia na escolha também. Grande parte das análises de dados acontecem com teste entre duas variáveis. Análises com mais de duas variáveis são mais complexas e envolvem questões de modelagem. A próxima parte é definir se o teste é pareado ou não. Ser pareado sig- nifica que os sujeitos dos grupos que está se comparando são a mes- ma pessoa em momentos diferentes ou pessoas com características mui- to similares, também é ter amostras relacionadas (VIEIRA, 2016, p. 139). Por exemplo, um estudo sobre estratégia de redução alimentar pode ter grupos parea- dos se a análise for comparar o antes e o depois, havendo ou não grupos independen- tes que comparam o peso eliminado entre o grupo controle e o intervenção. Os testes estatísticos mais comuns e suas características são (FLETCHER; FLET- CHER; FLETCHER, 2014, p. 193): ` Shapiro Wilk: avalia se uma variável quantitativa tem distribuição normal. A hipótese nula é que a variável tem distribuição normal; ` Qui-quadrado de Pearson: avalia a associação de duas variáveis qualitativas. Às vezes é expresso pelo símbolo Χ2. Como o fato de: avaliar se o sexo dos alunos influencia na aprovação da disciplina, comparar se a proporção de aprovados em cada grupo (mascu- lino e feminino) é diferente. ` Fisher: avalia a associação de duas variáveis qualitativas que tenham poucos números de observações ou muitas tabelas de contingência vazias. É similar ao qui-quadrado; ` Teste t de student: compara duas médias de uma variável quantitativa que tenha distri- buição normal. É um teste paramétrico, pode ser pareado ou para grupos independentes. Por exemplo: para avaliar se a idade influencia na aprovação dos alunos é preciso testar se a média de idade entre os aprovados é igual à idade média dos reprovados. Se a idade tiver distribuição normal, o teste a ser realizado é um teste t, já que se está comparando as médias de uma variável normal de dois grupos; ` Mann-Whitney: compara duas médias de uma variável quantitativa que não tenha dis- tribuição normal. É um teste não-paramétrico para grupos independentes. O exemplo é similar ao teste t, sendo a diferença a distribuição; 151 U11 Resultados: análise e apresentação Bioestatística e Epidemiologia ` Wilcoxon: compara duas médias de uma variável quantitativa que não tenha distribuição normal. É um teste não-paramétrico para grupos pareados. O exemplo é similar ao teste t, sendo a diferença a distribuição; ` ANOVA: compara três ou mais médias de uma variável quantitativa que tenha distribuição normal. É um teste paramétrico para grupos independentes. Por exemplo: serve para avaliar se a idade média dos estudantes é diferente entre os diversos cursos da área da saúde; ` Correlação: compara duas variáveis quantitativas. É possível calcular uma medida de asso- ciação que mede a intensidade e o quanto do desfecho pode ser explicado pela outra variável. Antes de realizar o teste estatístico, é necessário definir, primeiro, quais variáveis ana- lisar para que a pergunta da pesquisa e seus objetivos possam ser respondidos. É comum pesquisadores testarem todas as variáveis entre si, isso faz com que o número de testes seja grande e pelo acaso possa ser que encontre um p-valor menor que 0,05, mas depois não é possível discutir esse resultado, porque ele não faz sentido no as- pecto teórico. Após reflexão e decisão de quais análises fazer, existe uma sequência de etapa para realizar um teste de hipótese: Figura 03. Teste de hipótese Definir hipótese nula e alternativa Especificar o nível de significância Escolher e realizar o teste estatístico Interpretar o resultado do p-valor Fonte: elaborada pela autora. É importante definir o nível de significância antes de rodar os testes. Isso é fundamental para que a escolha do que é “positivo” seja feita independentemente dos resultados obtidos. Nas últimas décadas, tem-se mudado um paradigma de que uma boa pesquisa precisa ter resultados estatisticamente significantes. Uma das estratégias utilizadas é mudar o nível de significância para conseguir resultados positivos. Por isso que é co- mum estar escrito no artigo “α de 0,05 definido a priori”. U11 152 Resultados: análise e apresentação Bioestatística e Epidemiologia Atualmente, tem se aceitado mais a teoria de que um resultado negativo ou de não associação tem importância. Os cursos de pós-graduação também discutem o porquê da significância de 5%. Raras pesquisas possuem outros valores, como 10% ou 1%. 1.2 INTERVALO DE CONFIANÇA Uma outra estratégia de aferir o acaso é o intervalo de confiança de alguma estimativa. Considera-se estimativa uma medida estatística que resume ou descreve característi- cas dos dados coletados na amostra do estudo. (FLETCHER; FLETCHER; FLETCHER, 2014, p. 197) Elas são capazes de aferir magnitude real do efeito. São exemplos de estimativas: média, frequência relativa ou proporção, risco relativo, razão de chances. G LO SS Á R IO Medidas de associações Risco relativo é uma razão das incidências de um evento no grupo com a variável de interesse presente contra um grupo sem essa variável (ROUQUAYROL; GURGEL, 2018, p. 701). Razão de chances ou Odds ratio (OR) é a divisão das chances de um evento acon- tecer entre dois grupos, aqueles com a variável de interesse presente contra aqueles com a ausência da variável (FLETCHER; FLETCHER; FLETCHER, 2014, p. 94). Como as estimativas são medidas de ponto, não é possível garantir quãopróximo ela pode estar ao parâmetro, que é o valor observado na população toda ou na natureza. À vista disso, é comum que essas estimativas estejam sempre expressas com um inter- valo de confiança. Define-se como intervalo de confiança (IC) uma faixa de valores que se tem confiança que o valor real está. O valor da estimativa está sempre dentro do IC. O intervalo de confiança demonstra a certeza que se tem de que os dados da amostra são representativos da população. Costumeiramente, usa-se IC 95% ou que significa que há 95% de confiança ou probabilidade de que o parâmetro esteja dentro do inter- valo (VIEIRA, 2016, p. 116). R EF LI TA Em uma pesquisa de intenção de voto de uma eleição para prefeito, coletou uma amostra de 200 pessoas, 42% votariam no Candidato A. Será que o resultado final oficial da eleição será essa mesma proporção? Se o IC 95% for de 35,2% a 48,8% espera-se que o valor real esteja dentro da faixa. Caso isso não aconteça, pode ser que o erro tenha ocorrido por conta de vieses ou pelo acaso. Toda a interpretação dos resultados, então, parte de que a pesquisa foi bem conduzida e que tem baixo risco de vieses. Assim, espera-se que a amostra seja representativa e, de preferência, com seleção aleatória. Como o intervalo de confiança estima probabilidade é importante reforçar que todos os eventos tenham a mesma chance de ocorrer. 153 U11 Resultados: análise e apresentação Bioestatística e Epidemiologia Chama-se de margem de erro a distância entre a estimativa e o limite superior e inferior do intervalo. Para deixar a margem de erro menor, é necessário aumentar o número de observações e dados coletados. Ao retomar o caso da pesquisa eleitoral, que agora ava- lia 2.000 pessoas, o intervalo de confiança fica em 39,8% a 44,2%. Nesse exemplo, ao considerar que a média é 42%, a margem de erro é de 2,2%. A grande vantagem dessa estratégia é que as estimativas de pontos avaliam magnitude e intensidade. Intervalos de confianças amplos não conseguem deixar claro a magnitude da associação. Para leigos e profissionais da saúde, a interpretação do IC é mais fácil do que o p-valor. Quando se quer usar o intervalo de confiança para comparar se os valores são diferentes, é preciso que nenhum número dos dois intervalos se sobreponha. EX EM PL O IM PO R TA N TE O candidato A ficou 42% de proporção com IC95% de 35,2 a 48,8%, enquanto o candi- dato B ficou com 29,5% de intenção de voto com IC95% de 23,2 a 35,8%. Para um lei- go, 29,5% é diferente dos 42% o que deixaria o candidato A eleito. Mas ao interpretar o intervalo de confiança, é preciso garantir que as faixas não se sobreponham. Nesse caso, pela análise do intervalo de confiança é possível que o Candidato B tenha ven- cido. O parâmetro do candidato B pode ser bem no limite superior 35,7%, enquanto o candidato A possa estar com 35,3% perto do seu limite inferior. As fórmulas para calcular o intervalo de confiança variam de acordo com a estimativa de ponto. Em todas as fórmulas vai existir um valor que será associado à porcentagem de confiança que se deseja. Ao interpretar o intervalo de confiança do risco relativo e da razão de chances é pre- ciso considerar se a característica da interação mudou. A interpretação dessas duas medidas acontece de forma similar. Se o valor for maior do que 1,0, indica aumento do risco do desfecho. Se for igual a 1,0, não existe associação entre as variáveis e se for menor do que 1,0, indica que a exposição reduz o risco. Se um teste que avaliou se a presença do antecedente pessoal de insuficiência cardíaca influenciava na incidência de óbitos de pacientes internados na UTI, cujo o RR era de 2,22 (IC95% 0,99 – 4,98). Ao analisar somente o valor do risco relativo encontrado com os dados da amostra seria possível dizer que esse antecedente aumenta em 2,2 vezes o risco de ir a óbito, já que o RR > 1,0. Mas, ao olhar no intervalo de confiança percebe-se que existe a pos- sibilidade de que o valor real do RR seja 0,99, o que seria interpretar que esse antecedente pessoal reduz o risco de ir a óbito, pois o RR < 1,0. Nesses casos em que a abrangência do in- tervalo de confiança engloba números menores e maiores do que 1,0, não se pode afirmar se a associação é verdadeira e nem qual é o sentido da interação (reduzir ou aumentar o risco). 2. USO DE SOFTWARES Ao realizar a análise dos dados, utilizam-se softwares de tabulação e de análise estatís- tica que facilitam o processo. É importante sempre mencionar na sessão métodos do trabalho qual software foi utilizado e sua versão. U11 154 Resultados: análise e apresentação Bioestatística e Epidemiologia Para a organização dos dados, normalmente, utiliza-se o Excel ou o Google Planilhas – eles são muito similares. Neles é possível organizar o banco dos dados coletados, realizar estatística descritiva, estruturar as tabelas de resultados e gerar gráficos. Tanto o Excel como o Google Planilhas trabalham com células que são as casas da ta- bela. Elas são nomeadas pela coluna e linha em que estão. Exemplo: a célula que está na segunda coluna (coluna B) e na terceira linha (linha 3) tem o nome de B3. A Tabela 2 representa uma tabulação de um conjunto de dados de seis pessoas. O valor referente à célula B3 seria 2,3, que é a nota que a aluna M.C.M tirou na prova. Tabela 02. Exemplo de tabulação dos dados A B 1 Iniciais do nome Nota 2 V.L.M 8,1 3 M.C.M 2,3 4 G.F.M.M. 1,6 5 D.C.C.G 7,4 6 J.M.R. 9,0 7 S.E. 10 Fo nt e: e la bo ra da p el a au to ra . Fonte: elaborada pela autora. Nesses softwares, é possível inserir comandos que realizam operações matemáticas ou funções que fazem o cálculo mais facilmente. Para que o software realize qualquer função ou conta é preciso iniciar digitando o sinal “=”, assim o programa sabe que ou uma operação matemática ou uma função deve ser realizada. A Tabela 3 mostra alguns comandos e funções que eles podem realizar. Para saber mais informações, busque na aba fórmulas. Tabela 03. Exemplo de comandos de análise de dados do conjunto de observações descritos na Tabela anterior AÇÃO COMANDO RESULTADO DA OPERAÇÃO Soma de dois valores =A1+A2 10,4 Média do conjunto de dados =MÉDIA(A2:A7) 6,4 Contagem de quantas notas foram meno- res que 6,0 no conjunto de dados =CONT.SE(A2:A7;”<6”) 2 Existem vários pacotes e softwares estatísticos tanto nacionais como internacionais. Alguns são pagos e outros são de livre acesso. Nesta unidade será apresentado o sof- tware R. Outros programas utilizados com frequência na área da saúde são o SPSS e o BioStat. 155 U11 Resultados: análise e apresentação Bioestatística e Epidemiologia SA IB A M A IS O software R é livre e aberto para download. Ele foi inicialmente desenvolvido na University of Auckland, e atualmente é mantido por um esforço colaborativo com uma equipe central. Para mais informações, visite: https://www.r-project.org/. Acesso em: 23 jul. 2021. SPSS é da IBM. Ele é pago e com uma interface agradável de utilizar. Para conhecer, clique em: https://www.ibm.com/br-pt/products/spss-statistics. Acesso em: 23 jul. 2021. BioStat é uma opção de programa nacional de livre acesso que é mantido pelo Ins- tituto de Desenvolvimento Sustentável Mamirauá. Ele é simples de utilizar e é em português. Visite a plataforma: https://www.mamiraua.org.br/downloads/programas/. Acesso em: 23 jul. 2021. O software R é muito utilizado internacionalmente em diversos campos de estudo. Ele tem uma versão que é o RStudio que apresenta uma interface mais agradável. Uma dificuldade é que os comandos, algumas funções e alguns resultados são em inglês. Uma vantagem é que existem pacotes que podem ser baixados com comandos específi- cos para alguns tipos de pesquisa e análises estatísticas. Por exemplo, os dados de dis- tribuição das residências divididas nos setores censitários é um desses pacotes. Então, se alguém deseja fazer um levantamento populacional com uma amostra aleatória com sorteio de endereços por setor seráprático com o uso desse software e pacote estatístico. EX EM PL O Uma pesquisa avalia características de um grupo de 69 alunos que realizaram uma prova. Uma das análises a ser testada é se o tempo que cada aluno ficou na prova influencia na nota que ele tirou. Vamos considerar um nível de significância de 95%, a variável tempo de prova é qualitativa com duas categorias: quem demorou menos ou mais do que uma hora e que a variável nota é quantitativa com tem distribuição normal. Na Figura 4, há o teste estatístico para responder essa hipótese em que a análise foi feita no software R.. Em azul há o comando para se realizar um teste t comparando as notas de dois grupos, os que fizeram a prova em um tempo menor que uma hora e os que fizeram em um tempo maior. O resultado é o p-valor (na Figura, p-value) de 0,04233, o que significa que a proporção de se ter errado um erro tipo I é baixa, então, deve-se aceitar H1, que é dizer que existe uma diferença entre as médias de notas dos dois grupos. Nas últimas linhas da Figura está a média (na Figura, mean que significa média em inglês) de notas nos dois grupos. O grupo x é o primeiro mencionado (quem demorou menos tempo), e tem média de 8,18. O grupo y que é o que demorou mais tempo, tem média de 9,0. U11 156 Resultados: análise e apresentação Bioestatística e Epidemiologia Figura 04. Exemplo de comando e resultado de um teste estatístico no software RStudio Fonte: captura de tela realizada pela autora do software RStudio. 3. APRESENTAÇÃO DOS RESULTADOS Estatística descritiva é resumir os dados coletados de cada variável. Para as variáveis qualitativas são descritas com frequência absoluta e relativa, enquanto as variáveis quantitativas são descritas com medidas de tendência central (média, moda e mediana) e medidas de dispersão (amplitude, percentis, desvio padrão). Tanto a estatística des- critiva como a analítica, que foram abordadas nesta unidade, podem ser apresentadas em forma de texto, tabelas ou em gráficos. A decisão de qual meio apresentar depende do destaque que se deseja ter no resulta- do, a importância de detalhar mais as informações e a aparência visual. 3.1 GRÁFICOS Os gráficos são representações visuais que transmitem a informação de forma visual. Muitas pessoas acham essa é a forma mais agradável de fazer uma comparação e análise dos dados, uma vez que ajudam a visualizar a distribuição das observações. Todos os gráficos devem apresentar legenda, título e escala. Deve ser possível com- preender as informações descritas nele sem precisar realizar a leitura do texto auxiliar (VIEIRA, 2016, p. 18). Os gráficos de barras são utilizados para resumir a frequência para categoria da va- riável. Podem ser de frequência absoluta (contagem de pessoas que deram aquela resposta) ou frequência relativa (proporção de pessoas que deram a resposta). Eles podem ter barras horizontais ou verticais, que serão definidas pelas características dos dados e da variável. É possível ser com apenas uma variável ou pode mostrar a distri- buição entre duas variáveis qualitativas (Figura 6). 157 U11 Resultados: análise e apresentação Bioestatística e Epidemiologia Figura 05. Exemplo de gráfico de barras horizontais com duas variáveis Fonte: elaborada pela autora. Fonte: elaborada pela autora. O gráfico de setores, conhecido também como de “pizza”, é bem tradicional e de fácil compreensão. Normalmente, é utilizado em apresentações e pôster. Não é recomenda- do para artigos científicos, quando há restrição do número de imagens e as informações podem ser descritas em forma de texto sem prejudicar a compreensão do leitor. Figura 06. Exemplo de gráfico de pizza com a frequência absoluta para descrever uma variável U11 158 Resultados: análise e apresentação Bioestatística e Epidemiologia Fonte: elaborada pela autora. Os gráficos de dispersão são muito utilizados quando se faz um teste estatístico de correlação. Ele acontece quando se cruza duas variáveis numéricas, de preferência contínuas, que são representadas em cada eixo. Cada ponto do gráfico representa um indivíduo (Figura 7). Figura 07. Exemplo de gráfico de dispersão dos dados (azul) com regressão linear simples Os gráficos podem ter uma linha estimada a partir dos dados encontrados. Essa linha é o resultado do teste estatístico de regressão, a qual pode ser linear ou logística. Os pontos dessa reta ou curva é uma previsão. No exemplo da Figura 8 seria possível, a partir da regressão, prever qual seria a nota do aluno somente pelo tempo de realização da prova. Quando a reta da regressão linear está “subindo”, pode se concluir que existe uma correlação positiva entre as variáveis, quando uma aumenta a outra aumenta também. Quando a reta está “descendo” a correlação é negativa, ou seja, as variáveis são inver- samente proporcionais – quando uma aumenta a outra diminui. Quanto mais inclinada a reta, maior a intensidade da correlação. Quando a reta da regressão está próxima do sentido horizontal, a correlação é nula (VIEIRA, 2016, p. 57). 3.2 TABELAS Uma tabela permite ao leitor uma melhor aplicabilidade. A estatística analítica, prefe- rencialmente, é apresentada em forma de tabela para fornecer mais detalhamento da distribuição, deixando transparente os valores obtidos. 159 U11 Resultados: análise e apresentação Bioestatística e Epidemiologia É comum resultados de pesquisa serem descritos em grandes tabelas que contêm in- formações de diversas variáveis. Isso acontece, principalmente, quando é um estudo que investiga diversos fatores que possam estar associados há um mesmo desfecho, por exemplo, um estudo de coorte que avaliou as causas de internação e a complicação de sepse. As análises bivariadas foram feitas utilizando o teste qui-quadrado. A tabela abaixo mostra os resultados com o p-valor das análises bivariadas e risco rela- tivo com intervalo de confiança de 95%. Tabela 04. Exemplo de tabela de resultado CAUSA DE INTERNAÇÃO N (N=100) SEPSE N (%) RISCO RELATIVO (IC 95%) P-VALOR Pneumonia Presente 23 21 (91,3) 3,35 (2,28 a 4,92) <0,0001 Ausente 77 21 (27,3) Ref Apendicectomia Presente 14 7 (50,0) 1,23 (0,69 a 2,20) 0,7173 Ausente 86 35 (40,7) Ref Fonte: elaborada pela autora. Fonte: elaborada pela autora. Nestes casos, é preciso avaliar o intervalo de confiança da estimativa e o p-valor. Pode ocorrer que ao interpretar o risco relativo e o IC conclua-se uma associação, mas o resultado do p-valor ser maior do que 0,05. 4. OBJETO DE APRENDIZAGEM. Tabela 05. Tabela da eficácia vacinal de uma vacina fictícia contra Dengue VACINADOS N = 724 PLACEBO N = 706 EFICÁCIA VACINAL (IC95) P-VALOR Grupo de análise Casos Incidência (IC95) Caso Incidência (IC95) Casos de dengue clássica 85 11,74 (9,38 – 14,52) 167 23,64 (20,19 – 27,51) 50,39% (35,26 – 61,98) 0,0049 Casos de dengue hemorrá- gica 0 0 (0 – 0,51) 7 0,99 (0,40 – 2,04) 100% (95,42 – 100) 0,967 Considere que uma vacina contra dengue acabou de ser aprovada. Alguns dos resultados da pesquisa que aprovou a vacina estão descritos na Figura 8. A avaliação foi referente a redução de casos de dengue hemorrágica e dos casos de dengue clássica U11 160 Resultados: análise e apresentação Bioestatística e Epidemiologia Reflita sobre os resultados de eficácia vacinal com o intervalo de confiança de 95% (IC95) e sobre os p-valores. Pelos dados da tabela é possível afirmar que a vacina é eficaz contra os casos de dengue? É possível confiar que a eficácia vacinal para os casos de dengue hemor- rágica, na realidade, 100%? 161 U11 Resultados: análise e apresentação Bioestatística e Epidemiologia REFERÊNCIAS BIBLIOGRÁFICAS FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. S. Epidemiologia clínica: elementos essenciais. 5.ed. Porto Alegre: ArtMed, 2014. ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia & saúde. 8. ed. Rio de Janeiro: Medbook, 2018. 752 p. VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier,2016. 162 UNIDADE 12 CAUSALIDADE E SAÚDE BASEADA EM EVIDÊNCIA INTRODUÇÃO Já se perguntou se vacina faz bem ou faz mal? Será que faz bem comer manteiga todos os dias? Às vezes, você encontrará artigos e evidências com resultados conflituantes. Como decidir em qual acreditar? Nesta última unidade, abordaremos quais pesquisas e critérios devem ser utilizados para confiar nas evidências científicas disponíveis. 1. CAUSALIDADE Definir uma relação de causa e efeito é mais complexo do que apenas mostrar uma associação estatística, sendo que a matemática é só uma parte do processo. É preciso avaliar o conjunto e garantir que todos os procedimentos e etapas sejam conduzidos de forma correta. Uma pesquisa tem resultados que irão descrever e analisar os eventos investigados. Com os dados é possível estimar e predizer a probabilidade de um evento acontecer, mas é preciso lembrar que estamos tratando de uma probabilidade, e não de uma garantia. O acaso também influencia nas possibilidades que um quadro pode evoluir. Definir o que causa uma doença é complexo. Ao longo dos séculos, a definição do processo saúde-doença mudou muito e, atualmente, a teoria predominante é que a saúde tem determinantes e condicionantes. Ficar doente, portanto, é complexo e tem influência de múltiplos fatores. O impacto dos elementos de risco para uma doença é influenciado pela presença de outros fatores e, às vezes, é mais importante a soma desses fatores os quais o paciente apresenta. IM PO R TA N TE É indispensável reforçar que não é porque a pessoa é diabética que ela terá um infarto agudo do miocárdio; cada doença tem uma grande variedade de fatores que estão associados, algumas condições são mais específicas e com uma relação mais forte. Morar em uma casa sem abastecimento de água pela rede geral tem uma associação muito maior com doenças diarreicas, mas pode também contribuir para o surgimento de outras enfermidades. A estatística estabelece associações ao tentar controlar o acaso. É possível gerar uma estimativa do efeito ou proporção que se espera com os dados coletados. A partir desse valor, pode-se, pelo intervalo de confiança, supor qual será o valor do parâmetro que de fato acontece na população. (FLETCHER; FLETCHER; FLETCHER, 2014, p. 197). 163 U12 Causalidade e saúde baseada em evidência Bioestatística e Epidemiologia Outra ferramenta da estatística é calcular a probabilidade de o teste de hipótese ser um falso-positivo e, de fato, o que se observou na amostra não é representativo para a população. É um consenso um nível de significância de 5%, ou seja, um p-valor menor do que 0,05 é considerado que a associação é estatisticamente significante. As relações causais não são explicadas somente pela matemática. A maneira como os dados foram coletados tem um impacto muito grande. Será que houve algum viés que pode impac- tar na associação estatística encontrada? Viés é um erro sistemático que pode acontecer em diversos momentos e há diferentes estratégias que são capazes de ser implementadas no método da coleta de dados que reduzem a chance de ele acontecer (ROUQUAYROL, 2018, p. 705). Esses erros sistemáticos podem ocorrer na seleção da amostra quando os grupos que serão comparados não são similares porque houve alguma falha na amostragem. O viés de aferição acontece quando o equipamento ou a técnica utilizada para aferir se a variável foi errada ou não é confiável. Já o viés de confusão ocorre quando há uma associação estatística entre a variável explanatória e o desfecho, só que ela aconteceu por influência de uma terceira variável que realmente é o fator associado ao desfecho. C U R IO SI D A D E “Consumo de Chocolate, função cognitiva e prêmio Nobel” Esse artigo ficou famoso por ser uma publicação em uma das revistas mais conceituadas na área da saúde. Ele faz uma correlação entre o consumo de chocolate por habitante e o número de prêmios Nobel que os países têm. Estatisticamente, há uma correlação forte com um p-valor de < 0,0001. Na discussão, é abordado que existe uma plausibilidade biológica, uma vez que chocolate melhora a função cognitiva, o que pode levar a ganhar um Nobel. MESSERLI, Franz H. Chocolate Consumption, Cognitive Function, and Nobel Laure- ates. New England Journal of Medicine, v. 367, p. 1562-1564, out. 2012. Disponível em: https://www.nejm.org/doi/full/10.1056/nejmon1211064. Acesso em: 15 jun. 2021. Como vários fatores influenciam em uma associação com significância estatística entre duas variáveis, é difícil determinar com certeza que “A” causa “B”. Definir a causalida- de tem um enorme impacto em diversos setores da sociedade. Falar que agrotóxicos ou defensivos agrícolas causam câncer terá consequências nos setores agrícola e ali- mentícios e na economia. Em 1965, Austin Bradford Hill, um dos pesquisadores que descobriu a associação entre cigarro e câncer de pulmão, sistematizou quando se pode definir uma relação causal. Fletcher, Fletcher e Fletcher (2014, p. 214-216), a partir da leitura de Hill (1965), apontam que os oito critérios de Bradford Hill são: Figura 01. Critérios de Hill Força Temporalidade Reversibilidade Especialidade Plausabilidade biológica Consistência Relação dose-resposta Analogia Fonte: Fletcher, Fletcher e Fletcher (2014, p. 214-216). U12 164 Causalidade e saúde baseada em evidência Bioestatística e Epidemiologia EX EM PL O O critério da força avalia a intensidade da associação. Quanto maior o valor do risco relativo ou da razão de chances, maior a chance de existir uma relação causal. Mas isso não significa que associações com pouca força com certeza não têm causalidade. É importante reforçar que a medida do p-valor não avalia intensidade, então, um valor < 0,0001 não significa que as chances de causalidade são maiores. A consistência analisa se ocorre os mesmos resultados com observações diferentes. Se pesquisas com outras populações, em outros locais ou em outra época mostram resul- tados similares, muito provavelmente, a associação é verdadeira. É interessante que os estudos tenham delineamentos diferentes para que a fraqueza de um se complemente com a força do outro tipo de desenho. Nem sempre haverá uma concordância entre todos os estudos, por isso, é preciso avaliar a qualidade das pesquisas que serão comparadas. Ter uma discordância com um estudo de baixa qualidade não é tão impactante. O critério de especificidade investiga se o fator sempre causa o mesmo efeito. É um critério mais relevante para as doenças transmissíveis em que existe a presença do agente infeccioso que provoca uma única doença. A relação inversa também precisa ser avaliada – quando houve a doença, a causa também esteve presente? Mas, se considerarmos o cigarro, esse critério não é contemplado. Fumar pode causar diversas doenças e nem toda pessoa com câncer de pulmão fumou. A ausência dessa relação específica de causa e efeito não exclui a possibilidade de causalidade. A temporalidade examina a relação temporal. A causa sempre deve existir antes do efeito acontecer. Por isso que estudos longitudinais prospectivos são melhores para de- finir a causalidade. Garantir que, no início do acompanhamento, os sujeitos da pesquisa não tenham a doença, certifica a temporalidade. A relação dose-resposta investiga se a proporção da doença aumenta se a exposição também aumentar. Quem fuma altas quantidades de cigarros no dia tem uma taxa de mortalidade muito maior, ou seja, esse critério contribui muito para definir a causalidade O critério de plausabilidade biológica sonda se existe uma cadeia de eventos biológi- cos que justifica a exposição causar o efeito. A existência de um mecanismo fisiopato- lógico, que fundamente a relação causal, ajuda, mas sua ausência não exclui a possi- bilidade de causalidade. Pode ser que o caminho fisiológico ainda não foi descoberto, então, esse critério não é obrigatório para a definição da relação causal. Em 1854, John Snow – médico conhecido como opai da epidemiologia –, descobriu que a água fornecida por uma bomba específica de Londres causava morte por doen- ça diarreica, mesmo quando na época não se sabia da existência de bactérias e das vias de transmissão da cólera. A reversibilidade estuda se, ao remover a exposição, há uma redução dos efeitos. A presença desse critério aumenta as chances da relação causal. Depois de 15 anos que a pessoa para de fumar, ela tem o mesmo risco de ter um infarto agudo do miocárdio do que alguém que nunca fumou. O último critério é a analogia, na qual o argumento de causalidade é favorecido quando for possível fazer alguma associação com uma relação causal estabelecida. É mais fácil 165 U12 Causalidade e saúde baseada em evidência Bioestatística e Epidemiologia provar que uma medicação usada por uma gestante causa má-formação no feto, se a droga tiver características similares à talidomida (um exemplo clássico de um remédio que causa má-formação). Os critérios de Bradford Hill são importantes para provar que a relação é causal e não apenas uma associação estatística ao acaso. Não é preciso ter todos os critérios pre- sentes, mas quanto mais números deles forem contemplados, mais credibilidade terá o estudo. Nem mesmo o cigarro – que hoje em dia está bem claro que fumar mata – tem todos os critérios, visto que a especificidade não é contemplada. Com esse rigor de definição é difícil um artigo concluir uma relação causal, portanto, cabe ao leitor analisar se aquela associação tem muitas ou poucas chances de ter causalidade. Para isso, deve-se avaliar o rigor metodológico e a presença dos critérios, assim, com todas as informações você será capaz de julgar quais são as chances de a associação ser verdadeira. EX EM PL O SA IB A M A IS Um exemplo da diferença entre associação estatisticamente significante e causalida- de é a discussão se a vacina de Sarampo Caxumba e Rubéola (SCR) causa autis- mo. No final dos anos 1990, o movimento antivacina ganhou força com a publicação de um artigo científico da revista The Lancet. Esse artigo concluía que a vacina de Sarampo Caxumba e Rubéola (SCR) causava autismo e doenças gastrointestinais. Ele foi usado como a prova científica de que a vacina faz mal. A publicação em uma das principais revistas de área da saúde fez com que os profissionais de saúde e lei- gos questionassem a qualidade e a eficácia das vacinas, principalmente da SCR. Em 2010, a The Lancet fez uma retratação, mas as consequências da publicação ainda estão presentes. Várias questões metodológicas são questionadas sobre a pesquisa, mas isso não impe- diu a publicação e a interpretação de que uma associação forte era sinônimo de causa- lidade. Para nos ajudar a confiar nas conclusões de pesquisa, as revisões são um tipo de estudo que resumem as evidências sobre um determinado assunto. Vacina Sarampo Caxumba e Rubéola (SCR) ` O artigo original que associa a vacina SCR com autismo: WAKEFIELD, A. J.; et al. RETRACTED: Ileal-lymphoid-nodular hyperplasia, non-spe- cific colitis, and pervasive developmental disorder in children. The Lancet, v. 351, n. 9103, p. 637-641, 1998. Disponível em: https://doi.org/10.1016/S0140-6736(97)11096- 0. Acesso em: 15 jun. 2021. ` Para contrapor esse ideal de que a vacina faz mal, há uma revisão sistemática so- bre a eficácia e os danos da vacina SCR que avalia artigos de 1966 a 2019: PIETRANTOJ, C. D.; RIVETTI, A.; MARCHIONE, P.; DEBALINI, M. G.; DEMICHELI, V. Vaccines for measles, mumps, rubella, and varicella in children. Cochrane Database of Systematic Reviews, v. 4., n. CD004407. Disponível em: https://www.cochraneli- brary.com/cdsr/doi/10.1002/14651858.CD004407.pub4/full. Acesso em: 15 jun. 2021. U12 166 Causalidade e saúde baseada em evidência Bioestatística e Epidemiologia 2. REVISÃO SISTEMÁTICA As revisões sistemáticas são um tipo de estudo que resume outras pesquisas sobre um de- terminado tema (ROUQUAYROL, 2018, p. 157). Normalmente, elas ocorrem para avaliar a eficácia de um tratamento ou estabelecer que as evidências até o momento não são suficien- tes. Como os ensaios clínicos randomizados são o padrão-ouro para avaliar um tratamento, há revisões sistemáticas que restringem a amostra para somente esse tipo de estudo. Existe um rigor metodológico no processo de seleção dos artigos. A coleta de dados, que nesse caso são os artigos, é sistemática. Os artigos selecionados devem ser publicados em revistas científicas com parecer de outros pesquisadores para garantir a qualidade. Essas revistas são indexadas em bancos de artigos, bibliotecas e repositórios, como a BIREME e a MEDLINE/PubMed. Os pesquisadores selecionam descritores que definem o escopo da pesquisa com a finalidade de restringir a busca para o que somente eles estão procurando. Depois dessa primeira seleção, os critérios de inclusão são aplicados. IM PO R TA N TE É fundamental não excluir muitos artigos, porque isso pode deixar a amostra não representativa. Então, mesmo que o artigo seja pago, ou em outra língua, deve-se tentar incluir ela na pesquisa. Com frequência, dois avaliadores fazem a seleção dos artigos e, depois, os resultados são cruzados. Caso haja um artigo que só um avaliador selecionou, um terceiro pesqui- sador decide se ele deve ser incluído na amostra. Todo o processo de seleção deve ser descrito no artigo da mesma maneira que o método de seleção dos sujeitos da pesquisa é descrito. Normalmente, um fluxograma resume o processo. Figura 02. Exemplo de fluxograma do processo de seleção dos artigos 950 artigos encontrados nas bases de dados 625 restaram após a remo- ção dos artigos duplicados 130 artigos cujos resumos foram avaliados 495 artigos excluídos por: - Não serem em português ou inglês - Não estarem completos - Outros critérios de exclusão 85 artigos excluídos por: - Não serem ensaio clínico randomizado - Não terem grupo controle - Outros critérios ! ! Amostra final: 45 artigos Fonte: elaborada pela autora. 167 U12 Causalidade e saúde baseada em evidência Bioestatística e Epidemiologia O resultado da revisão sistemática são as características dos artigos. A metanálise é uma análise estatística que combina os resultados analíticos de cada estudo para chegar a uma única estimativa de ponto (ROUQUAYROL, 2018, p. 157). É uma análise estatística interessante porque, ao juntar várias pesquisas, o número amostral aumenta o que melhora o poder do teste. EX EM PL O A título de exemplo, combina-se o risco relativo de cada artigo para se chegar em um risco relativo total. Cada artigo tem um peso diferente na composição da estimativa final a depender da característica da amostra e dos resultados individuais. A metanálise pode ser apresentada pelo gráfico de Forest (Forest plot, em inglês). A Figura 3 é um exemplo do gráfico com resultados fictícios de oito estudos. Sempre ha- verá uma tabela com as informações e o gráfico com a representação da estimativa de ponto e o intervalo de confiança. A última linha é a estimativa de ponto combinada que no gráfico é representado pela imagem de losango, que também descreve o IC. Figura 03. Exemplo de gráfico Forest Estudos Combinado OR (IC 95%) 0,53 (0,39-0,73) N 147 Estudo A Estudo B Estudo C Estudo D Estudo E Estudo F Estudo G 0,58 (0,37-0,89) 0,16 (0,02-1,52) 0,25(0,07-0,83) 0,70 (0,33-1,47) 0,35 (0,08-1,45) 0,14 (0,02-1,21) 1,02 (0,37-2,83) 30 19 6 11 30 30 31 0.000 0.125 0.177 0.250 0.354 0.500 0.707 1.00 2.50 Legenda: N: número de observações da amostra. OR: odds ratio. IC: intervalo de confiança. Fonte: elaborada pela autora. Para interpretar o gráfico de Forest, é preciso relembrar que as medidas de associações odds ratio (razão de chances) e risco relativo se interpretam de forma similar. Se o valor for maior do que 1,0, indica aumento do risco do desfecho, mas se for igual a 1,0, não existe associação entre as variáveis. Quando for menor do que 1,0, indica que a exposi- ção reduz o risco.Outro ponto importante é que se o valor 1,0 estiver dentro do intervalo de confiança, não é possível garantir a presença de uma associação entre as variáveis. U12 168 Causalidade e saúde baseada em evidência Bioestatística e Epidemiologia No gráfico de Forest, há uma linha vertical no 1,0 para visualmente ficar claro quais estudos há dentro do IC com o valor 1,0. Na Figura 3, os estudos B, D, E, F e G estão nessa condição em que não se pode garantir associação, mas seus resultados são usados para gerar o valor combinado de associação. Vamos considerar que o gráfico de Forest (Fig. 3) resume estudos que comparam a as- sociação do uso de um medicamento com morte por determinada doença. Mesmo que só os estudos A e C concluam associação, o valor combinado de OR e o seu intervalo de confiança só tem valores menores do que 1,0. Isso significa que essa metanálise tem evidência estatística de que o uso da medicação reduz o risco de morte. Na revisão sistemática, o viés de publicação está presente, porque pesquisas que só tiveram resultados sem significância estatística têm mais dificuldade de publicação (FLETCHER; FLETCHER; FLETCHER, 2014, p. 227). Rejeitar artigos que demonstram a não associação entre as variáveis faz com que a revisão sistemática seja tendenciosa para ter resultados que corroborem a associação. É preciso ficar atento se os critérios de exclusão não estão enviesando a amostra quando se restringe a língua que o artigo é escrito ou para apenas textos de acesso livre. SA IB A M A IS Aprofunde seus conhecimentos acerca de revisão sistemática com a leitura do artigo abaixo: CAMPOS, A. C. V. et al. Prevalence of functional incapacity by gender in elderly people in Brazil: a systematic review with meta-analysis. Revista Brasileira de Geriatria e Gerontologia [online], v. 19, n. 3, p. 545-559, mai.-jun. 2016. Disponível em: https:// doi.org/10.1590/1809-98232016019.150086. Acesso em: 15 jun. 2021. A qualidade dos estudos também precisa ser avaliada. Se a revisão sistemática resume artigos de baixa qualidade, seu resultado não será confiável. Existem diversas escalas para avaliar a qualidade do artigo. É possível colocar como critério de exclusão artigos que pontuaram pouco nas escalas e, assim, fazer sua revisão e metanálise somente com pesquisas fortes. A escala PEDro é específica para ensaios clínicos da fisioterapia com avaliação de 11 critérios. Há a escala Downs e Black que avalia 27 critérios e pode ser utilizada para várias áreas. A Biblioteca Cochrane também tem uma escala de avaliação. De modo geral, todas elas avaliam a presença dos vieses, como o de seleção, de relato e de afe- rição, os cegamentos dos participantes da pesquisa e a análise estatística. Assim como existem escalas que avaliam os estudos primários, há as que avaliam a qualidade da revisão sistemática. As duas escalas mais utilizadas são a AMSTAR, com 14 itens, e a PRISMA, com 27 itens. É importante conhecer quais são os critérios utili- zados para que, ao escrever o artigo, o pesquisador deixe claro o que foi feito a fim de que o avaliador possa pontuar. As revisões sistemáticas devem ser lidas rotineiramente pelos profissionais da saúde, visto que elas facilitam a busca e o acesso às informações. Mas não é pelo fato de 169 U12 Causalidade e saúde baseada em evidência Bioestatística e Epidemiologia ser uma revisão que é possível confiar nos resultados – sempre deve-se questionar a qualidade do procedimento metodológico e da análise estatística. Atualmente existem bancos de dados e bibliotecas virtuais que se especializaram em revisões sistemáticas, algumas gratuitas e outras com acesso pago. SA IB A M A IS Bancos de dados e bibliotecas virtuais gratuitas: ` Biblioteca Cochrane é especializada em tratamento e até coordena alguns ensaios clínicos. Disponível em: https://www.cochranelibrary.com/ (Acesso em: 15 jun. 2021). ` Epistemonikos é uma base de dados de evidências com grande número de re- visões sistemáticas. Disponível em: https://www.epistemonikos.org/en/ (Acesso em:15 jun. 2021). ` Health Evidence é um repositório atualizado constantemente com pesquisas acer- ca de gestão, finanças e prestações de serviços em sistemas de saúde. Disponível em: https://healthevidence.org/ (Acesso em: 15 jun. 2021). 3. SAÚDE BASEADA EM EVIDÊNCIA Saúde baseada em evidência (SBE) é uma abordagem de atuação dos profissionais de saúde que é pautada nas melhores evidências científicas (ROUQUAYROL, 2018, p. 167). Para avaliar a qualidade das evidências são utilizadas ferramentas e conceitos de metodologia em pesquisa, da epidemiologia e da estatística. Esse é um conceito am- pliado do termo medicina baseada em evidência (MBE), mas, muitas vezes, as pessoas usam a terminologia mais antiga se referindo à atuação de outros profissionais. É difícil para um profissional de saúde se manter atualizado depois de formado. Mesmo durante os estudos é possível que o professor não esteja ciente das mais recentes atualizações. Quando existiam poucas revistas, era comum o profissional fazer uma as- sinatura e receber o exemplar em casa para se atualizar. Agora que há muitas revistas e um acesso facilitado é difícil conseguir separar o que ler. A revisão sistemática facilita o acesso às informações, mas, mesmo assim, há profissionais que atuam conforme o que ele percebe que funciona e não no que as evidências falam que é o melhor tratamento. Os delineamentos de estudo têm uma hierarquização da confiança na conclusão a par- tir da qualidade metodológica e análise dos dados. A ordem de prioridade é: ` Revisão sistemática: com metanálise por resumir os estudos primários e agrupar carac- terísticas diferentes. ` Ensaio clínico: estudo experimental e longitudinal com a comparação de dois grupos: a intervenção e o controle. As variáveis são muito controladas e, portanto, reduzem a chan- ce de viés de confusão ou outra interferência. De preferência, o ensaio clínico deve ser randomizado e duplo cego para melhorar a qualidade dos dados. ` Coorte: estudo observacional longitudinal, normalmente, prospectivo. Assim como nos ensaios clínicos, consegue medir a incidência e o risco de uma exposição “causar” uma doença, além disso, garante a temporalidade da associação. U12 170 Causalidade e saúde baseada em evidência Bioestatística e Epidemiologia IM PO R TA N TE ` Caso-controle: estudo observacional longitudinal e retrospectivo. Consegue medir a as- sociação entre exposição e desfecho, mas não garante a temporalidade. É mais rápido e prático do que o estudo coorte. ` Estudo transversal: estudo descritivo em um único período de tempo. As associações são frágeis já que não garantem temporalidade e fatores de confundimento. ` Série de casos e relato de casos: descrevem a evolução clínica de um grupo pequeno de pessoas que apresentavam um quadro similar. A amostra é enviesada. É útil para des- crição de casos incomuns ou de uma possível nova doença. ` Opiniões de especialistas e experiência prática: não existe método de pesquisa e análise estatística. É o pensamento de um especialista sobre o assunto e sobre o que ele vive no seu cotidiano de atendimento. Algumas revistas científicas têm uma sessão para publicação de opiniões de especialistas. Os estudos ecológicos não entram na lista porque as associações concluídas neles não podem ser inferidas para indivíduos. Recomendações clínicas é uma maneira fácil de resumir as evidências e comunicar os profissionais de saúde. O Sistema GRADE (Grading of Recommendations, Assessment, Development and Evaluation) gradua as informações, o que facilita para o profissional a interpretação se uma prática é recomendada e a qualidade das evidências coletadas (ALMEIDA FILHO; BARRETO, 2011, p. 358). Ele avalia intervenções de saúde. As recomendações são classificadas pela força em (1) forte ou (2) fraca. As evidên- cias são divididas em quatro níveis de qualidade: (a) alta, (b) moderada, (c) baixa, (d) muitobaixa. Dessa forma, uma intervenção classificada pela GRADE como 2c é uma recomendação fraca com evidências de baixa qualidade. Há também uma avaliação da clareza da relação risco/benefício. CONCLUSÃO Como profissionais de saúde, é nosso papel questionar se o que está sendo divulgado e realizado é de fato correto, ou seja, é nossa função procurar as respostas baseadas em evidências. Mas não se deve acreditar em qualquer evidência – precisa ser cientí- fica, com métodos definidos e análises estatísticas, além disso, a pesquisa precisa ser transparente e sem conflitos de interesse. É preciso julgar qualquer pesquisa, mesmo que ela seja feita por pessoas famosas ou publicadas em revistas importantes. Será que o procedimento metodológico foi correto? Teve algum erro? A amostra é representativa? Posso confiar nos resultados? Com tais respostas, avaliamos a pesquisa e decidimos nossas condutas. Por isso, é indispensá- vel que estejamos sempre atualizados. 171 U12 Causalidade e saúde baseada em evidência Bioestatística e Epidemiologia 4. OBJETO DE APRENDIZAGEM Faça a leitura dos apêndices A, B, C, D e F (páginas 95 a 163) que descrevem o método da revisão sistemática e como a avaliação da evidência foi feita para chegar à conclusão do protocolo brasileiro de detecção precoce de câncer de mama. O objetivo é conhecer um processo de recomendação clínica, desde as etapas da busca de artigos para a revisão sistemática até a avaliação das evidências. INSTITUTO NACIONAL DE CÂNCER JOSÉ ALENCAR GOMES DA SILVA – INCA. Diretrizes para a detecção precoce do câncer de mama no Brasil. Rio de Janeiro: INCA, 2015. Dispo- nível em https://www.inca.gov.br/sites/ufu.sti.inca.local/files//media/document//diretrizes_de- teccao_precoce_cancer_mama_brasil.pdf. Acesso em: 15 jun. 2021. U12 172 Causalidade e saúde baseada em evidência Bioestatística e Epidemiologia REFERÊNCIAS BIBLIOGRÁFICAS ALMEIDA FILHO, N. de; BARRETO, M. L. Epidemiologia & Saúde: Fundamentos, Métodos e Aplicações. Rio de Janeiro: Guanabara Koogan, 2011. FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. S. Epidemiologia clínica: elementos essenciais. 5. ed. Porto Alegre: ArtMed, 2014. HILL, A. B. The environment and disease: association or causation? Proceedings of the Royal Society of Medicine, v. 58, n. 5, p. 295-300, maio, 1965. Disponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/ PMC1898525/. Acesso em: 15 jun. 2021. ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia & saúde. 8. ed. Rio de Janeiro: Medbook, 2018. 752 p. VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016. Introdução à Bioestatística e Epidemiologia 2. Definição de epidemiologia 3. Método de pesquisa 4. Objeto de Aprendizagem Coleta, organização e descrição dos dados 2. Resultados 3. Objeto de Aprendizagem Estatística descritiva 2. Probabilidade 3. Distribuição normal 4. Anormalidades 5. Objeto de aprendizagem Epidemiologia descritiva 2. Série ou relato de casos 3. Estudos ecológicos 4. Distribuição de eventos por pessoas, tempo e lugar 5. Objeto de Aprendizagem Indicadores de Saúde 2. Incidência e prevalência 3. Indicadores de natalidade, fecundidade e morbidade 4. Objeto de Aprendizagem Transição demográfica e epidemiológica 2 Transição demográfica e epidemiológica 3. Objeto de Aprendizagem Estudos observacionais analíticos 2. Estudo de prognóstico 3. Estudo caso-controle 4. Objeto de Aprendizagem Medidas de associações 1. Risco relativo e risco atribuível 2. Razão de chances (odds ratio) 3. Análise de sobrevida 4. Objeto de Aprendizagem Estudos experimentais 2. Objeto de aprendizagem Estudo diagnóstico 2. Medidas 3. Teste diagnósticos múltiplos 4. Objeto de Aprendizagem Resultados: análise e apresentação 2. Uso de softwares 3. Apresentação dos resultados 4. Objeto de Aprendizagem. Causalidade e saúde baseada em evidência 2. Revisão sistemática 3. Saúde baseada em evidência 4. Objeto de Aprendizagem _GoBack _heading=h.gjdgxs MTBlankEqn _heading=h.30j0zll _GoBack _GoBack _Hlk65805682 _Hlk65805762 _Hlk65808120 _Hlk66233823 _GoBack _Hlk66227510 _Hlk65802407 _Hlk65802407 _Hlk69462932 _Hlk69483313 _GoBack _Hlk67732154 MTBlankEqn