Baixe o app para aproveitar ainda mais
Prévia do material em texto
BIOESTATÍSTICA E EPIDEMIOLOGIA FOTO CAPA RENATA CRISTOFANI MARTINS BIOESTATÍSTICA E EPIDEMIOLOGIA Renata Cristofani Martins 2021 PRESIDENTE Frei Thiago Alexandre Hayakawa, OFM DIRETOR GERAL Jorge Apóstolos Siarcos REITOR Frei Gilberto Gonçalves Garcia, OFM VICE-REITOR Frei Thiago Alexandre Hayakawa, OFM PRÓ-REITOR DE ADMINISTRAÇÃO E PLANEJAMENTO Adriel de Moura Cabral PRÓ-REITOR DE ENSINO, PESQUISA E EXTENSÃO Dilnei Giseli Lorenzi COORDENADOR DO NÚCLEO DE EDUCAÇÃO A DISTÂNCIA - NEAD Renato Adriano Pezenti GESTOR DO CENTRO DE SOLUÇÕES EDUCACIONAIS - CSE Fernando Rodrigo Andrian CURADORIA TÉCNICA Michele Lacerda Pereira Ferrer DESIGNER INSTRUCIONAL Paloma Larissa Souza Guimarães de Lima REVISÃO ORTOGRÁFICA Daniela Mandú PROJETO GRÁFICO Centro de Soluções Educacionais - CSE DIAGRAMADORES Daniel Luis Landucci Lucas Ichimaru Testa CAPA Daniel Luis Landucci © 2021 Universidade São Francisco Avenida São Francisco de Assis, 218 CEP 12916-900 – Bragança Paulista/SP CASA NOSSA SENHORA DA PAZ – AÇÃO SOCIAL FRANCISCANA, PROVÍNCIA FRANCISCANA DA IMACULADA CONCEIÇÃO DO BRASIL – ORDEM DOS FRADES MENORES RENATA CRISTOFANI MARTINS Renata Cristófani Martins possui Bacharel em Enfermagem pela Escola de Enferma- gem da Universidade de São Paulo (2005), Licenciatura Plena em Enfermagem pela Faculdade de Educação da Universidade de São Paulo (2010), mestrado e doutorado pelo Programa de Saúde Pública da Faculdade de Saúde Pública Universidade de São Paulo (2012 e 2017). Sua linha de pesquisa é epidemiologia, estatística vital e morta- lidade. Foi integrante da pesquisa “Uma nova ferramenta para a codificação e seleção automáticas da causa de morte: adequação do Software Iris para uso no Brasil” com financiamento da FAPESP. Trabalhou dois anos como enfermeira de uma Equipe de Saúde da Família e cinco anos como professora de curso técnico de enfermagem. Atu- almente é professora universitária na Universidade São Francisco nos diversos cursos da área da saúde ministrando os componentes curriculares Bioestatística aplicada à saúde, Epidemiologia, Saúde pública e Prática médica e sociedade IV. Em 2020, oi a pesquisadora responsável pelo inquérito populacional de prevalência de anticorpos para Sars-Cov-2 em Bragança Paulista (SP). A AUTORA SUMÁRIO UNIDADE 01: INTRODUÇÃO À BIOESTATÍSTICA E EPIDEMIOLOGIA ............8 1. Definição de bioestatística ..................................................................................8 2. Definição de epidemiologia .................................................................................9 3. Método de pesquisa ...........................................................................................11 4. Objeto de Aprendizagem .....................................................................................16 UNIDADE 02: COLETA, ORGANIZAÇÃO E DESCRIÇÃO DOS DADOS ............18 1. Coleta de dados ..................................................................................................18 2. Resultados ..........................................................................................................21 3. Objeto de Aprendizagem .....................................................................................28 UNIDADE 03: ESTATÍSTICA DESCRITIVA ............................................................32 1. Medidas de dispersão .........................................................................................32 2. Probabilidade ......................................................................................................38 3. Distribuição normal ..............................................................................................40 4. Anormalidades .....................................................................................................42 5. Objeto de aprendizagem .....................................................................................43 UNIDADE 04: EPIDEMIOLOGIA DESCRITIVA ......................................................48 1. Estudo transversal, de prevalência e seccional ..................................................48 2. Série ou relato de casos ......................................................................................50 3. Estudos ecológicos .............................................................................................50 4. Distribuição de eventos por pessoas, tempo e lugar ................................................. 52 5. Objeto de Aprendizagem .....................................................................................55 UNIDADE 05: INDICADORES DE SAÚDE ............................................................58 1. Conceito, histórico e características de um bom indicador ................................58 2. Incidência e prevalência ......................................................................................59 3. Indicadores de natalidade, fecundidade e morbidade .........................................64 4. Objeto de Aprendizagem .....................................................................................69 UNIDADE 06: TRANSIÇÃO DEMOGRÁFICA E EPIDEMIOLÓGICA ...................74 1. Indicadores de mortalidade ................................................................................74 2 Transição demográfica e epidemiológica .............................................................84 3. Objeto de Aprendizagem .....................................................................................88 UNIDADE 07: ESTUDOS OBSERVACIONAIS ANALÍTICOS ...............................90 1. Estudo Coorte .....................................................................................................90 2. Estudo de prognóstico .........................................................................................95 3. Estudo caso-controle ...........................................................................................97 4. Objeto de Aprendizagem .....................................................................................100 UNIDADE 08: MEDIDAS DE ASSOCIAÇÕES .......................................................102 1. Risco relativo e risco atribuível ............................................................................104 2. Razão de chances (odds ratio) ...........................................................................108 3. Análise de sobrevida ...........................................................................................111 4. Objeto de Aprendizagem .....................................................................................114 UNIDADE 09: ESTUDOS EXPERIMENTAIS .........................................................116 1. Ensaio clínico ......................................................................................................116 2. Objeto de aprendizagem .....................................................................................126 UNIDADE 10: ESTUDO DIAGNÓSTICO ................................................................128 1. Definição .............................................................................................................128 2. Medidas ...............................................................................................................131 3. Teste diagnósticos múltiplos ................................................................................141 4. Objeto de Aprendizagem .....................................................................................142 UNIDADE 11: RESULTADOS: ANÁLISE E APRESENTAÇÃO .............................144 1. Análise estatística ................................................................................................144 2. Uso de softwares .................................................................................................153 3. Apresentação dos resultados ..............................................................................1564. Objeto de Aprendizagem. ....................................................................................159 UNIDADE 12: CAUSALIDADE E SAÚDE BASEADA EM EVIDÊNCIA ................162 1. Causalidade ........................................................................................................162 2. Revisão sistemática ............................................................................................166 3. Saúde baseada em evidência .............................................................................169 4. Objeto de Aprendizagem .....................................................................................171 8 UNIDADE 1 INTRODUÇÃO À BIOESTATÍSTICA E EPIDEMIOLOGIA INTRODUÇÃO Muitas pessoas, mesmo sem saber, já usa- ram fundamentos e partes da estatística e da epidemiologia em seu dia a dia. Ao or- ganizar uma festa, por exemplo, usamos o conceito de estatística para preparar a lista de compras de comida. Se no churrasco teremos 20 convidados e, conforme as informações encontradas na internet, em média, o consumo de carne por pessoa é 100g, comprar 2kg de carne será suficiente para o evento? Saber o sexo e a idade dos convidados influencia na minha compra? Será que posso confiar na informação que eu encontrei na internet? Para responder essas perguntas, você utilizará conceitos de estatística e epidemiologia. “Estatística é a ciência que fornece os princípios e os métodos para coleta, organização, resumo, análise e interpretação de informações” (VIEIRA, 2016, p. 1). Im po rt an te ! 1. DEFINIÇÃO DE BIOESTATÍSTICA Contar, medir, comparar e resumir informações são ações que estão presentes no cotidiano de todas as pessoas, independentemente da profissão. No entanto, a forma com que esses processos são realizados influencia na qualidade da informação obtida. A mídia divulga que um em cada cinco brasileiros terão hipertensão arterial sistêmica, mas saber que essa infor- mação foi obtida em uma pesquisa com 50 indígenas no Canadá ou em uma população com 2.500 pessoas de todos os estados do Brasil mudaria o quanto você confia na informação? A estatística não se resume a números e cálculos, ela considera todo o processo desde o modo em que os dados são coletados e analisados até a forma com que eles são interpretados e divulgados. Figura 01. Estatística Fo nt e: 1 23 rf. 9 Bioestatística e Epidemiologia U1 Introdução à Bioestatística e Epidemiologia Epidemiologia é “[...] ciência que estuda o processo saúde-doença em coletividades humanas, analisando a distribuição e os fatores determinantes do risco de doenças, agravos e eventos associados à saúde, propondo medidas específicas de prevenção, controle ou erradicação de doenças, danos ou problemas de saúde e de proteção, promoção ou recuperação da saúde individual e coletiva, produzindo informação e conhecimento para apoiar a tomada de decisão no planejamento, administração e avaliação de sistemas, programas, serviços e ações de saúde”. (ROUQUAYROL; GURGEL, 2018, p. 9, grifos nossos) IM PO R TA N TE ! 2. DEFINIÇÃO DE EPIDEMIOLOGIA Historicamente, a epidemiologia conta sobre os eventos relacionados à saúde, como nas- cimentos, casos de doenças e mortes. Um exemplo clássico se refere a John Snow, o pai da Epidemiologia moderna, que, no século XIX, investigou a epidemia de cólera em Lon- dres, avaliando os casos e onde eles aconteceram para que, a partir dessas informações, conseguisse propor hipóteses causais e estratégias para reduzi-los. Esse marco amplia a atuação da epidemiologia para investigações sistemáticas de eventos com a finalidade de levantar hipóteses, definir meios de transmissão da doença e estratégias de ação Com o passar do tempo, a epidemiologia ampliou seu objeto de estudo para além das doenças transmissíveis, investigando o processo saúde-doença. Dessa forma, começa a busca por fatores de risco ou fatores determinantes para acontecimento de especí- ficas doenças, como o câncer, por exemplo. Nesse sentido, estrutura-se desenhos de estudos que possibilitam definir fatores causais. 2.1 CONCEITOS BÁSICOS Para responder uma questão de estudo, uma parte importante da pesquisa se refere à composição e definição das variáveis do estudo. Variáveis são valores ou informações obtidas diretamente ou podem ser resultado de um agrupamento, classificação ou cálculo de medidas coletadas. Elas podem ser características individuais, determinantes do processo saúde-doença, fatores de risco, eventos clínicos e desfechos, como morte, presença de doença, deficiência, sintomas e qualidade de vida. A epidemiologia classifica as variáveis de um estudo típico em três tipos, de acordo com Fletcher et al. (2014, p. 6), uma variável independente é o suposto fator de risco ou causa que se estuda, ela pode explicar a causa do problema; uma variável dependen- te, por sua vez, é o suposto desfecho ou efeito que se estuda, ela mede o fenômeno que se quer explicar, pode sofrer influência das variáveis independentes, como a rela- ção entre cigarro e câncer de pulmão. Segundo Pereira (2004, p. 46), nesse caso, a variável dependente seria o câncer de pulmão, pois sua presença pode ser influenciada pela variável independente cigarro. Por fim, uma variável externa não faz parte direta da questão principal, mas pode estar relacionada e afetar a relação entre a variável independente e dependente. Um fator de confusão é um exemplo de variável externa. U1 10Bioestatística e Epidemiologia Introdução à Bioestatística e Epidemiologia A qualidade de uma pesquisa é avaliada a partir da presença de erros cometidos. Nes- se contexto, viés é um erro sistemático e ao delinear o projeto é preciso pensar em estratégias metodológicas que diminuam a chance desse erro acontecer. Existem três principais tipos de vieses: o viés de seleção, viés de aferição e viés de con- fusão ou de confundimento. O primeiro, ocorre quando se comparam grupos com ca- racterísticas diferentes que não são as variá- veis principais, mas que influenciam no des- fecho. Isso acontece porque a seleção da amostra foi falha é que alguma característica não foi considerada, por exemplo, ao fazer uma pesquisa sobre uma possível medicação que emagrece, a pesquisa não considerou o grau de atividade física dos sujeitos. Então, aqueles que tomaram o remédio e emagreceram podem ser fisicamente ativos e os que não tomaram a medicação sejam sedentários. Como a seleção da amostra nos grupos não considerou a atividade física, não é possível considerar que o emagrecimento de fato foi por causa da medicação, pois foram comparados grupos com características diferentes. Figura 02. Variáveis e vieses de pesquisa Fo nt e: 1 23 rf. O viés de aferição ocorre quando o erro é na aferição de alguma variável, como usar uma balança não calibrada, realizar a técnica incorreta de aferição da pres- são arterial ou usar equipamentos diferentes para aferir alguma variável. O viés de confusão ou de confundimento ocorre quando duas variáveis po- dem influenciar o efeito que uma tem sobre um desfecho ou quando se con- funde qual variável influencia no desfecho. Desse modo, será que uma variável realmente causa o desfecho ou essa associação não existe e a verdadeira causa na verdade é outra variável? Um fator de confusão está associado à exposição, ele deve ter uma associação causal com o desfecho e não deve ser uma etapa do caminho da exposição gerar o desfecho. Por exemplo, uma pesquisa demonstra uma associação de depressão como fator cau- sal para ter câncer de pulmão. Nesse contexto, um fator de confundimento é o tabagismo, pois fumar causa câncer de pulmão e fumar está associado à depressão, pois esse é um hábito apresentado frequentemente em pacientes com câncer de pulmão. Portanto, o viés de confusão ocorre com a variável tabagismo, que impacta da associação principal da pesquisa, depressão e câncer de pulmão. 11 Bioestatística e Epidemiologia U1 Introdução à Bioestatística e Epidemiologia3. MÉTODO DE PESQUISA Uma pesquisa tem várias etapas, logo, ao desenvolver o método que será utilizado na coleta e análise dos dados devemos realizar diversas escolhas. Essas decisões devem ser feitas com o objetivo de melhorar a qualidade da pesquisa, mas, como nem sempre isso é possível, o pesquisador pode ser obrigado a escolher a opção mais viável e não a mais adequada. Para ajudar na decisão do pesquisador é importante saber as vantagens e desvan- tagem de cada possibilidade. Assim, ter o conhecimento de quais são os possíveis vieses que podem acontecer são conhecimentos essenciais para desenhar o estudo de maneira a contornar as dificuldades. IM PO R TA N TE ! 3.1 AMOSTRAGEM Uma das primeiras etapas ao realizar ou avaliar uma pesquisa é decidir quem serão os participantes. Por exemplo, considere que você se deseja realizar uma pesquisa sobre a frequência do uso de drogas, lícitas e ilícitas, nos universitários que moram no Brasil. Pela facilidade de acesso, você aplica um questionário com os estudantes da Univer- sidade São Francisco (USF) que estão cursando o componente curricular de Bioesta- tística e Epidemiologia. Nesse contexto, realizar a coleta de dados dessa maneira trará resultados confiáveis e compatíveis com o objetivo da pesquisa? Na pesquisa, considera-se população o grupo de pessoas que tem a característica que desejamos estudar, já a amostra é composta pelos indivíduos que foram selecionados para a pesquisa (VIEIRA, 2016, p. 91). No exemplo da pesquisa sobre drogas, a po- pulação é: todos os universitários que moram no Brasil e a amostra é: todos os alunos que responderam ao questionário. Uma amostra pode ser adequada se for capaz de fornecer resultados similares aos que existem na população. Na maioria dos casos, usa-se uma amostra principalmente pela economia do tempo e custo, como não é viável fazer exame laboratorial em todos os moradores da cidade para saber a proporção de munícipes que tem alguma doença. Segundo Viera (2016, p. 92-93), as pesquisas que realizam levantamento de dados de toda a população são chamadas de censo e não precisam de amostragem. Outro motivo para usar amostras é em ca- sos em que não é possível estudar toda a população. Por exemplo, você deixou uma embalagem de leite aberta a noite inteira fora da geladeira e, agora, precisa saber se o leite já estragou. Se a análise da qualidade for feita com todo o conteú- do do pacote, mesmo que o resultado seja que é possível consumir o leite, não seria possível realizar isso já que todo o produto foi utilizado no teste. Nesse caso, é obrigatório o uso de uma amostra de pequena quantidade do produto para que, se possível, utilizar o restante. Figura 03. Amostragem Fo nt e: 1 23 rf. U1 12Bioestatística e Epidemiologia Introdução à Bioestatística e Epidemiologia O uso de amostra tem um valor científico impactante, pois, ao usar menos sujeitos é possível coletar dados mais completos. Se a amostragem foi realizada corretamente, os valores reais que devemos encontrar na população estarão dentro de uma margem de erro do valor encontrado na amostra (VIEIRA, 2016, p. 93-94). As características das pessoas da amostra impactam na qualidade do resultado. Por isso, as descrições dos sujeitos da pesquisa e de todas as etapas de seleção desses indivíduos são essenciais para avaliar a qualidade dos resultados. IM PO R TA N TE ! Métodos amostrais É possível obter uma amostra por diversos métodos. Assim, escolher qual método utilizar é uma decisão dos pesquisadores a partir de suas características, vantagens e desvanta- gens. Logo, é de extrema importância que o método seja seguido exatamente como defi- nido e que sua descrição permita que ele seja reproduzido. Nesse sentido, muitas pessoas comparam os métodos de uma pesquisa com uma receita culinária, em que é preciso deixar claro todas as etapas para que outros consigam realizar e chegar no mesmo resultado. Uma amostra probabilística ou aleatória é quando a seleção dos sujeitos de pesqui- sa é feita ao acaso. Na prática, isso significa que a seleção foi feita por sorteio. Nessa técnica, um princípio importante é que todos os indivíduos da população têm a mesma probabilidade conhecida de participarem da amostra. Para que ela possa ser executada é necessário conhecer e identificar toda a população. Considere uma pesquisa da cidade de Votorantim (SP), com o objetivo de investigar quais são as medicações que os residentes com diabetes mellitus usam. Nesse caso, a população se trata dos diabéticos que moram na cidade. Seria possível ter conhecimento de quem são todos indivíduos da população antes de realizar o sorteio? Ainda não temos um cadastro obri- gatório e único com informações de saúde da população, independentemente de as pessoas serem ou não usuárias do Sistema Único de Saúde (SUS). Por não ser possível listar todos os diabéticos da cidade, não é possível obter uma amostra aleatória para essa pesquisa. A amostra pode ser aleatória simples quando o sorteio acontece a partir de toda a popu- lação. Esse método é utilizado quando a população é homogênea e não existem caracte- rísticas individuais que irão atrapalhar a análise dos dados. Porém, há casos que alguns subgrupos podem ter características diferentes que influenciem nos dados coletados. Ao fazer uma avaliação sobre a disciplina Estudo do Ser Humano Contemporâneo da USF, pode-se considerar que os estudantes terão avaliações similares independente do curso ou área de conhecimento que cursam? Nesse contexto, podemos supor que os alunos da área de humanas devem gostar mais da disciplina do que os alunos de exa- tas, portanto, a população não é homogênea. Em casos como o descrito anteriormente, a amostra pode ser aleatória estratificada. Esse método é usado quando a população tem subgrupos (estratos) que podem ter comportamentos diferentes. 13 Bioestatística e Epidemiologia U1 Introdução à Bioestatística e Epidemiologia Para selecionar a amostra, deve-se dividir a população nos subgrupos e sortear os su- jeitos em cada estrato, desse modo, podemos garantir a representação de cada subgru- po. Normalmente, os estratos são sexo, idade e/ou classe social, mas eles podem ser divididos conforme as características da população. A distribuição do número de partici- pantes da pesquisa em cada extrato deve ser proporcional a distribuição dos subgrupos na população. Se a população é distribuída com 30% sexo masculino e 70% feminino, uma amostra estratificada de 10 indivíduos deve selecionar 7 mulheres e 3 homens. Exemplo 1 Considere uma pesquisa com o objetivo de avaliar a proporção de pessoas com depressão entre os estudantes matriculados na Universidade São Francisco. Entre 10.350 estudantes, 33% são bolsistas. Para obter resultados significativos será necessária uma amostra com 75 pessoas. Uma amostra aleatória simples seria obtida a partir do sorteio de 75 pessoas entre os 10.350 estudantes. Já uma amostra aleatória estratificada seria obtida dividindo a população entre bolsistas e pagantes, depois sorteando 50 pessoas entre os pagantes e 25 entre os bolsistas para manter a proporção com a população. Uma amostra semiprobabilística tem parte do processo de seleção aleatório. A amostra sistemática tem regras pré-estabelecidas que devem ser seguidas sistematicamente. A parte aleatória acontece por meio de um sorteio que indica o valor que deve ser sor- teado e repetido sistematicamente. Para utilização desse método, é necessário que a população esteja distribuída em ordem e, por isso, esse é um método comum para seleção de prontuários. A primeira etapa é dividir a população em grupos, em que o número de grupos deve ser igual ao número de indivíduos na amostra. A segunda etapa se trada de sortear um número dentro de uma faixa de valor que é definida pelo número de pessoas em cada grupo. Após o sorteio, deve-se selecionar a pessoa que ocupa a posição sorteada em cada grupo. Se a população é de 250 pessoas e se desejauma amostra de 10 indivíduos, a amostra sistemática será a seleção da sétima pessoa de cada grupo considerando que o sorteio de 1 a 25 deu 7. A amostra por conglomerados seleciona grupos de pessoas definidos por algum moti- vo que são encontrados na população, como um município, uma clínica ou uma escola. Nesse caso, o sorteio não é dos sujeitos e sim dos conglomerados. Para utilização desse método, o pesquisador deve ter acesso a todos os conglomerados possíveis, ou o pesqui- sador corre o risco de ter uma amostra que não tem acesso. A vantagem dessa amostra é concentrar a coleta em menos locais, em vez de sortear entre todas as internações do município e correr o risco de ter que coletar dados em múltiplos hospitais, com esse mé- todo é possível sortear o conglomerado e realizar a pesquisa em um único local. Em alguns casos, mais de um método amostral é utilizado. Isso acontece frequente- mente quando o primeiro método é por conglomerado, pois, dentro de um conglome- rado pode ter uma quantidade maior do que a necessária. Então, utiliza-se de outro método para uma seleção dos indivíduos dento do conglomerado selecionado. A amostra por cotas seleciona com o objetivo de garantir representatividade e propor- ção igual a população, a lógica desse método é similar a cotas de vagas para acesso U1 14Bioestatística e Epidemiologia Introdução à Bioestatística e Epidemiologia aos processos seletivos. A amostra é dividida garantindo vagas para pessoas com ca- racterísticas diferentes, em que os grupos de cotas são similares aos estratos, frequen- temente divididos por sexo, idade e/ou classe social. O preenchimento das vagas é por acesso, desse modo, nesse método não existe sorteio. Nesse contexto, é comum que o entrevistador fique em locais de alto movimento para tentar encontrar pessoas que pre- encham as características das cotas. Essa é uma estratégia muito utilizada em razão de sua praticidade e baixo custo. Exemplo 3 Exemplo 2 Considere uma pesquisa com o objetivo de avaliar a proporção de pessoas com depressão entre os estudantes matriculados na Universidade São Francisco. Entre 10.350 estudantes, 33% são bolsistas. Para obter resultados significativos será necessária uma amostra com 75 pessoas. Uma amostra de conveniência seria obtida distribuindo o questionário on-line para todos os estudantes por meio de grupos de redes sociais. Considere uma pesquisa com o objetivo de avaliar a proporção de pessoas com depressão entre os estudantes matriculados na Universidade São Francisco. Entre 10.350 estudantes, 33% são bolsistas. Para obter resultados significativos será necessária uma amostra com 75 pessoas. Uma amostra sistemática seria obtida sorteando um número de 1 a 138 (considere que o resultado foi o número 84). A amostra será a octogésima quarta pessoa de cada grupo de 138 pessoas. Já uma amostra por conglomerados seria obtida sorteando uma sala de aula e os participan- tes da pesquisa seriam quem assiste aula nesse local. Uma amostra por cotas teria 50 vagas para pagantes e 25 vagas para bolsistas. Para realizar a pesquisa, o pesquisador poderia ficar na entrada principal da universidade e perguntar para cada aluno se eles eram bolsistas ou pagantes. As primeiras pessoas que preenchessem os critérios seriam selecionadas. A amostra de conveniência ou não probabilística é composta por pessoas que o pesquisador tem fácil acesso. Nesse método, não existe sorteio ou alguma etapa que garanta aleatoriedade e representatividade da população. Ele é similar ao método amostral por cotas, em que a diferença é que, por conveniência, não há os grupos de características específicas. Essa é uma das estratégias mais utilizadas por ser muito prática e barata, normalmente, os profissionais que desenvolvem pesquisa usam esse método ao fazerem a pesquisa somente com os seus pacientes. Pessoas leigas podem explicar esse método descrevendo que a seleção das pessoas ocor- reu ao acaso, conforme encontravam as pessoas na rua. Para estatística, o termo acaso está relacionado à aleatoriedade de um evento acontecer e não a ausência de método de coleta. 15 Bioestatística e Epidemiologia U1 Introdução à Bioestatística e Epidemiologia Tamanho da amostra A vantagem da amostra é não precisar avaliar a população inteira. Entretanto, o tama- nho da amostra tem que ser pequeno para otimizar tempo e recursos, mas grande o su- ficiente para ter significância estatística. Quanto maior o tamanho da amostra, maiores as chances dos valores encontrados (estimativas) serem próximos aos valores reais en- contrados na população (parâmetros). Para saber se um novo tratamento é eficaz, não se pode avaliar somente 10 pessoas, é preciso de um número suficiente que consiga garantir que o que foi observado não é uma exceção. Desse modo, para saber o tamanho ideal existem cálculos que definem o número ideal para a amostra ter significância e qualidade. De acordo com a situação, pode-se utilizar fórmulas diferentes. Normalmente, os critérios que precisam ser definidos ao fazer o cálculo são: margem de erro, nível de confiança e proporção na população. 3.2 INFERÊNCIA ESTATÍSTICA Uma vez que se obtém os resultados é preciso avaliar a qualidade deles e o quanto é possível usá-los para supor que é assim que eventos acontece na população. Então, primeiramente, avalia-se a validade interna que define a grau que os resultados represen- tam a amostra. Um bom estudo sem vieses e erros sempre tem alta validade interna. Por sua vez, a validade externa define o quanto o resultado pode representar a população. Nesse sentido, chama-se de inferência estatística a ação de generalizar os resultados da sua amostra para a população. Para fazer a inferência é necessário avaliar as carac- terísticas da amostra e refletir se ela é representativa da população. Uma amostra é tendenciosa quando suas características não são similares a popula- ção. Dessa forma, toda amostra tendenciosa ocorre por viés de seleção. Uma pesquisa sobre uso de drogas entre brasileiros teve uma amostra somente de alunos universitá- rios. Com os dados obtidos não é possível concluir que todos os brasileiros se compor- tam como na amostra. Portanto, para utilizar os resultados da pesquisa para embasar sua conduta profissio- nal, o estudo tem que ter alta validade interna e externa. Ela não pode ter vieses e uma amostra tendenciosa. Procure nos artigos científicos se os autores deixam claro o método amostral utilizado. Será que descrever como foi feita a seleção facilita a avaliação de validade da pesqui- sa e da presença de vieses? Sem a descrição do método amostral é possível definir a presença de viés de seleção? PA R A R EF LE TI R U1 16Bioestatística e Epidemiologia Introdução à Bioestatística e Epidemiologia 4. OBJETO DE APRENDIZAGEM Faça um quadro comparativos dos diferentes métodos amostrais MÉTODO AMOSTRAL CARACTERÍSTICA VANTAGEM DESVANTAGEM EXECUÇÃO Aleatória Simples Estratificada Sistemática Por conglomerados Por cotas Conveniência 17 Bioestatística e Epidemiologia U1 Introdução à Bioestatística e Epidemiologia REFERÊNCIAS BIBLIOGRÁFICAS FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. Epidemiologia clínica: elementos essenciais. 5. ed. Porto Alegre: ArtMed, 2014. PEREIRA, J. C. R. Análise de dados qualitativos: estratégias metodológicas para as ciências da saúde humanas e sociais. São Paulo: Edusp, 2004. ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia e saúde. 8. ed. Rio de Janeiro: Medbook, 2018. VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016. 18 UNIDADE 2 COLETA, ORGANIZAÇÃO E DESCRIÇÃO DOS DADOS Figura 01. Tipos de variáveis VARIÁVEIS QUALITATIVAS OU CATEGÓRICA NOMINAL ORDINAL DISCRETA CONTÍNUA QUANTITATIVA OU NUMÉRICA Fonte: elaborada pela autora. INTRODUÇÃO Uma parte importante para avaliar a qualidade da pesquisa é ter uma adequada coleta dos dados. Qual informação coletar, como aferir e qual instrumento utilizar sãodefini- ções importantes que um pesquisador deve fazer. Desse modo, toda escolha influencia na qualidade e nas análises utilizadas, mas não basta somente coletar corretamente, é preciso transmitir os dados e resumir as informações. 1. COLETA DE DADOS Ao desenhar uma pesquisa é preciso definir quais variáveis coletar e como conduzir esse processo. As variáveis são as informações de interesse que a pesquisa pretende estudar e suas características influenciam nas análises estatísticas que serão realiza- das que, por sua vez, definem os resultados. A classificação estatística das variáveis está esquematizada na Figura 1, em que as va- riáveis qualitativas ou categóricas são expressadas por categorias mutualmente exclu- dentes. Por exemplo, sexo é uma variável qualitativa porque a reposta é por categoria (masculino ou feminino) e só é possível ter uma resposta possível. A variável qualitativa pode ser ordinal quando as categorias possuem uma ordem na- tural. A ordenação é um consenso e não pode estar associada a juízo de valor pessoal. Uma pesquisa de satisfação que tem toda pergunta estruturada com as possibilidades de resposta: ruim, satisfatório e bom. Essa é uma variável qualitativa, pois as respostas são categorias e é ordinal porque as respostas têm uma ordenação. Um questionário fechado tem as possíveis respostas em ordem, mas isso não quer dizer que exista uma ordem natural nas respostas para classificá-la como ordinal. Nesse contexto, podemos 19 Bioestatística e Epidemiologia U2 Coleta, organização e descrição dos dados apresentar outros exemplos como escolaridade (ensino infantil, fundamental, médio e superior) e tamanho do edema (1+, 2+, 3+, 4+). A variável qualitativa pode ser nominal quando as categorias não têm uma distribuição ordinal. Uma grande parte das variáveis são desse tipo. Na declaração de nascido vivo, por exemplo, a variável tipo de parto é coletada com possibilidades de resposta: cesáreo, vaginal e ignorado. Apesar das evidências científicas e do juízo de valor que parto vaginal é melhor, a ordenação não é natural e, portanto, tipo de parto é uma variável qualitativa nominal. Além disso, são outros exemplos de variável qualidade nominal: município de residência ou droga ilícita utilizada (maconha, cocaína, crack, LSD, entre outras). Ademais, algumas variáveis qualitativas nominais podem, também, ser dicotômicas. Isto é, quando só há duas respostas possíveis e que elas são excludentes, por exemplo: faz uso de tabaco (sim/não), presença ou ausência de pressão alta. Normalmente, as respostas desse tipo de variáveis são sim e não. As variáveis quantitativas ou numéricas são expressas por números com intervalos entre os valores iguais, por exemplo, peso e altura. Por sua vez, o grau de estadiamen- to, apesar de ter respostas numéricas (estadiamento I, II, III e IV), não é uma variável quantitativa porque os intervalos entre os graus não são conhecidos. As variáveis quantitativas podem ser discretas quando as respostas são valores ou uma faixa de valores possíveis. Geralmente, essas respostas apresentam números in- teiros e resultados de uma contagem. Por exemplo, número de partos é uma variável quantitativa, em que o resultado é numérico, e é discreta, porque a pessoa contou quan- tos partos teve e não se pode ter metade de um parto. Por fim, a variável quantitativa contínua pode ter números decimais e resultados são obtidos por aferição. O peso de cada sujeito da pesquisa é aferido em uma balança e tem a possibilidade de um resultado decimal, 75,1 kg. Dessa forma, todo exame laboratorial de análises clínicas são variáveis quantitativas contínua, pois os resultados são sempre uma proporção. 1.1. DESEMPENHO DAS AFERIÇÕES Como e com quais instrumentos a coleta de dados foi realizada influencia na qualidade da pesquisa. Por isso, vários instrumentos têm seus desempenhos avaliados para jul- gar o quanto eles conseguem aferir. A validade avalia a capacidade de um instrumento medir o que se propõe a medir. Esse conceito, por sua vez, é similar ao conceito de acurácia que mede o quanto os dados aferidos representam a realidade. A confiabilidade está relacionada com a precisão e reprodutibilidade do instrumento, avaliando o quão próximos as aferições estão repe- tidas. A responsividade avalia se o instrumento consegue registrar mudanças após alteração clínica do quadro. Já a interpretabilidade avalia o grau de dificuldade de interpretar os dados e, também, avalia o intervalo de variação que o instrumento conse- gue medir e a capacidade de registrar alterações extremas. U2 20Bioestatística e Epidemiologia Coleta, organização e descrição dos dados Figura 02. Precisão e acurácia de quatro instrumentos diferente considerando que o local correto a ser acertado é o meio do desenho Fonte: elaborada pela autora. Os dois principais critérios para avaliar a qualidade de um instrumento são: a precisão e a acurácia. Para compreender melhor os conceitos, avalie a Figura 2. Considere que cada instrumento aferiu quatro vezes e que o valor que eles deveriam acertar está no centro do desenho, desse modo, quais instrumentos têm alta precisão e acurácia? Após analisar a Figura 2, o instrumento amarelo se mostra impreciso e tem baixa vali- dade; o instrumento verde, por sua vez, é preciso porque as aferições estão próximas, mas tem baixa validade já que estão longe do centro; o instrumento azul tem precisão e acurácia intermediárias; por fim, o instrumento vermelho tem alta precisão e acurácia. As escalas são ferramentas utilizadas por muitos profissionais da saúde para avaliar características dos indivíduos e os fatores determinantes de saúde, como o Mini Exame do Estado Mental (MEEM). Essas escalas ao serem criadas, traduzidas ou adaptadas para diferentes populações devem passar por uma avaliação de validade de conteúdo, de critério e de construto. A validade de conteúdo refere-se à capaci- dade que a escala tem de abranger todos os aspectos do problema a ser medido, assim como a clareza na medição do problema. A validade de critério, por outro lado, compara os resultados do teste em questão com outros exames ou características mensuráveis. Segundo Pasquali (2009), a validade de construto leva em consideração a consistência interna (correlação entre cada item e o restante dos itens da escala) e a capacidade do instrumento em medir uma variável latente (um construto que não pode ser medido diretamente). 21 Bioestatística e Epidemiologia U2 Coleta, organização e descrição dos dados 2. RESULTADOS Os dados são os valores ou as respostas obtidas. A análise dos dados começa com a estatística descritiva na qual a principal função é o resumo e a descrição das infor- mações obtidas. As variáveis qualitativas são resumidas com frequência absoluta e relativa de cada categoria de resposta. As variáveis quantitativas, normalmente, são resumidas com medidas de tendência central e medidas de dispersão. Frequência absoluta e relativa A frequência absoluta é a contagem dos casos de cada categoria da variável. Por exemplo, na variável sexo, a frequência absoluta é de 18 para os homens e 36 para as mulheres. A frequência relativa é uma proporção resultante de uma divisão. A frequ- ência relativa pode ser apresentada por coeficientes, taxas, porcentagens e índices. Ao resumir dados das variáveis qualitativas é comum expressar a frequência relativa em porcentagem após a menção da frequência absoluta. Fórmula de cálculo de frequência relativa por porcentagem: 1 00 frequencia absoluta tamanhoda amostra × 1 EX EM PL O Considere uma amostra de 54 pessoas, das quais 36 são mulheres e 18 são homens. O cálculo da frequência relativa em porcentagem para cada respos- ta dos homens é: 1 00 frequencia absoluta tamanhoda amostra × substituir a fórmula com os dados. 18 1 00 54 = × fazer a divisão (18 ÷ 54). 0,3333 1 00= × fazer a multiplicação. 33,33%= Já nas mulheres, temos: 36 1 00 100 0,6667 1 00 66,67% 54 frequencia absoluta tamanhoda amostra × = × = × = U2 22Bioestatística e Epidemiologia Coleta, organização e descrição dos dados Ao descrever variáveis quantitativas, a utilização da frequência para cada pos- sibilidade de resposta pode não resumir os dados. A dificuldade em realizar uma frequência simples é que dados quantitativos frequentemente têm diversas res- postas, não agrupando os dados e resumindo as informações. Para esses casos, recomenda-se a utilização de frequência agrupada, na qual criam-se agrupamen- tos de categorias de dados. Os agrupamentos de categorias de dados poder ser definidos, a partir da distri- buição dos dados da amostra ou de critérios predefinidos. Assim, é comum para idade de adultos distribuir em faixas de 20 a 29 anos ou de 30 a 39 anos. O inter- valo de valores deve ser igual em todas as faixas. Desse modo, é importante que as categorias criadas tenham uma sequência que garanta que todo número esteja incluso em somente uma única categoria. Por exemplo, se existem as categorias de 20 a 30 anos e de 30 a 40 anos, um sujeito com 30 anos pode erroneamente ser incluído em duas categorias. O exemplo a seguir mostra que a distribuição agrupada é mais adequada para variáveis quantitativas. Os dois tipos de frequência podem ser apresentados ao longo do texto, confor- me exemplo acima. Outra opção é descrever, no texto, usando o número abso- luto seguido da porcentagem entre parênteses, por exemplo, quanto a sexo 36 (66,67%) eram mulheres. Além disso, há a possibilidade de realizar uma tabela de distribuição de frequência, em que ela é organizada com três colunas, a primeira que terá as possibilidades de respostas, a segunda que terá a frequência absoluta (as vezes abreviada como “N”) e a terceira que terá a frequência relativa (normalmente, abreviada com “%”). A primeira linha da tabela mostra os títulos de cada coluna e a última linha é o Total, conforme a tabela a seguir. Tabela 01. Tabela de distribuição de frequência SEXO FREQUÊNCIA ABSOLUTA (N) FREQUÊNCIA RELATIVA (%) Feminino 36 66,67% Masculino 18 33,33% Total 54 100% Fonte: elaborada pela autora. 23 Bioestatística e Epidemiologia U2 Coleta, organização e descrição dos dados No cotidiano das secretarias de saúde, os dados do número de casos das doenças de notificações compulsórias são divulgados, portanto, é importante que em qualquer divulgação de dados seja utilizada frequência absoluta e relativa. Uma pesquisa entrevistou 8 universitários com os dados descritos na tabela a seguir. Crie uma tabela de distribuição simples e agrupada de frequência absoluta (N) e rela- tiva (%) da variedade idade. IDADE 20 21 57 40 23 20 21 21 Distribuição simples IDADE N % 20 2 2 100 0,25 100 25% 8 × = × = 21 3 3 100 0,375 100 37,5% 8 × = × = 23 1 1 100 0,1225 100 12,25% 8 × = × = 40 1 1 100 0,1225 100 12,25% 8 × = × = 57 1 1 100 0,1225 100 12,25% 8 × = × = Total 8 100% Distribuição agrupada IDADE N % 20 a 39 anos 6 6 100 0,25 100 75% 8 × = × = 40 a 59 anos 2 2 100 0,25 100 25% 8 × = × = Total 8 100% EX EM PL O U2 24Bioestatística e Epidemiologia Coleta, organização e descrição dos dados Ao realizar qualquer cálculo das medidas de tendência central é importante que todos os dados coletados sejam analisados. Então, mesmo que existam valores repetidos, todas as observações devem participar dos cálculos. IM PO R TA N TE ! Nesse sentido, a medida de tendência mais tradicional é a média aritmética. Por sua vez, ela é obtida somando todos os valores dos dados e depois dividindo a soma pelo número de dados observados. Fórmula da média: 2 xx n ∑ = ou soma dos dadosMédia númerodedados = A frequência absoluta tem como principal função demonstrar o impacto que aquele agravo, evento ou desfecho tem na sociedade. Outra aplicabilidade é que, a partir dos números de casos, os serviços de saúde podem planejar atendimentos e possíveis demandas. Sobre a pandemia de covid-19, por exemplo, divulgar o número de mortes diários causou uma comoção entre os brasileiros e, também, fez com que os municípios se preparassem para o suporte de estrutura e insumos que será necessário para os atendimentos. Já a frequência relativa tem como principal função comparar. O número de óbitos total por covid-19 em 9 de fevereiro de 2021 nos Estados Unidos da América (EUA) foi de 459.993 e no Reino Unido foi 112.798. Somente utilizando o número absoluto de casos, o EUA parece estar pior na pandemia por causa do maior número de casos. Agora ao complementar as informações com a frequência relativa, a comparação fica melhor. Com esse mesmo exemplo, a proporção de mortes por co- vid-19 por 1 milhão de habitantes no Reino Unido é de 1.661,58 e nos Estados Unidos da América é de 1.389,7. Por isso, cabe reforçar que para qualquer comparação é ne- cessário usar alguma frequência relativa. 2.2 MEDIDAS DE TENDÊNCIA CENTRAL Na descrição e resumo das variáveis quantitativas, frequentemente, utiliza-se no míni- mo uma medida de tendência central e uma medida de dispersão. As medidas de ten- dência central definem um ponto dentro do conjunto amostral que resume os dados. 25 Bioestatística e Epidemiologia U2 Coleta, organização e descrição dos dados Em que: x = um dado. ∑ = somatória. x∑ = somatória de todos os dados. n = número de dados. CÁLCULO MÉDIA Uma pesquisa entrevistou 8 universitários com os dados descritos na tabela a seguir. IDADE 20 21 57 40 23 20 21 21 Média: x soma dos dadosx n númerodedados ∑ = = 20 20 21 21 21 23 40 57 8 + + + + + + + = Portanto, a média desses dados é 27,88 anos. EX EM PL O – C Á LC U LO M ÉD IA Nesse exemplo, considere que, na amostra de 8 pessoas, o pesquisador seja incapaz de coletar a idade de um sujeito. Nesse caso, o número de dados é 7, que é a informações que se deve colocar na parte de baixo na fórmula, já que só tem idade de sete indivíduos. A mediana é a segunda medida de tendência central. O seu valor divide o conjunto de dados ordenados no meio, isso significa que metade das observações tem valores abaixo da mediana e metade acima. = 27,88 223 8 = substituir a fórmula com os dados. somar os valores. .......................................................... realizar a divisão. U2 26Bioestatística e Epidemiologia Coleta, organização e descrição dos dados Para calcular a mediana, a primeira etapa é organizar os dados em ordem crescente (do menor para o maior). A segunda etapa é en- contrar em qual local é o ponto de corte para dividir o conjunto ao meio. Quando o número de dados for ímpar, a mediana será um valor do conjunto. Conjunto A: {2,6,12,17,21} tem cinco observações (número ímpar), portanto, a mediana é valor do conjunto. Consideran- do que ele já está ordenado, o valor que está na posição central e consegue dividir o con- junto em dois grupos de dois é o 12. Logo, a mediana do conjunto A é 12. Quando o número de dados for par, a me- diana será a média dos dois valores centrais. Como será sempre uma média de dois valores, a conta será sempre igual, primeiro deve-se somar os valores centrais e depois dividir a soma por 2. Conjunto B: {7, 9, 13, 15} tem número quatro observações (número par), portanto, a mediana é a média dos dois valores centrais. Considerando que ele já está ordena- do, a posição central que consegue dividir o conjunto em dois grupos de dois é um valor entre 9 e 13. Para calcular a mediana, nesse caso, é preciso fazer a média entre 9 e 13. Assim, o cálculo da mediana será soma dos dados númerodedados = 9 13 2 + = 22 11. 2 = Ou seja, a mediana do conjunto B é 11. Figura 03. Distribuição de dados Fo nt e: 1 23 rf. Cálculo mediana Uma pesquisa entrevistou 8 universitários com os dados descritos na tabela a seguir. IDADE 20 21 57 40 23 20 21 21 Mediana 1) Colocar em ordem crescente: 20 20 21 21 21 23 40 57. 2) Número par de observações (oito).3) Achar os valores centrais: 21 e 21. 4) Realizar o cálculo: 21 21 2 + = 42 21 2 = . A mediana desses dados é 21 anos. EX EM PL O 27 Bioestatística e Epidemiologia U2 Coleta, organização e descrição dos dados A terceira medida de tendência central é a moda. A moda é o dado mais frequente, ou seja, dentro do conjunto é o valor que mais se repete. É possível que um conjunto tenha mais do que uma ou não tenha moda. Para facilitar reconhecer qual é a moda, pode-se fazer uma análise de frequência absoluta antes ou ordenar o conjunto para ficar mais fácil conseguir reconhecer os valores repetidos. Cálculo moda Uma pesquisa entrevistou 8 universitários com os dados descritos na tabela a seguir. IDADE 20 21 57 40 23 20 21 21 Moda: faça uma contagem (frequência absoluta) dos dados. A idade que mais se repete é 21, com três votos. IDADE 20 21 23 40 57 TOTAL N 2 3 1 1 1 8 Logo, a moda desses dados é 21 anos. EX EM PL O A média é influenciada pelos valores dos dados. Desse modo, se no conjunto de obser- vações tiverem valores extremos, ou seja, distante de onde a maioria dos valores está, a média será afetada. Essa desvantagem da média é a vantagem da mediana, que não é influenciada por valores extremos. Se analisarmos os exemplos de cálculo para essas duas medidas, podemos observar que a média está mais alta que a mediana por causa dos valores extremos (40 e 57). A vantagem da média é que ela pode sofrer manipulações matemáticas e é mais co- nhecida. Já a mediana não consegue sofrer muitas manipulações matemáticas. Quanto à moda, a vantagem é a praticidade de conhecer e calcular a medida. No entanto, a desvantagem é que os resultados não são significativos em grupos pequenos. A escolha de qual medida usar dependerá dos dados da pesquisa. As características, vantagens e desvantagens de cada medida influenciará na escolha da medida que descreverá melhor os dados. U2 28Bioestatística e Epidemiologia Coleta, organização e descrição dos dados 3. OBJETO DE APRENDIZAGEM Considere que uma sala de aula formou três grupos, cada um com 10 alunos. A tabela abaixo descreve as características dos alunos em cada grupo. IDENTIFICAÇÃO GRUPO TIME QUE TORCE NÚMERO DE IRMÃOS Aluno 1 A Santos 0 Aluno 2 A Santos 0 Aluno 3 A Guarani 3 Aluno 4 A Ponte Preta 2 Aluno 5 A Palmeiras 1 Aluno 6 A Ponte Preta 0 Aluno 7 A Ponte Preta 2 Aluno 8 A Guarani 1 Aluno 9 A Ponte Preta 2 Aluno 10 A Palmeiras 0 Aluno 11 B Bragantino 1 Aluno 12 B São Paulo 1 Aluno 13 B Santos 2 Aluno 14 B Bragantino 3 Aluno 15 B Palmeiras 0 Aluno 16 B Guarani 2 Aluno 17 B São Paulo 1 Aluno 18 B Bragantino 2 Aluno 19 B Guarani 4 Aluno 20 B São Paulo 2 Aluno 21 C Corinthians 1 Aluno 22 C Santos 3 Aluno 23 C Corinthians 2 Aluno 24 C São Paulo 0 Aluno 25 C Santos 5 Aluno 26 C São Paulo 3 Aluno 27 C Ponte Preta 2 Aluno 28 C Santos 4 Aluno 29 C Corinthians 2 Aluno 30 C Palmeiras 5 Fonte: própria autora 29 Bioestatística e Epidemiologia U2 Coleta, organização e descrição dos dados a. Monte uma tabela de frequência da variável Time que torce de todos os alunos da sala. A tabela deve conter frequência absoluta e frequência relativa. b. Calcule as medidas de tendência central da variável Número de irmãos de cada grupo de aluno. Reflita se existe diferença entre os grupos e se dentro de cada grupo qual é a medida de tendência central que melhor resume essa variável. U2 30Bioestatística e Epidemiologia Coleta, organização e descrição dos dados FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. Epidemiologia clínica: elementos essenciais. 5. ed. Porto Alegre: ArtMed, 2014. PASQUALI, L. Psicometria. Revista da Escola de Enfermagem da USP, São Paulo, v. 43, especial, p. 992- 999, 2009. Disponível em: http://dx.doi.org/10.1590/S0080-62342009000500002. Acesso em: 23 fev. 2021. VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016. REFERÊNCIAS BIBLIOGRÁFICAS about:blank 32 UNIDADE 3 ESTATÍSTICA DESCRITIVA INTRODUÇÃO O que é “normal”? Estar fora do “normal” faz alguém estar doente? Se uma pessoa chora todo dia por um mês após perder uma pessoa querida, isso é considerado normal ou é depressão? Como se definiu qual o limite entre febre e temperatura normal? Será que toda pessoa com temperatura de 37,3ºC está sem febre? Normal é um termo relativo, com base na sociedade e que varia ao longo do tempo, por isso, a saúde utiliza o termo padrão. Qual é a frequência cardíaca padrão de um adul- to? Aqui o termo padrão tem o significado de ser o que ocorre com maior frequência, o evento mais comum de acontecer. Dessa forma, as informações abordadas nessa unidade ajudarão a desvendar esses mistérios e a interpretar as informações. 1. MEDIDAS DE DISPERSÃO Para resumir e descrever um conjunto de dados de uma variável numérica, utiliza-se medidas de tendência central e medidas de dispersão. As medidas de tendência central informam um ponto que resume os dados, mas só ter um ponto central não descreve o quanto os dados variam. Considere o conjunto A {12,13,14,15,16} e o conjunto B {4,10,12,20,24}. Os dois conjun- tos têm média 14, mas eles não são similares. Os dados do conjunto A variam pouco, enquanto em B a variação é maior, pois, para descrever é preciso de no mínimo uma medida central e uma de dispersão. Uma medida de dispersão é a amplitude que é a diferença entre o valor máximo e o mínimo. Assim, é possível apenas citar o valor mínimo e máximo. Para facilitar o cálculo da amplitude, recomenda-se colocar os dados em ordem crescente para ajudar no re- conhecimento dos valores extremos. Fórmula da amplitude: 1 Amplitude Valor máximo Valor mínimo= − 33 Bioestatística e Epidemiologia U3 Estatística descritiva Cálculo de Amplitude Uma pesquisa entrevistou 6 universitários com os dados descritos na tabela a seguir. IDADE 20 21 57 40 23 18 Amplitude: 1) Colocar em ordem crescente: 18 20 21 23 40 57 2) Realizar o cálculo: 57 18 39− = A amplitude desses dados é 39 anos. Ex em pl o A segunda medida de dispersão é o quartil. O percentil é um ponto de corte que divide os dados ordenados, por exemplo, o percentil 85 divide as observações de modo que 85% dos dados estão entre o valor mínimo e o valor do percentil 85. Quartil são os pon- tos de corte que dividem o conjunto em quatro partes igual, portanto, o primeiro quartil é o percentil 25, o segundo é o percentil 50 e o terceiro é o percentil 75. O segundo quartil é sinônimo de mediana já que os dois dividem as observações na metade. A figura a seguir esquematiza os três pontos de corte no conjunto de dados. Figura 01. Esquema da localização dos quartis A 25% 25% 25% 25% B C Fonte: elaborada pela autora. Para calcular os quartis, a primeira etapa é organizar os dados em ordem crescente (do menor para o maior). A segunda etapa, por sua vez, é encontrar o segundo quartil. Quando o número de dados for ímpar, o segundo quartil será um valor do conjunto, e quando for par, ele será a média dos dois valores centrais. “A” é o primeiro quartil, “B” é o segundo quartil ou mediana e “C” é o terceiro quartil. U3 34Bioestatística e Epidemiologia Estatística descritiva A terceira etapa é dividir em dois grupos, de modo que o ponto de corte é a mediana. Quando o número de dados for ímpar, o segundo quartil será um valor do conjunto que deverá estar presente nos dois dos grupos. Quando o número de dados for par, todos os dados serão distribuídos nos grupos, independentemente dos dados centrais serem utilizados para calcular a mediana. A quarta etapa é encontrar o local do ponto de corte para dividir o grupo ao meio: o primei- ro quartil é o ponto que divide na metade o grupo de dados com as observações de menor valor; o terceiro quartil é o ponto que divide na metade o grupo de dados com as observa- ções de maior valor. Assim, no grupo, quando o número de dados for ímpar, o quartil será um valor do conjunto, mas quando for par será a média dos dois valores centrais. O conjuntoA: {2,6,12,17,21} tem número cinco observações (número ímpar), portanto, o ponto que divide esse conjunto na metade é uma observação. Considerando que ele já está ordenado, o valor que está na posição central e consegue dividir o conjunto em dois grupos de dois é o 12. O conjunto B: {7, 9, 13, 15} tem número quatro observações (número par), logo, o ponto que divide esse conjunto na metade é a média dos dois valores centrais. Como ele já está ordenado, a posição central que consegue dividir o conjunto em dois grupos de dois é um valor entre 9 e 13. Nesse caso, é preciso fazer a média entre 9 e 13, logo, soma dos dados númerodedados = 9 13 2 + = 22 11. 2 = Cálculo quartil número par de observações Uma pesquisa entrevistou seis universitários com os dados descritos na tabela a seguir: IDADE 20 21 57 40 23 18 Quartis: 1) Colocar em ordem crescente: 18 20 21 23 40 57 2) Número par de observações (seis). 2a) Achar os valores centrais: 21 e 23 2b) Realizar o cálculo do 2º quartil: 21 23 2 + = 44 22 2 = 3) Dividir em grupo: Grupo Z: 18 20 21 EX EM PL O 35 Bioestatística e Epidemiologia U3 Estatística descritiva EX EM PL O Grupo Y: 23 40 57 4) número ímpar de observações em cada grupo (três). 4a) Achar o 1º quartil no grupo Z: 20 4a) Achar o 3º quartil no grupo Y: 40 Desses dados, o primeiro quartil é 20 anos, o segundo quartil (mediana) é 22 anos e o terceiro quartil é 40 anos. Cálculo quartil número ímpar de observações Uma pesquisa entrevistou sete universitários com os dados descritos na tabela a seguir: IDADE 20 57 40 18 24 26 18 Quartis: 1) Colocar em ordem crescente: 18 18 20 24 26 40 57 2) Número ímpar de observações (sete). 2a) Achar o 2º quartil: 24 3) Dividir em grupo (no caso do 2º quartil ser uma observação, essa estará nos dois grupos): Grupo Z: 18 18 20 24 Grupo Y: 24 26 40 57 4) Número par de observações em cada grupo (quatro). 4a) Achar o 1º quartil no grupo Z: 18 20 2 + = 38 19 2 = 4a) Achar o 3º quartil no grupo Y: 26 40 2 + = 66 33 2 = Nesses dados, o primeiro quartil é 19 anos, o segundo quartil (mediana) é 24 anos e o terceiro quartil é 33 anos. EX EM PL O U3 36Bioestatística e Epidemiologia Estatística descritiva A terceira medida de dispersão é o desvio padrão, que descreve o quanto os dados estão distribuídos em torno da média. Então, toda vez que usar desvio padrão, deve-se usar também a média. O desvio padrão é calculado como a raiz quadrada de variância. SA IB A M A IS Para saber mais sobre o conceito de variância, leia a obra Introdução à Bioestatística (p. 47-51), de Sonia Vieira, lançado em 2016. Disponível na biblioteca digital em: https://integrada.minhabiblioteca.com.br/#/ books/9788595150911/epubcfi/6/20%5B%3Bvnd.vst.idref%3DaB9788535277166000 042%5D!/4/2/6/12/2/4/4%400:0. Acesso em: 15 mar. 2021. Fórmula de desvio-padrão de uma amostra: ( )22 2 1 x x ns n − = − ∑ ∑2 Em que: x é um dado; ∑ representa somatória; x∑ é a somatória de todos os dados; 2x∑ é a somatória dos quadrados dos dados; e n é o número de dados. Apesar de existir a possibilidade de realizar manualmente os cálculos de medidas de tendência central e de dispersão, a rotina do pesquisador é que softwares façam os cál- culos. Para utilizar a fórmula de desvio padrão para amostra, primeiramente, é necessário calcular as somatórias para obter todos os valores que devem ser inseridos na fórmula. EX EM PL O Cálculo de desvio padrão Uma pesquisa entrevistou quatro crianças com idades de 2, 6, 10 e 12 anos. Desvio Padrão: 1) Calcular os valores da somatória: 2 6 10 12 x 2x 22 4= 26 36= 210 100= 212 144= 2 284x =∑ 30x =∑ about:blank about:blank about:blank 37 Bioestatística e Epidemiologia U3 Estatística descritiva EX EM PL O 2) Coloque os valores na fórmula. Atente-se para não confundir onde colocar x∑ e 2x∑ , e para não sumir com a potência. Como n é o número de dados, nesse caso, 4n = . ( ) ( ) 2 2 2 2 2 30 284 4 1 4 1 x x ns n − − = = − − ∑ ∑ 3) Resolver a conta: ( )2 2 30 284 4 4 1 − = − realizar a potência 230 2 900284 4 4 1 − = − realizar a divisão 900 4 2 284 225 4 1 − = − realizar as duas subtrações 2 59 3 = realizar a divisão 2 19,67= realizar a raiz quadrada 4, 43= O desvio padrão é de 4,43 anos. 1.1 VANTAGENS E DESVANTAGENS A vantagem da amplitude ou da menção do valor mínimo e máximo é incluir todos os valores, mas, por outro lado, é uma medida muito afetada por valores extremos. Para descrever a idade dos óbitos ocorridos em um mês, o pesquisador relata que a idade variou de horas de vida até 106 anos. Com esse intervalo grande não é possível saber como de fato está a distribuição de óbitos. Os quartis conseguem fornecer mais dados da dispersão e não são afetados por va- lores extremos. A distância interquartílica, que é a distância entre o primeiro e terceiro quartil, é um valor consegue descrever se metade da amostra está afastada ou próxima a mediana. Uma desvantagem dos quartis é que existem métodos diferentes de calcu- U3 38Bioestatística e Epidemiologia Estatística descritiva lá-los, até mesmo entre os softwares, apesar da diferença entre eles ser pequena. Além disso, eles não são adequados para manipulações matemáticas. O desvio padrão é adequado para manipulações matemática e é utilizado para outras análises estatísticas. Ele é uma medida extremamente adequada para descrever vari- áveis com distribuição normal, no entanto, quando a amostra não tem uma distribuição normal, o desvio padrão não deve ser utilizado. 2. PROBABILIDADE A teoria clássica de probabilidade é aquela em que, normalmente, abordamos no Ensi- no Médio, em que calculávamos qual a probabilidade de se tirar uma carta de baralho específica ou de tirar um número no dado. As características dos fenômenos probabilís- ticos se mantem no campo da saúde. A probabilidade de um evento único acontecer é calculada pela definição básica, conforme a fórmula a seguir. Ela é somente para eventos mutualmente exclusivos e igualmente prováveis e eventos independentes ou condicionantes. Normalmente, ela é expressa por número entra 0 a 1, mas, frequentemente, usa-se a porcentagem para ficar mais fácil de compreender. Fórmula de probabilidade (evento único): númerodeeventos esperados númerodeeventos possíveis 3 No ensino médio, aprende-se que a probabilidade de se ter um filho do sexo masculino é de 50%. Para chegar a esse valor, utilizamos a seguinte Equação 3, logo: ( ) ( ) 1 2 eventoesperado nascer homemnúmerodeeventos esperados número deeventos possíveis eventos possíveis nascer homemou mulher = 1 2 = 0,5 x 100 = 50% Contudo, como podemos calcular a probabilidade de uma criança nascer com uma anomalia congênita? Nesse caso, podemos considerar que é 50% também, já que só existem dois eventos esperados (nascer com ou sem anomalia)? Na área da saúde, as probabilidades de eventos, como a chance de ficar doente ou de se curar, são calculadas a partir do que é observado na população. Então, pesquisas descritivas que contam os eventos são muito importantes para termos as probabilida- des. Logo, qual a probabilidade de ter uma criança com anomalia congênita? = 39 Bioestatística e Epidemiologia U3 Estatística descritiva Pelas informações divulgadas pelo Ministério da Saúde, em 2019, no Brasil nasceram 2.849.146 crianças, em que 24.838 nasceram com anomalias. Preenchendo a fórmula com esses valores, temos que: númerodeeventos esperados númerodeeventos possíveis = 24.838 2.849.146 = 0,00872 ×100 = 0,87%. O cálculo realizado é similar ao de frequência relativa. Portanto, dependendo de qual foi a amostra e como os dados foram coletados, pode-se considerar que a probabilidade de um evento acontecer é a frequência relativa que alguma pesquisa demostrou que ela acontece. PA R A R EF LE TI R Pelo ISA-Capital de 2008, a proporção de pessoas com mais de 20 anos quetinham Hipertensão Arterial Sistêmica (HAS) foi de 22%. Uma nutricionista atendeu em um dia 20 consultas de adultos ou idosos e nenhum deles tinha HAS. De acordo com a probabilidade, ela deveria ter atendido 4 hipertensos (22% de 20 consultas = 0,22 x 20 = 4,4). Considerando que a proporção de hipertensos na população está correta, o que será que aconteceu para a probabilidade errar? ` O número de pessoas atendidos é baixo e pode ter ocorrido um viés de seleção e a amostra não representar a população. ` Ao acaso, naquele dia, não houve hipertensos. Mas nos outros dias da semana, ela atendeu mais de 5 doentes. ` O público-alvo da nutricionista é específico para pessoas jovens e saudáveis e, portanto, a amostra não representa a população total. ` Existem pessoas que não estão diagnosticadas com HAS, mas já tem a doença e, provavelmente, alguns dos 20 pacientes estavam nessa situação. Para profissionais da saúde, a principal característica de probabilidade é que ela não é capaz de determinar resultados. Então, por mais que eu tenha o gene marcador de cân- cer, que me dá 95% de probabilidade de desenvolver a doença, isso não significa que eu de fato eu terei câncer. Além disso, pode-se soma a isso a interpretação da chance é subjetiva, isto é, alguém pode achar que 95% de chance de ter câncer é muito alta e querer, portanto, fazer tratamentos precoces e cirurgias para evitar a doença. Outra pessoa pode achar que uma sobrevida de 5% alta e que vai aproveitar esse resultado para aproveitar a vida. A reação das pessoas às probabilidades de eventos relaciona- dos a sua saúde é muito variável. Por isso, toda vez que se for discutir probabilidade de sucesso do tratamento, de voltar a andar ou de “voltar ao normal”, é importante deixar claro que probabilidade não garante um futuro. A longo prazo, por sua vez, é possível que a proporção de eventos observados se aproxime da probabilidade do evento acontecer. Nesse sentido, considere que a média de sobrevida após um diagnóstico de câncer de pulmão é de 1 ano. Um profissional começa seu trabalha em uma clínica de oncologia e, com o passar do tempo e de atendimentos, ele observará que a maioria dos casos de fato morrem próximo de 1 ano de diagnóstico. No entanto, ha- verá exceções, desde quem morreu dias depois ou de quem demorou 5 anos para falecer. U3 40Bioestatística e Epidemiologia Estatística descritiva Com a experiência, os dados vão cada vez mais se aproximar da distribuição normal. Contudo, sempre há a chance de alguém ser a exceção, que em estatística pode ser chamado de ponto fora da curva (outlier). Ao ter um diagnóstico, não é possível saber em qual parte da curva você ficará, mas é possível saber quais são as probabilidades. Portanto, as probabilidades devem ser usadas no cotidiano do profissional de saúde. O uso da probabilidade ocorre principalmente como referência para decisão de condutas e possíveis pré-conceitos que ajudam no atendimento. Dessa forma, é preciso ter um equilíbrio e saber quando usar e como transmitir a informação para pacientes ou usuários. 3. DISTRIBUIÇÃO NORMAL Os matemáticos no século XIX observaram que, em grande escala ou na natureza, os eventos bio- lógicos tendem a seguir uma mesma distribuição de frequência. Desse modo, pode-se pressupor que as variáveis de uma pesquisa tenham distri- buição normal ou testar estatisticamente se a cur- va dos dados observados é similar. A Figura 2 representa que os eventos tendem a se repetir próximo a posição central e que poucos casos acontecem longe do esperado. Portanto, a curva do gráfico representa a distribuição normal e, também, pode ser chamada de curva de Gauss. A distribuição normal tem características bem co- nhecidas que são iguais para todas as variáveis que apresentem a distribuição. O comportamento da variável será independente do valor das me- didas de tendência e dispersão e do que se está medindo (peso, tempo de sobrevida e tempera- tura corpórea). Dessa forma, variáveis contínuas tendem a formar curvas mais próximas à teórica por conseguir aferir os valores de forma contínua. A curva da distribuição normal é em formato de sino e é simétrica em torno da média, isso faz com que a mediana e a moda sejam iguais a média. Toda a população está sobe a curva, em que metade tem valores menores do que a média. A distribuição da frequência de eventos em torno da média é uma constante. Assim, por meio de cálculos matemático, chegou-se a proporção descrita na Figura 3. Figura 02. Esquema que descreve a distribuição normal Fo nt e: 1 23 rf. 41 Bioestatística e Epidemiologia U3 Estatística descritiva ` 68,26% dos dados estão a um desvio padrão (𝜎) da média (µ). � Fórmula limite inferior µ σ= − . � Fórmula limite superior .µ σ= + ` 95,44% dos dados estão a dois desvios padrões (2𝜎) da média (µ). � Fórmula limite inferior 2µ σ= − . � Fórmula limite superior 2µ σ= + . ` 99,72% dos dados estão a três desvios padrões (𝜎) da média (µ). � Fórmula limite inferior 3µ σ= − . � Fórmula limite superior 3µ σ= + . Figura 03. Frequência relativa dos eventos a partir de distâncias de desvios-padrões (𝜎) da média (µ) Fonte: 123rf. Para calcular os limites mínimos e máximos que estão na proporção de casos, é só somar ou subtrair do desvio padrão da média. Considere que, o tempo de duração de sintomas de uma doença febril tem distribuição normal, em que a média de duração dos sintomas é de 7 dias com um desvio padrão de 1,4 dia. Essas medidas foram calcula- U3 42Bioestatística e Epidemiologia Estatística descritiva das em uma amostra representativa com tamanho amostral adequado e o estudo não apresentou vieses. Pelas características da distribuição normal, temos: ` 68,26% dos casos dessa doença teriam de 5,6 a 8,4 dias de sintomas. � Fórmula limite inferior 7 1,4 5,6µ σ= − = − = . � Fórmula limite superior 7 1,4 8,4µ σ= + = + = . ` 95,44% dos casos dessa doença teriam de 4,2 a 9,8 dias de sintomas. � Fórmula limite inferior ( )7 2 1,4 7 2,8 4,2µ σ= − = − × = − = . � Fórmula limite superior ( )7 2 1,4 7 2,8 8,4.µ σ= + = + × = + = ` 99,72% dos casos dessa doença teriam de 5,6 a 8,4 dias de sintomas. � Fórmula limite inferior ( )7 3 1,4 7 4,2 0µ σ= − = − × = − = . � Fórmula limite superior ( )7 3 1, 4 7 4,2 11,2µ σ= + = + × = + = . Com as diversas frequências que a curva de distribuição normal fornece, pode-se pen- sar em probabilidades de eventos acontecerem e na definição de situações normais. 4. ANORMALIDADES Há várias estratégias para definir se um comportamento, resultado, sinal ou sintoma está dentro do padrão ou “normal”. Nesse sentido, a mais comum e mais utilizada é a definição de que é normal tudo que acontece com grande frequência. A principal refe- rência são os padrões da curva de distribuição normal, em que há um consenso de que tudo que está dentro de 2 desvios padrões da média (95,44%) é normal. Se a pessoa se encontra nos extremos da curva de Gauss, ela pode ser uma pessoa saudável com padrões de referência fora do comum ou pode ser uma pessoa doen- te. Desse modo, cabe julgar outras características, sinais e sintomas do paciente. Por exemplo, ao atender uma pessoa com temperatura de 37,3ºC que está com calafrios e dor no corpo, pode-se considerar que ela está com febre apesar de o valor da tem- peratura estar dentro do normal, ao mesmo tempo que uma pessoa com 38ºC e sem nenhum sintoma pode estar saudável. Com isso, outro critério que se pode usar para definir normalidade é apresentar uma forma clínica diferente do que é considerado um bom estado de saúde. O quanto de choro é considerado fora do normal para alguém de luto ou todo choro é patológico? Se ao tratar a provável anormalidade e a pessoa melhorar é possível definir que o quadro era anormal. 43 Bioestatística e Epidemiologia U3 Estatística descritiva 5. OBJETO DE APRENDIZAGEM A definição de normalidade ou alteração de peso nas crianças foi feita a partir dos con- teúdosaprendidos na unidade de hoje. A Organização Mundial da Saúde (OMS) dispo- nibiliza as curvas de crescimento (peso, altura e índice de massa corpórea por peso) com pontos de corte, a partir de percentis ou de escore z (1). A Figura 4 é um exemplo de curva de peso por idade, em que as curvas com escore z usa como base o desvio padrão, em que 1 escore significa 1 desvio padrão. Peso-por-idade MASCULINO De 0 a 2 anos (escore z) Pe so (K g) Idade (meses e anos completos) 0 1 2 3 4 5 6 7 8 9 10 11 1 ano Meses 2 anos 1 2 3 4 5 6 7 8 9 10 11 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Fonte: OMS ([s.d.], [n. p.]). A caderneta de saúde da criança (BRASIL, 2017) é a carteira de vacinação com diver- sas outras informações sobre o crescimento e o desenvolvimento dela. Entre as infor- mações disponíveis nesse impresso temos a Figura 5, que compara pontos de corte em percentis e em desvio padrão (escore z). Figura 04. Gráfico da curva de crescimento de peso por idade de crianças do sexo masculino de 0 a 2 anos com ponto de corte a partir do escore z U3 44Bioestatística e Epidemiologia Estatística descritiva Figura 05. Medidas de dispersão escores z e percentis +3,0 escores z +2,0 escores z +1,881 escore z +0,674 escore z -0,674 escore z 97º percentil 75º percentil 25º percentil +1,645 escore z 95º percentil +1,282 escore z 90º percentil +1,0 escore z Média 99,85º percentil 97,72º percentil 84,2º percentil 50º percentil 15,8º percentil 2,28º percentil 0,15º percentil = mediana ( 110% A/I 120% P/I)~= ~= -1,0 escore z -2,0 escore z -3,0 escore z ( 90% A/I 80% P/I)~= ~= -1,282 escore z 10º percentil -1,645 escore z 5º percentil -1,881 escore z -2,67 escore z 3º percentil 0,4º percentil Fonte: Brasil (2017, p. 52). Pela OMS ([s.d.]), a definição de normalidade do peso é a partir de onde a criança está no gráfico. Logo, as definições variam conforme a idade e variável (peso, altura ou ín- dice de massa corpórea). Tabela 01. Pontos de corte e classificação do peso para a idade para crianças de 0 a 10 anos PONTO NO GRÁFICO CLASSIFICAÇÃO DO PESO > +2 escores z Peso elevado para idade. ≥ -2 e ≤ +2 escores z Peso adequado para idade. ≥ -3 e ≤ -2 escores z Peso baixo para idade. < -3 escores z Peso muito baixo para idade. Fonte: Brasil (2011, p. 15). Uma criança brasileira do sexo masculino que fará 2 anos de idade daqui dois dias pesa 16,5kg. Após colocar esses valores na curva de crescimento (Figura 4), o que tem mais chance de ser real: 45 Bioestatística e Epidemiologia U3 Estatística descritiva a. A criança tem padrões fora do frequente, então, aquele peso é adequado para ela; ou b. A probabilidade desse menino ter uma anormalidade é baixa, então, pode-se considerar que o peso não é adequado para a idade? Comentário: O mais provável é que a criança esteja com peso elevado para a idade e, portanto, algum tipo de orientação dietética deve ser realizada. A probabilidade é baixa (menor de 4,56%) da criança estar com peso adequado e ter características diferentes da maioria da população e, por isso, estar fora da faixa de normalidade da curva. Nesse sentido, as informações sobre a altura e o índice de massa corpórea (IMC), que também tem seus gráficos, pode ajudar na interpretação do dado. Se só no peso a criança está acima da curva de 2 escores z, significa que a criança está acima do peso. Outra estra- tégia que contribui para a avaliação é acompanhar o peso da criança ao longo do tempo, a fim de saber se ela está seguindo as inclinações das curvas de referência ou teve um aumento fora do esperado. U3 46Bioestatística e Epidemiologia Estatística descritiva REFERÊNCIAS BIBLIOGRAFICAS BRASIL. Ministério da Saúde. Caderneta de saúde da criança: menino. 11 ed. Brasília, DF: Ministério da Saúde, 2017. Disponível em: http://bvsms.saude.gov.br/bvs/publicacoes/caderneta_saude_crianca_meni- no_11ed.pdf. Acesso em: 9 fev. 2021. BRASIL. Ministério da Saúde. Secretaria de Atenção à Saúde. Departamento de Atenção Básica. Orienta- ções para a coleta e análise de dados antropométricos em serviços de saúde: Norma Técnica do Sis- tema de Vigilância Alimentar e Nutricional - SISVAN. Brasília, DF: Ministério da Saúde, 2011. Disponível em: http://189.28.128.100/dab/docs/portaldab/publicacoes/orientacoes_coleta_analise_dados_antropometricos. pdf. Acesso em: 9 fev. 2021. FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. Epidemiologia clínica: elementos essenciais. 5. ed. Porto Alegre: ArtMed, 2014. ORGANIZAÇÃO MUNDIAL DA SAÚDE (OMS). Curva de crescimento peso por idade meninos de 0 a 2 anos – escore z. Disponível em: https://www.who.int/docs/default-source/child-growth/child-growth-standards/indicators/weight-for-age/cht-w- fa-boys-z-6-2.pdf?sfvrsn=ec5b30eb_6. Acesso em: 9 fev. 2021. ORGANIZAÇÃO MUNDIAL DA SAÚDE (OMS). Documentos com padrões de crescimento de crianças. Dispo- nível em: https://www.who.int/tools/child-growth-standards/standards. Acesso em: 9 fev. 2021. VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016. about:blank about:blank about:blank about:blank about:blank about:blank 48 UNIDADE 4 EPIDEMIOLOGIA DESCRITIVA INTRODUÇÃO É possível saber a proporção de pessoas que tem diabetes ou que usam drogas ilíci- tas? Ao longo do tempo, será que o número de casos de AIDS reduziu no Brasil? Neste país, será que há regiões que têm mais ou menos casos que as outras? A AIDS é mais frequente em algum tipo de população? As informações abordadas nessa unidade aju- darão você a entender como essas informações podem ser obtidas. Nesta unidade, abordaremos os tipos de estudos epidemiológicos, que são classifica- dos como descritivos ou analíticos. Os estudos analíticos buscam associações entre variáveis, como fatores de risco para doença ou desfechos possíveis de um evento. Enquanto os estudos descritivos têm como objetivo principal descrever características da doença, pessoas, locais ou tempo, como também para identificar casos, analisar tendências, fazer diagnóstico situacional da população e gerar hipóteses. Além disso, há outra classificação quanto a intervenção estudada, por exemplo, os estudos observacionais têm as intervenções decididas por profissionais de saúde que não pertencem a equipe da pesquisa. A pesquisa, por sua vez, só observa o que foi realizado. Já nos estudos experimentais, a decisão de qual intervenção o participante da pesquisa será submetido é realizada pelos pesquisadores. 1. ESTUDO TRANSVERSAL, DE PREVALÊNCIA E SECCIONAL O estudo transversal é descritivo e observacional. Esse nome tem origem da definição que as informações são coletadas em um único ponto do tempo, como se a linha do tempo sofresse um corte transversal ou como uma fotografia, ele também pode ser chamado de estudo sec- cional ou de prevalência. A principal característica do estudo transversal é que as informações das variáveis dependentes e independentes são coletadas simultaneamente. Figura 01. Esquema do desenho de estudo transversal Pessoa com presença de uma ou mais variáveis independentes. Pessoa com presença de uma ou mais variáveis independentes. Pessoas com presença da variável dependente Pessoas com presença da variável dependente Fonte: elaborada pela autora. 49 Bioestatística e Epidemiologia U4 Epidemiologia descritiva Dessa forma, a principal finalidade desse tipo estudo é medir e descrever frequências de doenças e fatores de risco. Normalmente, ele é utilizado para descrever doenças comuns e de longa duração, como levantamentos de dados que descrevem dados já registrados e os inquéritos populacionais de saúde que buscam as informações para complementar os dados coletados por outros meios. A Pesquisa Nacional de Saúde (PNS) é o inquérito de saúde da população brasileira, por meio de entrevistas com amostra de base domiciliar e de âmbito nacional, realizada em parceria com o Instituto Brasileiro
Compartilhar