Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

BIOESTATÍSTICA 
E EPIDEMIOLOGIA
FOTO CAPA
RENATA CRISTOFANI MARTINS
BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Renata Cristofani Martins
2021
PRESIDENTE 
Frei Thiago Alexandre Hayakawa, OFM
DIRETOR GERAL 
Jorge Apóstolos Siarcos 
REITOR 
Frei Gilberto Gonçalves Garcia, OFM 
VICE-REITOR 
Frei Thiago Alexandre Hayakawa, OFM
PRÓ-REITOR DE ADMINISTRAÇÃO E PLANEJAMENTO 
Adriel de Moura Cabral 
PRÓ-REITOR DE ENSINO, PESQUISA E EXTENSÃO 
Dilnei Giseli Lorenzi 
COORDENADOR DO NÚCLEO DE EDUCAÇÃO A DISTÂNCIA - NEAD 
Renato Adriano Pezenti
GESTOR DO CENTRO DE SOLUÇÕES EDUCACIONAIS - CSE
Fernando Rodrigo Andrian
CURADORIA TÉCNICA
Michele Lacerda Pereira Ferrer
DESIGNER INSTRUCIONAL 
Paloma Larissa Souza Guimarães de Lima
 REVISÃO ORTOGRÁFICA
Daniela Mandú
PROJETO GRÁFICO
Centro de Soluções Educacionais - CSE
DIAGRAMADORES
Daniel Luis Landucci
Lucas Ichimaru Testa
CAPA
Daniel Luis Landucci
© 2021 Universidade São Francisco
Avenida São Francisco de Assis, 218
CEP 12916-900 – Bragança Paulista/SP
CASA NOSSA SENHORA DA PAZ – AÇÃO SOCIAL FRANCISCANA, PROVÍNCIA 
FRANCISCANA DA IMACULADA CONCEIÇÃO DO BRASIL – 
ORDEM DOS FRADES MENORES
RENATA CRISTOFANI MARTINS
Renata Cristófani Martins possui Bacharel em Enfermagem pela Escola de Enferma-
gem da Universidade de São Paulo (2005), Licenciatura Plena em Enfermagem pela 
Faculdade de Educação da Universidade de São Paulo (2010), mestrado e doutorado 
pelo Programa de Saúde Pública da Faculdade de Saúde Pública Universidade de São 
Paulo (2012 e 2017). Sua linha de pesquisa é epidemiologia, estatística vital e morta-
lidade. Foi integrante da pesquisa “Uma nova ferramenta para a codificação e seleção 
automáticas da causa de morte: adequação do Software Iris para uso no Brasil” com 
financiamento da FAPESP. Trabalhou dois anos como enfermeira de uma Equipe de 
Saúde da Família e cinco anos como professora de curso técnico de enfermagem. Atu-
almente é professora universitária na Universidade São Francisco nos diversos cursos 
da área da saúde ministrando os componentes curriculares Bioestatística aplicada à 
saúde, Epidemiologia, Saúde pública e Prática médica e sociedade IV. Em 2020, oi 
a pesquisadora responsável pelo inquérito populacional de prevalência de anticorpos 
para Sars-Cov-2 em Bragança Paulista (SP).
A AUTORA
SUMÁRIO
UNIDADE 01: INTRODUÇÃO À BIOESTATÍSTICA E EPIDEMIOLOGIA ............8
1. Definição de bioestatística ..................................................................................8
2. Definição de epidemiologia .................................................................................9
3. Método de pesquisa ...........................................................................................11
4. Objeto de Aprendizagem .....................................................................................16
UNIDADE 02: COLETA, ORGANIZAÇÃO E DESCRIÇÃO DOS DADOS ............18
1. Coleta de dados ..................................................................................................18
2. Resultados ..........................................................................................................21
3. Objeto de Aprendizagem .....................................................................................28
UNIDADE 03: ESTATÍSTICA DESCRITIVA ............................................................32
1. Medidas de dispersão .........................................................................................32
2. Probabilidade ......................................................................................................38
3. Distribuição normal ..............................................................................................40
4. Anormalidades .....................................................................................................42
5. Objeto de aprendizagem .....................................................................................43
UNIDADE 04: EPIDEMIOLOGIA DESCRITIVA ......................................................48
1. Estudo transversal, de prevalência e seccional ..................................................48
2. Série ou relato de casos ......................................................................................50
3. Estudos ecológicos .............................................................................................50
4. Distribuição de eventos por pessoas, tempo e lugar ................................................. 52
5. Objeto de Aprendizagem .....................................................................................55
UNIDADE 05: INDICADORES DE SAÚDE ............................................................58
1. Conceito, histórico e características de um bom indicador ................................58
2. Incidência e prevalência ......................................................................................59
3. Indicadores de natalidade, fecundidade e morbidade .........................................64
4. Objeto de Aprendizagem .....................................................................................69
UNIDADE 06: TRANSIÇÃO DEMOGRÁFICA E EPIDEMIOLÓGICA ...................74
1. Indicadores de mortalidade ................................................................................74
2 Transição demográfica e epidemiológica .............................................................84
3. Objeto de Aprendizagem .....................................................................................88
UNIDADE 07: ESTUDOS OBSERVACIONAIS ANALÍTICOS ...............................90
1. Estudo Coorte .....................................................................................................90
2. Estudo de prognóstico .........................................................................................95
3. Estudo caso-controle ...........................................................................................97
4. Objeto de Aprendizagem .....................................................................................100
UNIDADE 08: MEDIDAS DE ASSOCIAÇÕES .......................................................102
1. Risco relativo e risco atribuível ............................................................................104
2. Razão de chances (odds ratio) ...........................................................................108
3. Análise de sobrevida ...........................................................................................111
4. Objeto de Aprendizagem .....................................................................................114
UNIDADE 09: ESTUDOS EXPERIMENTAIS .........................................................116
1. Ensaio clínico ......................................................................................................116
2. Objeto de aprendizagem .....................................................................................126
UNIDADE 10: ESTUDO DIAGNÓSTICO ................................................................128
1. Definição .............................................................................................................128
2. Medidas ...............................................................................................................131
3. Teste diagnósticos múltiplos ................................................................................141
4. Objeto de Aprendizagem .....................................................................................142
UNIDADE 11: RESULTADOS: ANÁLISE E APRESENTAÇÃO .............................144
1. Análise estatística ................................................................................................144
2. Uso de softwares .................................................................................................153
3. Apresentação dos resultados ..............................................................................1564. Objeto de Aprendizagem. ....................................................................................159
UNIDADE 12: CAUSALIDADE E SAÚDE BASEADA EM EVIDÊNCIA ................162
1. Causalidade ........................................................................................................162
2. Revisão sistemática ............................................................................................166
3. Saúde baseada em evidência .............................................................................169
4. Objeto de Aprendizagem .....................................................................................171
8
UNIDADE 1
INTRODUÇÃO À BIOESTATÍSTICA 
E EPIDEMIOLOGIA
INTRODUÇÃO
Muitas pessoas, mesmo sem saber, já usa-
ram fundamentos e partes da estatística e 
da epidemiologia em seu dia a dia. Ao or-
ganizar uma festa, por exemplo, usamos o 
conceito de estatística para preparar a lista 
de compras de comida. Se no churrasco 
teremos 20 convidados e, conforme as 
informações encontradas na internet, em 
média, o consumo de carne por pessoa é 
100g, comprar 2kg de carne será suficiente 
para o evento? Saber o sexo e a idade dos 
convidados influencia na minha compra? 
Será que posso confiar na informação que 
eu encontrei na internet? Para responder essas perguntas, você utilizará conceitos de 
estatística e epidemiologia.
“Estatística é a ciência que fornece os princípios e os métodos para coleta, organização, 
resumo, análise e interpretação de informações” (VIEIRA, 2016, p. 1).
Im
po
rt
an
te
!
1. DEFINIÇÃO DE BIOESTATÍSTICA
Contar, medir, comparar e resumir informações são ações que estão presentes no cotidiano 
de todas as pessoas, independentemente da profissão. No entanto, a forma com que esses 
processos são realizados influencia na qualidade da informação obtida. A mídia divulga que 
um em cada cinco brasileiros terão hipertensão arterial sistêmica, mas saber que essa infor-
mação foi obtida em uma pesquisa com 50 indígenas no Canadá ou em uma população com 
2.500 pessoas de todos os estados do Brasil mudaria o quanto você confia na informação?
A estatística não se resume a números e cálculos, ela considera todo o processo desde 
o modo em que os dados são coletados e analisados até a forma com que eles são 
interpretados e divulgados.
Figura 01. Estatística
Fo
nt
e:
 1
23
rf.
9 Bioestatística e Epidemiologia
U1 Introdução à Bioestatística e Epidemiologia
Epidemiologia é “[...] ciência que estuda o processo saúde-doença em coletividades 
humanas, analisando a distribuição e os fatores determinantes do risco de 
doenças, agravos e eventos associados à saúde, propondo medidas específicas 
de prevenção, controle ou erradicação de doenças, danos ou problemas de saúde 
e de proteção, promoção ou recuperação da saúde individual e coletiva, produzindo 
informação e conhecimento para apoiar a tomada de decisão no planejamento, 
administração e avaliação de sistemas, programas, serviços e ações de saúde”. 
(ROUQUAYROL; GURGEL, 2018, p. 9, grifos nossos)
IM
PO
R
TA
N
TE
!
2. DEFINIÇÃO DE EPIDEMIOLOGIA
Historicamente, a epidemiologia conta sobre os eventos relacionados à saúde, como nas-
cimentos, casos de doenças e mortes. Um exemplo clássico se refere a John Snow, o pai 
da Epidemiologia moderna, que, no século XIX, investigou a epidemia de cólera em Lon-
dres, avaliando os casos e onde eles aconteceram para que, a partir dessas informações, 
conseguisse propor hipóteses causais e estratégias para reduzi-los. Esse marco amplia a 
atuação da epidemiologia para investigações sistemáticas de eventos com a finalidade de 
levantar hipóteses, definir meios de transmissão da doença e estratégias de ação 
Com o passar do tempo, a epidemiologia ampliou seu objeto de estudo para além das 
doenças transmissíveis, investigando o processo saúde-doença. Dessa forma, começa 
a busca por fatores de risco ou fatores determinantes para acontecimento de especí-
ficas doenças, como o câncer, por exemplo. Nesse sentido, estrutura-se desenhos de 
estudos que possibilitam definir fatores causais.
2.1 CONCEITOS BÁSICOS
Para responder uma questão de estudo, uma parte importante da pesquisa se refere à 
composição e definição das variáveis do estudo. Variáveis são valores ou informações 
obtidas diretamente ou podem ser resultado de um agrupamento, classificação ou 
cálculo de medidas coletadas. Elas podem ser características individuais, determinantes 
do processo saúde-doença, fatores de risco, eventos clínicos e desfechos, como morte, 
presença de doença, deficiência, sintomas e qualidade de vida.
A epidemiologia classifica as variáveis de um estudo típico em três tipos, de acordo com 
Fletcher et al. (2014, p. 6), uma variável independente é o suposto fator de risco ou 
causa que se estuda, ela pode explicar a causa do problema; uma variável dependen-
te, por sua vez, é o suposto desfecho ou efeito que se estuda, ela mede o fenômeno 
que se quer explicar, pode sofrer influência das variáveis independentes, como a rela-
ção entre cigarro e câncer de pulmão. Segundo Pereira (2004, p. 46), nesse caso, a 
variável dependente seria o câncer de pulmão, pois sua presença pode ser influenciada 
pela variável independente cigarro. Por fim, uma variável externa não faz parte direta 
da questão principal, mas pode estar relacionada e afetar a relação entre a variável 
independente e dependente. Um fator de confusão é um exemplo de variável externa. 
U1
10Bioestatística e Epidemiologia
Introdução à Bioestatística e Epidemiologia
A qualidade de uma pesquisa é avaliada a 
partir da presença de erros cometidos. Nes-
se contexto, viés é um erro sistemático e 
ao delinear o projeto é preciso pensar em 
estratégias metodológicas que diminuam a 
chance desse erro acontecer.
Existem três principais tipos de vieses: o viés 
de seleção, viés de aferição e viés de con-
fusão ou de confundimento. O primeiro, 
ocorre quando se comparam grupos com ca-
racterísticas diferentes que não são as variá-
veis principais, mas que influenciam no des-
fecho. Isso acontece porque a seleção da amostra foi falha é que alguma característica 
não foi considerada, por exemplo, ao fazer uma pesquisa sobre uma possível medicação 
que emagrece, a pesquisa não considerou o grau de atividade física dos sujeitos. Então, 
aqueles que tomaram o remédio e emagreceram podem ser fisicamente ativos e os que 
não tomaram a medicação sejam sedentários. Como a seleção da amostra nos grupos não 
considerou a atividade física, não é possível considerar que o emagrecimento de fato foi por 
causa da medicação, pois foram comparados grupos com características diferentes.
Figura 02. Variáveis e vieses de pesquisa
Fo
nt
e:
 1
23
rf.
O viés de aferição ocorre quando o erro é na aferição de alguma variável, como 
usar uma balança não calibrada, realizar a técnica incorreta de aferição da pres-
são arterial ou usar equipamentos diferentes para aferir alguma variável. 
O viés de confusão ou de confundimento ocorre quando duas variáveis po-
dem influenciar o efeito que uma tem sobre um desfecho ou quando se con-
funde qual variável influencia no desfecho. Desse modo, será que uma variável 
realmente causa o desfecho ou essa associação não existe e a verdadeira 
causa na verdade é outra variável? 
Um fator de confusão está associado à exposição, ele deve ter uma associação causal 
com o desfecho e não deve ser uma etapa do caminho da exposição gerar o desfecho. 
Por exemplo, uma pesquisa demonstra uma associação de depressão como fator cau-
sal para ter câncer de pulmão. 
Nesse contexto, um fator de confundimento é o tabagismo, pois fumar causa câncer 
de pulmão e fumar está associado à depressão, pois esse é um hábito apresentado 
frequentemente em pacientes com câncer de pulmão. Portanto, o viés de confusão 
ocorre com a variável tabagismo, que impacta da associação principal da pesquisa, 
depressão e câncer de pulmão.
11 Bioestatística e Epidemiologia
U1 Introdução à Bioestatística e Epidemiologia3. MÉTODO DE PESQUISA 
Uma pesquisa tem várias etapas, logo, ao desenvolver o método que será utilizado na coleta 
e análise dos dados devemos realizar diversas escolhas. Essas decisões devem ser feitas 
com o objetivo de melhorar a qualidade da pesquisa, mas, como nem sempre isso é possível, 
o pesquisador pode ser obrigado a escolher a opção mais viável e não a mais adequada. 
Para ajudar na decisão do pesquisador é importante saber as vantagens e desvan-
tagem de cada possibilidade. Assim, ter o conhecimento de quais são os possíveis 
vieses que podem acontecer são conhecimentos essenciais para desenhar o estudo 
de maneira a contornar as dificuldades.
IM
PO
R
TA
N
TE
!
3.1 AMOSTRAGEM
Uma das primeiras etapas ao realizar ou avaliar uma pesquisa é decidir quem serão os 
participantes. Por exemplo, considere que você se deseja realizar uma pesquisa sobre 
a frequência do uso de drogas, lícitas e ilícitas, nos universitários que moram no Brasil. 
Pela facilidade de acesso, você aplica um questionário com os estudantes da Univer-
sidade São Francisco (USF) que estão cursando o componente curricular de Bioesta-
tística e Epidemiologia. Nesse contexto, realizar a coleta de dados dessa maneira trará 
resultados confiáveis e compatíveis com o objetivo da pesquisa?
Na pesquisa, considera-se população o grupo de pessoas que tem a característica que 
desejamos estudar, já a amostra é composta pelos indivíduos que foram selecionados 
para a pesquisa (VIEIRA, 2016, p. 91). No exemplo da pesquisa sobre drogas, a po-
pulação é: todos os universitários que moram no Brasil e a amostra é: todos os alunos 
que responderam ao questionário. Uma amostra pode ser adequada se for capaz de 
fornecer resultados similares aos que existem na população.
Na maioria dos casos, usa-se uma amostra principalmente pela economia do tempo e 
custo, como não é viável fazer exame laboratorial em todos os moradores da cidade 
para saber a proporção de munícipes que tem alguma doença. Segundo Viera (2016, 
p. 92-93), as pesquisas que realizam levantamento de dados de toda a população são 
chamadas de censo e não precisam de amostragem. 
Outro motivo para usar amostras é em ca-
sos em que não é possível estudar toda 
a população. Por exemplo, você deixou 
uma embalagem de leite aberta a noite 
inteira fora da geladeira e, agora, precisa 
saber se o leite já estragou. Se a análise 
da qualidade for feita com todo o conteú-
do do pacote, mesmo que o resultado seja 
que é possível consumir o leite, não seria 
possível realizar isso já que todo o produto 
foi utilizado no teste. Nesse caso, é obrigatório o uso de uma amostra de pequena 
quantidade do produto para que, se possível, utilizar o restante.
Figura 03. Amostragem
Fo
nt
e:
 1
23
rf.
U1
12Bioestatística e Epidemiologia
Introdução à Bioestatística e Epidemiologia
O uso de amostra tem um valor científico impactante, pois, ao usar menos sujeitos é 
possível coletar dados mais completos. Se a amostragem foi realizada corretamente, os 
valores reais que devemos encontrar na população estarão dentro de uma margem de 
erro do valor encontrado na amostra (VIEIRA, 2016, p. 93-94).
As características das pessoas da amostra impactam na qualidade do resultado. Por 
isso, as descrições dos sujeitos da pesquisa e de todas as etapas de seleção desses 
indivíduos são essenciais para avaliar a qualidade dos resultados.
IM
PO
R
TA
N
TE
!
Métodos amostrais
É possível obter uma amostra por diversos métodos. Assim, escolher qual método utilizar 
é uma decisão dos pesquisadores a partir de suas características, vantagens e desvanta-
gens. Logo, é de extrema importância que o método seja seguido exatamente como defi-
nido e que sua descrição permita que ele seja reproduzido. Nesse sentido, muitas pessoas 
comparam os métodos de uma pesquisa com uma receita culinária, em que é preciso deixar 
claro todas as etapas para que outros consigam realizar e chegar no mesmo resultado.
Uma amostra probabilística ou aleatória é quando a seleção dos sujeitos de pesqui-
sa é feita ao acaso. Na prática, isso significa que a seleção foi feita por sorteio. Nessa 
técnica, um princípio importante é que todos os indivíduos da população têm a mesma 
probabilidade conhecida de participarem da amostra. Para que ela possa ser executada 
é necessário conhecer e identificar toda a população. 
Considere uma pesquisa da cidade de Votorantim (SP), com o objetivo de investigar quais 
são as medicações que os residentes com diabetes mellitus usam. Nesse caso, a população 
se trata dos diabéticos que moram na cidade. Seria possível ter conhecimento de quem são 
todos indivíduos da população antes de realizar o sorteio? Ainda não temos um cadastro obri-
gatório e único com informações de saúde da população, independentemente de as pessoas 
serem ou não usuárias do Sistema Único de Saúde (SUS). Por não ser possível listar todos 
os diabéticos da cidade, não é possível obter uma amostra aleatória para essa pesquisa.
A amostra pode ser aleatória simples quando o sorteio acontece a partir de toda a popu-
lação. Esse método é utilizado quando a população é homogênea e não existem caracte-
rísticas individuais que irão atrapalhar a análise dos dados. Porém, há casos que alguns 
subgrupos podem ter características diferentes que influenciem nos dados coletados. 
Ao fazer uma avaliação sobre a disciplina Estudo do Ser Humano Contemporâneo da 
USF, pode-se considerar que os estudantes terão avaliações similares independente do 
curso ou área de conhecimento que cursam? Nesse contexto, podemos supor que os 
alunos da área de humanas devem gostar mais da disciplina do que os alunos de exa-
tas, portanto, a população não é homogênea. Em casos como o descrito anteriormente, 
a amostra pode ser aleatória estratificada. Esse método é usado quando a população 
tem subgrupos (estratos) que podem ter comportamentos diferentes. 
13 Bioestatística e Epidemiologia
U1 Introdução à Bioestatística e Epidemiologia
Para selecionar a amostra, deve-se dividir a população nos subgrupos e sortear os su-
jeitos em cada estrato, desse modo, podemos garantir a representação de cada subgru-
po. Normalmente, os estratos são sexo, idade e/ou classe social, mas eles podem ser 
divididos conforme as características da população. A distribuição do número de partici-
pantes da pesquisa em cada extrato deve ser proporcional a distribuição dos subgrupos 
na população. Se a população é distribuída com 30% sexo masculino e 70% feminino, 
uma amostra estratificada de 10 indivíduos deve selecionar 7 mulheres e 3 homens.
Exemplo 1
Considere uma pesquisa com o objetivo de avaliar a proporção de pessoas com depressão entre 
os estudantes matriculados na Universidade São Francisco. Entre 10.350 estudantes, 33% são 
bolsistas. Para obter resultados significativos será necessária uma amostra com 75 pessoas.
Uma amostra aleatória simples seria obtida a partir do sorteio de 75 pessoas entre os 10.350 
estudantes. Já uma amostra aleatória estratificada seria obtida dividindo a população entre 
bolsistas e pagantes, depois sorteando 50 pessoas entre os pagantes e 25 entre os bolsistas 
para manter a proporção com a população.
Uma amostra semiprobabilística tem parte do processo de seleção aleatório. A amostra 
sistemática tem regras pré-estabelecidas que devem ser seguidas sistematicamente. 
A parte aleatória acontece por meio de um sorteio que indica o valor que deve ser sor-
teado e repetido sistematicamente. Para utilização desse método, é necessário que 
a população esteja distribuída em ordem e, por isso, esse é um método comum para 
seleção de prontuários. A primeira etapa é dividir a população em grupos, em que o 
número de grupos deve ser igual ao número de indivíduos na amostra. A segunda etapa 
se trada de sortear um número dentro de uma faixa de valor que é definida pelo número 
de pessoas em cada grupo. Após o sorteio, deve-se selecionar a pessoa que ocupa a 
posição sorteada em cada grupo. Se a população é de 250 pessoas e se desejauma 
amostra de 10 indivíduos, a amostra sistemática será a seleção da sétima pessoa de 
cada grupo considerando que o sorteio de 1 a 25 deu 7.
A amostra por conglomerados seleciona grupos de pessoas definidos por algum moti-
vo que são encontrados na população, como um município, uma clínica ou uma escola. 
Nesse caso, o sorteio não é dos sujeitos e sim dos conglomerados. Para utilização desse 
método, o pesquisador deve ter acesso a todos os conglomerados possíveis, ou o pesqui-
sador corre o risco de ter uma amostra que não tem acesso. A vantagem dessa amostra 
é concentrar a coleta em menos locais, em vez de sortear entre todas as internações do 
município e correr o risco de ter que coletar dados em múltiplos hospitais, com esse mé-
todo é possível sortear o conglomerado e realizar a pesquisa em um único local.
Em alguns casos, mais de um método amostral é utilizado. Isso acontece frequente-
mente quando o primeiro método é por conglomerado, pois, dentro de um conglome-
rado pode ter uma quantidade maior do que a necessária. Então, utiliza-se de outro 
método para uma seleção dos indivíduos dento do conglomerado selecionado.
A amostra por cotas seleciona com o objetivo de garantir representatividade e propor-
ção igual a população, a lógica desse método é similar a cotas de vagas para acesso 
U1
14Bioestatística e Epidemiologia
Introdução à Bioestatística e Epidemiologia
aos processos seletivos. A amostra é dividida garantindo vagas para pessoas com ca-
racterísticas diferentes, em que os grupos de cotas são similares aos estratos, frequen-
temente divididos por sexo, idade e/ou classe social. O preenchimento das vagas é por 
acesso, desse modo, nesse método não existe sorteio. Nesse contexto, é comum que o 
entrevistador fique em locais de alto movimento para tentar encontrar pessoas que pre-
encham as características das cotas. Essa é uma estratégia muito utilizada em razão 
de sua praticidade e baixo custo. 
Exemplo 3
Exemplo 2
Considere uma pesquisa com o objetivo de avaliar a proporção de pessoas com depressão entre 
os estudantes matriculados na Universidade São Francisco. Entre 10.350 estudantes, 33% são 
bolsistas. Para obter resultados significativos será necessária uma amostra com 75 pessoas.
Uma amostra de conveniência seria obtida distribuindo o questionário on-line para todos os 
estudantes por meio de grupos de redes sociais.
Considere uma pesquisa com o objetivo de avaliar a proporção de pessoas com depressão 
entre os estudantes matriculados na Universidade São Francisco. Entre 10.350 estudantes, 
33% são bolsistas. Para obter resultados significativos será necessária uma amostra com 75 
pessoas.
Uma amostra sistemática seria obtida sorteando um número de 1 a 138 (considere que o 
resultado foi o número 84). A amostra será a octogésima quarta pessoa de cada grupo de 
138 pessoas.
Já uma amostra por conglomerados seria obtida sorteando uma sala de aula e os participan-
tes da pesquisa seriam quem assiste aula nesse local.
Uma amostra por cotas teria 50 vagas para pagantes e 25 vagas para bolsistas. Para realizar 
a pesquisa, o pesquisador poderia ficar na entrada principal da universidade e perguntar para 
cada aluno se eles eram bolsistas ou pagantes. As primeiras pessoas que preenchessem os 
critérios seriam selecionadas.
A amostra de conveniência ou não probabilística é composta por pessoas que o 
pesquisador tem fácil acesso. Nesse método, não existe sorteio ou alguma etapa que 
garanta aleatoriedade e representatividade da população. Ele é similar ao método 
amostral por cotas, em que a diferença é que, por conveniência, não há os grupos de 
características específicas. Essa é uma das estratégias mais utilizadas por ser muito 
prática e barata, normalmente, os profissionais que desenvolvem pesquisa usam esse 
método ao fazerem a pesquisa somente com os seus pacientes. 
Pessoas leigas podem explicar esse método descrevendo que a seleção das pessoas ocor-
reu ao acaso, conforme encontravam as pessoas na rua. Para estatística, o termo acaso está 
relacionado à aleatoriedade de um evento acontecer e não a ausência de método de coleta.
15 Bioestatística e Epidemiologia
U1 Introdução à Bioestatística e Epidemiologia
Tamanho da amostra
A vantagem da amostra é não precisar avaliar a população inteira. Entretanto, o tama-
nho da amostra tem que ser pequeno para otimizar tempo e recursos, mas grande o su-
ficiente para ter significância estatística. Quanto maior o tamanho da amostra, maiores 
as chances dos valores encontrados (estimativas) serem próximos aos valores reais en-
contrados na população (parâmetros). Para saber se um novo tratamento é eficaz, não 
se pode avaliar somente 10 pessoas, é preciso de um número suficiente que consiga 
garantir que o que foi observado não é uma exceção.
Desse modo, para saber o tamanho ideal existem cálculos que definem o número ideal 
para a amostra ter significância e qualidade. De acordo com a situação, pode-se utilizar 
fórmulas diferentes. Normalmente, os critérios que precisam ser definidos ao fazer o 
cálculo são: margem de erro, nível de confiança e proporção na população.
3.2 INFERÊNCIA ESTATÍSTICA
Uma vez que se obtém os resultados é preciso avaliar a qualidade deles e o quanto é 
possível usá-los para supor que é assim que eventos acontece na população. Então, 
primeiramente, avalia-se a validade interna que define a grau que os resultados represen-
tam a amostra. Um bom estudo sem vieses e erros sempre tem alta validade interna. Por 
sua vez, a validade externa define o quanto o resultado pode representar a população.
Nesse sentido, chama-se de inferência estatística a ação de generalizar os resultados 
da sua amostra para a população. Para fazer a inferência é necessário avaliar as carac-
terísticas da amostra e refletir se ela é representativa da população.
Uma amostra é tendenciosa quando suas características não são similares a popula-
ção. Dessa forma, toda amostra tendenciosa ocorre por viés de seleção. Uma pesquisa 
sobre uso de drogas entre brasileiros teve uma amostra somente de alunos universitá-
rios. Com os dados obtidos não é possível concluir que todos os brasileiros se compor-
tam como na amostra. 
Portanto, para utilizar os resultados da pesquisa para embasar sua conduta profissio-
nal, o estudo tem que ter alta validade interna e externa. Ela não pode ter vieses e uma 
amostra tendenciosa.
Procure nos artigos científicos se os autores deixam claro o método amostral utilizado. 
Será que descrever como foi feita a seleção facilita a avaliação de validade da pesqui-
sa e da presença de vieses? Sem a descrição do método amostral é possível definir a 
presença de viés de seleção?
PA
R
A 
R
EF
LE
TI
R
U1
16Bioestatística e Epidemiologia
Introdução à Bioestatística e Epidemiologia
4. OBJETO DE APRENDIZAGEM
Faça um quadro comparativos dos diferentes métodos amostrais
MÉTODO AMOSTRAL CARACTERÍSTICA VANTAGEM DESVANTAGEM EXECUÇÃO
Aleatória
Simples
Estratificada
Sistemática
Por conglomerados
Por cotas
Conveniência
17 Bioestatística e Epidemiologia
U1 Introdução à Bioestatística e Epidemiologia
REFERÊNCIAS BIBLIOGRÁFICAS
FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. Epidemiologia clínica: elementos essenciais. 5. ed. 
Porto Alegre: ArtMed, 2014.
PEREIRA, J. C. R. Análise de dados qualitativos: estratégias metodológicas para as ciências da saúde 
humanas e sociais. São Paulo: Edusp, 2004.
ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia e saúde. 8. ed. Rio de Janeiro: Medbook, 
2018.
VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016.
18
UNIDADE 2
COLETA, ORGANIZAÇÃO E 
DESCRIÇÃO DOS DADOS
Figura 01. Tipos de variáveis
VARIÁVEIS
QUALITATIVAS 
OU 
CATEGÓRICA
NOMINAL ORDINAL DISCRETA CONTÍNUA
QUANTITATIVA 
OU 
NUMÉRICA
Fonte: elaborada pela autora.
INTRODUÇÃO
Uma parte importante para avaliar a qualidade da pesquisa é ter uma adequada coleta 
dos dados. Qual informação coletar, como aferir e qual instrumento utilizar sãodefini-
ções importantes que um pesquisador deve fazer. Desse modo, toda escolha influencia 
na qualidade e nas análises utilizadas, mas não basta somente coletar corretamente, é 
preciso transmitir os dados e resumir as informações.
1. COLETA DE DADOS
Ao desenhar uma pesquisa é preciso definir quais variáveis coletar e como conduzir 
esse processo. As variáveis são as informações de interesse que a pesquisa pretende 
estudar e suas características influenciam nas análises estatísticas que serão realiza-
das que, por sua vez, definem os resultados. 
A classificação estatística das variáveis está esquematizada na Figura 1, em que as va-
riáveis qualitativas ou categóricas são expressadas por categorias mutualmente exclu-
dentes. Por exemplo, sexo é uma variável qualitativa porque a reposta é por categoria 
(masculino ou feminino) e só é possível ter uma resposta possível.
A variável qualitativa pode ser ordinal quando as categorias possuem uma ordem na-
tural. A ordenação é um consenso e não pode estar associada a juízo de valor pessoal. 
Uma pesquisa de satisfação que tem toda pergunta estruturada com as possibilidades 
de resposta: ruim, satisfatório e bom. Essa é uma variável qualitativa, pois as respostas 
são categorias e é ordinal porque as respostas têm uma ordenação. Um questionário 
fechado tem as possíveis respostas em ordem, mas isso não quer dizer que exista uma 
ordem natural nas respostas para classificá-la como ordinal. Nesse contexto, podemos 
19 Bioestatística e Epidemiologia
U2 Coleta, organização e descrição dos dados
apresentar outros exemplos como escolaridade (ensino infantil, fundamental, médio e 
superior) e tamanho do edema (1+, 2+, 3+, 4+).
A variável qualitativa pode ser nominal quando as categorias não têm uma distribuição 
ordinal. Uma grande parte das variáveis são desse tipo. Na declaração de nascido vivo, 
por exemplo, a variável tipo de parto é coletada com possibilidades de resposta: cesáreo, 
vaginal e ignorado. Apesar das evidências científicas e do juízo de valor que parto vaginal 
é melhor, a ordenação não é natural e, portanto, tipo de parto é uma variável qualitativa 
nominal. Além disso, são outros exemplos de variável qualidade nominal: município de 
residência ou droga ilícita utilizada (maconha, cocaína, crack, LSD, entre outras).
Ademais, algumas variáveis qualitativas nominais podem, também, ser dicotômicas. 
Isto é, quando só há duas respostas possíveis e que elas são excludentes, por exemplo: 
faz uso de tabaco (sim/não), presença ou ausência de pressão alta. Normalmente, as 
respostas desse tipo de variáveis são sim e não.
As variáveis quantitativas ou numéricas são expressas por números com intervalos 
entre os valores iguais, por exemplo, peso e altura. Por sua vez, o grau de estadiamen-
to, apesar de ter respostas numéricas (estadiamento I, II, III e IV), não é uma variável 
quantitativa porque os intervalos entre os graus não são conhecidos. 
As variáveis quantitativas podem ser discretas quando as respostas são valores ou 
uma faixa de valores possíveis. Geralmente, essas respostas apresentam números in-
teiros e resultados de uma contagem. Por exemplo, número de partos é uma variável 
quantitativa, em que o resultado é numérico, e é discreta, porque a pessoa contou quan-
tos partos teve e não se pode ter metade de um parto.
Por fim, a variável quantitativa contínua pode ter números decimais e resultados 
são obtidos por aferição. O peso de cada sujeito da pesquisa é aferido em uma 
balança e tem a possibilidade de um resultado decimal, 75,1 kg. Dessa forma, todo 
exame laboratorial de análises clínicas são variáveis quantitativas contínua, pois os 
resultados são sempre uma proporção.
1.1. DESEMPENHO DAS AFERIÇÕES
Como e com quais instrumentos a coleta de dados foi realizada influencia na qualidade 
da pesquisa. Por isso, vários instrumentos têm seus desempenhos avaliados para jul-
gar o quanto eles conseguem aferir. 
A validade avalia a capacidade de um instrumento medir o que se propõe a medir. Esse 
conceito, por sua vez, é similar ao conceito de acurácia que mede o quanto os dados 
aferidos representam a realidade. A confiabilidade está relacionada com a precisão e 
reprodutibilidade do instrumento, avaliando o quão próximos as aferições estão repe-
tidas. A responsividade avalia se o instrumento consegue registrar mudanças após 
alteração clínica do quadro. Já a interpretabilidade avalia o grau de dificuldade de 
interpretar os dados e, também, avalia o intervalo de variação que o instrumento conse-
gue medir e a capacidade de registrar alterações extremas.
U2
20Bioestatística e Epidemiologia
Coleta, organização e descrição dos dados
Figura 02. Precisão e acurácia de quatro instrumentos diferente considerando 
que o local correto a ser acertado é o meio do desenho
Fonte: elaborada pela autora.
Os dois principais critérios para avaliar a qualidade de um instrumento são: a precisão 
e a acurácia. Para compreender melhor os conceitos, avalie a Figura 2. Considere que 
cada instrumento aferiu quatro vezes e que o valor que eles deveriam acertar está no 
centro do desenho, desse modo, quais instrumentos têm alta precisão e acurácia?
Após analisar a Figura 2, o instrumento amarelo se mostra impreciso e tem baixa vali-
dade; o instrumento verde, por sua vez, é preciso porque as aferições estão próximas, 
mas tem baixa validade já que estão longe do centro; o instrumento azul tem precisão 
e acurácia intermediárias; por fim, o instrumento vermelho tem alta precisão e acurácia.
As escalas são ferramentas utilizadas por muitos profissionais da saúde para avaliar 
características dos indivíduos e os fatores determinantes de saúde, como o Mini 
Exame do Estado Mental (MEEM). Essas escalas ao serem criadas, traduzidas ou 
adaptadas para diferentes populações devem passar por uma avaliação de validade 
de conteúdo, de critério e de construto. A validade de conteúdo refere-se à capaci-
dade que a escala tem de abranger todos os aspectos do problema a ser medido, 
assim como a clareza na medição do problema. 
A validade de critério, por outro lado, compara os resultados do teste em questão com 
outros exames ou características mensuráveis. Segundo Pasquali (2009), a validade 
de construto leva em consideração a consistência interna (correlação entre cada item e 
o restante dos itens da escala) e a capacidade do instrumento em medir uma variável 
latente (um construto que não pode ser medido diretamente). 
21 Bioestatística e Epidemiologia
U2 Coleta, organização e descrição dos dados
2. RESULTADOS
Os dados são os valores ou as respostas obtidas. A análise dos dados começa com 
a estatística descritiva na qual a principal função é o resumo e a descrição das infor-
mações obtidas. As variáveis qualitativas são resumidas com frequência absoluta e 
relativa de cada categoria de resposta. As variáveis quantitativas, normalmente, são 
resumidas com medidas de tendência central e medidas de dispersão.
Frequência absoluta e relativa
A frequência absoluta é a contagem dos casos de cada categoria da variável. Por 
exemplo, na variável sexo, a frequência absoluta é de 18 para os homens e 36 para as 
mulheres. A frequência relativa é uma proporção resultante de uma divisão. A frequ-
ência relativa pode ser apresentada por coeficientes, taxas, porcentagens e índices. Ao 
resumir dados das variáveis qualitativas é comum expressar a frequência relativa em 
porcentagem após a menção da frequência absoluta. 
Fórmula de cálculo de frequência relativa por porcentagem:
 1 00
 
frequencia absoluta
tamanhoda amostra
×
 
1
EX
EM
PL
O
Considere uma amostra de 54 pessoas, das quais 36 são mulheres e 18 são 
homens. O cálculo da frequência relativa em porcentagem para cada respos-
ta dos homens é:
 1 00
 
frequencia absoluta
tamanhoda amostra
×
 substituir a fórmula com os dados.
18 1 00
54
= ×
 fazer a divisão (18 ÷ 54).
0,3333 1 00= × fazer a multiplicação.
33,33%= 
Já nas mulheres, temos:
 
 36 1 00 100 0,6667 1 00 66,67%
 54
frequencia absoluta
tamanhoda amostra
× = × = × =
U2
22Bioestatística e Epidemiologia
Coleta, organização e descrição dos dados
Ao descrever variáveis quantitativas, a utilização da frequência para cada pos-
sibilidade de resposta pode não resumir os dados. A dificuldade em realizar uma 
frequência simples é que dados quantitativos frequentemente têm diversas res-
postas, não agrupando os dados e resumindo as informações. Para esses casos, 
recomenda-se a utilização de frequência agrupada, na qual criam-se agrupamen-
tos de categorias de dados.
Os agrupamentos de categorias de dados poder ser definidos, a partir da distri-
buição dos dados da amostra ou de critérios predefinidos. Assim, é comum para 
idade de adultos distribuir em faixas de 20 a 29 anos ou de 30 a 39 anos. O inter-
valo de valores deve ser igual em todas as faixas. Desse modo, é importante que 
as categorias criadas tenham uma sequência que garanta que todo número esteja 
incluso em somente uma única categoria. Por exemplo, se existem as categorias 
de 20 a 30 anos e de 30 a 40 anos, um sujeito com 30 anos pode erroneamente 
ser incluído em duas categorias.
O exemplo a seguir mostra que a distribuição agrupada é mais adequada para 
variáveis quantitativas.
Os dois tipos de frequência podem ser apresentados ao longo do texto, confor-
me exemplo acima. Outra opção é descrever, no texto, usando o número abso-
luto seguido da porcentagem entre parênteses, por exemplo, quanto a sexo 36 
(66,67%) eram mulheres. 
Além disso, há a possibilidade de realizar uma tabela de distribuição de frequência, 
em que ela é organizada com três colunas, a primeira que terá as possibilidades 
de respostas, a segunda que terá a frequência absoluta (as vezes abreviada como 
“N”) e a terceira que terá a frequência relativa (normalmente, abreviada com “%”). A 
primeira linha da tabela mostra os títulos de cada coluna e a última linha é o Total, 
conforme a tabela a seguir.
Tabela 01. Tabela de distribuição de frequência
SEXO FREQUÊNCIA ABSOLUTA (N)
FREQUÊNCIA RELATIVA 
(%)
Feminino 36 66,67%
Masculino 18 33,33%
Total 54 100%
Fonte: elaborada pela autora.
23 Bioestatística e Epidemiologia
U2 Coleta, organização e descrição dos dados
No cotidiano das secretarias de saúde, os dados do número de casos das doenças 
de notificações compulsórias são divulgados, portanto, é importante que em qualquer 
divulgação de dados seja utilizada frequência absoluta e relativa. 
Uma pesquisa entrevistou 8 universitários com os dados descritos na tabela a seguir. 
Crie uma tabela de distribuição simples e agrupada de frequência absoluta (N) e rela-
tiva (%) da variedade idade.
IDADE 20 21 57 40 23 20 21 21
Distribuição simples
IDADE N %
20 2
 
2 100 0,25 100 25% 
8
× = × =
21 3
 
3 100 0,375 100 37,5%
8
× = × =
23 1
 
1 100 0,1225 100 12,25%
8
× = × =
40 1
 
1 100 0,1225 100 12,25%
8
× = × =
57 1
 
1 100 0,1225 100 12,25%
8
× = × =
Total 8 100%
 
Distribuição agrupada
IDADE N %
20 a 39 anos 6
 
6 100 0,25 100 75%
8
× = × =
40 a 59 anos 2
 
2 100 0,25 100 25%
8
× = × =
Total 8 100%
EX
EM
PL
O
U2
24Bioestatística e Epidemiologia
Coleta, organização e descrição dos dados
Ao realizar qualquer cálculo das medidas de tendência central é importante que todos 
os dados coletados sejam analisados. Então, mesmo que existam valores repetidos, 
todas as observações devem participar dos cálculos.
IM
PO
R
TA
N
TE
!
Nesse sentido, a medida de tendência mais tradicional é a média aritmética. Por sua 
vez, ela é obtida somando todos os valores dos dados e depois dividindo a soma pelo 
número de dados observados.
Fórmula da média:
2 xx
n
∑
=
 ou 
 
 
soma dos dadosMédia
númerodedados
=
A frequência absoluta tem como principal função demonstrar o impacto que aquele 
agravo, evento ou desfecho tem na sociedade. Outra aplicabilidade é que, a partir dos 
números de casos, os serviços de saúde podem planejar atendimentos e possíveis 
demandas. Sobre a pandemia de covid-19, por exemplo, divulgar o número de mortes 
diários causou uma comoção entre os brasileiros e, também, fez com que os municípios 
se preparassem para o suporte de estrutura e insumos que será necessário para os 
atendimentos. Já a frequência relativa tem como principal função comparar. 
O número de óbitos total por covid-19 em 9 de fevereiro de 2021 nos Estados Unidos 
da América (EUA) foi de 459.993 e no Reino Unido foi 112.798. Somente utilizando o 
número absoluto de casos, o EUA parece estar pior na pandemia por causa do maior 
número de casos. Agora ao complementar as informações com a frequência relativa, 
a comparação fica melhor. Com esse mesmo exemplo, a proporção de mortes por co-
vid-19 por 1 milhão de habitantes no Reino Unido é de 1.661,58 e nos Estados Unidos 
da América é de 1.389,7. Por isso, cabe reforçar que para qualquer comparação é ne-
cessário usar alguma frequência relativa.
2.2 MEDIDAS DE TENDÊNCIA CENTRAL
Na descrição e resumo das variáveis quantitativas, frequentemente, utiliza-se no míni-
mo uma medida de tendência central e uma medida de dispersão. As medidas de ten-
dência central definem um ponto dentro do conjunto amostral que resume os dados.
25 Bioestatística e Epidemiologia
U2 Coleta, organização e descrição dos dados
Em que:
x = um dado.
∑ = somatória.
x∑ = somatória de todos os dados.
n = número de dados.
CÁLCULO MÉDIA
Uma pesquisa entrevistou 8 universitários com os dados descritos na 
tabela a seguir. 
IDADE 20 21 57 40 23 20 21 21
Média:
 
 
x soma dos dadosx
n númerodedados
∑
= =
 
20 20 21 21 21 23 40 57
8
+ + + + + + +
=
Portanto, a média desses dados é 27,88 anos.
EX
EM
PL
O
 –
 C
Á
LC
U
LO
 M
ÉD
IA
Nesse exemplo, considere que, na amostra de 8 pessoas, o pesquisador seja incapaz de 
coletar a idade de um sujeito. Nesse caso, o número de dados é 7, que é a informações 
que se deve colocar na parte de baixo na fórmula, já que só tem idade de sete indivíduos.
A mediana é a segunda medida de tendência central. O seu valor divide o conjunto 
de dados ordenados no meio, isso significa que metade das observações tem valores 
abaixo da mediana e metade acima. 
= 27,88
223
8
= 
substituir a fórmula com os dados.
somar os valores.
.......................................................... realizar a divisão.
U2
26Bioestatística e Epidemiologia
Coleta, organização e descrição dos dados
Para calcular a mediana, a primeira etapa é 
organizar os dados em ordem crescente (do 
menor para o maior). A segunda etapa é en-
contrar em qual local é o ponto de corte para 
dividir o conjunto ao meio. Quando o número 
de dados for ímpar, a mediana será um valor 
do conjunto. Conjunto A: {2,6,12,17,21} tem 
cinco observações (número ímpar), portanto, 
a mediana é valor do conjunto. Consideran-
do que ele já está ordenado, o valor que está 
na posição central e consegue dividir o con-
junto em dois grupos de dois é o 12. Logo, a 
mediana do conjunto A é 12.
Quando o número de dados for par, a me-
diana será a média dos dois valores centrais. Como será sempre uma média de dois 
valores, a conta será sempre igual, primeiro deve-se somar os valores centrais e depois 
dividir a soma por 2.
Conjunto B: {7, 9, 13, 15} tem número quatro observações (número par), portanto, a 
mediana é a média dos dois valores centrais. Considerando que ele já está ordena-
do, a posição central que consegue dividir o conjunto em dois grupos de dois é um 
valor entre 9 e 13. Para calcular a mediana, nesse caso, é preciso fazer a média 
entre 9 e 13. Assim, o cálculo da mediana será 
 
 
soma dos dados
númerodedados
=
 
9 13
2
+
=
 
22 11.
2
=
 
Ou seja, a mediana do conjunto B é 11.
Figura 03. Distribuição de dados
Fo
nt
e:
 1
23
rf.
Cálculo mediana 
Uma pesquisa entrevistou 8 universitários com os dados descritos na tabela a seguir. 
IDADE 20 21 57 40 23 20 21 21
Mediana
1) Colocar em ordem crescente: 20 20 21 21 21 23 40 57.
2) Número par de observações (oito).3) Achar os valores centrais: 21 e 21.
4) Realizar o cálculo: 
21 21
2
+
=
 
42 21
2
=
.
A mediana desses dados é 21 anos.
EX
EM
PL
O
27 Bioestatística e Epidemiologia
U2 Coleta, organização e descrição dos dados
A terceira medida de tendência central é a moda. A moda é o dado mais frequente, ou 
seja, dentro do conjunto é o valor que mais se repete. É possível que um conjunto tenha 
mais do que uma ou não tenha moda. Para facilitar reconhecer qual é a moda, pode-se 
fazer uma análise de frequência absoluta antes ou ordenar o conjunto para ficar mais 
fácil conseguir reconhecer os valores repetidos.
Cálculo moda 
Uma pesquisa entrevistou 8 universitários com os dados descritos na tabela a seguir. 
IDADE 20 21 57 40 23 20 21 21
Moda: faça uma contagem (frequência absoluta) dos dados. A idade que mais se 
repete é 21, com três votos.
IDADE 20 21 23 40 57 TOTAL
N 2 3 1 1 1 8
Logo, a moda desses dados é 21 anos.
EX
EM
PL
O
A média é influenciada pelos valores dos dados. Desse modo, se no conjunto de obser-
vações tiverem valores extremos, ou seja, distante de onde a maioria dos valores está, 
a média será afetada. Essa desvantagem da média é a vantagem da mediana, que não 
é influenciada por valores extremos. Se analisarmos os exemplos de cálculo para essas 
duas medidas, podemos observar que a média está mais alta que a mediana por causa 
dos valores extremos (40 e 57).
A vantagem da média é que ela pode sofrer manipulações matemáticas e é mais co-
nhecida. Já a mediana não consegue sofrer muitas manipulações matemáticas. Quanto 
à moda, a vantagem é a praticidade de conhecer e calcular a medida. No entanto, a 
desvantagem é que os resultados não são significativos em grupos pequenos.
A escolha de qual medida usar dependerá dos dados da pesquisa. As características, 
vantagens e desvantagens de cada medida influenciará na escolha da medida que 
descreverá melhor os dados.
U2
28Bioestatística e Epidemiologia
Coleta, organização e descrição dos dados
3. OBJETO DE APRENDIZAGEM
Considere que uma sala de aula formou três grupos, cada um com 10 alunos. A tabela abaixo 
descreve as características dos alunos em cada grupo.
IDENTIFICAÇÃO GRUPO TIME QUE TORCE NÚMERO DE IRMÃOS
Aluno 1 A Santos 0
Aluno 2 A Santos 0
Aluno 3 A Guarani 3
Aluno 4 A Ponte Preta 2
Aluno 5 A Palmeiras 1
Aluno 6 A Ponte Preta 0
Aluno 7 A Ponte Preta 2
Aluno 8 A Guarani 1
Aluno 9 A Ponte Preta 2
Aluno 10 A Palmeiras 0
Aluno 11 B Bragantino 1
Aluno 12 B São Paulo 1
Aluno 13 B Santos 2
Aluno 14 B Bragantino 3
Aluno 15 B Palmeiras 0
Aluno 16 B Guarani 2
Aluno 17 B São Paulo 1
Aluno 18 B Bragantino 2
Aluno 19 B Guarani 4
Aluno 20 B São Paulo 2
Aluno 21 C Corinthians 1
Aluno 22 C Santos 3
Aluno 23 C Corinthians 2
Aluno 24 C São Paulo 0
Aluno 25 C Santos 5
Aluno 26 C São Paulo 3
Aluno 27 C Ponte Preta 2
Aluno 28 C Santos 4
Aluno 29 C Corinthians 2
Aluno 30 C Palmeiras 5
Fonte: própria autora
29 Bioestatística e Epidemiologia
U2 Coleta, organização e descrição dos dados
a. Monte uma tabela de frequência da variável Time que torce de todos os alunos da sala. A 
tabela deve conter frequência absoluta e frequência relativa.
b. Calcule as medidas de tendência central da variável Número de irmãos de cada grupo 
de aluno. Reflita se existe diferença entre os grupos e se dentro de cada grupo qual é a 
medida de tendência central que melhor resume essa variável.
U2
30Bioestatística e Epidemiologia
Coleta, organização e descrição dos dados
FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. Epidemiologia clínica: elementos essenciais. 5. ed. 
Porto Alegre: ArtMed, 2014.
PASQUALI, L. Psicometria. Revista da Escola de Enfermagem da USP, São Paulo, v. 43, especial, p. 992-
999, 2009. Disponível em: http://dx.doi.org/10.1590/S0080-62342009000500002. Acesso em: 23 fev. 2021.
VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016.
REFERÊNCIAS BIBLIOGRÁFICAS
about:blank
32
UNIDADE 3
ESTATÍSTICA DESCRITIVA
INTRODUÇÃO
O que é “normal”? Estar fora do “normal” faz alguém estar doente? Se uma pessoa 
chora todo dia por um mês após perder uma pessoa querida, isso é considerado normal 
ou é depressão? Como se definiu qual o limite entre febre e temperatura normal? Será 
que toda pessoa com temperatura de 37,3ºC está sem febre?
Normal é um termo relativo, com base na sociedade e que varia ao longo do tempo, por 
isso, a saúde utiliza o termo padrão. Qual é a frequência cardíaca padrão de um adul-
to? Aqui o termo padrão tem o significado de ser o que ocorre com maior frequência, 
o evento mais comum de acontecer. Dessa forma, as informações abordadas nessa 
unidade ajudarão a desvendar esses mistérios e a interpretar as informações.
1. MEDIDAS DE DISPERSÃO
Para resumir e descrever um conjunto de dados de uma variável numérica, utiliza-se 
medidas de tendência central e medidas de dispersão. As medidas de tendência central 
informam um ponto que resume os dados, mas só ter um ponto central não descreve o 
quanto os dados variam.
Considere o conjunto A {12,13,14,15,16} e o conjunto B {4,10,12,20,24}. Os dois conjun-
tos têm média 14, mas eles não são similares. Os dados do conjunto A variam pouco, 
enquanto em B a variação é maior, pois, para descrever é preciso de no mínimo uma 
medida central e uma de dispersão.
Uma medida de dispersão é a amplitude que é a diferença entre o valor máximo e o 
mínimo. Assim, é possível apenas citar o valor mínimo e máximo. Para facilitar o cálculo 
da amplitude, recomenda-se colocar os dados em ordem crescente para ajudar no re-
conhecimento dos valores extremos.
Fórmula da amplitude:
1 Amplitude Valor máximo Valor mínimo= −
33 Bioestatística e Epidemiologia
U3 Estatística descritiva
Cálculo de Amplitude
Uma pesquisa entrevistou 6 universitários com os dados descritos na tabela a seguir. 
IDADE 20 21 57 40 23 18
Amplitude:
1) Colocar em ordem crescente: 18 20 21 23 40 57
2) Realizar o cálculo: 57 18 39− =
A amplitude desses dados é 39 anos.
Ex
em
pl
o 
A segunda medida de dispersão é o quartil. O percentil é um ponto de corte que divide 
os dados ordenados, por exemplo, o percentil 85 divide as observações de modo que 
85% dos dados estão entre o valor mínimo e o valor do percentil 85. Quartil são os pon-
tos de corte que dividem o conjunto em quatro partes igual, portanto, o primeiro quartil é 
o percentil 25, o segundo é o percentil 50 e o terceiro é o percentil 75. O segundo quartil 
é sinônimo de mediana já que os dois dividem as observações na metade. A figura a 
seguir esquematiza os três pontos de corte no conjunto de dados.
Figura 01. Esquema da localização dos quartis
A
25% 25% 25% 25%
B C
Fonte: elaborada pela autora. 
Para calcular os quartis, a primeira etapa é organizar os dados em ordem crescente 
(do menor para o maior). A segunda etapa, por sua vez, é encontrar o segundo quartil. 
Quando o número de dados for ímpar, o segundo quartil será um valor do conjunto, e 
quando for par, ele será a média dos dois valores centrais. 
“A” é o primeiro quartil, “B” é o segundo quartil ou mediana e “C” é o terceiro quartil.
U3
34Bioestatística e Epidemiologia
Estatística descritiva
A terceira etapa é dividir em dois grupos, de modo que o ponto de corte é a mediana. 
Quando o número de dados for ímpar, o segundo quartil será um valor do conjunto que 
deverá estar presente nos dois dos grupos. Quando o número de dados for par, todos 
os dados serão distribuídos nos grupos, independentemente dos dados centrais serem 
utilizados para calcular a mediana.
A quarta etapa é encontrar o local do ponto de corte para dividir o grupo ao meio: o primei-
ro quartil é o ponto que divide na metade o grupo de dados com as observações de menor 
valor; o terceiro quartil é o ponto que divide na metade o grupo de dados com as observa-
ções de maior valor. Assim, no grupo, quando o número de dados for ímpar, o quartil será 
um valor do conjunto, mas quando for par será a média dos dois valores centrais.
O conjuntoA: {2,6,12,17,21} tem número cinco observações (número ímpar), 
portanto, o ponto que divide esse conjunto na metade é uma observação. 
Considerando que ele já está ordenado, o valor que está na posição central e 
consegue dividir o conjunto em dois grupos de dois é o 12. 
O conjunto B: {7, 9, 13, 15} tem número quatro observações (número par), logo, 
o ponto que divide esse conjunto na metade é a média dos dois valores centrais. 
Como ele já está ordenado, a posição central que consegue dividir o conjunto em 
dois grupos de dois é um valor entre 9 e 13. Nesse caso, é preciso fazer a média 
entre 9 e 13, logo, 
 
soma dos dados
númerodedados
= 9 13
2
+
= 22 11.
2
= 
Cálculo quartil número par de observações 
Uma pesquisa entrevistou seis universitários com os dados descritos na tabela a seguir:
IDADE 20 21 57 40 23 18
Quartis:
1) Colocar em ordem crescente: 18 20 21 23 40 57
2) Número par de observações (seis). 
2a) Achar os valores centrais: 21 e 23
2b) Realizar o cálculo do 2º quartil: 
21 23
2
+
=
 
44 22
2
=
3) Dividir em grupo: Grupo Z: 18 20 21
EX
EM
PL
O
35 Bioestatística e Epidemiologia
U3 Estatística descritiva
EX
EM
PL
O
 Grupo Y: 23 40 57
4) número ímpar de observações em cada grupo (três).
4a) Achar o 1º quartil no grupo Z: 20
4a) Achar o 3º quartil no grupo Y: 40
Desses dados, o primeiro quartil é 20 anos, o segundo quartil (mediana) é 22 anos e 
o terceiro quartil é 40 anos.
Cálculo quartil número ímpar de observações 
Uma pesquisa entrevistou sete universitários com os dados descritos na tabela a seguir: 
IDADE 20 57 40 18 24 26 18
Quartis:
1) Colocar em ordem crescente: 18 18 20 24 26 40 57
2) Número ímpar de observações (sete).
2a) Achar o 2º quartil: 24 
3) Dividir em grupo (no caso do 2º quartil ser uma observação, essa estará nos dois 
grupos): Grupo Z: 18 18 20 24
 Grupo Y: 24 26 40 57
4) Número par de observações em cada grupo (quatro).
4a) Achar o 1º quartil no grupo Z: 
18 20
2
+
= 
38 19
2
=
4a) Achar o 3º quartil no grupo Y: 
26 40
2
+
= 
66 33
2
=
Nesses dados, o primeiro quartil é 19 anos, o segundo quartil (mediana) é 24 anos e 
o terceiro quartil é 33 anos.
EX
EM
PL
O
U3
36Bioestatística e Epidemiologia
Estatística descritiva
A terceira medida de dispersão é o desvio padrão, que descreve o quanto os dados 
estão distribuídos em torno da média. Então, toda vez que usar desvio padrão, deve-se 
usar também a média. O desvio padrão é calculado como a raiz quadrada de variância. 
SA
IB
A 
M
A
IS
Para saber mais sobre o conceito de variância, leia a obra Introdução à Bioestatística 
(p. 47-51), de Sonia Vieira, lançado em 2016.
Disponível na biblioteca digital em: https://integrada.minhabiblioteca.com.br/#/
books/9788595150911/epubcfi/6/20%5B%3Bvnd.vst.idref%3DaB9788535277166000
042%5D!/4/2/6/12/2/4/4%400:0. Acesso em: 15 mar. 2021.
Fórmula de desvio-padrão de uma amostra:
( )22
2
 
1
x
x
ns
n
−
=
−
∑
∑2
Em que: x é um dado; ∑ representa somatória; x∑ é a somatória de todos os dados; 
2x∑ é a somatória dos quadrados dos dados; e n é o número de dados.
Apesar de existir a possibilidade de realizar manualmente os cálculos de medidas de 
tendência central e de dispersão, a rotina do pesquisador é que softwares façam os cál-
culos. Para utilizar a fórmula de desvio padrão para amostra, primeiramente, é necessário 
calcular as somatórias para obter todos os valores que devem ser inseridos na fórmula. 
EX
EM
PL
O
Cálculo de desvio padrão 
Uma pesquisa entrevistou quatro crianças com idades de 2, 6, 10 e 12 anos.
 
Desvio Padrão:
1) Calcular os valores da somatória:
2
6
10
12
x 2x
22 4=
26 36=
210 100=
212 144=
2 284x =∑ 30x =∑
about:blank
about:blank
about:blank
37 Bioestatística e Epidemiologia
U3 Estatística descritiva
EX
EM
PL
O
2) Coloque os valores na fórmula. Atente-se para não confundir onde colocar 
x∑ e 
2x∑ , e para não sumir com a potência. Como n é o número de dados, nesse caso, 
4n = . 
( ) ( )
2
2
2
2 2
30
284
4 
1 4 1
x
x
ns
n
− −
= =
− −
∑
∑
3) Resolver a conta:
( )2
2
30
284
4
4 1
−
=
−
 realizar a potência 
230
2
900284
4
4 1
−
=
−
 realizar a divisão 
900
4
2
284 225
4 1
−
=
−
 realizar as duas subtrações
2
59
3
= realizar a divisão
2 19,67= realizar a raiz quadrada
4, 43= 
O desvio padrão é de 4,43 anos.
1.1 VANTAGENS E DESVANTAGENS
A vantagem da amplitude ou da menção do valor mínimo e máximo é incluir todos os 
valores, mas, por outro lado, é uma medida muito afetada por valores extremos. Para 
descrever a idade dos óbitos ocorridos em um mês, o pesquisador relata que a idade 
variou de horas de vida até 106 anos. Com esse intervalo grande não é possível saber 
como de fato está a distribuição de óbitos.
Os quartis conseguem fornecer mais dados da dispersão e não são afetados por va-
lores extremos. A distância interquartílica, que é a distância entre o primeiro e terceiro 
quartil, é um valor consegue descrever se metade da amostra está afastada ou próxima 
a mediana. Uma desvantagem dos quartis é que existem métodos diferentes de calcu-
U3
38Bioestatística e Epidemiologia
Estatística descritiva
lá-los, até mesmo entre os softwares, apesar da diferença entre eles ser pequena. Além 
disso, eles não são adequados para manipulações matemáticas.
O desvio padrão é adequado para manipulações matemática e é utilizado para outras 
análises estatísticas. Ele é uma medida extremamente adequada para descrever vari-
áveis com distribuição normal, no entanto, quando a amostra não tem uma distribuição 
normal, o desvio padrão não deve ser utilizado.
2. PROBABILIDADE
A teoria clássica de probabilidade é aquela em que, normalmente, abordamos no Ensi-
no Médio, em que calculávamos qual a probabilidade de se tirar uma carta de baralho 
específica ou de tirar um número no dado. As características dos fenômenos probabilís-
ticos se mantem no campo da saúde. 
A probabilidade de um evento único acontecer é calculada pela definição básica, conforme a 
fórmula a seguir. Ela é somente para eventos mutualmente exclusivos e igualmente prováveis 
e eventos independentes ou condicionantes. Normalmente, ela é expressa por número entra 
0 a 1, mas, frequentemente, usa-se a porcentagem para ficar mais fácil de compreender.
Fórmula de probabilidade (evento único):
 
 
númerodeeventos esperados
númerodeeventos possíveis
3
No ensino médio, aprende-se que a probabilidade de se ter um filho do sexo masculino 
é de 50%. Para chegar a esse valor, utilizamos a seguinte Equação 3, logo:
( )
( )
1 
 2 
eventoesperado nascer homemnúmerodeeventos esperados
número deeventos possíveis eventos possíveis nascer homemou mulher
=
 
1
2 
= 0,5 x 100 = 50%
Contudo, como podemos calcular a probabilidade de uma criança nascer com uma 
anomalia congênita? Nesse caso, podemos considerar que é 50% também, já que só 
existem dois eventos esperados (nascer com ou sem anomalia)?
Na área da saúde, as probabilidades de eventos, como a chance de ficar doente ou de 
se curar, são calculadas a partir do que é observado na população. Então, pesquisas 
descritivas que contam os eventos são muito importantes para termos as probabilida-
des. Logo, qual a probabilidade de ter uma criança com anomalia congênita?
=
39 Bioestatística e Epidemiologia
U3 Estatística descritiva
Pelas informações divulgadas pelo Ministério da Saúde, em 2019, no Brasil nasceram 
2.849.146 crianças, em que 24.838 nasceram com anomalias. Preenchendo a fórmula com 
esses valores, temos que: 
 
 
númerodeeventos esperados
númerodeeventos possíveis = 
24.838
2.849.146 = 0,00872 ×100 = 0,87%.
O cálculo realizado é similar ao de frequência relativa. Portanto, dependendo de qual foi a 
amostra e como os dados foram coletados, pode-se considerar que a probabilidade de um 
evento acontecer é a frequência relativa que alguma pesquisa demostrou que ela acontece.
PA
R
A 
R
EF
LE
TI
R
Pelo ISA-Capital de 2008, a proporção de pessoas com mais de 20 anos quetinham 
Hipertensão Arterial Sistêmica (HAS) foi de 22%. Uma nutricionista atendeu em um 
dia 20 consultas de adultos ou idosos e nenhum deles tinha HAS. De acordo com a 
probabilidade, ela deveria ter atendido 4 hipertensos (22% de 20 consultas = 0,22 x 
20 = 4,4). Considerando que a proporção de hipertensos na população está correta, o 
que será que aconteceu para a probabilidade errar?
 ` O número de pessoas atendidos é baixo e pode ter ocorrido um viés de seleção e 
a amostra não representar a população.
 ` Ao acaso, naquele dia, não houve hipertensos. Mas nos outros dias da semana, ela 
atendeu mais de 5 doentes.
 ` O público-alvo da nutricionista é específico para pessoas jovens e saudáveis e, 
portanto, a amostra não representa a população total.
 ` Existem pessoas que não estão diagnosticadas com HAS, mas já tem a doença e, 
provavelmente, alguns dos 20 pacientes estavam nessa situação.
Para profissionais da saúde, a principal característica de probabilidade é que ela não é 
capaz de determinar resultados. Então, por mais que eu tenha o gene marcador de cân-
cer, que me dá 95% de probabilidade de desenvolver a doença, isso não significa que 
eu de fato eu terei câncer. Além disso, pode-se soma a isso a interpretação da chance 
é subjetiva, isto é, alguém pode achar que 95% de chance de ter câncer é muito alta 
e querer, portanto, fazer tratamentos precoces e cirurgias para evitar a doença. Outra 
pessoa pode achar que uma sobrevida de 5% alta e que vai aproveitar esse resultado 
para aproveitar a vida. A reação das pessoas às probabilidades de eventos relaciona-
dos a sua saúde é muito variável. Por isso, toda vez que se for discutir probabilidade de 
sucesso do tratamento, de voltar a andar ou de “voltar ao normal”, é importante deixar 
claro que probabilidade não garante um futuro. 
A longo prazo, por sua vez, é possível que a proporção de eventos observados se aproxime 
da probabilidade do evento acontecer. Nesse sentido, considere que a média de sobrevida 
após um diagnóstico de câncer de pulmão é de 1 ano. Um profissional começa seu trabalha 
em uma clínica de oncologia e, com o passar do tempo e de atendimentos, ele observará 
que a maioria dos casos de fato morrem próximo de 1 ano de diagnóstico. No entanto, ha-
verá exceções, desde quem morreu dias depois ou de quem demorou 5 anos para falecer. 
U3
40Bioestatística e Epidemiologia
Estatística descritiva
Com a experiência, os dados vão cada vez mais se aproximar da distribuição normal. 
Contudo, sempre há a chance de alguém ser a exceção, que em estatística pode ser 
chamado de ponto fora da curva (outlier). Ao ter um diagnóstico, não é possível saber 
em qual parte da curva você ficará, mas é possível saber quais são as probabilidades.
Portanto, as probabilidades devem ser usadas no cotidiano do profissional de saúde. O 
uso da probabilidade ocorre principalmente como referência para decisão de condutas 
e possíveis pré-conceitos que ajudam no atendimento. Dessa forma, é preciso ter um 
equilíbrio e saber quando usar e como transmitir a informação para pacientes ou usuários. 
3. DISTRIBUIÇÃO NORMAL
Os matemáticos no século XIX observaram que, 
em grande escala ou na natureza, os eventos bio-
lógicos tendem a seguir uma mesma distribuição 
de frequência. Desse modo, pode-se pressupor 
que as variáveis de uma pesquisa tenham distri-
buição normal ou testar estatisticamente se a cur-
va dos dados observados é similar. 
A Figura 2 representa que os eventos tendem a 
se repetir próximo a posição central e que poucos 
casos acontecem longe do esperado. Portanto, a 
curva do gráfico representa a distribuição normal 
e, também, pode ser chamada de curva de Gauss. 
A distribuição normal tem características bem co-
nhecidas que são iguais para todas as variáveis 
que apresentem a distribuição. O comportamento 
da variável será independente do valor das me-
didas de tendência e dispersão e do que se está 
medindo (peso, tempo de sobrevida e tempera-
tura corpórea). Dessa forma, variáveis contínuas 
tendem a formar curvas mais próximas à teórica 
por conseguir aferir os valores de forma contínua.
A curva da distribuição normal é em formato de sino 
e é simétrica em torno da média, isso faz com que 
a mediana e a moda sejam iguais a média. Toda a 
população está sobe a curva, em que metade tem valores menores do que a média.
A distribuição da frequência de eventos em torno da média é uma constante. Assim, por 
meio de cálculos matemático, chegou-se a proporção descrita na Figura 3. 
Figura 02. Esquema que descreve 
a distribuição normal
Fo
nt
e:
 1
23
rf.
41 Bioestatística e Epidemiologia
U3 Estatística descritiva
 ` 68,26% dos dados estão a um desvio padrão (𝜎) da média (µ).
 � Fórmula limite inferior µ σ= − .
 � Fórmula limite superior .µ σ= +
 ` 95,44% dos dados estão a dois desvios padrões (2𝜎) da média (µ).
 � Fórmula limite inferior 2µ σ= − .
 � Fórmula limite superior 2µ σ= + .
 ` 99,72% dos dados estão a três desvios padrões (𝜎) da média (µ).
 � Fórmula limite inferior 3µ σ= − .
 � Fórmula limite superior 3µ σ= + .
Figura 03. Frequência relativa dos eventos a partir de distâncias de desvios-padrões (𝜎) da média (µ)
Fonte: 123rf.
Para calcular os limites mínimos e máximos que estão na proporção de casos, é só 
somar ou subtrair do desvio padrão da média. Considere que, o tempo de duração de 
sintomas de uma doença febril tem distribuição normal, em que a média de duração dos 
sintomas é de 7 dias com um desvio padrão de 1,4 dia. Essas medidas foram calcula-
U3
42Bioestatística e Epidemiologia
Estatística descritiva
das em uma amostra representativa com tamanho amostral adequado e o estudo não 
apresentou vieses. Pelas características da distribuição normal, temos:
 ` 68,26% dos casos dessa doença teriam de 5,6 a 8,4 dias de sintomas.
 � Fórmula limite inferior 7 1,4 5,6µ σ= − = − = .
 � Fórmula limite superior 7 1,4 8,4µ σ= + = + = .
 ` 95,44% dos casos dessa doença teriam de 4,2 a 9,8 dias de sintomas.
 � Fórmula limite inferior ( )7 2 1,4 7 2,8 4,2µ σ= − = − × = − = .
 � Fórmula limite superior ( )7 2 1,4 7 2,8 8,4.µ σ= + = + × = + =
 ` 99,72% dos casos dessa doença teriam de 5,6 a 8,4 dias de sintomas.
 � Fórmula limite inferior ( )7 3 1,4 7 4,2 0µ σ= − = − × = − = .
 � Fórmula limite superior ( )7 3 1, 4 7 4,2 11,2µ σ= + = + × = + = .
Com as diversas frequências que a curva de distribuição normal fornece, pode-se pen-
sar em probabilidades de eventos acontecerem e na definição de situações normais.
4. ANORMALIDADES
Há várias estratégias para definir se um comportamento, resultado, sinal ou sintoma 
está dentro do padrão ou “normal”. Nesse sentido, a mais comum e mais utilizada é a 
definição de que é normal tudo que acontece com grande frequência. A principal refe-
rência são os padrões da curva de distribuição normal, em que há um consenso de que 
tudo que está dentro de 2 desvios padrões da média (95,44%) é normal. 
Se a pessoa se encontra nos extremos da curva de Gauss, ela pode ser uma pessoa 
saudável com padrões de referência fora do comum ou pode ser uma pessoa doen-
te. Desse modo, cabe julgar outras características, sinais e sintomas do paciente. Por 
exemplo, ao atender uma pessoa com temperatura de 37,3ºC que está com calafrios 
e dor no corpo, pode-se considerar que ela está com febre apesar de o valor da tem-
peratura estar dentro do normal, ao mesmo tempo que uma pessoa com 38ºC e sem 
nenhum sintoma pode estar saudável.
Com isso, outro critério que se pode usar para definir normalidade é apresentar uma 
forma clínica diferente do que é considerado um bom estado de saúde. O quanto de 
choro é considerado fora do normal para alguém de luto ou todo choro é patológico? 
Se ao tratar a provável anormalidade e a pessoa melhorar é possível definir que o 
quadro era anormal.
43 Bioestatística e Epidemiologia
U3 Estatística descritiva
5. OBJETO DE APRENDIZAGEM
A definição de normalidade ou alteração de peso nas crianças foi feita a partir dos con-
teúdosaprendidos na unidade de hoje. A Organização Mundial da Saúde (OMS) dispo-
nibiliza as curvas de crescimento (peso, altura e índice de massa corpórea por peso) 
com pontos de corte, a partir de percentis ou de escore z (1). A Figura 4 é um exemplo 
de curva de peso por idade, em que as curvas com escore z usa como base o desvio 
padrão, em que 1 escore significa 1 desvio padrão. 
Peso-por-idade MASCULINO
De 0 a 2 anos (escore z)
Pe
so
 (K
g)
Idade (meses e anos completos)
0
1 2 3 4 5 6 7 8 9 10 11
1 ano
Meses
2 anos
1 2 3 4 5 6 7 8 9 10 11
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
Fonte: OMS ([s.d.], [n. p.]).
A caderneta de saúde da criança (BRASIL, 2017) é a carteira de vacinação com diver-
sas outras informações sobre o crescimento e o desenvolvimento dela. Entre as infor-
mações disponíveis nesse impresso temos a Figura 5, que compara pontos de corte em 
percentis e em desvio padrão (escore z).
Figura 04. Gráfico da curva de crescimento de peso por idade de crianças do sexo 
masculino de 0 a 2 anos com ponto de corte a partir do escore z
U3
44Bioestatística e Epidemiologia
Estatística descritiva
Figura 05. Medidas de dispersão escores z e percentis
+3,0 escores z
+2,0 escores z
+1,881 escore z
+0,674 escore z
-0,674 escore z
97º percentil
75º percentil
25º percentil
+1,645 escore z 95º percentil
+1,282 escore z 90º percentil
+1,0 escore z
Média
99,85º percentil
97,72º percentil
84,2º percentil
50º percentil
15,8º percentil
2,28º percentil
0,15º percentil
= mediana
( 110% A/I 120% P/I)~= ~=
-1,0 escore z
-2,0 escore z
-3,0 escore z
( 90% A/I 80% P/I)~= ~=
-1,282 escore z 10º percentil
-1,645 escore z 5º percentil
-1,881 escore z
-2,67 escore z
3º percentil
0,4º percentil
Fonte: Brasil (2017, p. 52). 
Pela OMS ([s.d.]), a definição de normalidade do peso é a partir de onde a criança está 
no gráfico. Logo, as definições variam conforme a idade e variável (peso, altura ou ín-
dice de massa corpórea).
Tabela 01. Pontos de corte e classificação do peso para a idade para crianças de 0 a 10 anos
PONTO NO GRÁFICO CLASSIFICAÇÃO DO PESO
> +2 escores z Peso elevado para idade.
≥ -2 e ≤ +2 escores z Peso adequado para idade.
≥ -3 e ≤ -2 escores z Peso baixo para idade.
< -3 escores z Peso muito baixo para idade.
Fonte: Brasil (2011, p. 15).
Uma criança brasileira do sexo masculino que fará 2 anos de idade daqui dois dias pesa 
16,5kg. Após colocar esses valores na curva de crescimento (Figura 4), o que tem mais 
chance de ser real:
45 Bioestatística e Epidemiologia
U3 Estatística descritiva
a. A criança tem padrões fora do frequente, então, aquele peso é adequado para ela; ou
b. A probabilidade desse menino ter uma anormalidade é baixa, então, pode-se considerar 
que o peso não é adequado para a idade?
Comentário: O mais provável é que a criança esteja com peso elevado para a idade e, 
portanto, algum tipo de orientação dietética deve ser realizada. A probabilidade é baixa 
(menor de 4,56%) da criança estar com peso adequado e ter características diferentes 
da maioria da população e, por isso, estar fora da faixa de normalidade da curva. Nesse 
sentido, as informações sobre a altura e o índice de massa corpórea (IMC), que também 
tem seus gráficos, pode ajudar na interpretação do dado. Se só no peso a criança está 
acima da curva de 2 escores z, significa que a criança está acima do peso. Outra estra-
tégia que contribui para a avaliação é acompanhar o peso da criança ao longo do tempo, 
a fim de saber se ela está seguindo as inclinações das curvas de referência ou teve um 
aumento fora do esperado.
U3
46Bioestatística e Epidemiologia
Estatística descritiva
REFERÊNCIAS BIBLIOGRAFICAS
BRASIL. Ministério da Saúde. Caderneta de saúde da criança: menino. 11 ed. Brasília, DF: Ministério da 
Saúde, 2017. Disponível em: http://bvsms.saude.gov.br/bvs/publicacoes/caderneta_saude_crianca_meni-
no_11ed.pdf. Acesso em: 9 fev. 2021.
BRASIL. Ministério da Saúde. Secretaria de Atenção à Saúde. Departamento de Atenção Básica. Orienta-
ções para a coleta e análise de dados antropométricos em serviços de saúde: Norma Técnica do Sis-
tema de Vigilância Alimentar e Nutricional - SISVAN. Brasília, DF: Ministério da Saúde, 2011. Disponível em: 
http://189.28.128.100/dab/docs/portaldab/publicacoes/orientacoes_coleta_analise_dados_antropometricos.
pdf. Acesso em: 9 fev. 2021.
FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. Epidemiologia clínica: elementos essenciais. 5. ed. 
Porto Alegre: ArtMed, 2014.
ORGANIZAÇÃO MUNDIAL DA SAÚDE (OMS). Curva de crescimento peso por idade meninos de 0 a 2 anos 
– escore z. Disponível em: 
https://www.who.int/docs/default-source/child-growth/child-growth-standards/indicators/weight-for-age/cht-w-
fa-boys-z-6-2.pdf?sfvrsn=ec5b30eb_6. Acesso em: 9 fev. 2021.
ORGANIZAÇÃO MUNDIAL DA SAÚDE (OMS). Documentos com padrões de crescimento de crianças. Dispo-
nível em: https://www.who.int/tools/child-growth-standards/standards. Acesso em: 9 fev. 2021.
VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016.
about:blank
about:blank
about:blank
about:blank
about:blank
about:blank
48
UNIDADE 4
EPIDEMIOLOGIA DESCRITIVA
INTRODUÇÃO
É possível saber a proporção de pessoas que tem diabetes ou que usam drogas ilíci-
tas? Ao longo do tempo, será que o número de casos de AIDS reduziu no Brasil? Neste 
país, será que há regiões que têm mais ou menos casos que as outras? A AIDS é mais 
frequente em algum tipo de população? As informações abordadas nessa unidade aju-
darão você a entender como essas informações podem ser obtidas.
Nesta unidade, abordaremos os tipos de estudos epidemiológicos, que são classifica-
dos como descritivos ou analíticos. Os estudos analíticos buscam associações entre 
variáveis, como fatores de risco para doença ou desfechos possíveis de um evento. 
Enquanto os estudos descritivos têm como objetivo principal descrever características 
da doença, pessoas, locais ou tempo, como também para identificar casos, analisar 
tendências, fazer diagnóstico situacional da população e gerar hipóteses.
Além disso, há outra classificação quanto a intervenção estudada, por exemplo, os 
estudos observacionais têm as intervenções decididas por profissionais de saúde que 
não pertencem a equipe da pesquisa. A pesquisa, por sua vez, só observa o que foi 
realizado. Já nos estudos experimentais, a decisão de qual intervenção o participante 
da pesquisa será submetido é realizada pelos pesquisadores.
1. ESTUDO TRANSVERSAL, DE PREVALÊNCIA E SECCIONAL
O estudo transversal é descritivo e observacional. Esse nome tem origem da definição que as 
informações são coletadas em um único ponto do tempo, como se a linha do tempo sofresse 
um corte transversal ou como uma fotografia, ele também pode ser chamado de estudo sec-
cional ou de prevalência. A principal característica do estudo transversal é que as informações 
das variáveis dependentes e independentes são coletadas simultaneamente.
Figura 01. Esquema do desenho de estudo transversal
Pessoa com presença 
de uma ou mais 
variáveis independentes.
Pessoa com presença 
de uma ou mais 
variáveis independentes.
Pessoas com presença da 
variável dependente
Pessoas com presença da 
variável dependente
Fonte: elaborada pela autora.
49 Bioestatística e Epidemiologia
U4 Epidemiologia descritiva
Dessa forma, a principal finalidade desse tipo estudo é medir e descrever frequências 
de doenças e fatores de risco. Normalmente, ele é utilizado para descrever doenças 
comuns e de longa duração, como levantamentos de dados que descrevem dados já 
registrados e os inquéritos populacionais de saúde que buscam as informações para 
complementar os dados coletados por outros meios. 
A Pesquisa Nacional de Saúde (PNS) é o inquérito de saúde da população brasileira, por 
meio de entrevistas com amostra de base domiciliar e de âmbito nacional, realizada em 
parceria com o Instituto Brasileirode Geografia e Estatística (IBGE). A PNS de 2019 aborda 
a percepção do estado de saúde, estilos de vida, doenças crônicas e saúde bucal. Em um 
de seus resultados, observa-se que entre as pessoas de mais de 18 anos, no Brasil, 66,1% 
auto avaliam sua saúde como boa ou muito boa, 26,4% consomem bebida alcoólica uma 
vez ou mais por semana, 23,9% afirmam ter o diagnóstico para hipertensão arterial e 93,6% 
escovam os dentes pelo menos duas vezes por dia. (IBGE, 2020, p. 28; 41; 54; 73).
As vantagens do estudo transversal são: pratici-
dade, simplicidade, rapidez e baixo custo bene-
fício. No entanto, isso depende do tamanho e da 
população amostral, mas comparado com os ou-
tros tipos de estudos, ele é fácil de ser executado. 
Como todas as variáveis são coletadas no mesmo 
tempo, não há necessidade de segmento evitando 
assim perdas amostrais. 
Em contrapartida, nesse estudo não é adequado 
estabelecer causas entre variáveis, pois, como 
as informações foram coletadas simultaneamen-
te não é possível distinguir a temporalidade e garantir que um fator veio antes do outro. 
Por exemplo, uma pesquisa em idosos relata que 20% fumantes ativos têm câncer de 
pulmão, enquanto 10% dos não fumantes têm câncer de pulmão. Com essas informa-
ções não é possível definir que fumar causa câncer, já que a pessoa pode ter começado 
ou parado de fumar após o diagnóstico de câncer. 
Nesse sentido, as pesquisas transversais são capazes de sugerir associações ou hipóte-
ses para possíveis relações causais entre variáveis. Por isso, é comum que elas conclu-
am que estudos longitudinais devem ser feitos para avaliar se de fato existe associação.
Figura 02. Estudo
Fo
nt
e:
 1
23
R
F.
Não é possível definir fatores determinantes de eventos ou relações causais nos 
estudos transversais (ROUQUAYROL; GURGEL, 2018, p. 120-121).
IM
PO
R
TA
N
TE
!
Outra limitação é o alto risco de presença de vieses. Isto é, toda vez que uma associação é 
sugerida, há sempre um risco de ter viés de confusão, ou seja, outra variável é responsável 
pelo evento que não aquela proposta. Outro viés possível é o de sobrevivente, por exemplo, 
uma pesquisa sobre qualidade de vida para pacientes oncológicos pode ser tendenciosa, pois, 
provavelmente, grande parte da amostra é de casos menos graves e com melhor prognóstico. 
U4
50Bioestatística e Epidemiologia
Epidemiologia descritiva
Os resultados desses estudos são utilizados para ter um diagnóstico situacional da popu-
lação e, com isso, planejar ações e serviços a partir das demandas levantadas. Por exem-
plo, se um levantamento entre os adultos do território de uma Unidade Básica de Saúde 
encontra que 66% dessas pessoas têm sobrepeso ou obesidade, a equipe desse serviço 
pode planejar ações para reduzir essa proporção e prevenir doenças cardiovasculares.
 ` Viés é um erro sistemático e ao delinear o projeto é preciso pensar em estratégias 
metodológicas que diminuam a chance dele acontecer. 
BORGES, A. L. V.; SCHOR, N. Início da vida sexual na adolescência e relações 
de gênero: um estudo transversal em São Paulo, Brasil, 2002. Cadernos da Saúde 
Pública, Rio de Janeiro, v. 21, n. 2, p. 499-507, mar./abr. 2005. Disponível em: http://
dx.doi.org/10.1590/S0102-311X2005000200016. Acesso em: 25 fev. 2021. 
G
LO
SS
Á
R
IO
EX
EM
PL
O
2. SÉRIE OU RELATO DE CASOS
O relato de caso é uma descrição detalhada do quadro de um único paciente. Uma série 
de casos são descrições do curso de uma doença ou condição em um número pequeno de 
pessoas (ROUQUAYROL; GURGEL, 2018, p. 145), normalmente, elas são utilizadas para 
descrever doenças e quadros raros ou situações que a doença teve uma evolução diferente. 
Esse é o principal meio de comunicação de novas doenças e, portanto, é comum que sejam 
escritos por profissionais da saúde para descrever um ou poucos pacientes que apresentam 
características similares. A partir das séries de casos incomuns, que estavam ocorrendo em 
diversos lugares, iniciou-se uma investigação de uma nova doença que viria a ser a AIDS.
Para saber mais sobre o primeiro relato de caso da AIDS, leia o artigo referenciado a seguir:
CENTERS FOR DISEASE CONTROL - CDC. Pneumocystis pneumonia – Los Angeles. 
MMWR, [s. l.], v. 30, n. 21, p. 250-252, 5 jun. 1981. Disponível em: https://www.cdc.
gov/mmwr/preview/mmwrhtml/june_5.htm. Acesso em: 25 fev. 2021.
C
U
R
IO
SI
D
A
D
E
3. ESTUDOS ECOLÓGICOS
O estudo ecológico é um estudo descritivo em que a unidade análise é um grupo e não 
um indivíduo, por isso, segundo Rouquayrol e Gurgel (2018, p. 125-126), ele pode ser 
classificado com estudo agregado. As proporções e taxas das variáveis serão analisa-
das por grupos populacionais, esse é o delineamento mais comum para pesquisas com 
dados secundários, como aqueles disponibilizados pelo DATASUS. 
51 Bioestatística e Epidemiologia
U4 Epidemiologia descritiva
Esse tipo de estudo utiliza três tipos de medidas. As medidas agregadas resumem 
os dados dos indivíduos, não sendo possível saber informação de cada indivíduo da 
população. Assim, não é possível saber se uma pessoa que é hipertensa também 
consome bebida alcoólica mais do que uma vez na semana ou se realiza atividade 
física. Elas são representadas por médias, proporções ou frequências dos eventos em 
uma determinada população e local. 
Já as medidas ambientais representam as características físicas do ambiente, como 
qualidade do ar e índice de radiação ultravioleta (UV). Por fim, as medidas globais 
representam características sociais que não existem no nível individual, como nível de 
desigualdade social de uma população e local. As finalidades dos estudos ecológicos 
são de gerar novas hipóteses, assim como o estudo transversal, e de avaliar interven-
ções comunitárias ou impactos de leis. 
 ` DATASUS é a sigla do Departamento de Informática do Sistema Único de Saúde. 
Uma de suas funções é manter o acervo das bases de dados dos sistemas de 
informações em saúde e disponibilizar esses dados. Então, nessa plataforma, con-
seguimos dados agregados de mortalidade, natalidade, doenças transmissíveis, 
assistência à saúde, entre outros. G
LO
SS
Á
R
IO
Um estudo ecológico avaliará se houve redução de mortes em acidentes de trânsito 
após a lei que obrigou o uso do cinto de segurança. Esse delineamento é adequado 
para quando não se interesse em avaliar características dos indivíduos, quando a 
variabilidade de uma variável é baixa dentro da população e quando só se consegue 
obter dados agregados (FLETCHER; FLETCHER; FLETCHER, 2014, p. 216-217).E
XE
M
PL
O
Além disso, as vantagens são: baixo custo, rapidez e praticidade, já que, em alguns ca-
sos, os dados já estão disponíveis em plataformas. Por outro lado, como desvantagens, 
esse estudo leva em conta a média e não a variabilidade da característica dentro da po-
pulação, tem dificuldade em estabelecer temporalidade e fluxos migratórios ou eventos 
específicos podem mudar a característica da população, atrapalhando a análise. 
Dessa forma, o principal viés que pode ocorrer é a falácia ecológica ou viés de agre-
gação, que acontece ao interpretar o resultado e tentar inferir os resultados para o 
nível individual. Ou seja, os estudos ecológicos só demonstram associação entre dados 
agregados. Para confiar que essa associação também ocorre em nível individual preci-
samos de estudos com dados individuais. 
Por exemplo, um estudo ecológico observa uma associação que quanto maior o Índi-
ce de Desenvolvimento Humano (IDH) do município, maior a quantidade de exames 
preventivos de câncer de colo uterino (Papanicolau) são realizados. Cometer o erro de 
falácia ecológica seria pensar que a causa de a Sra. Maria não fazer o exame de Papa-
nicolau, há mais de cinco anos, é porque ela tem poucas condições socioeconômicas.
U4
52Bioestatística e Epidemiologia
Epidemiologia descritiva
4. DISTRIBUIÇÃO DE EVENTOS POR PESSOAS, TEMPO E LUGAR
Os estudos descritivos relatam, detalhadamente, os padrões de distribuição das variá-
veis. Com isso, pode-se medira frequência de algum evento entre pessoas de caracte-
rísticas diferentes, entre locais diferentes ou ao longo do tempo. 
Assim, analisar eventos por características da população tem como objetivo propor hipóteses 
de possíveis grupos de risco e características demográficas, comportamentais e socioeconô-
micas que possam influenciar na frequência do evento. No exemplo da Figura 3, a proporção 
de usuários atuais de produtos derivados do tabaco é maior em homens, em pessoas de 40 a 
59 anos e em pessoas de baixa escolaridade (ensino médio incompleto ou inferior).
Figura 03. Exemplo de comparação de características individuais
CECCON, R. F. et al. Suicídio e trabalho em metrópoles brasileiras: um estudo ecológi-
co. Ciência & Saúde Coletiva, Rio de Janeiro, v. 19, n. 7, p. 2225-2234, 2014. Disponível 
em: https://doi.org/10.1590/1413-81232014197.09722013. Acesso em: 25 fev. 2021.
EX
EM
PL
O
Gráfico 24 - Proporção de pessoas de 18 anos ou mais de idade usuárias de produtos 
derivados do tabaco, com indicação do intervalo de confiança de 95%, por sexo, grupos de 
idade, cor ou raça e nível de instrução - Brasil - 2019.
Total 12,8
16,2
9,8
10,8
12,0
14,9
11,9
11,8
13,7
13,5
17,6
15,5
9,6
7,1
0,0 5,0 10,0 15,0 20,0 25,0 30,0 35,0 40,0
De 18 a 24 anos
Homem
De 25 a 39 anos
Branca
Sem instrução e fundamental incompleto
Mulher
De 40 a 59 anos
Preta
Fundamental completo e médio incompleto
De 60 ou mais
Parda
Médio completo e superior incompleto
Superior completo
Fonte: IBGE. Diretoria de Pesquisas, Coordenação de Trabalho e Rendimento. Pesquisa Nacional de Saúde 2019.
Pesquisa Nacional de Saúde 2019, proporção de pessoas com 18 anos ou mais usuárias atuais de produtos derivados do 
tabaco. Fonte: IBGE (2020, p. 50).
53 Bioestatística e Epidemiologia
U4 Epidemiologia descritiva
Historicamente, a análise de dados por lugar foi o primeiro estudo epidemiológico, em 
que na epidemia de cólera procurou-se associação entre os locais em que os casos 
residiam e a frequência da doença. Nesse sentido, a análise com geoprocessamento é 
importante para definir se a doença está confinada a uma região, quais são as carac-
terísticas dos conglomerados de casos e se eles estão associados a outras variáveis. 
Figura 04. Exemplo de comparação de locais
GRÁFICO 181
Coeficiente de incidência de tuberculose. * São Paulo, 2012
Fonte: Sinan/SVS-MS e IBGE. 
*Por 100 mil habitantes.
0
1 | --- 20
20 | --- 40
40 | --- 60
60 e mais
Distribuição de proporção de casos novos de tuberculose nos municípios do Estado de São 
Paulo em 2012. 
Fonte: Brasil (2014, p. 55).
Desse modo, analisar a distribuição de um evento ao longo do tempo permite acompanhar 
a evolução da doença e associá-la a outros acontecimentos que, em algum período, fizeram 
com que a proporção do evento alterasse a tendência. Por exemplo, na Figura 5 podemos 
perceber uma tendência a estabilizar o número de casos novos de AIDS. Dessa forma, po-
de-se associar esse fato com a introdução da terapia antirretroviral de alta potência em 1997.
U4
54Bioestatística e Epidemiologia
Epidemiologia descritiva
Figura 05. Série histórica da proporção de dos casos novos notificados de AIDS 
por 100.000 habitantes no Brasil de 1980, 1982-2019 
0,00
5,00
10,00
15,00
20,00
25,00
Série1
Fonte: http://www2.datasus.gov.br/DATASUS/index.php?area=02. Acesso em: 25 fev. 2021. 
Além das séries ou tendência históricas, é possível determinar variações sazonais na 
frequência de casos. Em outras palavras, sabe-se que o número de casos de dengue 
aumenta nos meses de verão, assim como os casos de gripe nos meses de inverno. 
A partir da análise da distribuição de casos ao longo do tempo é possível definir se a ocorrência 
da doença em tempos atuais é uma epidemia ou não. No entanto, para isso, é necessário definir 
anteriormente o que é uma faixa endêmica. Endemia é a presença constante de determinada 
doença em populações e espaços específicos, normalmente, ela acontece depois que a doen-
ça é introduzida em um local e o número de casos se estabilizam ao longo dos anos. 
Uma doença endêmica apresenta taxas constantes de casos novos podendo ou 
não ter variação sazonal. A malária é endêmica no Região Amazônica, apresen-
tando, de forma geral, um aumento de casos no período de transição entre as 
estações úmidas e secas.
A faixa endêmica é uma previsão estatística do possível número de casos que devem ser 
encontrados em um período. Para criá-la, primeiramente, fazemos a média dos números 
de casos no período e depois consideramos como um intervalo dentro do normal dois 
desvios padrões de distância do valor da média. Na Figura 6, as linhas verdes represen-
tam os limites inferiores e superiores da faixa endêmica, já a linha azul apresenta a média 
de casos nos últimos anos. No mês de julho, a média de casos dos últimos anos foi de 30, 
mas é esperado que nesse ano a quantidade de doentes varie entre 21 e 39.
55 Bioestatística e Epidemiologia
U4 Epidemiologia descritiva
Quando o número de casos excede o que é esperado pela faixa, temos uma epidemia. 
Ela pode ser definida também como um aumento de doentes que excede o que se 
espera, normalmente com velocidade rápida e descontrolada. Na Figura 6 é possível 
perceber a epidemia a partir de maio, quando os casos ultrapassam o limite.
Figura 06. Gráfico da faixa endêmica
0
10
20
30
40
50
60
jan fev mar abr mai jun jul ago set out nov dez
média superior inferior casos
Com limites inferiores e superiores, e média da proporção de casos de uma doença 
fictícia além da frequência dos casos que ocorreram de janeiro a junho de 2021. 
Fonte: elaborada pela autora.
Popularmente, as pessoas usam surto como sinônimo de epidemia, contudo, para a 
epidemiologia, surto é uma concentração de casos delimitados a locais específicos. Por 
exemplo, 15 crianças apresentaram conjuntivite em uma escola específica, nesse caso, 
pode-se dizer que a escola apresentou um surto de conjuntivite. Outro termo semelhan-
te é a pandemia, que consiste na disseminação e no número excessivo de casos da 
doença no mundo inteiro. 
5. OBJETO DE APRENDIZAGEM
O DATASUS desenvolveu o TABNET, um tabulador das informações de saúde. Com ele 
é possível consultar de forma rápida os dados dos sistemas de informações em saúde 
e tabulá-los conforme necessário. Todos os exemplos utilizados nessa unidade foram 
obtidos por meio desse aplicativo. 
U4
56Bioestatística e Epidemiologia
Epidemiologia descritiva
A partir do seu domicílio, busque quantos novos casos de tuberculose tivemos nos úl-
timos anos, quantas crianças nasceram de parto cesárea e quantas pessoas morreram 
antes dos 50 anos de idade.
Explore a plataforma TABNET disponível em: http://www2.datasus.gov.br/DATASUS/index.
php?area=02. Acesso em: 15 mar. 2021. 
57 Bioestatística e Epidemiologia
U4 Epidemiologia descritiva
BRASIL. Ministério da Saúde. Panorama da tuberculose no Brasil: indicadores epidemiológicos e operacio-
nais. Brasília: Ministério da Saúde, 2014.
FLETCHER, R. H; FLETCHER, S. W.; FLETCHER, G. S. Epidemiologia clínica: elementos essenciais. 5. 
ed. Porto Alegre: ArtMed, 2014.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA – IBGE. Pesquisa nacional de saúde 2019: 
percepção do estado de saúde, estilos de vida, doenças crônicas e saúde bucal: Brasil e grandes regiões. Rio 
de Janeiro: IBGE, 2020. Disponível em: https://biblioteca.ibge.gov.br/visualizacao/livros/liv101764.pdf. Acesso 
em: 25 fev. 2021.
ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia e saúde. 8. ed. Rio de Janeiro: Medbook, 
2018.
REFERÊNCIAS BIBLIOGRÁFICAS
58
INTRODUÇÃO
Quantos pessoas são diagnosticadas com AIDS por ano no Brasil? Quantas pessoas 
estão com tuberculose neste momento? Como saber qual o impacto que as doenças 
têm na saúde e na expectativa de vida da população? Nesta unidade, você aprenderá 
como essas informações podem ser obtidas e como interpretá-las.
1. CONCEITO, HISTÓRICO E CARACTERÍSTICAS DE UM BOM INDICADOR 
Segundoa Ripsa (2008, p. 13), o indicador de saúde é uma medida que resume infor-
mações de saúde e os determinantes de uma população e do desempenho dos serviços 
de saúde de um local. Essa é uma ferramenta para realização de um diagnóstico popula-
cional, o que permite elaborar e avaliar ações, propor hipóteses e descrever a situação. 
Desse modo, um indicador de saúde para ser satisfatório, ele deve ser acessível para a 
população, de fácil compreensão, capaz de sintetizar as condições de saúde comparadas 
as outras realidades, capaz de propor ações de saúde adequadas a partir do acesso aos 
dados. Por isso, no mundo inteiro, os indicadores são calculados da mesma maneira, a 
partir de regras e consensos internacionais da Organização Mundial da Saúde (OMS).
A estratégia tradicional e mais antiga utilizada 
para avaliar a qualidade de vida da população 
é a análise dos óbitos. A análise estatística das 
mortes começou no século XVII, na Inglaterra, 
quando John Graunt tabulou as principais cau-
sas de morte a partir dos registros de igrejas 
(LAURENTI, 1991, p. 408-410). Nos séculos 
seguintes, a contagem e a análise dos dados 
foram se aprimorando até que outros eventos, 
como nascimento e doenças transmissíveis, fo-
ram incluídos. Assim, a análise dos óbitos e de 
nascimento é denominada de estatística vital. 
Um indicador de saúde é uma razão, ou seja, 
uma divisão entre valores de duas variáveis. 
Na maioria dos casos, trata-se de proporções 
em que o numerador está incluso no denominador, assim como a frequência relativa. 
Quando o valor do indicador é expresso com um número de 0 a 1, o chamamos de co-
eficiente, já a taxa é expressa por uma potência de base 10.
UNIDADE 5
INDICADORES DE SAÚDE
Figura 01. Indicador de saúde
Fo
nt
e:
 1
23
R
F.
59 Bioestatística e Epidemiologia
U5 Indicadores de Saúde
O coeficiente de mortalidade geral é 0,007 e a taxa de mortalidade é de 7 óbitos 
por 1.000 habitantes. As taxas têm fácil compreensão e, por isso, elas são mais 
usadas. Para calculá-las, na maioria das vezes, é só multiplicar o coeficiente 
por 1.000 ou 100.000.EX
EM
PL
O
1
 
 100 
 
númerode pessoas acometidas coma doença
emuma populaçãoeumdeterminado períodoPrevalência númerototal de pessoas
emuma populaçãoeumdeterminado período
= ×
2. INCIDÊNCIA E PREVALÊNCIA
Os indicadores mais frequentes para descrever uma doença são a incidência e a pre-
valência. A prevalência é uma proporção que descreve a frequência relativa em que o 
evento aconteceu durante um p eríodo de tempo. No entanto, ela não considera se a 
doença se iniciou e/ou terminou durante o período. Sendo assim, o que importa é contar 
quantos casos de doentes ocorreram. 
A principal função da prevalência é medir a magnitude da doença e o impacto que ela 
tem na população, sendo utilizada para gestores dos serviços e sistemas para planejar 
atendimentos e cuidados específicos. Esse indicador não é capaz de medir risco de 
alguém contrair uma doença.
Fórmula da prevalência:
O numerador contém pessoas com diferentes tempos de duração da doença, mas o 
que importa é que todos os casos ativos da doença – seja ele novo ou antigo – estão 
contados. A população e período devem ser os mesmos para o numerador e para o de-
nominador. A prevalência não tem unidade de medida e, normalmente, é expressa em 
porcentagem, logo, na fórmula, após a divisão, deve-se multiplicar por 100. 
A prevalência pode ser de ponto, de período ou de toda a vida, dependendo do período 
considerado. A prevalência de ponto expressa a situação em um único dia, por exem-
plo, quem está com a gripado hoje? A de período avalia quem, em algum momento des-
se período, ficou com a doença (que ficou gripado nesse último mês?). A prevalência 
de toda a vida – como o próprio nome remete – avalia quem teve a doença em algum 
momento da vida. Nos três tipos não importa se a pessoa acabou de ser diagnosticada 
ou se está com a doença há anos. O sujeito deve entrar no numerador quando em al-
gum momento do período estipulado para prevalência a pessoa apresentou a doença.
U5
60Bioestatística e Epidemiologia
Indicadores de Saúde
EX
EM
PL
O
Cálculo de prevalência 
Em uma cidade fictícia “X” com 3.000 habitantes, em 1º de janeiro de 2019, 
havia 12 pessoas em tratamento por Hanseníase. Ao longo do mês de janeiro 
foram diagnosticados mais 3 casos, e até 31 de junho de 2019 houve 5 altas por 
cura no mês de maio e não foram identificados mais novos casos da doença. 
A partir do princípio de que todo caso da doença está em tratamento, qual é a 
prevalência de hanseníase na cidade “X” no primeiro dia de janeiro de 2019; em 
janeiro de 2019 e no primeiro semestre do mesmo ano?
 ` Prevalência em 1 de janeiro de 2019 (prevalência de ponto):
 
 
 
númerode pessoas acometidas coma doença
emuma populaçãoeumdeterminado períodoPrevalência númerototal de pessoas
emuma populaçãoeumdeterminado período
=
12 
3.000
=
0,004 100 = ×
0,4%. =
 ..................................................................
 .............
 .............
 ..................................................................
substituir a fórmula
substituir a fórmula
dividir.
multiplicar. ............................................................
Logo, a prevalência de hanseníase em 1 de janeiro de 2019, na cidade “X”, é 
de 0,4%.
 ` Prevalência em janeiro de 2019 (prevalência de período):
 
 
 
númerode pessoas acometidas coma doença
emuma populaçãoeumdeterminado períodoPrevalência númerototal de pessoas
emuma populaçãoeumdeterminado período
=
12 3 
3.000
+
=
15 
3.000
=
0,005 100 = ×
0,5%. =
 ..................................................................
 .............................................................
 ..................................................................
somar.
dividir.
por fim, multiplicar.
61 Bioestatística e Epidemiologia
U5 Indicadores de Saúde
EX
EM
PL
O
A prevalência de hanseníase em janeiro de 2019, na cidade “X”, é de 0,5%.
 ` Prevalência no primeiro semestre de 2019 (prevalência de período):
 ............. substituir a fórmula
 ...............................................................
 .............................................................
 ..................................................................
 ..................................................................
somar.
dividir.
por fim, multiplicar.
 
 
 
númerode pessoas acometidas coma doença
emuma populaçãoeumdeterminado períodoPrevalência númerototal de pessoas
emuma populaçãoeumdeterminado período
=
12 3 5 
3.000
+ −
=
10 
3.000
=
0,0033 100 = ×
0,33%. =
Portanto, a prevalência de hanseníase no primeiro semestre de 2019, na 
cidade “X”, é de 0,33%.
Alguns fatores influenciam no cálculo da prevalência e devem ser considerados na hora 
de interpretar o resultado. Primeiramente, pode ser que o indicador esteja subestimado, 
visto que os casos graves podem não ter sido diagnosticados antes do óbito, e os casos 
leves e assintomáticos ainda não procuraram assistência. Desse modo, toda variação 
que aconteça desse indicador, ao longo do tempo, precisa ser levada em consideração. 
Nesse contexto, a prevalência pode ter aumentado porque, de fato, estão entrando ca-
sos novos e há mais pessoas doentes ou porque surgiu uma intervenção que aumenta a 
sobrevida do paciente e, portanto, as pessoas estão vivendo mais tempo com a doença.
Em segundo lugar, a incidência é a proporção e descreve o número de novos casos de uma 
doença em uma determinada população. Ela só pode ser medida se no início do acompa-
nhamento das pessoas for garantido que todos estão saudáveis, ou seja, sem a doença. 
Ela pode contar qualquer evento, como caso de doença, de morte e de deficiência.
Fórmula da incidência:
 
 100 
 
númerodecasos novos deuma doença
emuma populaçãoeumdeterminado períodoIncidência númerototal de pessoasemuma populaçãoeumdeterminado período
= ×2
U5
62Bioestatística e Epidemiologia
Indicadores de Saúde
Ela é expressa pelo número de casos por 1.000 a 100.000 habitantes, dependendo da 
frequência do evento. Essa decisão tem o objetivo de deixar o número de fácil com-
preensão. Normalmente, em uma análise de populações de cidades, estados e países 
usamos a cada 100.000 pessoas. Todo indivíduo que está no denominador pode ser um 
caso e, também, participar do numerador.
Esse indicador é o único que pode avaliar risco de se ter a doença. Portanto, ele é 
capaz de medir o impacto e a magnitude da doença na população, sendo usada para 
avaliar relações causais entre as variáveis.
EX
EM
PL
O
Cálculo de incidência 
01. Em uma cidade fictícia “X” com 3.000 habitantes, em 1 de janeiro de 2019, 
havia 12 pessoas em tratamento por Hanseníase. No mês de janeiro foram 
diagnosticados mais 3 casos, até 31 de junho de 2019 houve 5 altas por cura 
no mês de maio e não houve mais casos novos. Parta do princípio de que todo 
caso da doença está em tratamento. Qual é a incidência de hanseníase na 
cidade “X” no primeiro semestre do mesmo ano?
A incidência de hanseníase no primeiro semestre de 2019 é de 1 caso para 
cada 1.000 habitantes.
02. No Brasil, em 2019, foram diagnosticados 37.308 casos de AIDS. Conside-
rando que a população estimada para o ano de 2019 é de 210.661.032, qual foi 
a incidência da doença em 2019?
 ..................................................................
 .............
 .............
 .........................................................................
substituir a fórmula
substituir a fórmula
dividir.
multiplicar. ............................................................
 
 
 
númerodecasos novos da doença
emuma populaçãoeumdeterminado períodoIncidência númerototal de pessoas
emuma populaçãoeumdeterminado período
=
3 
3.000
=
0,001 1.000 = ×
1. =
 
 
 
númerodecasos novos da doença
emuma populaçãoeumdeterminado períodoIncidência númerototal de pessoas
emuma populaçãoeumdeterminado período
=
63 Bioestatística e Epidemiologia
U5 Indicadores de Saúde
EX
EM
PL
O
No Brasil, a incidência de AIDS em 2019 é de 17,71 casos para cada 100.000 
habitantes.
dividir.
multiplicar. ..................................................................................
 ..................................................................37.308 100.000
210.661.032
= ×
17,71. =
A prevalência está associada com a incidência e a duração da doença, em situações es-
táveis, a prevalência é diretamente proporcional a esses dois fatores. A Figura 2 ajudará 
você a entender essa associação das variáveis. Nesse caso, considere uma pia com a 
torneira aberta, a água que entra é a incidência e o volume de água parada é a preva-
lência (número de casos ativos da doença). Os casos só saem da prevalência por óbito 
ou cura, isto é, na figura, a água só sai pelo ralo. Assim, se o ralo da pia aumentar de 
tamanho, por exemplo, com a resistência do agente etiológico ao tratamento, o volume 
da pia aumentará, assim como a prevalência.
Figura 02. Esquema sobre a associação da prevalência, incidência (casos novos) 
e tempo de duração da doença
Casos novos
Cura, óbito
Prevalência
Fonte: elaborada pela autora.
U5
64Bioestatística e Epidemiologia
Indicadores de Saúde
Nesse sentido, doenças de longa duração têm prevalência alta, pois os casos acabam 
sendo super-representados, já que a cura e o óbito demoram mais tempo para acon-
tecer do que o aparecimento dos casos novos. Assim, outras situações, como realizar 
diagnóstico precoce e a melhora no tratamento, aumentam o tempo da doença e, por-
tanto, aumentam a prevalência.
Para as doenças crônicas não transmissíveis, a prevalência é a única medida a ser 
utilizada. Na maioria dos casos, ela pode ser obtida por meio de estudos transversais. 
Já para as doenças transmissíveis de notificação compulsória, pode-se calcular a inci-
dência e a prevalência dos casos.
3. INDICADORES DE NATALIDADE, FECUNDIDADE E MORBIDADE
Apenas contar o número de casos da doença não é suficiente para avaliar a gravidade. 
Por exemplo, a dengue tem alta taxa de incidência, mas em poucos casos há morte. 
A letalidade, por sua vez, é a proporção de casos da doença que vão ao óbito, sendo 
expressa em porcentagem.
Fórmula da letalidade:
Se descobrirmos um novo método diagnóstico que é mais sensível a doença, a incidên-
cia aumentará devido ao aumento do número de casos novos, assim como a prevalên-
cia. Na lógica do esquema da Figura 2, o novo diagnóstico abrirá ainda mais a torneira 
e, portanto, a pia ficará cheia de água, já que o ralo continua do mesmo tamanho.EX
EM
PL
O
 
 100 
 
númerototal deóbitos pela doença
emuma populaçãoeumdeterminado períodoLetalidade númerototal decasos pela doença
emuma populaçãoeumdeterminado período
= ×3
Enquanto a incidência representa o risco de ficar doente, a letalidade expõe o risco de 
morrer uma vez que se está doente.
Em 2019, o Brasil tinha uma população total de 210.659.013 habitantes. Nesse período, 
o país apresentou o total de 1.349.802 óbitos, entre eles, 1.434 pessoas tinham como 
causa básica a meningite. Em 2019, foram diagnosticados 16.159 casos da doença. 
Qual é a letalidade de meningite em 2019, no Brasil?EX
EM
PL
O
65 Bioestatística e Epidemiologia
U5 Indicadores de Saúde
Letalidade
EX
EM
PL
O
 100
 
númerodeóbitos pela doençaLetalidade
total casos pela doença
= ×
1.434 100
16.159
Letalidade = ×
 8,87.Letalidade =
Em 2019, a letalidade no Brasil para meningite é de 8,87%, ou seja, 9% dos casos da 
doença irão a óbito.
substituir os valor
.................realizar a divisão e a multiplicação.
A taxa bruta de natalidade é a proporção de crianças nascidas vivas em uma determina-
da população, tempo e local. Ela é utilizada para estimar o crescimento da população, 
sendo expressa pelo número de nascidos vivos a cada 1.000 habitantes.
Fórmula da taxa bruta de natalidade:
O indicador é influenciado pela característica da população, pois em uma população 
mais idosa há poucos nascimentos de crianças, e pelas condições socioeconômicas. 
A taxa de fecundidade total indica o número médio de filhos que uma mulher tem no seu 
período reprodutivo (de 15 a 49 anos). Essa taxa é utilizada, principalmente, para avaliar 
o crescimento populacional, indicando a possibilidade de reposição populacional, em que 
a fecundidade menor do que 2,1 indica uma reposição populacional insuficiente. As con-
dições sociais e econômicas podem influenciar no aumento ou na redução da taxa.
A taxa específica de fecundidade indica a média do número de filhos que uma mulher 
tem em uma determinada faixa etária. A fórmula é o número de nascidos vivos de mu-
lheres com uma faixa de idade específica dividindo pela população total feminina da 
faixa etária. Normalmente, essa análise é observada a cada cinco anos, por exemplo, 
fecundidade de mulheres 15 a 19 anos, 20 a 24 e assim sucessivamente até a faixa 45 
a 49 anos. Podem ser expressas a cada 1.000 mulheres de determinada faixa etária. 
 
 1.000 
 
númerototal denascidos vivos deresidentes
emumdeterminado períodoetempoNatalidade númerototal de pessoas emuma
populaçãoeumdeterminado períodoetempo
= ×4
%
U5
66Bioestatística e Epidemiologia
Indicadores de Saúde
Para isso se multiplica o resultado por 1.000.
Fórmula da taxa de fecundidade específica (TFE):
EX
EM
PL
O
Natalidade e fecundidade específica e total
Em 2019, o Brasil tinha uma população total de 210.659.013 habitantes, em que 
57.055.184 pessoas eram mulheres de 15 a 49 anos. Nesse ano, o país teve 2.849.146 
nascidos vivos. 
O cálculo da taxa de fecundidade total é feito primeiramente somando as taxas especí-
ficas de fecundidade de períodos idade (15 a 19, 20 a 24, 25 a 29, 30 a 34, 35 a 39, 40 
a 44 e 45 a 49 anos) de mulheres residentes em determinado local. Os valoresa serem 
somados são o resultado da divisão antes de multiplicar por 1.000. Depois da soma se 
multiplica o valor por 5 já que a faixa etária das fecundidades específicas é de cinco anos.
Fórmula da taxa de fecundidade total:
5
( )1 5 1 9 20 24 25 29 30 34 35 39 40 44 45 49 5 Fecundidade TFE a anos TFE a anos TFE a anos TFE a anos TFE a anos TFE a anos TFE a anos
Total
= + + + + + + ×
( )1 5 1 9 20 24 25 29 30 34 35 39 40 44 45 49 5 Fecundidade TFE a anos TFE a anos TFE a anos TFE a anos TFE a anos TFE a anos TFE a anos
Total
= + + + + + + ×
Tabela 01. Distribuição de nascidos vivos por faixa etária materna e população 
feminina residente no Brasil em 2019 conforme faixa etária
NASCIDOS VIVOS POPULAÇÃO FEMININA
15 a 19 anos 399.922 8.338.727
20 a 24 anos 697.478 8.415.846
25 a 29 anos 674.427 8.424.527
30 a 34 anos 597.119 8.587.322
35 a 39 anos 364.105 8.700.521
40 a 44 anos 90.968 7.727.483
45 a 49 anos 5.310 6.860.758
Fonte: elaborada pela autora.
67 Bioestatística e Epidemiologia
U5 Indicadores de Saúde
EX
EM
PL
O
Nesse contexto, quais são as taxas brutas de natalidade e taxas de fecundidade espe-
cíficas e total em 2019 no Brasil?
Taxa de bruta de natalidade:
 1.000
 
númerodenascidos vivosNatalidade
númerototal de pessoas
= ×
2.849.146 1.000
210.659.013
Natalidade = ×
13,52. Natalidade =
...................substituir os valores.
...............realizar a divisão e a multiplicação.
No Brasil, a taxa de bruta de natalidade em 2019 é de 13,52 nascidos vivos a cada 
1.000 habitantes.
Taxa de fecundidade específica:
 
 1 5 1 9 1 5 1 9 
 1 5 1 9 
nascidos vivos de
mulheres de a anosTFE a anos
mulheres de a anos
=
399.9221 5 1 9 
8.338.727
TFE a =
1 5 1 9 TFE a anos =
...................substituir os valores.
.....................realizar a divisão e a multiplicação.
0,0480
 
697.478 20 24 20 24 0,0829
 20 24 8.415.846
nascidos vivos de
mulheres de a anosTFE a anos
mulheres de a anos
= = =
 
674.427 25 29 25 29 0,
 25 29 8.424.527
nascidos vivos de
mulheres de a anosTFE a anos
mulheres de a anos
= = =
 
597.119 30 34 30 34 0,0695
 30 34 8.587.322
nascidos vivos de
mulheres de a anosTFE a anos
mulheres de a anos
= = =
 
364.105 35 39 35 39 0,0418
 35 39 8.700.521
nascidos vivos de
mulheres de a anosTFE a anos
mulheres de a anos
= = =
= 0,0829
= 0,0801
= 0,0695
= 0,0418
U5
68Bioestatística e Epidemiologia
Indicadores de Saúde
EX
EM
PL
O
 
90.968 40 44 40 44 0,0118
 40 44 7.727.483
nascidos vivos de
mulheres de a anosTFE a anos
mulheres de a anos
= = =
 
5.310 45 49 45 49 0,0008
 45 49 6.860.758
nascidos vivos de
mulheres de a anosTFE a anos
mulheres de a anos
= = =
= 0,0118
= 0,0008
Taxa de fecundidade total:
( )1 5 1 9 20 24 25 29 30 34 35 39 40 44 45 49 5Fecundidade TFE a TFE a TFE a TFE a TFE a TFE a TFE a= + + + + + + ×
( )1 5 1 9 20 24 25 29 30 34 35 39 40 44 45 49 5Fecundidade TFE a TFE a TFE a TFE a TFE a TFE a TFE a= + + + + + + × ...................substituir os valores.
...................................................... realizar a multiplicação.
(0,0480 0,0829 0,0801 0,0695 0,0418 0,0118 0,0008 5Fecundidade = + + + + + + ×
(0,0480 0,0829 0,0801 0,0695 0,0418 0,0118 0,0008 5Fecundidade = + + + + + + ×
Em 2019, a taxa de fecundidade total no Brasil é de 1,67 nascidos vivos a cada mulheres 
de 15 a 49 anos, sendo que a faixa etária de mulher que mais tem filho é a de 20 a 24 anos.
Por fim, a esperança (ou expectativa) de 
vida ao nascer é o número médio de anos 
que a pessoa vive, conforme o ano de nas-
cimento. Esse indicador é muito utilizado 
para avaliar e comparar a saúde de um 
país, nesse sentido, seu valor é utilizado na 
construção do Índice de Desenvolvimento 
Humano (IDH). Contudo, embora a expec-
tativa de vida ao nascer no Brasil seja maior 
do que 75 anos, isso não significa que todas 
as pessoas viverão, em média, até os 75 
anos. A estatística serve para estimar o tempo de vida das crianças nascidas naquele 
ano, logo, para saber qual é sua esperança de vida ao nascer, é necessário buscar o 
valor a partir do seu ano de nascimento.
Com isso, é possível comparar a esperança de vida para faixas etárias. Por exemplo, em 
2015, quem tem 10 anos e quem tem 65 anos tem expectativas de vidas diferentes. As-
Figura 03. Expectativa de vida
Fo
nt
e:
 1
23
R
F.
%
69 Bioestatística e Epidemiologia
U5 Indicadores de Saúde
sim, à medida que se envelhece, a expectativa de vida aumenta. Então, uma pessoa com 
10 anos naquele ano terá uma expectativa de vida maior do que 65 anos, uma vez que 
já sobreviveu e superou a mortalidade esperada para a mortalidade infantil, por exemplo.
Dessa forma, estimar o tempo de vida não é suficiente, pois não se avalia a quali-
dade da vida. Por isso, uma iniciativa internacional que o Brasil participa começou 
a avaliar o peso das doenças na longevidade da população. Os estudos da Carga 
Global de Doenças (em inglês GBD – Global Disease Burden) tiveram início no final 
dos anos 1990. Eles desenvolveram ou difundiram os indicadores: anos potenciais 
de vida perdidos (em inglês YLL – years life lost), anos de vida saudáveis perdidos 
(em inglês DALY – disability adjusted life years) e expectativa de vida saudável (em 
inglês HALE – healty life expectancy). 
O YLL avalia o impacto que a doença pode ter na vida da pessoa a partir de quantos 
anos de vida foram perdidos pela morte precoce. O DALY avalia qual o tempo que a 
pessoa viveu com alguma deficiência em decorrência de uma doença, aferindo o impac-
to da doença no sobrevivente. Já o HALE avalia a expectativa de vida antes de desen-
volver uma doença ou condição grave incapacitante, sendo muito útil para avaliar se o 
aumento da esperança de vida está associado com mais tempo de vida saudável ou se 
esse tempo a mais será com um baixo nível de saúde e qualidade de vida.
4. OBJETO DE APRENDIZAGEM
0,00
10,00
20,00
30,00
40,00
50,00
60,00
70,00
80,00
90,00
100,00
Incidência média de COVID-19 por 100.000 habitantes de 
01/03/20 a 20/04/21
Peru Itália EUA Reino Unido Brasil Espanha
Comentário
No final do ano de 2020 as novas variantes começaram a circular e por isso 
pode-se observar um aumento do número de casos novos.
U5
70Bioestatística e Epidemiologia
Indicadores de Saúde
Comentário
Perceba que o eixo vertical tem duas escalas diferentes já que as duas variáveis 
(casos e óbitos) tem grandezas diferentes
Comentário
A curva de mortalidade do Brasil no final do gráfico é de mesma intensidade que 
a curva da Itália no começo da pandemia. 
Esses dois picos estreitos do Peru provavelmente são explicados por atualiza-
ção de dados atrasados.
0
5
10
15
20
25
Taxa de Mortalidade média por COVID-19 por 1.000.000 
habitantes de 01/03/20 a 20/04/21
Peru Itália EUA Reino Unido Brasil Espanha
0
500
1000
1500
2000
2500
3000
3500
0
10000
20000
30000
40000
50000
60000
70000
80000
90000
N
úm
er
o 
de
 ó
bi
to
s
N
úm
er
o 
de
 c
as
os
 n
ov
os
Média de casos novos e média de óbitos diários de 
COVID-19 no Brasil de 01/03/2020 a 20/04/2021 
casos óbitos
71 Bioestatística e Epidemiologia
U5 Indicadores de Saúde
PAÍS POPULAÇÃO CASOS TOTAIS ÓBITOS TOTAIS LETALIDADE
INCIDÊNCIA 
(POR 100.000 
HAB)
TAXA DE 
MORTALIDADE 
ESPECÍFICA 
(POR 100.000 
HAB)
Peru 32.510.450 1.697.626 56.797 3,35% 5.221,79 174,70
Itália 60.302.090 3.870.131 116.927 3,02% 6.417,91 193,90
EUA 328.239.520 31.311.941 561.616 1,79% 9.539,36 171,10
Reino Unido 66.836.330 4.387.824 127.270 2,90% 6.565,03 190,42
Brasil 211.049.530 13.900.091 371.678 2,67% 6.586,17 176,11
Espanha 47.133.520 3.396.685 76.882 2,26% 7.206,52 163,12
Fonte de todos os gráficos e tabela: 
- Dados COVID-19 coletados na Organização Mundial da Saúde (OMS) Disponível 
em https://portal.who.int/report/eios-covid19-counts/#display=Countries_and_
Territories&nrow=2&ncol=3&arr=row&pg=1&labels=&sort=cur_case_who;desc&filter=&sidebar=4&fv=Acessado em 20 abr 2021. 
- Dados de população: Banco Mundial Disponível em: https://data.worldbank.org/indicator/SP.POP.
TOTL . Acessado em: 15 Maio 2021 
Tabela 02. Informações sobre a pandemia de COVID-19 em países no período de 
04/01/2020 a 20/04/2021 
U5
72Bioestatística e Epidemiologia
Indicadores de Saúde
DEPARTAMENTO DE INFORMÁTICA DA FUNDAÇÃO NACIONAL DE SAÚDE DO SUS - DATASUS. In-
formação de Saúde. Brasília, DF: Ministério da Saúde, 2020. Disponível em: http://www2.datasus.gov.br/
DATASUS/index.php?area=02. Acesso em: 25 fev. 2021.
FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. Epidemiologia clínica: elementos essenciais. 5. ed. 
Porto Alegre: ArtMed, 2014.
LAURENTI, R. Análise da informação em saúde: 1893 – 1993, cem anos da Classificação Internacional de 
Doenças. Revista Saúde Pública, São Paulo, v. 25, n. 6, p. 407-417, 1991. Disponível em: https://www.scie-
losp.org/pdf/rsp/1991.v25n6/407-417. Acesso em: 15 mar. 2021.
REDE INTERAGENCIAL DE INFORMAÇÃO PARA A SAÚDE – RIPSA. Indicadores básicos para a saúde 
no Brasil: conceitos e aplicações. 2. ed. Brasília: Organização Pan-Americana da Saúde, 2008. Disponível 
em: http://www.ripsa.org.br/2014/10/30/indicadores-basicos-para-a-saude-no-brasil-conceitos-e-aplicacoes-
-livro-2a-edicao-2008-2/. Acesso em: 3 mar. 2021.
ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia e saúde. 8. ed. Rio de Janeiro: Medbook, 
2018. 
REFERÊNCIAS BIBLIOGRÁFICAS
about:blank
about:blank
about:blank
about:blank
about:blank
about:blank
74
UNIDADE 6
TRANSIÇÃO DEMOGRÁFICA E 
EPIDEMIOLÓGICA
INTRODUÇÃO
Quantas pessoas morrem por essa doença? Do que as pessoas morrem? Qual é a 
principal causa de morte do estado de São Paulo e do município de Curitiba? Ao longo 
do tempo, as causas de morte e a expectativa de vida mudaram?
As informações abordadas nesta unidade ajudarão você a entender como essas infor-
mações podem ser obtidas e como interpretá-las.
1. INDICADORES DE MORTALIDADE 
A análise das causas de morte é um indicador de saúde. Essa é uma referência para 
saber quais doenças mais acometem a população ao ponto de levar as pessoas a óbito. 
As informações são obtidas na declaração de óbito, que se trata de um documento igual 
em todo o país e segue um padrão internacional de descrever as causas da morte, a fim 
de possibilitar uma comparação entre países.
A principal análise da mortalidade considera apenas uma única causa. Desse modo, 
considere que uma pessoa que tinha câncer de mama há seis anos, com metástase 
hepática há dois anos, e que teve insuficiência hepática seguida de falência múltipla dos 
órgãos, que a levou a óbito. Qual dessas doenças seria o mais adequado para entrar na 
estatística? A causa que irá para a análise de mortalidade é a causa básica de morte, ou 
seja, a doença ou evento que iniciou a cadeia de eventos que levou a óbito. Portanto, 
nesse caso descrito, seria o câncer de mama.
Por causa desse raciocínio, algumas doenças 
podem apresentar uma baixa taxa de mortali-
dade, mesmo sendo frequentemente citadas 
nos atestados de óbito, como a diabetes e a 
hipertensão arterial sistêmica. Essas doenças 
são muito prevalentes na população adulta, 
no entanto, raramente são definidas como a 
causa básica nos atestados de óbito. Logo, há 
prejuízo na identificação do impacto dessas 
doenças na mortalidade da população.
Há vários indicadores de mortalidade, no 
entanto, tradicionalmente, a análise ocorre 
pelos óbitos de residentes do local (município, estado, região ou país) e não a partir dos 
óbitos ocorridos no local. Como algumas informações sofrem ajustes após a notificação, 
normalmente, os indicadores demoram de um a dois anos para serem concluídos. Por 
sua vez, os dados brutos para realizar os cálculos podem ser encontrados no DATASUS. 
Figura 01. Taxas e indicadores
Fo
nt
e:
 1
23
R
F.
75 Bioestatística e Epidemiologia
U6 Transição demográfica e epidemiológica
As causas das estatísticas de mortalidade são contadas a partir do código Classificação Es-
tatística Internacional de Doenças e Problemas Relacionados com a Saúde (CID) de cada 
doença. Essa classificação é internacional, desenvolvida pela Organização Mundial da Saúde 
(OMS) e, em 2019, foi lançada a sua 11ª edição (CID-11). Com isso, em 2022, espera-se que 
os países da OMS iniciem o uso da nova versão. Na CID-10, as doenças estão organizadas 
por aparelhos e agrupadas por similaridades, por exemplo, o capítulo IX se refere a doenças 
do aparelho circulatório, em que o código I10 se trata da hipertensão arterial sistêmica.
A taxa de mortalidade geral é o principal indicador, pois, ela resume qual a proporção 
de pessoas que morrem em um determinado período e local. Esse indicador é expresso 
por 1.000 habitantes e essa taxa é utilizada para avaliar a condição geral de saúde.
Fórmula da taxa de mortalidade geral (TMG):
1
Além da mortalidade geral, é possível calcular grupos específicos de causas ou de 
idades. Para indicadores de causa, pode-se avaliar apenas uma causa ou um grupo. 
Tradicionalmente, as causas são agrupadas por capítulos ou agrupamentos previamen-
te previstos pela CID-10.
A taxa de mortalidade específica por causa calcula a proporção de óbitos por uma 
causa ou o grupo de causas específicas na população. Esse indicador, por sua vez, é 
expresso por 100.000 habitantes.
A taxa de mortalidade específica por neoplasias malignas expressa a proporção de 
pessoas, de um determinado período e local, que tiveram como causa básica de morte 
uma neoplasia maligna.
EX
EM
PL
O
Fórmula da taxa de mortalidade específica por causa (TM específica):
2
Essa taxa mede a intensidade e magnitude da doença. Ela é uma incidência de morte e, 
portanto, avalia risco de a população ir a óbito por uma causa, podendo ser utilizado para 
ajudar na avaliação das condições de saúde e de planejamento do sistema e serviços.
U6
76Bioestatística e Epidemiologia
Transição demográfica e epidemiológica
Já a mortalidade proporcional por causa calcula a proporção de óbitos por uma cau-
sa ou o grupo de causas específicas entre todos os óbitos. Por exemplo, mortalidade 
proporcional por doenças cardiovasculares expressa a proporção dos óbitos de um de-
terminado período e local que tiveram como causa básica uma doença cardiovascular, 
sendo expressa por porcentagem de óbitos. Nesse indicador, observe que o denomina-
dor é o número total de óbitos.
Fórmula da mortalidade proporcional por causa (M Proporcional):
3
A mortalidade proporcional mede a participação da causa no total de óbitos, podendo 
ser utilizada para ajudar na avaliação das condições de saúde e de planejamento do 
sistema e serviços. Ela depende das características da população e sofre influência 
pela frequência das outras causas.
Uma mortalidade proporcional baixa não significa, necessariamente, que exista um bai-
xo risco de óbito por uma causa específica. Nesse contexto, pode ser que a mortalidade 
proporcional esteja baixa porque, naquele período, houve um aumento de outros casos. 
Já a taxa de mortalidade específica não é influenciada pelas outras causas. Na Figura 
2, ao comparar os óbitos por causas externas (capítulo XX), a taxa de mortalidade pro-
porcional no Amazonas é maior quando comparado com o Brasil, mas a taxa de morta-
lidade específica pelo mesmo capítulo é similar.
Figura 02. Gráficos comparando a taxa de mortalidade específica (A) por 100.000 habitantes e a mortali-
dade proporcional (B) por capítulos da CID-10 no Brasil, Amazonas e São Paulo em 2019
77 Bioestatística e Epidemiologia
U6 Transição demográfica e epidemiológica
Nota: cap. II: neoplasmas [tumores]; cap. IV: doenças endócrinas, nutricionais e metabólicas; cap. 
IX: doenças do aparelho circulatório; cap. X: doenças do aparelho respiratório; cap. XVIII: sintomas, 
sinais e achados anormais de exames clínicos e de laboratório, não classificados em outra parte; e 
cap. XX: causas externas de morbidade e de mortalidade. Fonte: DATASUS (2019, [n. p.]).
TMG, TM específica e mortalidadeproporcional 
Em 2019, o Brasil tinha uma população total de 210.659.013 habitantes. Nesse perío-
do, o país apresentou 1.349.802 óbitos totais, em que 364.132 desses óbitos ocorre-
ram devido às doenças do aparelho circulatório e 235.301 por neoplasias. Quais são 
as taxas de mortalidade geral, taxa de mortalidade específica por neoplasias e a taxa 
de mortalidade proporcional por doenças do aparelho circulatório, no Brasil, em 2019?
Taxa de mortalidade geral:
EX
EM
PL
O
S
......................substituir os valores.
.........................................dividir e multiplicar.
Logo, a taxa de mortalidade geral no Brasil em 2019 é de 6,41 mortes a cada 
1.000 habitantes.
U6
78Bioestatística e Epidemiologia
Transição demográfica e epidemiológica
EX
EM
PL
O
S
Taxa de mortalidade específica por neoplasia:
...................................substituir os valores.
...............................................................dividir e multiplicar.
A taxa de mortalidade específica por neoplasia no Brasil em 2019 é de 111,7 mortes a 
cada 100.000 habitantes.
Mortalidade proporcional por doenças do aparelho circulatório:
...........substituir os valores.
.........................................dividir e multiplicar.
Por fim, a mortalidade proporcional por doenças do aparelho circulatório no Brasil em 
2019 é de 26,98%. Ou seja, 26,98% dos óbitos têm como causa básica uma doença 
do aparelho circulatório.
Fonte: DATASUS (2019, [n. p.]).
A mortalidade proporcional por faixa etária consegue indicar o nível de saúde da popu-
lação, a qualidade dos serviços e o grau de desenvolvimento do local. Por sua vez, os 
dois indicadores mais comuns são a Razão de Mortalidade Proporcional e a curva de 
Mortalidade Proporcional.
A curva de Mortalidade Proporcional é também chamada de curva de Nelson de Mo-
raes, autor da classificação de quatro tipos de curvas relacionadas ao nível de saúde 
da população, foi descrita em 1959. 
EX
EM
PL
O
A Figura 3 apresenta a representação gráfica dos quatro tipos de curvas (A) e a curva 
do Brasil, Amazonas e São Paulo em 2019.
79 Bioestatística e Epidemiologia
U6 Transição demográfica e epidemiológica
Fonte: (A) Rouquayrol e Gurgel (2018, p. 54) e (B) DATASUS (2019, [n. p.]).
Figura 03. Curva mortalidade proporcional por faixa etária. (A) Representação dos quatro tipos de níveis de 
saúde diferentes descrito por Nelson de Moraes. (B) Informações do Brasil, Amazonas e São Paulo em 2019
U6
80Bioestatística e Epidemiologia
Transição demográfica e epidemiológica
A Razão de Mortalidade Proporcional, ou o Índice de Swaroop & Uemura, se trata da 
proporção de óbitos que ocorreram em pessoas com 50 anos ou mais em um determi-
nado período e local. Ela é expressa em porcentagem.
Fórmula da razão de mortalidade proporcional:
4
Nesse indicador, criado em 1955, quanto maior seu valor, melhores as condições de saú-
de do local, pois, espera-se que a grande maioria dos óbitos ocorram em pessoas com 
mais de 50 anos de idade. Com isso, ele é utilizado para avaliar as condições de países. 
Para ajudar a interpretá-lo, criaram-se quatro grupos: índice de 75% ou mais, em que se 
considera o país desenvolvido; índice de 50 a 74%, país com certo desenvolvimento eco-
nômico e bom serviços de saúde; índice de 25 a 49%, país com atraso econômico e social; 
por fim, índice inferior a 25%, considera-se o país com alto grau de subdesenvolvimento.
EX
EM
PL
O
S
Razão de mortalidade proporcional: 
O Brasil, em 2019, tinha uma população total de 210.659.013 habitantes. Nesse pe-
ríodo, o país apresentou 1.349.802 óbitos totais, em que 1.084.425 desses óbitos 
ocorreram em pessoas com 50 anos ou mais. 
Razão de mortalidade proporcional:
...........substituir os valores.
.........................................dividir e multiplicar.
No Brasil, a razão de mortalidade em 2019 foi de 80,34%, no estado de São Paulo foi 
de 84,28% e no Estado de Amazonas de 64,35%.
Fonte: DATASUS (2019, [n. p.]).
81 Bioestatística e Epidemiologia
U6 Transição demográfica e epidemiológica
Além disso, outro indicador que consegue fazer uma associação com as condições de 
saúde de um local é a mortalidade infantil. A taxa de mortalidade infantil é como uma 
mortalidade específica para uma faixa etária, estimando o risco de morte das crianças 
com menos de 1 ano (de 0 a 364 dias de vida). Para estimar esse risco, o correto seria 
o denominador do cálculo da taxa ser a população menor de 1 ano do determinado local 
e período em que se pretende avaliar. No entanto, como não é possível ter esse valor 
real, usamos o número de nascidos vivos como estimativa.
Fórmula da taxa de mortalidade infantil (TMI):
5
Esse indicador é muito utilizado para comparar países e, normalmente, é considerado alto se o 
valor for 50 ou mais óbitos por mil habitantes, médio se apresenta de 20 a 49 e baixo se menor 
que 20. Para conseguir um detalhamento das razões que levaram as crianças a óbito, pode-se 
utilizar um indicador de mortalidade com faixas etárias mais reduzidas. A taxa de mortalidade 
neonatal utiliza os óbitos de crianças de 0 a 27 dias. A taxa de mortalidade neonatal precoce 
utiliza os óbitos de crianças de 0 a 6 dias de vida, enquanto a neonatal tardia de 7 a 27 dias. 
Fórmula da taxa de mortalidade neonatal (TMN):
6
7
8
Fórmula da taxa de mortalidade neonatal precoce (TMN precoce):
Fórmula da taxa de mortalidade neonatal tardia (TMN tardia):
U6
82Bioestatística e Epidemiologia
Transição demográfica e epidemiológica
9
A mortalidade neonatal está associada a qualidade da atenção à saúde, pois, normal-
mente, os óbitos que acontecem nesse período são em decorrência da qualidade da 
assistência nos períodos de pré-natal, parto e perinatal. Para avaliar as condições so-
cioambientais é adequado utilizar a taxa de mortalidade pós-neonatal. Essa taxa, por 
sua vez, utiliza os óbitos de crianças com 28 a 364 dias de vida. Nesse período, as prin-
cipais causas de morte são questões nutricionais ou doenças transmissíveis. A Figura 4 
apresenta um esquema com as divisões dos períodos da mortalidade infantil.
Fórmula da taxa de mortalidade pós-neonatal (TMPN):
Figura 04. Esquema das divisões das faixas etárias da mortalidade infantil
Mo
rta
lid
ad
e n
eo
na
tal
 pr
ec
oc
e (
0 a
 6d
)
Mo
rta
lid
ad
e n
eo
na
tal
 ta
rdi
o (
7 a
 27
d)
Mortalidade neonatal 
(0 a 27d)
Mortalidade pós-neonatal 
(28 a 364d)
Mortalidade infantil
0d 7d 28d 1a
Fonte: elaborada pela autora.
EX
EM
PL
O
S
Taxa de mortalidade infantil e suas subdivisões 
Em 2019, o Brasil tinha uma população total de 210.659.013 habitantes. Nesse pe-
ríodo, o país apresentou 1.349.802 óbitos totais, entre eles, 35.293 ocorreram em 
crianças menores de 1 ano de idade, 18.402 entre crianças com 0 a 6 dias de vida, 
6.102 entre 7 e 27 dias e 10.789 entre 28 e 364 dias. Nesse ano, o país teve 2.849.146 
nascidos vivos. Quais as taxas de mortalidade infantil, neonatal, neonatal precoce, 
neonatal tardia e pós-neonatal, em 2019, no Brasil?
83 Bioestatística e Epidemiologia
U6 Transição demográfica e epidemiológica
EX
EM
PL
O
S
Taxa de mortalidade infantil (TMI):
 1 1.000
 
númerodeóbitos em anoTMI
total denascidos vivos
<
= ×
35.293 1.000
2.849.146
TMI = ×
1 2,39TMI =
...........substituir os valores.
...........substituir os valores.
...........substituir os valores.
.......................................dividir e multiplicar.
.......................................dividir e multiplicar.
.......................................dividir e multiplicar.
A taxa de mortalidade infantil no Brasil em 2019 é de 12,39 mortes a cada 1.000 nas-
cidos vivos.
 
Taxa de mortalidade neonatal (TMN):
 0 27 1.000
 
númerodeóbitos de a diasTMN
total denascidos vivos
= ×
24.504 1.000
2.849.146
TMN = ×
8,60. TMN =
A taxa de mortalidade neonatal no Brasil em 2019 é de 8,6 mortes a cada 1.000 nas-
cidos vivos.
Taxa de mortalidade neonatal precoce (TMN precoce):0 6 1.000
 
númerodeóbitos de a diasTMN precoce
total denascidos vivos
= ×
18,402 1.000
2.849.146
TMN p = ×
 6, 46. TMN p =
Já a taxa de mortalidade neonatal precoce no Brasil em 2019 é de 6,46 mortes a cada 
1.000 nascidos vivos.
U6
84Bioestatística e Epidemiologia
Transição demográfica e epidemiológica
EX
EM
PL
O
S
Taxa de mortalidade neonatal tardia (TMN tardia):
Então, em 2019, a taxa de mortalidade neonatal tardia no Brasil foi de 2,14 mortes a 
cada 1.000 nascidos vivos.
Taxa de mortalidade pós-neonatal (TMPN):
 7 27 1.000
 
númerodeóbitos de a diasTMN tardia
total denascidos vivos
= ×
6.102 1.000
2.849.146
TMN t = ×
 2,14.TMN t =
...........substituir os valores.
.......................................dividir e multiplicar.
 28 364 1.000
 
númerodeóbitos de a diasTMPN
total denascidos vivos
= ×
10.789 1.000
2.849.146
TMPN = ×
 3,79.TMPN =
...........substituir os valores.
.......................................dividir e multiplicar.
Portanto, a taxa de mortalidade pós-neonatal no Brasil em 2019 é de 3,79 mortes a 
cada 1.000 nascidos vivos.
Fonte: DATASUS (2019, [n. p.]).
2 TRANSIÇÃO DEMOGRÁFICA E EPIDEMIOLÓGICA
Há outros indicadores que ajudam na avaliação e na descrição da população de um lo-
cal, como: razão de sexo, proporção de idosos ou de menores de 5 anos e índice de en-
velhecimento (RIPSA, 2008, p. 70-71). Assim, ao analisar uma série histórica de todos 
os indicadores, é possível contar a história da população e suas condições de saúde.
Por exemplo, considere a primeira metade do século XX no Brasil, pense na família dos 
seus avós, normalmente, as famílias tinham mais do que 5 filhos e, frequentemente, 
uma criança não chegava a fase adulta, as pessoas morriam jovens e existiam muitos 
casos e mortes por doenças transmissíveis (como sarampo e tuberculose). Historica-
mente, o Brasil é uma república recente com grande participação econômica da agricul-
tura, mas as cidades cresceram consideravelmente com a industrialização. 
85 Bioestatística e Epidemiologia
U6 Transição demográfica e epidemiológica
Ao pensar nos indicadores de saúde, a taxa de fecundidade total e natalidade eram altas 
naquela época, a proporção de idosos era muito baixa enquanto a de crianças era alta, 
a taxa de mortalidade infantil era alta e a principal causa de morte eram doenças trans-
missíveis. As condições de vida eram precárias, as casas não tinham saneamento bási-
co, pessoas moravam em cortiços e espaços pequenos e aglomerados, elas passavam 
fome e o salário era baixo. Consequentemente, essas situações favoreceram as doenças 
transmissíveis e mortalidade infantil por fome, desnutrição e doenças diarreicas.
Conforme o tempo passou, as condições das pessoas melhoraram, houve a criação 
dos direitos trabalhistas, o investimento no saneamento básico e a melhoria no acesso 
e nos serviços de saúde com campanhas sanitaristas e vacinas. Isso fez reduzir o nú-
mero de óbitos por doenças transmissíveis, a taxa mortalidade geral e infantil. Dessa 
forma, a população começou a sobreviver por mais tempo com aumento da prevalência 
de doenças crônicas. Nesse período, as taxas de fecundidade e natalidade ainda são 
altas, e isso, associado ao aumento da expectativa de vida, fez a população crescer. 
A redução da mortalidade infantil 
diminuiu a necessidade de se ter 
muitos filhos para garantir que al-
guns cheguem a idade adulta. Com 
o passar do tempo, as pessoas mi-
graram para as cidades que são ur-
banizadas e com saneamento e as 
melhorias das condições de vida, 
trabalho e serviços de saúde se 
mantiveram. Só depois dessas di-
versas e extensas melhoras é que 
as taxas de fecundidade total e na-
talidade começaram a reduzir. No 
Brasil, especificamente, isso aconteceu a partir de 1980, e nessa fase houve uma 
aceleração da transição demográfica. 
No Brasil no século XXI, as mulheres estão trabalhando e não têm “tempo” para ter e cuidar 
de filhos; há aumento no número de famílias com um ou nenhum filho; e com o advento da 
reprodução assistida, casais com idade avançada conseguem ter filhos. A população está 
em processo de envelhecimento. As crianças, fruto das altas taxas de fecundidade da dé-
cada de 1950 e 1960, estão se tornando idosos e, com o aumento da expectativa de vida, 
esse grupo etário só deve aumentar de tamanho. Por outro lado, no futuro, caso a situação 
se mantenha, teremos um contingente menor de adultos e crianças.
Figura 05. Aumento da expectativa de vida
Fo
nt
e:
 1
23
R
F.
SA
IB
A 
M
A
IS
O artigo a seguir descreve a mudança populacional no Brasil:
MIRANDA, G. M. D.; MENDES, A. da C. G.; SILVA, A. L. A. da. O envelhecimento popu-
lacional brasileiro: desafios e consequências sociais atuais e futuras. Revista Brasileira 
de Geriatria e Gerontologia, Rio de Janeiro, v. 19, n. 3, p. 507-519, jun. 2016. Dispo-
nível em: https://doi.org/10.1590/1809-98232016019.150140. Acesso em: 1 mar. 2021.
about:blank
U6
86Bioestatística e Epidemiologia
Transição demográfica e epidemiológica
Esse processo de transformação das características da população é chamado de tran-
sição epidemiológica ou demográfica. A transição epidemiológica se refere a mudanças 
dos padrões de morbimortalidade da população como a alteração da principal causa de 
morte e das doenças mais prevalentes. A transição demográfica, por sua vez, refere-se 
às mudanças das características da população, que passa de uma população jovem 
para uma população envelhecida. Portanto, esse processo é alavancado pela diminui-
ção da mortalidade e queda nas taxas de fecundidade e natalidade.
Uma ferramenta para avaliar a transição demográfica é o gráfico de pirâmide populacional 
em que é possível visualizar a proporção de pessoas por faixa etária e sexo para um de-
terminado local e período. Para países e locais que ainda não passaram pelas transições, 
o contorno do gráfico parece uma pirâmide com base larga e baixa com uma ponta final. 
Esses locais têm alta natalidade e baixa expectativa de vida, como é o caso da pirâmide 
na Figura 6b. Já os países que já passaram pelo processo de transição têm o gráfico 
com um desenho que se assemelha a um barril. A proporção de crianças e idosos são 
similares, com alta expectativa de vida e baixa natalidade, esse desenho ocorre em lo-
cais desenvolvidos. Na Figura 6a é possível observação uma pirâmide durante a transi-
ção demográfica, a base está reduzindo enquanto o topo está aumentando de tamanho.
Figura 06. Pirâmide populacional de Porto Alegre/RS (A) e Autazes/AM (B), em 2010, 
comparada com a do Brasil no mesmo período
A
87 Bioestatística e Epidemiologia
U6 Transição demográfica e epidemiológica
B
Fonte: https://cidades.ibge.gov.br/brasil/panorama. Acesso em: 1 mar. 2021.
As transições acontecem em períodos diferente para cada país ou região. Logo, os mar-
cos sociais que causam a transição podem ainda não ter ocorrido. No Brasil do século 
XXI, há locais com uma pirâmide populacional com desenho de pirâmide e locais que 
estão mais próximos do desenho de barril. 
Dessa forma, a análise do envelhecimento da população possibilita prever ou programar 
uma sociedade que esteja preparada para essa mudança de demanda. No futuro não ha-
verá tanta necessidade de pediatras e escolas, mas, em contrapartida, necessitaremos de 
um aumento de gerontólogos, da aposentadoria e de instituições de longa permanência.
SA
IB
A 
M
A
IS
O vídeo: Hans Rosling em crescimento populacional (título original Hans Rosling: Glo-
bal population growth, box by box), do canal TED, descreve a distribuição e caracte-
rísticas ao longo dos anos da população mundial e quais são os futuros desafios que 
teremos no futuro. 
Disponível em: https://youtu.be/fTznEIZRkLg. Acesso em: 1 mar. 2021.
about:blank
U6
88Bioestatística e Epidemiologia
Transição demográfica e epidemiológica
3. OBJETO DE APRENDIZAGEM
Visite o site disponível em: https://cidades.ibge.gov.br/brasil/panorama (acesso em: 4 
abr. 2021) e observeos indicadores de saúde e a pirâmide populacional.
89 Bioestatística e Epidemiologia
U6 Transição demográfica e epidemiológica
REFERÊNCIAS BIBLIOGRÁFICAS
DEPARTAMENTO DE INFORMÁTICA DA FUNDAÇÃO NACIONAL DE SAÚDE DO SUS - DATASUS. Portal 
de Saúde. Brasília, DF: Ministério da Saúde, 2020. Disponível em: http://www2.datasus.gov.br/DATASUS/
index.php?area=02. Acesso em: 25 fev. 2021.
FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. S. Epidemiologia clínica: elementos essenciais. 5. 
ed. Porto Alegre: ArtMed, 2014.
REDE INTERAGENCIAL DE INFORMAÇÃO PARA A SAÚDE – RIPSA. Indicadores básicos para a saúde 
no Brasil: conceitos e aplicações. 2. ed. Brasília: Organização Pan-Americana da Saúde, 2008. Disponível 
em: Erro! A referência de hiperlink não é válida.http://www.ripsa.org.br/2014/10/30/indicadores-basicos-pa-
ra-a-saude-no-brasil-conceitos-e-aplicacoes-livro-2a-edicao-2008-2/. Acesso em: 3 mar. 2021.
ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia & saúde. 8. ed. Rio de Janeiro: Medbook, 
2018. 
about:blank
about:blank
about:blank
about:blank
90
UNIDADE 7
ESTUDOS OBSERVACIONAIS 
ANALÍTICOS
INTRODUÇÃO
Como são definidos quais são os fatores de risco para uma doença ou, ainda, quais são 
os fatores que significam uma melhor evolução do quadro clínico do indivíduo? Consu-
mir bebida alcóolica durante a gestação faz mal para a criança? 
Essa unidade abordará os tipos de estudos que conseguem responder a essas pergun-
tas. Para tanto, serão abordados os estudos observacionais, analíticos e longitudinais, 
o que significa que o pesquisador observa os eventos sem definir a qual intervenção o 
sujeito será submetido, que é possível provar associações e causalidade entre as vari-
áveis e a coleta de dado acontece em mais de um momento.
Esses três tipos de estudo conseguem medir o risco de um evento acontecer. Contudo, 
o que os difere são os desfechos, se os grupos comparados foram divididos com base 
na exposição ou desfecho e a precisão da avaliação do risco.
 ` Variáveis independentes são fatores estudados que podem estar associados com 
a variável independente. Trata-se das causas presumíveis ou possíveis fatores de 
risco, em que pode ser chamada de exposição, já que é a exposição ao fator de 
risco pode causar alguma doença (ROUQUARYOL, 2018, p. 705). Por exemplo: 
fumar, bebida alcóolica e aleitamento materno.
 ` Já a variável dependente é o efeito presumível da variável independente. 
Ela pode ser chamada de desfecho ou variável de interesse. (ROUQUARYOL, 
2018, p. 705). Além disso, normalmente, ela é dicotômica, ou seja, só tem duas 
possibilidades de resposta, como ter ou não ter uma doença. Por exemplo: cân-
cer de pulmão, incapacidade e óbito. 
G
LO
SS
Á
R
IO
1. ESTUDO COORTE
Entre os estudos observacionais, o estudo do tipo coorte é o que melhor consegue avaliar 
o risco. Isso se deve porque, no início da pesquisa, todos os sujeitos não têm desfecho, 
sendo assim possível avaliar quantos casos novos aparecerão. Esse estudo compara 
dois grupos, um que tem exposição ao fator de risco a ser estudado e outro grupo que não 
é exposto. Os sujeitos, por sua vez, são acompanhados ao longo do tempo para contar 
o surgimento do desfecho (ROUQUARYOL, 2018, p. 123-125). O desenho desse tipo de 
estudo (Figura 1) iniciará pela exposição e, após uma quantidade determinada de tempo, 
o desfecho é aferido. Desse modo, uma característica que diferencia o estudo de coorte 
de outros estudos longitudinais é a pesquisa dividindo os grupos pela exposição. 
91 Bioestatística e Epidemiologia
U7 Estudos observacionais analíticos
Figura 02. Esquema do desenho de estudo coorte
Pessoas com presença de uma 
ou mais variáveis independentes
Pessoas com ausência de uma ou 
mais variáveis independentes
EXEMPLO
FUMANTE NÃO FUMANTE
Pessoas com presença 
da variável dependente
Pessoas com presença 
da variável dependente
Pessoas com ausência 
da variável dependente
Pessoas com ausência 
da variável dependente
Pessoas com câncer de pulmão Pessoas com câncer de pulmão
Pessoas sem câncer de pulmão Pessoas sem câncer de pulmão
Fonte: elaborada pela autora.
U7
92Bioestatística e Epidemiologia
Estudos observacionais analíticos
O termo coorte se refere a um grupo de pessoas com uma característica em comum. 
Por isso, um estudo coorte tem em seu desenho o acompanhamento de grupo de pes-
soas. Há coortes que são estudadas desde 1950, como a corte de nascidos vivos em 
Pelotas (RS) que acompanha as pessoas há 30 anos, desde o nascimento até sua fase 
adulta. Por exemplo, esses estudos conseguem avaliar qual o impacto do aleitamento 
materno na saúde das crianças ao longo dos anos até a idade adulta. 
Os estudos de coorte acompanham indivíduos sadios divididos em grupos de quem 
possui uma característica e de quem não possui. Normalmente, o objetivo é avaliar 
quais consequências essa exposição pode gerar. Nesse sentido, alguns estudos acom-
panham um grupo de pessoas ao longo de vários anos para avaliar a morbidade de uma 
exposição ou a associação entre ela e um desfecho.
Um marco nos estudos epidemiológicos é o estudo de Doll e Hill com o acompanha-
mento dos médicos britânicos, em que essa coorte conseguiu provar as complicações 
causadas pelo fumo. O artigo indicado a seguir resume a trajetória da pesquisa citada 
e seus resultados. 
DI CICCO, M. E.; RAGAZZO, V.; JACINTO, T. Mortality in relation to smoking: the 
British Doctors Study. Breathe (Sheff), [s. l.], v. 12, n. 3, p. 275-276, set. 2016. Dis-
ponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5298160/. Acesso em: 10 
abr. 2021.
Uma pesquisa acompanha quem fuma ou não, o pesquisador não influencia na de-
cisão de qual participante deverá fumar. Ou, então, uma pesquisa acompanhar os 
pacientes internados que tiveram abordagens terapêuticas diferentes para avaliar a 
cura de uma doença, conforme a abordagem terapêutica. Nesse último caso, a variá-
vel independente é a abordagem terapêutica e o desfecho é a proporção de cura da 
doença. Para alguns tipos de exposição, esse é o melhor desenho de pesquisa, pois, 
não é possível fazer estudo experimental. 
De acordo com a ética, um pesquisador não pode oferecer a gestantes bebidas alcoó-
licas, em razão do risco que isso pode causar à criança. No entanto, ele pode observar 
quais são os efeitos encontrados em gestantes que consumiram a bebida.
C
U
R
IO
SI
D
A
D
E
EX
EM
PL
O
S
No começo do estudo, os participantes não podem apresentar o desfecho. Contudo, na 
avaliação inicial é comum testar se a pessoa já apresenta o desfecho, ainda que ele esteja 
na fase inicial da doença e seja assintomático. Por isso, esse é o único estudo observacional 
capaz de medir incidência, somente a pesquisa pode monitorar esse indicador de saúde.
A duração e a periodicidade do acompanhamento da pesquisa dever ser estabelecido a 
partir da História Natural da Doença da variável dependente. Por exemplo, para avaliar se 
o fumo está associado ao câncer de pulmão, a coleta de dado não precisa ser anual ou 
após um ano de ter começado a fumar, já que a doença demora para se manifestar. Por-
tanto, dependendo das variáveis de interesse, um estudo coorte será de longa duração.
Por ser um estudo observacional, a decisão de que sujeitos serão expostos às variáveis 
independentes não é do pesquisador. 
93 Bioestatística e Epidemiologia
U7 Estudos observacionais analíticos
A temporalidade é uma característica importante dos estudos coorte. Ela garante a 
certeza de que o fator de risco existiu antes do desfecho, o que é fundamental porque, 
muitas vezes, consegue-se perceber uma associação estatística entre duas variáveis, 
mas não se sabe dizer qual é a causa e o efeito. Por exemplo, um estudo descritivo, que 
coleta todas as informações, mostra uma associação entre ser sedentária e ter depres-
são. Para definir se de fato uma variável é fator de risco para outra é preciso um estudo 
longitudinal de coorte que garanta, no começo, o acompanhamento dos sedentários e 
daquelesque praticam atividades físicas. Nesse caso, no acompanhamento se avalia 
quantas pessoas apresentaram depressão.
Há dois tipos de estudo coorte, o prospectivo e o retrospectivo. Na coorte retrospec-
tiva, os grupos são selecionados no passado e acompanhados até o presente. A título 
de exemplo: uma pesquisa que quer avaliar se o uso de antibiótico em pessoas com 
gripe previne que o paciente necessite de ventilação mecânica. Com levantamento de 
prontuário do último ano de todos os casos internados por gripe, o pesquisador separa 
quem usou de quem não usou antibiótico e, em seguida, avalia quais precisaram de 
entubação. O acompanhamento é realizado com as informações do prontuário e é pos-
sível que, no tempo atual, os sujeitos já tenham o desfecho.
As vantagens da coorte retrospectiva são de que é possível ter um alto número de sujeito de 
pesquisa e ela são de curta duração. Isso ocorre porque, como os fatos estão no passado, 
não há necessidade de ficar esperando o evento acontecer desde o início da exposição. 
Em contrapartida, a grande desvantagem é de que, ao utilizar registros e informações de 
prontuário, não é possível garantir a qualidade dos dados e como as informações foram 
coletadas. Isto é, quando os dados são coletados em prontuários que não se pode garantir 
a qualidade da informação, a pesquisa apresenta um viés de registro de informação.
Já a coorte prospectiva se trata do acompanhamento em tempo atual, como acompa-
nhar atletas profissionais e avaliar o risco de lesões osteomioarticulares. Nesse caso, 
a partir de hoje, por exemplo, atletas de diversas modalidades que não tenham lesão 
serão acompanhados e avaliados, a fim de identificar quais e quantas lesões aparecem 
ao longo dos anos. Por um lado, a vantagem é a coleta das informações ser padroni-
zada e, assim, garantir a confiabilidade dos dados. Além disso, outra vantagem se trata 
de medir outras variáveis que podem influenciar na associação e avaliar fatores de con-
fusão. Por outro lado, as desvantagens são que essas pesquisas são caras e de longa 
duração, o que pode gerar a desistência de participantes no meio do acompanhamento. 
A perda de segmento é uma desvantagem de qualquer tipo de estudo, mas é mais fre-
quente em estudos longos, como a coorte prospectiva. A perda do acompanhamento 
do sujeito da pesquisa pode ter várias causas, como migração, aderência, desistência e 
outro desfecho que inviabilize a continuidade na pesquisa. Isso pode gerar impacto na 
análise estatística e resultado. 
Desse modo, a primeira informação a se avaliar é a proporção da perda, se ela for maior 
do que 10% do número total da amostra da pesquisa, a qualidade dos resultados é 
questionável; mas, se ela for maior do que 30%, a validade interna fica prejudicada. Em 
seguida, é necessário avaliar as causas e se os grupos se mantêm comparáveis ou se 
as pessoas que saíram tinham características diferentes.
U7
94Bioestatística e Epidemiologia
Estudos observacionais analíticos
Esse tipo de estudo não é adequado para avaliar doenças de baixa prevalência. Como 
a frequência do evento é baixa, é necessário ter uma amostra muito grande para conse-
guir poucos desfechos, o que, consequentemente, aumentaria o custo sem ter a certeza 
de que a quantidade de desfecho seria adequada para análise. Para doenças que tem 
um longo período de latência, esse desenho também não é adequado.
Uma pesquisa para avaliar se consumir bebida alcoólica na gestação faz mal para 
a criança, na qual 100 mulheres foram acompanhadas em dois grupos. Ao longo do 
segmento, 20 mulheres desistiram de participar ou mudaram de endereço, entre as 
desistentes, 18 eram usuárias de bebida alcoólica e tinham menos de 20 anos. Com 
a perda do segmento, o grupo de expostos apresenta características e tamanho dife-
rentes do grupo de não expostas.
Na pesquisa, qualquer pessoa que não saiba dizer a qual grupo o participante perten-
ce, se ele faz parte do grupo controle, intervenção, caso, exposto ou não exposto, é 
considerada “cego”. O problema de não ter o participante “cego” é que ele pode mudar 
o seu comportamento, o que poderá influenciar na avaliação. Dessa forma, apesar 
de continuar ingerindo bebida alcoólica enquanto grávida, a mulher pode começar a 
comer de forma mais saudável para garantir que o filho não tenha problemas. Assim, 
o resultado da pesquisa pode não representar a realidade. No caso da coorte, o volun-
tário sabe qual é o objetivo da pesquisa e, portanto, sabe se ele está no grupo exposto 
ou não. O ideal é que todo sujeito de qualquer pesquisa seja cego, contudo, no estudo 
coorte, dificilmente o sujeito da pesquisa é “cego”.
EX
EM
PL
O
S
Como em toda pesquisa, é possível que erros sistêmicos ocorram e que enfraqueçam 
a validade do resultado. Assim, o viés de amostragem pode acontecer se o grupo 
exposto e o grupo não exposto tiverem características diferentes. Isto é, é preciso que 
eles sejam similares com exceção pela exposição ou, ainda, pode acontecer quando os 
participantes não representam todos as situações de exposição. 
 ` As principais vantagens de qualquer estudo coorte são: 
 ` Ter relação temporal (exposição sempre veio antes do desfecho);
 ` Calcular incidência, não expõe o paciente ao risco (é um estudo observacional); 
 ` Avaliar os múltiplos efeitos de uma exposição e é bom para avaliar exposição rara. 
Tendo em mente o exposto até aqui, reflita: será que a pesquisa sobre fumo tem 
alguém que fuma desde 1 a mais de 40 cigarros por dia, que fuma cigarro de palha ou 
elétrico, ou ainda têm pessoas de todos os sexos e idades?
PA
R
A 
R
EF
LE
TI
R
95 Bioestatística e Epidemiologia
U7 Estudos observacionais analíticos
O viés de migração ocorre nos casos de perda de segmento quando os grupos ficam dife-
rentes do que que eram no início da pesquisa e já não são mais comparáveis. Por isso, no 
planejamento do estudo é importante programar estratégias que diminuam as perdas, como 
ligações telefônicas para manter. Ele ocorre com mais frequência na coorte prospectiva.
O viés de aferição, por sua vez, pode acontecer sempre, mas ocorre com mais frequência 
na coorte retrospectiva. Nele, é importante que todos os indivíduos sejam avaliados da mes-
ma maneira e de preferência pelo mesmo equipamento. Por isso, o ideal é criar protocolos 
para definir as técnicas e as frequências com que os sujeitos devem ser avaliados. Para os 
estudos retrospectivos é importante garantir a confiança das informações registradas.
As análises estatísticas principais para esse estudo são: o risco relativo e o risco atribu-
ível, além da incidência. Com elas, é possível avaliar o impacto que se exposto tem o 
risco de desenvolver o desfecho.
Para saber mais, leia o artigo sobre Estudo coorte, disponível a seguir:
TSAO, C. W.; VASA, R. S. Cohort profile: the framingham heart study (FHS): overview 
of milestones in cardiovascular epidemiology. International Journal Epidemiology, 
[s. l.], v. 44, n. 3, p. 1800-1813, dez. 2015. Disponível em https://www.ncbi.nlm.nih.gov/
pmc/articles/PMC5156338/. Acesso em: 10 abr. 2021.S
A
IB
A 
M
A
IS
2. ESTUDO DE PROGNÓSTICO
O estudo de prognóstico prediz quais são os resultados possíveis de um evento. Por 
exemplo, o prognóstico de quem sofre um acidente de carro é 45% de chance da pes-
soa sair ilesa, 25% de sair com alguma lesão que será curada, 15% de ficar com alguma 
sequela e 15% de ir a óbito em um mês do acidente.
No estudo de prognóstico, todos os participantes, desde o início da pesquisa, têm a doen-
ça a ser estudada. O objetivo é acompanhar a evolução da doença comparando grupos 
com característica diferente (presença ou ausência de fator prognóstico) e avaliar se ela 
influencia no desfecho a ser avaliado. Como o caso de uma pesquisa que pretende ava-
liar se o tamanho do tumor do câncer de mama influencia na chance de a mulher estar 
viva depois de 5 anos. O desenho do estudo está esquematizado na Figura a seguir. 
Figura 01. Esquema do desenho de estudo prognóstico
Pessoas doentescom presença de 
um ou mais fatores prognósticos
Pessoas com presença 
do desfecho.
Pessoas com ausência 
do desfecho.
U7
96Bioestatística e Epidemiologia
Estudos observacionais analíticos
EXEMPLO
Pessoa com 
câncer com idade 
maior que 40 anos
Pessoa com câncer 
com idade menor 
que 40 anos
Pessoas vivas, após 5 anos Pessoas vivas, após 5 anos
Pessoas mortas, após 5 anos Pessoas mortas, após 5 anos
Fonte: elaborada pela autora.
Essas pesquisas comparam como alguns fatores influenciam na história natural da do-
ença. Por exemplo, iniciar o tratamento nas primeiras seis horas de um Acidente Vas-
cular Cerebral (AVC) altera a história natural da doença com aumento da sobrevida e 
redução das sequelas. 
Os fatores prognósticos podem ser características do indivíduo, como idade, caracte-
rísticas da doença (tipo histológico do câncer ou intervenções realizadas, como realizar 
inicialmente quimioterapia em vez da cirurgia). Os desfechos do estudo podem ser morte, 
deficiência ou incapacidade, sofrimento ou, ainda, redução da qualidade de vida. Os es-
tudos prognósticos mais comuns são os de sobrevida, que avaliam quais são as chances 
de a pessoa estar viva após 5 anos do diagnóstico. Nesse caso, o desfecho é morte.
Quando se usa a gravidade da doença como fator prognóstico, um possível problema 
que pode acontecer é, no meio da pesquisa, surgir um método diagnóstico. Se após 
essa novidade, os novos casos começarem a serem classificados de maneira diferente, 
a pesquisa fica comprometida. 
Pessoas doente com ausência de 
um ou mais fatores prognósticos
Pessoas com presença 
do desfecho.
Pessoas com ausência 
do desfecho.
97 Bioestatística e Epidemiologia
U7 Estudos observacionais analíticos
Um novo método tomográfico consegue identificar tumores menores e faz com 
que o que antes seria uma classificação grau II, agora seja grau III. Por sua vez, 
esse processo se chama migração de estágio e altera a análise estatística de cada 
fator prognóstico. Assim, as probabilidades de sobrevida de cada fator prognóstico 
aumentam (FLETCHER; FLETCHER; FLETCHER, 2014, p. 103).E
XE
M
PL
O
O início do acompanhamento é denominado tempo zero, trata-se do diagnóstico, do início 
dos sintomas, do início do tratamento, entre outras opções. O importante é que todos os parti-
cipantes entrem na pesquisa no mesmo tempo zero. Para a gestão do sistema de saúde é im-
portante avaliar o impacto que a demora para o início do tratamento tem sobre o prognóstico. 
Esse estudo é similar ao coorte, no entanto, uma diferença é que, no prognóstico, todos 
os indivíduos têm a doença. A coorte investiga fatores de risco que podem causar uma 
doença, já o prognóstico investiga fatores que alteram a evolução da doença. Ainda, no pri-
meiro estudo, o principal desfecho é desenvolver uma doença, já no segundo, o desfecho é 
avaliar as complicações da doença que são muito mais frequentes. Além disso, na coorte, 
os vieses que mais frequentemente acontecem são de amostragem, migração e aferição.
A análise estatística principal para esse estudo é a análise de sobrevida que calcula as 
probabilidades dos desfechos acontecerem a partir dos grupos de fatores prognósticos. 
Para doenças com estigmas associados é comum o paciente perguntar para algum 
profissional de saúde qual é o seu prognóstico. Nesse contexto, a oncologia tem grande 
quantidade de estudos para avaliar as associações de diversos fatores para dar uma 
resposta correta ao paciente e familiares. Contudo, é importante ressaltar que o prog-
nóstico é uma probabilidade e isso não necessariamente acontecerá.
Com o intuito de ampliar seus conhecimentos acerca do Estudo prognóstico, reco-
mendamos a leitura do material disposto a seguir:
SCHNEIDER, I. J. C.; D’ORSI, E. Sobrevida em cinco anos e fatores prognósticos em 
mulheres com câncer de mama em Santa Catarina, Brasil. Cadernos de Saúde Públi-
ca, Rio de Janeiro, v. 25, n. 6, p. 1285-1296, jun. 2009. Disponível em: http://www.scie-
lo.br/scielo.php?script=sci_arttext&pid=S0102-311X2009000600011&lng=pt&nrm=i-
so. Acesso em: 10 abr. 2021. 
SA
IB
A 
M
A
IS
3. ESTUDO CASO-CONTROLE
O estudo de caso-controle é, também, observacional e longitudinal. A diferença com o 
estudo coorte é o modo em os grupos de comparação são divididos. Na coorte se com-
para os grupos a partir da presença ou ausência de exposição. Já no caso-controle, os 
grupos são presença ou ausência da variável dependente, ou seja, do desfecho. 
O desenho do estudo caso-controle é dividir a amostra conforme a presença do desfecho 
e depois avaliar quais são os fatores que as pessoas estavam expostas. Por exemplo, 
uma pesquisa sobre a associação entre câncer de pulmão e cigarro. Inicialmente, sepa-
ra-se quem tem e não tem câncer de pulmão e depois investiga por questionário ou pron-
tuário quais pessoas fumavam. O desenho do estudo está esquematizado na Figura 3.
U7
98Bioestatística e Epidemiologia
Estudos observacionais analíticos
Figura 02. Esquema do desenho de estudo caso-controle
EXEMPLO
Pessoas com 
câncer de pulmão
Pessoas sem 
câncer de pulmão
Fumante Fumante
Não fumante Não fumante
Fonte: elaborada pela autora.
Pessoas com presença da 
variável dependente
Pessoas com ausência da 
variável dependente
Pessoas com presença de uma 
ou mais variáveis independentes
Pessoas com presença de uma 
ou mais variáveis independentes
Pessoas com ausência de uma 
ou mais variáveis independentes
Pessoas com ausência de uma 
ou mais variáveis independentes
O objetivo do estudo é avaliar, a partir da doença, quais são os possíveis fatores de 
risco e qual é a frequência que cada exposição ocorreu. Ele é ideal quando a doença é 
rara ou tem um longo período de latência. 
99 Bioestatística e Epidemiologia
U7 Estudos observacionais analíticos
Uma pesquisa que quer avaliar estresse de professores do ensino fundamental. Os casos 
foram professores que, em uma escala de estresse, pontuaram alto, enquanto os con-
troles são os professores que pontuaram baixo. A amostra foi selecionada em uma única 
escola de ensino fundamental, com o objetivo das condições de trabalho serem similares.EX
EM
PL
O
Assim, é possível parear o controle com o caso. Normalmente, o pareamento é por 
idade e sexo, mas ele pode ser por outras características que não a exposição. Nor-
malmente, a quantidade de controle pode ser igual a de casos. Então, nas situações 
em que há poucos casos, é possível selecionar de duas a três vezes mais controles do 
que caso. Exemplificando: um estudo sobre quedas de pacientes no hospital teve pare-
amento feito em relação ao sexo, data de internação e clínica. Se um homem internado 
na clínica cirúrgica em 05/01/2015 sofreu uma queda, o controle deveria ser um homem 
internado na clínica cirúrgica em 05/01/2015 que não caiu.
A vantagem desse desenho é a praticidade e ser de curta duração. A principal desvanta-
gem é ser um estudo retrospectivo, o que significa que a informação sobre a exposição 
pode não ser correta. Portanto, frequentemente, ocorre o viés de registro de informa-
ção. Dessa forma, é importante utilizar fontes seguras, confiáveis e que relatem a expo-
sição antes de saber da existência da doença. No entanto, a avaliação de exposição só 
é possível a partir de entrevista com os sujeitos ou análise de prontuário. 
Os participantes podem lembrar de maneira diferente um fato, em que normalmente os 
casos vão tender a lembrar de mais detalhes do que o controle. Pense: você consegue 
lembrar o que comeu há dois dias? Provavelmente não, mas se foi um dia com um 
evento importante, isso o ajudará a se lembrar. Ainda, se um dia você teve episódios 
de diarreia é mais provável que você lembre que alimentos ingeridos no dia. Esse erro 
possível de acontecer em todo estudo caso-controle tem o nome de viés de memória 
ou de lembrança (FLETCHER; FLETCHER; FLETCHER, 2014, p. 92). 
Os participantes são selecionados em dois grupos, o caso e o controle. Essa divisão ocorre 
a partir da presençaou ausência do desfecho e é independente da exposição. A definição 
do que é um caso deve ser precisa e adequada, assim, o pesquisador deve estabelecer 
critérios rigorosos para não haver dúvida se uma pessoa se enquadra no grupo caso. A 
amostra dos casos deve conter quem acabou de ser diagnosticado e quem foi há mais 
tempo, que faz ou não acompanhamento e/ou tratamento e os diversos graus da doença. 
A definição do controle deve ser alguém da mesma população do caso e que poderia 
se tornar um se ficasse doente. Os controles podem ser outras pessoas internadas no 
mesmo hospital, mas com outro diagnóstico ou, ainda, pessoas próximas da residência 
do caso ou parentes. 
U7
100Bioestatística e Epidemiologia
Estudos observacionais analíticos
Os profissionais de saúde, contudo, só poderão investigar sobre exposições que estão 
associadas com a hipótese diagnóstica. Então, para esses casos é mais provável que 
se tenha uma avaliação completa e, nos controles, a avaliação ser mais simples.
O estudo caso-controle é comum por ser rápido e prático de realizar. Além de permitir 
explorar múltiplas exposições para uma mesma doença e de não precisar de muitos 
indivíduos para provar associações. Apesar de parecer prático e simples, ao fazer uma 
pesquisa rápida, deve-se ter cuidado para que a qualidade não seja adequada por 
apresentar diversos vieses.
A análise estatística principal para esse estudo é a razão de chances ou, em inglês, odds 
ratio (OR). Com ela é possível estimar o risco que a exposição desenvolva o desfecho.
Para saber mais a respeito sobre o Estudo caso-controle e sua aplicação, leia:
GAMBA, M. A. et al. Amputações de extremidades inferiores por diabetes melli-
tus: estudo caso-controle. Revista de Saúde Pública, São Paulo, v. 38, n. 3, p. 399-
404, jun. 2004. Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pi-
d=S0034-89102004000300010&lng=en&nrm=iso. Acesso em: 10 abr. 2021.S
A
IB
A 
M
A
IS
4. OBJETO DE APRENDIZAGEM
Preencha o quadro resumo sobre as principais características dos diversos 
desenhos de estudo:
Coorte prospectivo Coorte retrospectivo Prognóstico Caso-controle
Grupos divididos a partir Da exposição
Duração Longo
Principal uso Avaliar consequência de uma exposição
Desvantagem Caro e longo
Vantagem Temporalidade
Possíveis vieses Aferição, migração e amos-tragem
101 Bioestatística e Epidemiologia
U7 Estudos observacionais analíticos
REFERÊNCIAS BIBLIOGRÁFICAS
ALMEIDA FILHO, N. de; BARRETO, M. L. Epidemiologia e saúde: fundamentos, métodos e aplicações. Rio 
de Janeiro: Guanabara Koogan, 2011.
FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. S. Epidemiologia clínica: elementos essenciais. 5. 
ed. Porto Alegre: ArtMed, 2014.
ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia e saúde. 8. ed. Rio de Janeiro: Medbook, 
2018. 
102
UNIDADE 8
MEDIDAS DE ASSOCIAÇÕES
INTRODUÇÃO
Fumar 10 ou 30 cigarros por dia faz com que o indivíduo tenha riscos diferentes de ter 
câncer de pulmão? Qual é a chance de uma pessoa infartar se for hipertensa? Essa 
unidade abordará sobre como calcular e interpretar as análises estatísticas que medem 
a intensidade da associação entre diversas variáveis. 
Entre duas variáveis podem acontecer comparações, sendo uma variável independente 
e outra dependente, ou entre múltiplas variáveis, em que várias variáveis são indepen-
dentes e uma é dependente. Geralmente, as variáveis independentes são as exposi-
ções ou fatores, e a variável dependente é o desfecho, que pode ser desde deficiência, 
complicação, morte ou doença.
Para a análise entre duas variáveis é comum organizar os dados em uma tabela de con-
tingência 2 x 2 (Figura 1). Nessa tabela, nas linhas estão descritas as possibilidades da 
variável independente e nas colunas as da variável dependente. Como de preferência a 
exposição e o desfecho são dicotômicos (presentes ou ausentes), a tabela fica com duas 
linhas e duas colunas, por isso, ela tem esse nome. As casas da tabela são nomeadas 
como “a”, “b”, “c” e “d” para depois facilitar as fórmulas das medidas de associações.
Tabela 01. Tabela de contingência 2 x 2
DESENHO
DESFECHO 
PRESENTE
DESFECHO 
AUSETE TOTAL
EXPOSIÇÃO 
PRESENTE a b a+b
EXPOSIÇÃO 
AUSENTE c d c+d
TOTAL a+c b+d a+b+c+d
103 Bioestatística e Epidemiologia
U8 Medidas de associações
EXEMPLO
COM CÂNCER DE 
PULMÃO
SEM CÂNCER DO 
PULMÃO TOTAL
FUMANTES 67 9 76
NÃO FUMANTES 5 114 119
TOTAL 72 123 195
Fonte: elaborada pela autora.
A Figura 1 exemplifica uma pesquisa para avaliar a associação entre fumo e câncer de 
pulmão. Nesse caso, primeiramente, deve-se definir que o fumo é a variável indepen-
dente e o câncer de pulmão a variável dependente. Então, pode-se designar que a = 
67, b = 9, c = 5 e d = 114 e que os valores totais foram obtidos por uma soma simples. 
É interessante observar que independentemente do tipo de estudo, se é transversal, 
caso-controle ou coorte, a tabela é montada da mesma maneira. 
Tabela de contingência 2 x 2
Em uma pesquisa para avaliar a associação do sexo com a chance de ter depressão, 
no início do acompanhamento, nenhum dos participantes eram depressivos. Contudo, 
depois de 10 anos, das 452 mulheres 79 foram diagnosticadas com depressão, enquan-
to 39 homens foram diagnosticados do total de 908 participantes do sexo masculino.
Como os dados estão distribuídos em uma tabela?
Tabela 2 x 2
Para montar a tabela, deve-se considerar que ter depressão é o desfecho e o sexo é 
a exposição. Como desejamos saber o risco de uma mulher ter a doença, podemos 
definir que ser mulher é ter a exposição.
Então, preencha a tabela com os valores descritos no enunciado:
EX
EM
PL
O
U8
104Bioestatística e Epidemiologia
Medidas de associações
 ` Incidência, ou coeficiente de incidência, é a proporção que descreve o número 
de casos novos de uma doença em uma determinada população. O resultado pode 
ser expresso em coeficiente com os números decimais resultantes da divisão ou 
em taxa a cada 1.000 pessoas, ou qualquer outra proporção que for adequada.
G
LO
SS
Á
R
IO
EX
EM
PL
O
Tabela 02. Índices de depressão por sexo
COM DEPRESSÃO SEM DEPRESSÃO TOTAL
MULHERES 79 (a) (b) 452
HOMENS 39 (c) (d) 908
TOTAL (a+c) (b+d) (a+b+c+d)
COM DEPRESSÃO SEM DEPRESSÃO TOTAL
MULHERES 79 373 452
HOMENS 39 869 908
TOTAL 118 1242 1360
Fonte: elaborado pela autora.
Para calcular “b”: do total de mulheres subtraia aquelas que tiveram depressão = 452 
– 79 = 373.
Para calcular “d”: do total de homens subtraia aqueles que tiveram depressão = 908 
– 39 = 869.
Some as colunas para preencher a linha “Total.”
Tabela 03. Tabela completa
 Fonte: elaborado pela autora.
1. RISCO RELATIVO E RISCO ATRIBUÍVEL
As medidas de associação risco relativo e risco atribuível estão associadas a incidência 
de um evento. Por serem dependentes da incidência, essas medidas só podem ser 
calculadas em estudos do tipo coorte, pois ele é o único que consegue avaliar o número 
de casos novos de um desfecho.
Fonte: Rouquayrol; Gurgel (2018, p. 682).
1
105 Bioestatística e Epidemiologia
U8 Medidas de associações
As duas medidas avaliam o risco de se ter o desfecho quando temos a exposição ao 
fator de risco comparando com o risco nas pessoas não expostas. risco relativo é uma 
razão das incidências do desfecho do grupo exposto contra o grupo não exposto (ROU-
QUAYROL; GURGEL, 2018, p. 138). A partir desse resultado, é possível saber quantas 
vezes maior é o risco do desfecho ao comparar os dois grupos (expostos e não expostos 
ao fator de risco). Um resultado alto favorece a causalidade da associação das variáveis.
Fórmula do risco relativo (RR):
2
Em que: a, b, c e d são as casas de referência da tabela 2 x 2.
Risco relativo 
Em uma pesquisa para avaliar a associação do sexo com a chance de ter depressão, 
no início do acompanhamento, nenhum dos participantes tinham a doença. Porém, 
das 452 mulheres analisadas, depois de 10 anos, 79 foram diagnosticadas com de-
pressão; enquanto apenas 39 homens foram diagnosticadoscom a doença em um 
total de 908 participantes do sexo masculino.
Qual é o risco relativo de mulheres terem depressão após 10 anos?
EX
EM
PL
O
Considere que, um estudo coorte acompanhou 95 pessoas entre fumantes e não fu-
mantes e, depois de 15 anos, avaliou quantas delas desenvolveram câncer de pulmão. 
A distribuição hipotética dos casos nos grupos está no exemplo da Figura 1. Para cal-
cular o risco relativo, inicialmente, é preciso calcular a incidência do desfecho nos dois 
grupos (expostos e não expostos). Nessa pesquisa, a exposição é o fumo e o desfecho 
é o câncer. Ao fazer o cálculo, identifica-se que incidência de câncer de pulmão em 
fumantes é de 0,8816 e em não fumantes é de 0,2632. Como usaremos os valores da 
incidência, podemos mantê-los na forma de coeficiente. Então, para calcular o risco 
relativo é preciso dividir as incidências, na qual se obtém o resultado de 3,35. Como 
interpretar esse resultado?
Esse valor de risco relativo significa que, o risco de ter câncer de pulmão entre fumantes 
é 3,35 vezes maior do que entre os não fumantes ou, ainda, pode-se dizer que fumar 
está associado a um risco de 3,35 vezes maior de desenvolver câncer de pulmão. 
U8
106Bioestatística e Epidemiologia
Medidas de associações
EX
EM
PL
O
Tabela 03. Tabela 2 x 2 completa
COM DEPRESSÃO SEM DEPRESSÃO TOTAL
MULHERES 79 373 452
HOMENS 39 869 908
TOTAL 118 1242 1360
Fonte: elaborado pela autora.
Risco relativo
Ou pela outra fórmula
realizar a divisão.
substituir o valor.
dividir no numerador e no denominador.
realizar a divisão.
Logo, o risco relativo é de 4,07. Isso significa que as mulheres têm um risco 4,07 
maior do que os homens de desenvolver depressão.
Caso o risco relativo seja 1,0, a exposição não altera o risco de desenvolver o desfe-
cho. Quando o risco relativo é menor do que 1,0, pode-se dizer que a exposição é um 
fator protetor, pois, a presença dela reduz o risco de ter a doença. Por exemplo, uma 
pesquisa sobre aleitamento materno e infecções respiratórias na primeira infância cujo 
RR=0,2. Isso significa que, aleitamento materno protege quanto a infecções respirató-
rias na primeira infância ou que não aleitamento é um fator de risco para a doença. 
107 Bioestatística e Epidemiologia
U8 Medidas de associações
Quando o risco relativo é menor do que 1,0, é possível fazer uma conta para avaliar o 
quanto a exposição reduz o risco. A fórmula, simplesmente, divide 1 pelo valor do risco 
relativo. No exemplo , ou seja, o aleitamento materno reduz em 5 vezes o 
risco de infecções respiratórias na primeira infância.
Já o risco atribuível se trata do quanto a incidência aumentou por causa da exposição, 
ou seja, ele avalia o risco que pode ser atribuído a exposição. Por sua vez, o cálculo é 
realizado a partir da subtração das incidências do desfecho entre os dois grupos (ex-
postos e não expostos) (FLETCHER; FLETCHER; FLETCHER, 2014, p. 73-75).
Fórmula do risco atribuível (RA):
3
Em que: a, b, c e d são as casas de referência da tabela 2 x 2.
Assim, analisando a Figura 1, é possível que um não fumante tenha câncer de pulmão, 
mesmo que o risco seja bem menor. Ao usar o risco atribuível, você avaliará o quanto 
fumar acrescentou no risco de desenvolver câncer. Para ficar mais fácil de interpretar 
o resultado é melhor transformá-lo em taxa a cada 1.000 pessoas, ou qualquer outra 
proporção que se achar adequada.
Risco atribuível 
Em uma pesquisa para avaliar a associação do sexo com a chance de ter depressão, 
no início do acompanhamento, nenhum dos participantes eram depressivos. Contudo, 
depois de 10 anos, das 452 mulheres 79 foram diagnosticadas com depressão, enquan-
to 39 homens foram diagnosticados do total de 908 participantes do sexo masculino.
Qual é o risco atribuível de mulheres terem depressão após 10 anos?
Tabela 04. Tabela 2 x 2 completa
EX
EM
PL
O
COM DEPRESSÃO SEM DEPRESSÃO TOTAL
MULHERES 79 373 452
HOMENS 39 869 908
TOTAL 118 1242 1360
Fonte: elaborado pela autora.
U8
108Bioestatística e Epidemiologia
Medidas de associações
EX
EM
PL
O
Risco atribuível
subtrair.
realizar a multiplicação para transformar em taxa.
Com isso, o risco de ter depressão atribuível a ser mulher é de 131,8 casos para 
1.000 pessoas.
2. RAZÃO DE CHANCES (ODDS RATIO)
Para estudos que não são coorte e, portanto, não se sabe a incidência do desfecho, 
o risco relativo não pode ser calculado. Para esses casos, existe a razão de chances 
ou odds ratio (OR), em inglês, que significa estimativa de risco. Essa medida pode ser 
usada em qualquer tipo de estudo.
Chances, no inglês Odds, é uma medida utilizada que avalia a chance de um even-
to acontecer contra a chance de não acontecer. Essa medida é popularmente usada 
em eventos esportivos e apostas. Ela se assemelha a probabilidade, com a diferença 
de que o denominador na probabilidade é a totalidade de possibilidades, enquanto na 
chance é a frequência do evento não acontecer. Por exemplo, qual é a chance e a pro-
babilidade e sair o número 6 no dado? 
 ` Na probabilidade a conta é 
 ` Na chance a conta é
109 Bioestatística e Epidemiologia
U8 Medidas de associações
A razão de chances é a divisão das chances (odds) do desfecho acontecer nos dois 
grupos (expostos e não expostos). Matematicamente, a fórmula pode ser simplificada 
pela divisão dos produtos cruzados.
Fórmula da razão de chances ou odds ratio (OR):
4
Em que: a, b, c e d são as casas de referência da tabela 2 x 2.
DESENVOLVIMENTO DA FÓRMULA DA RAZÃO DE 
CHANCES OU ODDS RATIO
Considere a tabela 2x2 de uma pesquisa de caso-controle.
Tabela 05. Exemplo de pesquisa de caso-controle
COM DESFECHO SEM DESFECHO TOTAL
COM EXPOSIÇÃO a b a+b
SEM EXPOSIÇÃO c d c+d
TOTAL a+c b+d a+b+c+d
Fonte: elaborado pela autora.
Para calcular a razão de chances, primeiramente, é necessário calcular a chance de o desfecho 
acontecer em cada um dos grupos. Nesse caso, os grupos são: com exposição e sem exposição.
5
6
A razão de chances ou odds ratio é a divisão da chance do desfecho no grupo dos expostos 
pela chance do desfecho no grupo dos não expostos:
7
U8
110Bioestatística e Epidemiologia
Medidas de associações
Uma divisão de frações pode ser solucionada multiplicando a primeira fração pelo inverso da 
segunda (o numerador vira o denominador e vice-versa), como na equação a seguir: 
8
Já a multiplicação de frações é solucionada multiplicando os numeradores e multiplicando os 
denominadores. Com isso, obtemos a fórmula final (Equação 9).
A interpretação do resultado é muito similar ao do risco relativo, mas a diferença é que o RR 
mede o risco, enquanto o OR estima o risco. Portanto, razão de chances maior do que 1,0 
indica aumento no risco do desfecho. Se for igual a 1,0, não existe associação entre 
as variáveis e se for menor do que 1,0 indica que a exposição reduz o risco. 
Razão de chances ou OR 
Em uma pesquisa para avaliar a associação do sexo com a chance de ter depressão, no 
início do acompanhamento, nenhum dos participantes eram depressivos. No entanto, 
depois de 10 anos, das 452 mulheres 79 foram diagnosticadas com depressão, enquan-
to 39 homens foram diagnosticados do total de 908 participantes do sexo masculino.
Qual é a razão de chances de mulheres terem depressão após 10 anos?
Tabela 06. Tabela 2 x 2 completa
EX
EM
PL
O
COM DEPRESSÃO SEM DEPRESSÃO TOTAL
MULHERES 79 373 452
HOMENS 39 869 908
TOTAL 118 1242 1360
Fonte: elaborado pela autora.
9
111 Bioestatística e Epidemiologia
U8 Medidas de associações
EX
EM
PL
O
Razão de chances
substituir os valores.
multiplicar.
dividir.
Logo, estima-se que ser mulher aumenta o risco de ter depressão em 4,72 vezes.
O risco relativo e a razão de chances têm valores aproximados quando a prevalência 
do desfecho for inferior a 10% (FLETCHER; FLETCHER; FLETCHER, 2014, p. 106). 
Nos exemplos da unidade sobre a pesquisa de depressão, nota-se que os valores es-
tão próximos, RR=4,07 e OR=4,72. Isso ocorre porque a prevalência de depressãona 
amostra foi de 8,7%. Para chegar nesse resultado de prevalência, divide-se o total de 
pessoas com depressão pelo total de pessoas (= 118/1360) e, em seguida, o resultado 
é multiplicado por 100. Já no exemplo da pesquisa sobre fumo e câncer, em que os 
valores estão descritos na Figura 1, a prevalência da doença é 75,8%. Nesse caso, o 
RR=3,35 está bem distante do OR=20,84. 
Como o risco relativo mede o risco enquanto a outra medida apenas estima, toda vez 
que for um estudo de coorte e for possível, deve-se dar preferência as medidas de risco 
relativo em vez da razão de chances.
3. ANÁLISE DE SOBREVIDA
As análises de sobrevida são gráficos que descrevem as probabilidades de o desfecho 
acontecer ao longo do tempo, podendo ou não ser estratificada em grupos de fatores 
prognósticos. Trata-se da medida mais completa dos estudos prognósticos, pois é pos-
sível avaliar a probabilidade do desfecho em cada ponto do tempo.
Porém, ela só pode ser calculada se o desfecho é dicotômico e só ocorre uma vez. O 
evento dicotômico é quando só há duas possibilidades presente/ausente ou sim/não. 
Se o desfecho não for morte/vida, mas seguir os mesmos pressupostos, pode-se usar 
o termo análise de tempo ou evento.
Para fazer estimativa, o método estatístico mais habitual é a análise de Kaplan-Meier 
(Figura 2). Nessa análise, a probabilidade de sobreviver é calculada em intervalos de 
tempo. As pessoas que saem da pesquisa por perda de segmento são chamadas de 
censurados e saem da conta do denominador naquele período em diante. 
U8
112Bioestatística e Epidemiologia
Medidas de associações
Figura 01. Representação gráfica de uma curva de sobrevida com a análise 
de Kaplan-Meier estratificada pelos fatores prognósticos de câncer. 
Os valores são fictícios. 
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
0 6 12 18 24 30 36 42 48 54 60
Pr
ob
ab
ili
da
de
 d
e 
so
br
ev
id
a
Tempo (meses)
sem metastase metastase em outros órgãos metastase em ganglionar
Fonte: elaborada pela autora.
Para calcular a probabilidade de sobrevida em um maior de tempo, é necessário 
multiplicar a probabilidade de cada intervalo. Por exemplo, para saber qual é a probabi-
lidade de sobreviver após um ano do diagnóstico do câncer, é preciso multiplicar a pro-
babilidade de ter sobrevivido a cada mês desse primeiro ano. Então, com o passar do 
tempo, a probabilidade se reduz cada vez mais. Na representação gráfica, as probabili-
dades já estão calculadas considerando a chance de sobreviver a todo aquele período.
A Teorema do Produto de Probabilidade fala que, quando se quer saber a probabilida-
de de dois ou mais eventos acontecerem simultaneamente, é necessário multiplicar a 
probabilidade de cada evento acontecer individualmente (VIEIRA, 2016, p. 177).
Por exemplo, acertar um número na loteria é mais fácil do que acertar três, que 
é mais fácil do que acertar seis, porque quanto mais eventos entrarem na conta, 
menor fica a probabilidade.
SA
IB
A 
M
A
IS
A interpretação da cauda da curva deve ser feita com cuidado. Isso se deve pelo fato de 
que, quando a probabilidade está baixa, o número de pessoas vivas é baixo e qualquer al-
teração terá um impacto muito maior, mas essa mudança não necessariamente represen-
ta o que pode acontecer. Por exemplo, a probabilidade de morrer quando se tem 1 morte:
113 Bioestatística e Epidemiologia
U8 Medidas de associações
 ` Em 100 pessoas acompanhadas é de 1%.
 ` Em 50 pessoas acompanhadas é de 2%.
 ` Em 25 pessoas acompanhadas é de 4%.
 ` Em 10 pessoas acompanhadas é de 10%.
 ` Em 5 pessoas acompanhadas é de 20%.
No entanto, continua sendo uma única morte, mas dependendo da amostra ela tem 
um impacto muito maior na estatística. Por isso, no final da curva, em que o número de 
pessoas é baixo, é importante utilizar a probabilidade com cautela.
Essa é a análise estatística principal dos estudos de prognósticos. Por ser comum o 
paciente perguntar para algum profissional de saúde qual é o seu prognóstico, deve-se 
refletir o que isso significa para o indivíduo e seus familiares. Nesse contexto, é impor-
tante ressaltar que a resposta é uma probabilidade e que isso não, necessariamente, 
acontecerá. Desse modo, pode ser que a média de sobrevida das pessoas, após o 
diagnóstico de câncer de mama bilateral, seja de 1,5 ano. Na maioria dos casos, as 
pessoas irão viver um tempo próximo a esse, mas é possível que o seu paciente sobre-
viva 1 mês ou 7 anos. As exceções são raras, mas elas podem acontecer. Ao conversar 
com o paciente e familiar é importante considerar diversos fatores e não só números.
Estes artigos mostram curvas de sobrevidas:
CENTEMERO, M. et al. Avaliação comparativa do valor prognóstico de quatro marca-
dores bioquímicos de lesão miocárdica pós intervenções percutâneas utilizando stents 
coronarianos. Arquivos Brasileiros de Cardiologia, São Paulo, v. 83, n. especial, p. 53-
58, dez. 2004. Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pi-
d=S0066-782X2004001900010&lng=en&nrm=iso. Acesso em: 10 abr. 2021. 
MIGOWSKI, A.; SILVA, G. A. Sobrevida e fatores prognósticos de pacientes com cân-
cer de próstata clinicamente localizado. Revista de Saúde Pública, São Paulo, v. 44, n. 
2, p. 344-352, abr. 2010. Disponível em: http://www.scielo.br/scielo.php?script=sci_art-
text&pid=S0034-89102010000200016&lng=en&nrm=iso. Acesso em: 10 abr. 2021. 
SA
IB
A 
M
A
IS
U8
114Bioestatística e Epidemiologia
Medidas de associações
4. OBJETO DE APRENDIZAGEM
Considerando as duas pesquisas fictícias, calcule as medidas de associações 
para cada uma delas e interprete o resultado.
Uma pesquisa tem como objetivo avaliar o consumo de cocaína e o desenvolvimento 
de esquizofrenia. Para esse estudo foram acompanhados 50 usuários de cocaína e 200 
pessoas que não faziam uso da droga. No início do acompanhamento, todos os partici-
pantes passaram por uma avaliação que definiu que nenhum deles tinham diagnóstico 
de esquizofrenia. Após 5 anos uma nova avaliação foi feita, na qual foram diagnosti-
cados com esquizofrenia 4 usuários de cocaína e 6 pessoas que não usaram a droga.
Pesquisa 1: 
Pesquisa 1: 
Pesquisa 2: 
Pesquisa 2: 
RESPOSTA
Uma pesquisa tem o objetivo de avaliar possíveis fatores causais para obesidade em 
adolescentes. Nessa pesquisa foram investigados 80 adolescentes obesos e 100 com 
peso adequado. No inquérito, avaliou-se a alimentação no primeiro ano de vida. Hou-
ve relato de consumo de alimentos ultraprocessados, como refrigerante e bolachas 
recheadas, em 35 obesos e em 12 adolescentes com peso adequado.
Nesse caso, as principais medidas de associações são risco relativo e risco atribuível, 
pois o desenho de estudo é coorte. O risco relativo foi de 2,67, o que significa que usar 
cocaína aumenta em 2,67 vezes o risco de desenvolver esquizofrenia. O risco atri-
buível foi de 0,05, o que significa que 5 casos a cada 100 pessoa com esquizofrenia 
podem ser atribuídos ao uso de cocaína.
 A principal medida de associação é a razão de chances ou odds ratio, já que o de-
senho do estudo é caso-controle. O odds ratio foi de 5,70, significando que consumir 
alimentos ultraprocessados no primeiro ano de vida aumenta em 5,7 vezes a chance 
de desenvolver obesidade na adolescência.
115 Bioestatística e Epidemiologia
U8 Medidas de associações
REFERÊNCIAS BIBLIOGRÁFICAS
ALMEIDA FILHO, N. de; BARRETO, M. L. Epidemiologia e saúde: fundamentos, métodos e aplicações. Rio 
de Janeiro: Guanabara Koogan, 2011.
FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. S. Epidemiologia clínica: elementos essenciais. 5. 
ed. Porto Alegre: ArtMed, 2014. 
ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia e saúde. 8. ed. Rio de Janeiro: Medbook, 
2018. 
VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016.
116
UNIDADE 9
ESTUDOS EXPERIMENTAIS
INTRODUÇÃO
Já se perguntou se a acupuntura é uma boa ação para redução de dor? Vacina funciona? 
Grupos educativos conseguem ajudar no controle das doenças crônicas? Comosaber 
se um tratamento é eficaz? Como definir se uma nova estratégia terapêutica funciona? 
Essa unidade abordará o tipo de estudo que responde às perguntas feitas anteriormen-
te. Abordaremos os estudos experimentais, isso significa que o pesquisador é quem 
decide qual conduta ou intervenção o sujeito da pesquisa será submetido.
1. ENSAIO CLÍNICO
Os ensaios clínicos são estudos experimentais que avaliam benefícios, malefícios, 
eficácia e efetividade de alguma intervenção. Considera-se como intervenção qualquer 
feito que tenha o objetivo de melhorar o quadro do paciente, seja uma medicação, um 
procedimento ou um atendimento.
O desenho desse estudo (Figura 1) é a comparação de dois grupos, a intervenção e o 
controle. Os grupos devem ser os mais similares possíveis, sendo que a única diferença 
é a intervenção. Esse é um estudo longitudinal, depois de algum tempo avalia-se os 
resultados. O desfecho pode variar conforme a intervenção, podendo ser ausência de 
complicação, estabilidade da doença, entre outros fatores.
Grupo intervenção
Pessoas que realizaram 
a intervenção
Grupo controle
Pessoas que não reali-
zaram a intervenção
Pessoas com presença do desfecho
Pessoas com presença do desfecho
Pessoas com ausência do desfecho
Pessoas com ausência do desfecho
DESENHO
Figura 01. Esquema do desenho de estudo de ensaio clínico
117
U9 Estudos experimentais
Bioestatística e Epidemiologia
Vacinados com 
princípio ativo
Vacinados com 
placebo
Pessoas com a doença
Pessoas com a doença
Pessoas sem a doença
Pessoas sem a doença
EXEMPLO
Fonte: elaborada pela autora.
O grupo controle pode ter outra intervenção diferente da estudada. Por princípios éti-
cos de que devemos tratar o paciente, raramente o controle não tem intervenção. Se a 
pesquisa é de um medicamento novo para uma doença que não tem tratamento, nor-
malmente se administra um placebo para que o sujeito não reconheça qual grupo ele 
faz parte. Entende-se como placebo uma substância que não tem princípio ativo, mas 
que apresente características como cor, cheiro e formato semelhantes à intervenção.
EX
EM
PL
O Ao testar uma vacina contra malária, o controle deverá ser com placebo, já que não 
existe outra medicação preventiva. Se a vacina é vermelha, com via de administração 
intramuscular, dose testada de 0,5 ml e disponibilizada em frasco único, o placebo 
deve ter essas mesmas características.
Se já existe um tratamento preconizado da doença, é importante que este seja a inter-
venção do grupo controle. Pode-se comparar com o melhor tratamento disponível ou 
com o tratamento convencional da doença dependendo do objetivo do estudo. Exem-
plificando: ao testar um novo quimioterápico para câncer de mama, o grupo controle 
pode ser a primeira droga de escolha do protocolo do serviço ou pode ser a droga que 
na literatura é mais eficaz. Se a melhor medicação não é disponível para a maioria da 
população brasileira, fazer essa comparação não ajudará o médico na hora de decidir 
qual remédio prescrever. Por isso, em algumas situações é melhor comparar com o 
tratamento convencional.
Existem dois tipos de ensaio clínico: ele pode ser de superioridade ou de não inferiori-
dade. É de superioridade quando o objetivo do estudo é avaliar se a intervenção testada 
é melhor do que o controle. Ele é de não inferioridade quando o objetivo é somente com-
parar se uma intervenção tem um efeito minimamente igual ao do controle. Normalmente, 
estudos sobre medicamentos genéricos ou com um custo inferior são de não inferioridade, 
já que o objetivo é garantir que o novo remédio não seja pior que a medicação comercial.
U9
118
Estudos experimentais
Bioestatística e Epidemiologia
Fo
nt
e:
 A
da
pt
ad
o 
de
 F
le
tc
he
r; 
Fl
et
ch
er
; F
le
tc
he
r (
20
14
, p
. 1
47
).
EX
EM
PL
O
SA
IB
A 
M
A
IS
Para conhecer mais acerca dos tipos de ensaio clínico, recomendamos as leituras de:
Superioridade
RUELA, L. de O.; et al. Efetividade da acupuntura auricular no tratamento da dor 
oncológica: ensaio clínico randomizado. Rev. esc. enferm. USP, São Paulo, v. 
52, 2018. Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pi-
d=S0080-62342018000100477&lng=en&nrm=iso. Acesso em: 28 abr. 2021.
Não inferioridade
LUNA, E. J. de A.; et al. Eficácia e segurança da vacina brasileira contra hepatite 
B em recém-nascidos. Rev. Saúde Pública, São Paulo, v. 43, n. 6, p. 1014-1020, 
dez. 2009. Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pi-
d=S0034-89102009000600013&lng=en&nrm=iso. Acesso em: 28 abr. 2021.
Uma característica importante desse estudo é o controle e o gerenciamento das variá-
veis com a finalidade de reduzir o viés de confundimento. Os grupos devem ser os mais 
semelhantes possíveis em suas características e tratamento, exceto pela intervenção 
pesquisada. Esse controle rigoroso das diversas variáveis aumenta a validade interna 
da pesquisa.
Se a pesquisa é sobre um novo tratamento para emagrecer, é preciso controlar nos dois gru-
pos a realização de atividade física e a ingesta de alimentos para garantir que não são essas 
variáveis que causaram a redução de peso. Para isso, é possível medir essas variáveis para 
depois, na análise estatística, os ajustes serem realizados ou ser solicitado que os sujeitos 
da pesquisa cumpram um regime, bem como orientações específicas. Uma possibilidade é 
internar os pacientes, assim, todos participantes irão comer a mesma comida.
Figura 02. Fatores associados com a melhora do quadro do paciente no grupo controle e no grupo intervenção
0
10
20
30
40
50
60
70
Grupo Controle Grupo intervenção
Título do Gráfico
Efeito da intervenção
Efeito Placebo
Cuidado convencional
Efeito Hawthorne
História Natural da doença
119
U9 Estudos experimentais
Bioestatística e Epidemiologia
Vários fatores estão associados à melhora do quadro de um paciente, como descri-
to na Figura 2 (FLETCHER; FLETCHER; FLETCHER, 2014, p. 147). A melhora pode 
acontecer pela história natural da doença, ou seja, o quadro gripal melhora depois de 
sete dias, independentemente da medicação em uso. O efeito Hawthorne refere-se à 
mudança de comportamento e ao cuidado com a saúde que o sujeito tem por participar 
de uma pesquisa ou por estar recebendo um cuidado especial. Ou seja, só pelo fato de 
alguém ligar para você todos os dias perguntando como você está, pode te fazer melho-
rar, não importando a medicação que está sendo usada. O efeito placebo é a melhora 
do quadro por fazer algum tratamento independentemente de ser um princípio ativo.
Esses três fatores associados com a melhora do quadro do paciente devem ser iguais 
nos grupos controle e intervenção. Dessa forma, é ideal que todo o cuidado seja se-
melhante nos dois grupos para que o único fator diferente seja o efeito da intervenção. 
Então, ao desenhar o estudo e o protocolo do cuidado é preciso levar em conta esses 
efeitos a fim de que o resultado terapêutico seja o único diferente entre os grupos.
1.1AMOSTRAGEM NOS ENSAIOS CLÍNICOS
A amostra do ensaio clínico segue as mesmas etapas de qualquer outra pesquisa com cri-
térios de inclusão e exclusão, ou seja, quem está no grupo controle poderia estar no grupo 
intervenção. É importante manter a homogeneidade dos grupos. Para facilitar esse proces-
so, é comum que o grupo controle seja selecionado pareado com o grupo intervenção. 
EX
EM
PL
O
Se foi incluído um homem de 35 anos com peso adequado para idade no grupo inter-
venção, no grupo controle deve ser incluído também uma pessoa com essas mesmas 
características. O pareamento pode ter uma ou mais variáveis em comum, normal-
mente o sexo e a idade, mas, dependendo da característica do estudo outras podem 
ser incluídas. Normalmente, o número de pessoas no controle é a mesma que na 
intervenção, mas, às vezes, a proporção pode ser de 1:2, sendo que o grupo controle 
tem o dobro de pessoas que a intervenção
Denomina-se alocação o processo de definição de quem fará parte do grupo controle e 
quemserá intervenção. O ideal é que esse processo seja randomizado, ou seja, a deci-
são é feita por meio de um sorteio, em que todos os participantes têm a mesma chance 
de serem selecionados para o grupo intervenção. 
A alocação pode ser randomizada estratificada quando o sorteio ocorre dentro de 
estratos. A título de exemplificação: dentro das faixas etárias (estratos) será sorteado 
quem irá para determinado grupo, ou a alocação pode ser randomizada por conglome-
rados, na qual o sorteio é o local da pesquisa. Por exemplo, quatro unidades de saúde 
vão participar da amostra, o sorteio irá definir as duas unidades serão controle e as 
duas que serão intervenção. A estratégia por conglomerado é boa por questões logísti-
cas, já que não é preciso treinar os profissionais nos dois procedimentos.
Como o ensaio clínico é um estudo experimental, é necessária uma padronização dos 
critérios de avaliação e do processo de intervenção. Para isso, é comum a criação de 
protocolo da pesquisa com descrição de cada etapa. Esses protocolos reduzem os vie-
ses e aumentam a validade interna da pesquisa. 
U9
120
Estudos experimentais
Bioestatística e Epidemiologia
Para reduzir o viés de confundimento, a amostra pode ser bem controlada, como em 
algumas etapas de estudos clínicos cuja população da pesquisa seja somente indivíduos 
adultos saudáveis sem comorbidades e com hábitos de vidas saudáveis. Ao restringir par-
ticipantes com possíveis fatores de confusão é mais fácil garantir a eficácia do tratamento. 
Para reduzir o viés de migração, são necessárias estratégias que garantam adesão ao 
tratamento e que o sujeito siga os cuidados corretamente. É importante assegurar que 
o sujeito não esteja realizando outro tratamento além do protocolado na pesquisa. Por 
exemplo, uma pesquisa de uma nova medicação para de ansiedade: é preciso garantir 
que o único tratamento que os participantes estejam recebendo para ansiedade seja a 
medicação proposta. Então, é preciso reforçar que práticas complementares, como me-
ditação e uso de plantas medicinais não podem ser realizadas. Essas cointervenções 
podem influenciar no resultado da pesquisa.
Outro risco que se corre é de o participante trocar de grupo por conta própria. Se ele 
sabe que está no grupo controle e tem acesso ao grupo intervenção, é possível que ele 
busque o tratamento experimental em vez de manter com o que foi solicitado.
Para reduzir o viés de aferição, o avaliador é treinado para o preenchimento do ques-
tionário, e os equipamentos utilizados são os mesmos. Tomemos como exemplo uma 
pesquisa sobre tratamento de ferida que irá acompanhar a cicatrização com fotos da 
lesão. O avaliador treinado irá tirar as fotos sempre na mesma máquina, no mesmo 
local, com a mesma iluminação, na mesma distância da lesão. 
Outra estratégia de redução de vieses é o cegamento na pesquisa. Isso significa que a pes-
soa “cega” não sabe dizer qual sujeito está em qual grupo (intervenção ou controle). Existem 
quatro momentos ou pessoas que podem ser “cegas” no ensaio clínico: a alocação, o pacien-
te, o profissional que executa a intervenção e o profissional que faz a avaliação (Figura 3).
Figura 03. Esquema com as diversas pessoas que podem ser “cegas” na pesquisa
Alocação
Controle
Avaliação
Intervenção
Fo
nt
e:
 e
la
bo
ra
da
 p
el
a 
au
to
ra
.
121
U9 Estudos experimentais
Bioestatística e Epidemiologia
O sigilo da alocação é o cegamento nesse processo. Isso ocorre quando quem faz a 
alocação não sabe dizer qual indivíduo foi para qual grupo. Logo, ao fazer o processo, a 
pessoa não pode saber que está decidindo onde essa pessoa vai estar. Saber quem é 
o sujeito pode influenciar na decisão de escolher qual grupo alocar. Para facilitar o sigilo 
desse processo, a seleção é feita com frequência com a ajuda do computador. 
O sujeito da pesquisa também deve ser cego para que ele não seja tendencioso nas 
suas condutas. É possível que a pessoa busque outras intervenções ou mude para 
hábitos mais saudáveis para querer ajudar o resultado da pesquisa. Já para os sujeitos 
que sabem que estão no grupo controle isso pode estimular a não adesão ao tratamen-
to ou a uma maior taxa de desistência. 
IM
PO
R
TA
N
TE
EX
EM
PL
O
Uma dificuldade em cegar o sujeito da pesquisa é a obrigatoriedade do Termo de Con-
sentimento Livre e Esclarecido (TCLE) que todo participante deve ler e assinar para 
poder participar do estudo. No TCLE está descrito o objetivo da pesquisa, o que pode 
fazer com que a pessoa saiba qual é o grupo que ela está.
O profissional que realiza o cuidado também precisa ser cego para que ele preste a 
mesma atenção, independentemente do grupo que o paciente está. Esse profissional 
pode ser alguém do serviço onde a pesquisa está realizada ou mesmo algum pesqui-
sador. Mas é importante que o cuidado seja o mesmo para que o efeito Hawthorne seja 
igual nos dois grupos. 
Uma estratégia que ajuda no cegamento do profissional é a alocação por conglomera-
do. Nesse caso, os sujeitos daquele serviço de saúde são do mesmo grupo, isso impe-
de que o profissional compare as pessoas e faça atendimento diferenciado.
Para facilitar o cegamento do sujeito e do cuidador é importante que o placebo ou a outra 
intervenção do grupo controle seja muito similar à intervenção do estudo. Assim, eles não 
serão capazes de diferenciar um do outro. Se a pesquisa é sobre técnicas de curativo, 
as duas pomadas devem ser embaladas no mesmo frasco e quem fez a alocação deve 
nomear o tudo por paciente e não por produto. Mas se as características são diferentes, o 
cuidador que deveria ser cego vai conseguir descobrir qual grupo o sujeito está.
É essencial o profissional que faz a avaliação ser cego, já que a avaliação pode ser 
tendenciosa e muito mais detalhada no grupo intervenção. O avaliador pode ser alguém do 
serviço onde a pesquisa está sendo realizada ou pode ser algum pesquisador. Mas é impor-
tante que ele siga o protocolo de avaliação da mesma maneira para todos os indivíduos. 
Na pesquisa de curativo em que a avaliação é por fotos, quem faz a análise das imagens 
deve realizá-la sem saber qual foi a pomada aplicada. Assim, a pessoa não será tenden-
ciosa em procurar algum critério de melhora ao saber que o sujeito é do grupo intervenção.
U9
122
Estudos experimentais
Bioestatística e Epidemiologia
IM
PO
R
TA
N
TE
Tradicionalmente se classifica um estudo duplo cego usando como referência que o 
sujeito da pesquisa e o cuidador ou avaliador são cegos. É possível que a alocação, a 
intervenção e a avaliação sejam feitas pela equipe de pesquisa e, por isso, sejam con-
sideradas como um ponto cego. Mesmo sendo o termo mais tradicional, é importante 
estar claro no estudo quais são os pontos cegos e quais foram as estratégias utilizadas 
para garantir isso. Quando um ensaio clinico não é cego, ele é classificado como aberto.
Um estudo pode ser cego em um ou mais momentos: na alocação, com o sujeito da 
pesquisa, o profissional que realiza o cuidado e o profissional que realiza a avaliação. 
Um estudo randomizado é quando a alocação dos sujeitos nos grupos, intervenção ou 
controle é aleatória. Quando isso acontece, o estudo é cego no momento da alocação.
Um estudo duplo cego tradicionalmente indica que o sujeito e o pesquisador são ce-
gos. Nesses casos, normalmente o pesquisador será o cuidador e o avaliador. O ideal 
é o pesquisador deixar claro as estratégias para cegar as pessoas.
1.2. ANÁLISE DA PESQUISA
A análise dos resultados pode ser feita com testes estatísticos e com medidas sumárias, 
que são Redução do Risco Relativo (RRR), Redução do Risco Absoluto (RRA) e Núme-
ro Necessário para Tratar (NNT) (ROUQUAYROL, 2018, p. 155). Como o desenho do 
estudo é semelhante ao estudo coorte, a análise de dados também é similar. É possível 
calcular a incidência do desfecho nos dois grupos. 
A RRR é a diferença das incidências do desfecho entre os grupos dividido pela incidên-
cia do grupo controle. A RRA representa o risco absoluto coma diferença da incidência 
do desfecho entre cada grupo. O NNT informa quantas pessoas são necessárias para 
tratar para evitar um desfecho ruim. 
Fórmula da Redução do Risco Relativo (RRR):
1
 
 
Incidência desfechoControle Incidência desfecho IntervençãoRRR
Incidência desfechoControle
−
=
A medida que as pessoas comumente vão utilizar no ensaio clínico é a eficácia do 
tratamento, que é a redução do risco relativo em porcentagem. Para fazer esse cál-
culo, basta multiplicar por 100 o valor de RRR.
123
U9 Estudos experimentais
Bioestatística e Epidemiologia
EX
EM
PL
O
Um ensaio clínico para avaliar a efetividade de uma vacina na prevenção de CO-
VID-19 utilizou como desfecho as possíveis classificações de gravidade da doença. A 
pesquisa acompanhou 724 pessoas do grupo intervenção e 706 do grupo placebo. No 
grupo intervenção 85 foram sintomáticos e 7 tiveram casos mais graves que neces-
sitaram de assistência. No grupo placebo 167 foram sintomáticos e 31 tiveram casos 
mais graves que necessitaram de assistência.
Calcule a eficácia da vacina na prevenção de casos sintomáticos e na prevenção de 
casos mais graves que necessitaram de assistência.
Casos sintomáticos
Tabela 01. Tabela 2 x 2 completa
SINTOMÁTICOS ASSINTOMÁTICOS + NÃO DOENTES TOTAL
INTERVENÇÃO 85 639 724
PLACEBO 167 539 706
TOTAL 252 1178 1430
Fonte: elaborada pela autora.
 85 0,1174
 724
númerode sintomáticos na IntervençãoIncidência na Intervenção
total de Intervenção
= = =
 
 167 0, 2365
 706
númerode sintomáticos noControleIncidência noControle
total deControle
= = =
 
 
 
Incidência desfechoControle Incidência desfecho IntervençãoRRR
Incidência desfechoControle
−
=
 
substituir os valores 
0,2365 0,1174
0,2365
RRR −= realiza a subtração
0,1191
0,2365
RRR = realiza a divisão
0,5036RRR = multiplica por 100
Eficácia = 50,36%
A vacina reduz em 50,36% a chance de uma pessoa ser caso sintomático de CO-
VID-19, quando comparado a pessoas não vacinadas.
U9
124
Estudos experimentais
Bioestatística e Epidemiologia
A análise dos dados pode ocorrer pela intenção de tratar ou pelo tratamento que de 
fato os sujeitos receberam (denominada análise explanatória). Essa escolha deve 
ser definida e ser clara nos resultados da pesquisa. É uma decisão que acontece 
quando há cruzamento de grupos, ou seja, apesar de a pessoa estar no grupo con-
trole ela recebeu o tratamento intervenção. 
Normalmente, a análise é pela intenção de tratar, já que é esse o olhar que importa 
para o profissional de saúde. Por exemplo, um médico precisa saber qual é a 
eficácia do remédio que ele prescreve para o paciente, mesmo que se tenha o risco 
de o paciente usar outros tratamentos e não fazer uso da medicação indicada. 
A análise explanatória é importante para saber, de fato, quão eficaz é tratamento 
quando o paciente realmente o realiza. O grande problema dessa análise é que a 
amostra pode estar enviesada, uma vez que a análise dos grupos não segue a alo-
cação definida no início da pesquisa.
Os ensaios clínicos avaliam a eficácia e a efetividade do tratamento. Define-se efi-
cácia a avaliação da intervenção em condições ideais. Ela ocorre em ensaios clíni-
cos com uma população de saudáveis e com o controle rigoroso das variáveis. Por 
conta disso, essa pesquisa tem baixo viés de confundimento e alta validade interna. 
Em contrapartida, há baixa capacidade de generalização, já que a amostra é tão 
restrita e, portanto, não representa a população geral.
Ao restringir a população da pesquisa para somente pessoas saudáveis, a validade 
interna aumenta, mas a capacidade de generalização dos resultados diminui, visto 
que no mundo real são poucas as pessoas que são saudáveis. Para conseguir me-
lhorar a validade externa sem alterar a população, pode-se aumentar o número de 
participantes e os locais de coleta de dados.
Já a efetividade é definida como a avaliação da intervenção em condições normais. Ela 
ocorre em ensaios clínicos com uma população com características diferentes, como 
presença de comorbidades. Essa pesquisa tem maior chance de viés de confundimen-
to e, portanto, pode apresentar validade interna baixa. Contudo, se for possível controlar 
os fatores de confusão, a pesquisa terá uma alta capacidade de generalização. 
G
O
SS
Á
R
IO
Eficácia refere-se ao impacto que uma ação tem, por exemplo, condições ótimas ou 
experimentais (ROUQUAYROL, 2018, p. 688).
Efetividade avalia o efeito que uma ação alcança em aplicação prática ou condições 
habituais (ROUQUAYROL, 2018, p. 688).
A validade externa define o quanto o resultado pode representar a população. Está 
associada à capacidade de generalização da pesquisa (ROUQUAYROL, 2018, p. 
161).
125
U9 Estudos experimentais
Bioestatística e Epidemiologia
A pesquisa clínica para avaliar novos tratamentos medicamentosos passa por qua-
tro fases. Antes dessas etapas são realizados estudos pré-clínicos em laboratórios 
e com animais. O ensaio clínico de fase I avalia a faixa terapêutica de segurança 
e os possíveis efeitos colaterais. Ela descreve as características do fármaco como 
qual é a via de eliminação e a meia-vida da substância. O número de participantes é 
muito pequeno, com menos de 100 pessoas, e não é necessário um grupo controle.
A fase II é um ensaio clínico de avaliação de eficácia, avaliação entre doses e efi-
cácia e investigação de efeitos colaterais. Dessa forma, a população é de pessoas 
saudáveis. Há um grupo controle e a amostra é pequena de algumas centenas. 
A fase III é um ensaio clínico de efetividade randomizado e avalia os reais efeitos 
do tratamento na população. Tem grupo controle e a amostra é grande, com mais 
de 1.000 pessoas. Com o resultado da fase III publicado a droga pode ser utilizada 
para uso comercial a depender da aprovação do órgão regulador. 
A fase IV do estudo clínico é a vigilância pós-comercialização. Nessa etapa, a co-
leta de dados é feita a partir de notificação de efeitos adversos que só serão detec-
tados com um uso amplo da medicação. Alguns medicamentos já foram retirados 
do mercado após a fase IV avaliar efeitos colaterais que não compensavam os 
benefícios da medicação.
Por ser um estudo experimental, as duas principais desvantagens são o custo ele-
vado e a logística complexa. O gasto é alto, já que tudo deve ser fornecido pela 
equipe da pesquisa. A logística é maior do que nos estudos observacionais, uma 
vez que é preciso realizar a intervenção e não somente avaliar o que já foi feito. 
Outro fator que influencia é as diversas etapas necessárias para manter as pessoas 
“cegas”. Além disso, outro motivo que dificulta a execução é a participação das pes-
soas. Se for um estudo de eficácia, atualmente é difícil conseguir pessoas saudá-
veis. Também, as pessoas podem ter medo de fazerem parte do grupo intervenção 
ou não quererem participar se for controle. 
Em alguns casos, os estudos experimentais não são possíveis de serem realizados. 
Uma das justificativas para isso é o princípio ético da não maleficência, ou seja, não 
se pode causar mal para o sujeito da pesquisa. Por exemplo, quando se investigava 
uma possível associação de fumo com câncer de pulmão, não foi possível fazer um 
ensaio clínico, já que não se podia incentivar o consumo de uma substância que 
podia fazer mal às pessoas. Em outros casos, os estudos observacionais conse-
guem respostas mais rápidas e com um custo menor. 
G
O
SS
Á
R
IO
O ensaio clínico randomizado duplo cego é considerado o padrão-ouro dos estudos 
científicos. Entende-se como padrão-ouro a indicação mais robusta, que é um padrão 
de referência, seja ele um estudo, método diagnóstico ou tratamento (FLETCHER; 
FLETCHER; FLETCHER, 2014, p. 117). Então, deve-se sempre almejar realizar um 
ensaio clínico para avaliar uma intervenção em vez de estudos observacionais.
U9
126
Estudos experimentais
Bioestatística e Epidemiologia
2. OBJETO DE APRENDIZAGEM
Julgue a pesquisa descrita abaixo. Qual é o tipo de estudo? Quais pessoas são“ce-
gas”? Existem vieses? Quais estratégias melhorariam a pesquisa?
C
A
SO
 D
E 
PE
SQ
U
IS
A
R
EF
LE
XÃ
O
Uma pesquisa realizada por duas pessoas tinha como objetivo avaliar se o uso de fita 
adesiva terapêutica melhorava a dor lombar em pacientes com lombalgia crônica. Os 
dois grupos fizeram exercícios específicos para o quadro três vezes na semana. A du-
ração do tratamento foi de duas de quatro semanas, sendo que o grupo intervenção 
trocava a fita adesiva uma vez por semana. Os sujeitos de pesquisa, ao lerem o TCLE, 
sabiam quais eram os dois grupos. Foram convidados a participar da pesquisa quem es-
tava na fila de espera de atendimento fisioterápico pelo SUS (Sistema Único de Saúde).
No primeiro atendimento, o pesquisador fez uma avaliação inicial e depois sorteou 
qual era o grupo que o participante iria ser incluído. O mesmo pesquisador era quem 
aplicava a fita terapêutica e orientava os exercícios. Como a sessão de atendimento e 
exercícios eram em grupos, os sujeitos sabiam que tinha algumas pessoas que colo-
cavam faixa e outras não. Entre os participantes teve quem estava fazendo atividade 
física em academias, que realizava tratamento fisioterápico particular ou que fazia em 
casa os exercícios aprendidos nos outros dias da semana. Ao final das quatro sema-
nas o mesmo pesquisador fez a avaliação final.
I. A pesquisa é um ensaio clínico de superioridade.
II. Houve sigilo de alocação, já que a alocação foi randomizada. O sujeito da pesqui-
sa não era cego, porque ele sabia se estava no grupo da fita adesiva terapêutica ou só 
do exercício. Como quem fez a alocação é a mesma pessoa que aplicou a intervenção 
e fez a avaliação final, não houve cegamento nos outros momentos.
III. Houve viés de confundimento, já que houve participantes que não seguiram o 
protocolo de atendimento, que era fazer somente os exercícios prescritos três vezes 
por dia. O ideal seria excluir as pessoas que faziam academia ou fisioterapia em outro 
serviço, por isso, também houve viés de amostragem. 
IV. Como a equipe era de dois pesquisadores, um poderia fazer a avaliação e o outro 
a alocação e a intervenção. Era preciso enfatizar que durante o período de pesquisa 
não se podia realizar outros exercícios. Era necessário avaliar a realização de outras 
atividades físicas e decidir se compensava excluir os sujeitos ou se deveria alocar as 
pessoas nos grupos a partir da quantidade de exercício que era realizado (fazer uma 
alocação estratificada pelo grau de atividade física).
127
U9 Estudos experimentais
Bioestatística e Epidemiologia
REFERÊNCIAS BIBLIOGRÁFICAS
FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. S. Epidemiologia clínica: elementos essenciais. 5. 
ed. Porto Alegre: ArtMed, 2014.
ROUQUAYROL, Maria Zélia; GURGEL, Marcelo. Rouquayrol: epidemiologia & saúde. 8. ed. Rio de Janeiro: 
Medbook, 2018. 752 p.
128
UNIDADE 10
ESTUDO DIAGNÓSTICO
INTRODUÇÃO
As variáveis têm distribuição normal na população, mas nem sempre o limite entre o 
sadio e o doente é bem definido. Uma pessoa com 37,8 °C está com febre ou ela só tem 
uma temperatura corpórea maior do que a maior parte da população? Qual é a propor-
ção que você acha aceitável em um teste de falso positivo ou falso negativo?
Uma pesquisa investiga se um novo exame de sangue consegue diagnosticar câncer 
de mama de uma maneira menos invasiva do que a biópsia. Como avaliar qual o valor 
definirá se a pessoa tem ou não a doença? Como conduzir essa pesquisa?
Nesta unidade, responderemos a essas perguntas e abordaremos as características 
dos testes diagnósticos.
1. DEFINIÇÃO
Os estudos diagnósticos são pesquisas que avaliam testes desse tipo. Considera-se 
como teste diagnóstico qualquer exame, escala ou procedimento cujo objetivo é avaliar e 
definir um diagnóstico. A pesquisa descreve as características do teste como capacidade 
de medir corretamente e quantidade de acertos e erros com proporções de verdadeiro e 
falso positivo. Além disso, o estudo é capaz de ajudar na interpretação do resultado.
EX
EM
PL
O A pesquisa calcula a probabilidade de um exame acertar ou errar e, a partir dessas 
informações, o profissional de saúde pode escolher qual exame é melhor para o seu 
paciente. Também, o estudo auxilia o profissional a interpretar o resultado ao avaliar 
qual é a chance de o resultado ser verdadeiro ou falso.
Esse desenho de estudo é proposto quando se quer implantar ou desenvolver um 
novo teste em uma população, aplicando este teste entre a população sadia e doente. 
Para definir o grupo sadio e doente, um outro método diagnóstico será utilizado. 
Normalmente, a comparação é com o método padrão-ouro, ou seja, o teste com evi-
dências mais sólidas, de maior acurácia e precisão; às vezes pode-se comparar com 
o exame mais frequente a ser realizado nos casos de o padrão-ouro não ser aces-
sível. Por exemplo, uma pesquisa quer avaliar se um marcador tumoral sorológico é 
um bom teste de diagnóstico precoce de câncer colorretal, a comparação pode ser 
feita com o teste padrão-ouro, que é a colonoscopia, ou com o convencional, que é o 
sangue oculto nas fezes.
129
U10 Estudo diagnóstico
Bioestatística e Epidemiologia
SA
IB
A 
M
A
IS
Para aprofundar ainda mais seus conhecimentos acerca do tipo de pesquisa, confira 
o artigo abaixo:
DUARTE, Geraldo; et al. Teste rápido para detecção da infecção pelo HIV-
1 em gestantes. Rev. Bras. Ginecol. Obstet., v. 23, n. 2, p. 107-111, mar. 
2001. Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pi-
d=S0100-72032001000200008&lng=en&nrm=iso. Acesso em: 1 maio 2021.
As informações obtidas na pesquisa são descritas na tabela 2 x 2 (tabela 1) que com-
para, nas linhas, os resultados do novo método diagnóstico e nas colunas os grupos de 
pessoas sadias e doentes. Quatro possibilidades de desfecho são possíveis. 
 ` Verdadeiro positivo (VP): quando os doentes testam positivo;
 ` Verdadeiro negativo (VN): quando os sadios testam negativo;
 ` Falso positivo (FP): quando os sadios testam positivo;
 ` Falso negativo (FN): quando os doentes testam negativo.
Tabela 01. Cruzamento do resultado do novo teste nos grupos doente e sadio com 
as possibilidades dos quatro desfechos
DOENTE SADIO TOTAL
RESULTADO 
POSITIVO Verdadeiro Positivo (VP) Falso Positivo (FP) VP + FP
RESULTADO 
NEGATIVO Falso Negativo (FN) Verdadeiro Negativo (VN) FN + VN
TOTAL VP + FN FP + VN VP + FP + VN + FN
Fonte: elaborada pela autora.
Métodos diagnósticos quantitativos, como exames de sangue, têm distribuição normal 
na população. Então, uma pessoa sadia pode ter uma faixa de valores que o exame 
pode alterar e ela ainda ser “não doente”. O ideal com qualquer método diagnóstico é 
que a curva de distribuição dos resultados dos sadios e dos doentes sejam indepen-
dentes (Figura 1A). Mas isso raramente ocorre, normalmente, as curvas se sobrepõem 
(Figuras 1B e 1C) e com isso fica difícil saber qual valor se deve definir como o limite 
entre um exame normal ou alterado.
Considere na Figura 1 a representação gráfica da frequência de cada valor de resultado 
de um exame sorológico que pode ser um novo método diagnóstico para câncer. Na 
Figura A, as curvas dos sadios e doentes são independentes, ou seja, não existe um 
valor que tanto indivíduos sadios como os doentes apresentaram como resultado. Na 
Figura B, existe um pouco de sobreposição e em alguns valores há indivíduos sadios 
e doentes. Na Figura C, a sobreposição é total e, portanto, o exame não é adequado 
como método diagnóstico.
U10
130
Estudo diagnóstico
Bioestatística e Epidemiologia
Fo
nt
e:
 e
la
bo
ra
da
 p
el
a 
au
to
ra
.
Figura 01. Gráficos da frequência de cada valor de resultado de um novo exame sorológico 
comparando o grupo sadio e doente
131
U10 Estudo diagnóstico
Bioestatística e Epidemiologia
Na Figura A, o ponto de corte entre o exame normal e o alterado pode ser 10 ou 11. Na 
Figura B, é mais difícil decidir apenas graficamente. Já na Figura C, o teste diagnóstico 
não é eficaz e, portanto,não necessita decidir. Para ajudar na definição de qual é o me-
lhor ponto de corte, algumas medidas de testes diagnósticos são necessárias. Além dis-
so, o objetivo e as consequências do teste também contribuirão na tomada de decisão.
2. MEDIDAS
Os testes diagnósticos têm duas medidas intrínsecas, a sensibilidade e a especificidade. 
Além delas, a pesquisa consegue avaliar os valores preditivos positivo e negativo. Essas 
quatro medidas são probabilidades e são expressas normalmente em porcentagem.
2.1. SENSIBILIDADE E ESPECIFICIDADE
A sensibilidade e a especificidade são características do teste diagnóstico que não 
sofrem alteração com mudanças de outras variáveis, como a prevalência da doença. 
São informações importantes a serem consideradas antes de solicitar o exame para o 
paciente. Dependendo do objetivo do exame pode ser interessante escolher um teste 
com alta sensibilidade ou com alta especificidade. 
A confiabilidade dos valores das medidas depende da amostra. A população deve ser 
representativa e com um número amostral grande para que o valor real esteja perto do 
valor estimado pelo cálculo.
A sensibilidade é a proporção de pessoas do grupo doente que testaram positivo 
(ROUQUAYROL, 2018, p. 151). Seu valor está associado à quantidade de falsos nega-
tivos. Quanto menor o número de falsos negativos, maior o valor da sensibilidade. 
Fórmula da Sensibilidade (S):
( )
 
 
 
Verdadeiro PositivoS total dedoentes
Verdadeiro Positivo Falso Negativo
=
+
 ou VPS
VP FN
=
+
1
Para transformar o valor em porcentagem é só multiplicar o resultado por 100.
Um teste com alta sensibilidade significa que ele irá detectar a grande maioria dos do-
entes. Por essa característica, exames com alta sensibilidade são utilizados quando se 
quer garantir que todos os doentes sejam identificados. É comum para doenças trans-
missíveis, porque se quer ter certeza de que não existe algum doente com exame falso 
negativo e que continuará transmitindo a doença.
Outra característica dos testes com alta sensibilidade é que se confia no resultado ne-
gativo. Isso acontece uma vez que a proporção de falsos negativos é baixa e, portanto, 
um exame negativo tem grande chance de ser um verdadeiro negativo. 
U10
132
Estudo diagnóstico
Bioestatística e Epidemiologia
2
Os testes de rastreamento e os testes iniciais no processo diagnóstico têm alta sensibi-
lidade, sendo que o objetivo nesses dois casos é confirmar a ausência de determinada 
doença. Por isso que exames de rastreamento não determinam a presença de doença e 
é necessária a realização de novos exames para fechar o diagnóstico. Essa caracterís-
tica é importante ser ressaltada, já que muitas pessoas ao terem o teste rápido de HIV 
positivo já consideram que são verdadeiros positivos e portadores do vírus, quando, na 
verdade, o teste rápido só consegue garantir o exame negativo.
A especificidade é a proporção de pessoas do grupo sadio que testaram negativo (ROU-
QUAYROL; GURGEL, 2018, p. 151). Seu valor está associado à quantidade de falsos 
positivos. Quanto menor o número de falsos positivos, maior o valor da especificidade.
Fórmula da Especificidade (E):
( )
 
 
 
Verdadeiro NegativoE total de sadios
Verdadeiro Negativo Falso Positivo
=
+
 ou VNE
VN FP
=
+
Pa transformar o valor em porcentagem é só multiplicar o resultado por 100.
Um teste com alta especificidade detectará a grande maioria dos sadios, ou seja, rara-
mente se classificará alguém como doente sendo que, de fato, a pessoa é sadia. Sua 
principal característica é que se confia no resultado positivo, uma vez que a proporção 
de falsos positivos é muito baixa.
O principal uso de testes com alta especificidade é para confirmação diagnóstica. Ele 
também é utilizado quando um resultado positivo pode ser nocivo para o indivíduo. Por 
exemplo, se um exame positivo significa que a pessoa deverá passar por uma cirurgia, 
é importante ter certeza que o paciente não sofrerá uma intervenção desnecessária, já 
que o resultado era, na verdade, um falso positivo.
EX
EM
PL
O
Cálculo de sensibilidade e especificidade 
Uma pesquisa com o objetivo de avaliar se um novo marcador sorológico é capaz 
de identificar precocemente o câncer de mama realizou 200 testes e comparou com 
os achados da mamografia. Dos 100 casos positivos na mamografia, 95 foram posi-
tivos no novo exame. Dos 100 casos negativos na mamografia 20 foram negativos 
no novo exame.
Qual é a sensibilidade e a especificidade desse novo teste?
133
U10 Estudo diagnóstico
Bioestatística e Epidemiologia
Tabela 2 x 2 completa
DOENTE 
(MAMOGRAFIA +)
SADIO 
(MAMOGRAFIA -) TOTAL
TESTE POSITIVO 95 80 175
TESTE 
NEGATIVO 5 20 25
TOTAL 100 100 200
Sensibilidade
 VPS
VP FN
=
+ substituir o valor
95 
95 5
S =
+ fazer a soma do denominador
95 
100
S =
 realizar a divisão
 0,95 S = 
 0,95 1 00S = × . realizar a multiplicação para transformar em porcentagem
95% S = . 
Especificidade
 VNE
VN FP
=
+ substituir o valor
20 
20 80
E =
+ fazer a soma do denominador
20 
100
E =
 realizar a divisão
 0, 20E = 
 0, 20 1 00E = × . realizar a multiplicação para transformar em porcentagem
U10
134
Estudo diagnóstico
Bioestatística e Epidemiologia
20% E = 
A sensibilidade desse teste é de 95% e a especificidade é de 20%. Como tem alta 
sensibilidade, pode ser um teste de rastreamento adequado.
Como mencionado no final do tópico anterior, para decidir qual é o melhor ponto de cor-
te entre exame normal e alterado é preciso calcular a sensibilidade e a especificidade 
de cada ponto e, a partir disso, decidir qual é o melhor ponto. 
Uma representação gráfica denominada curva ROC (receiver operator characteristics) 
pode auxiliar nessa definição (FLETCHER; FLETCHER; FLETCHER, 2014, p. 121). A 
curva é um gráfico de correlação entre as proporções da sensibilidade (eixo y) e do falso 
positivo (eixo x) nos diversos pontos de cortes possíveis (pontos na curva). A proporção 
de falso positivo é a parte complementar da especificidade e, às vezes, é mencionada 
no gráfico como “1 - Especificidade”. Por exemplo, se a especificidade for de 40%, 
primeiro devemos transformar ela novamente em número decimal dividindo por 100 
(40% ÷ 100 = 0,4), depois fazer a subtração (1 - 0,4 = 0,6) para por último transformar 
novamente em porcentagem multiplicando por 100 (0,6 × 100 = 60%).
Figura 02. Curva ROC de três testes diagnósticos diferentes
Fo
nt
e:
 e
la
bo
ra
da
 p
el
a 
au
to
ra
.
A Figura 2 representa a curva ROC de três testes diagnósticos diferentes. A curva 1 é 
de um teste diagnóstico que tem distribuição dos resultados de sadios e doentes com 
poucas sobreposições. A curva 2 tem a distribuição conforme a imagem 4. O teste da 
curva 3 apresenta sobreposição completa entre os resultados dos dois grupos e, por-
tanto, não é um exame capaz de diferenciar doentes de sadios.
135
U10 Estudo diagnóstico
Bioestatística e Epidemiologia
Figura 03. Distribuição da frequência de cada valor de resultado de um novo exame sorológico 
comparando o grupo sadio e doente
Fo
nt
e:
 e
la
bo
ra
da
 p
el
a 
au
to
ra
.
Normalmente, a definição do limite de resultado positivo ou negativo é o valor que repre-
senta um ponto na curva ROC em que há mudança na inclinação. Na curva 1 é claro o 
momento em que o trajeto passa de vertical para horizontal, que é o primeiro ponto do 
gráfico com sensibilidade de 90%. Na curva 2, seria possível usar três pontos, os que 
têm sensibilidade de 65%, 80% ou 85%
Considerando o exame da curva 2 (Figura 2) descrito na Figura 3, calcularemos a sen-
sibilidade e a especificidade de dois pontos de corte com definição de doente para 
resultados ≥ 11 ou ≥ 13.
EX
EM
PL
O
Cálculo da curva 2 – diversos pontos de corte
Considere que a pesquisa analisou 100 sadios e 100 doentes e realizou o novo teste 
sorológico. Qual é a sensibilidade e a especificidade desse novo teste se o ponto de 
definição de positivo e negativo for ≥ 11 ou ≥ 13?
Ponto decorte ≥ 11
DOENTE SADIO TOTAL
TESTE POSITIVO 85 40 125
TESTE 
NEGATIVO 15 60 75
TOTAL 100 100 200
Sensibilidade
85 85 0,85 0,85 1 00 85% 
85 15 100
VPS
VP FN
= = = = = × =
+ +
.
 
U10
136
Estudo diagnóstico
Bioestatística e Epidemiologia
DOENTE SADIO TOTAL
TESTE POSITIVO 65 10 75
TESTE 
NEGATIVO 35 90 125
TOTAL 100 100 200
Especificidade
60 60 0,60 0,60 1 00 60% 
60 40 100
VNE
VN FP
= = = = = × =
+ +
 
Ponto de corte ≥ 13
Sensibilidade
65 65 0,65 0,65 1 00 65% 
65 35 100
VPS
VP FN
= = = = = × =
+ +
 
Especificidade
90 90 0,90 0,90 1 00 90% 
90 10 100
VNE
VN FP
= = = = = × =
+ +
 
Com os cálculos, usar a definição de exame positivo com resultados ≥ 11, significa que 
o teste diagnóstico terá alta sensibilidade, ou seja, ele será capaz de detectar quase 
todos os doentes e será possível confiar no resultado negativo. Caso a definição seja 
≥ 13, o teste diagnóstico terá alta especificidade, ou seja, ele será capaz de detectar 
quase todos os sadios e será possível confiar no resultado positivo.
Para escolher qual desses pontos utilizar, é preciso pensar qual é o objetivo do teste. Se o pro-
pósito for um teste de rastreamento ou avaliação inicial, deve-se escolher um padrão com alta 
sensibilidade que, nesse caso, é definir como positivo ≥ 11. Também se escolhe esse ponto 
caso um resultado positivo, mesmo que falso positivo, não tenha impacto na vida do sujeito. 
Agora, se o objetivo for um teste de confirmação diagnóstica, deve-se escolher um 
padrão com alta especificidade, que nesse caso é definir como positivo ≥ 13. Também 
se escolhe esse ponto caso resultado positivo signifique uma intervenção cirúrgica ou 
algum estigma que irá impactar na vida da pessoa.
SA
IB
A 
M
A
IS
Conheça mais sobre a Análise de ponto de corte e sua aplicação no artigo abaixo:
INFANTINO, M. et al. Diagnostic accuracy of an automated chemiluminescent im-
munoassay for anti-SARS-CoV-2 IgM and IgG antibodies: an Italian experience. J 
Med Virol., v. 92, n. 9, p. 1671– 1675, 2020. Disponível em: https://doi.org/10.1002/
jmv.25932. Acessado em 12 jun. 2021.
137
U10 Estudo diagnóstico
Bioestatística e Epidemiologia
2.2 VALOR PREDITIVO POSITIVO E NEGATIVO
Os valores preditivos auxiliam na interpretação do resultado e avaliam a probabilidade 
de confiar no resultado obtido. São medidas que avaliam a probabilidade pós-teste 
(ROUQUAYROL; GURGEL, 2018, p. 152).
O valor preditivo positivo (VPP) é a proporção de pessoas do grupo que testaram po-
sitivo que são doentes. Seu valor está associado à quantidade de falsos positivos e com 
o valor da especificidade. Essa é a probabilidade de se confiar no resultado positivo.
Fórmula do Valor Preditivo Positivo (VPP):
( )
 
 
 
Verdadeiro PositivoVPP total de positivos
Verdadeiro Positivo Falso Positivo
=
+
 ou VPVPP
VP FP
=
+3
4
Para transformar o valor em porcentagem é só multiplicar o resultado por 100.
O valor preditivo negativo (VPN) é a proporção de pessoas do grupo que testaram 
negativo que são sadias. Seu valor está associado à quantidade de falsos negativos 
e com o valor da sensibilidade. É a probabilidade de se confiar no resultado negativo. 
Fórmula do Valor Preditivo Negativo (VPN):
( )
 
 
 
Verdadeiro NegativoVPN total denegativos
Verdadeiro Negativo Falso Negativo
=
+
 ou VNVPN
VN FN
=
+
Para transformar o valor em porcentagem é só multiplicar o resultado por 100.
EX
EM
PL
O
Cálculo de Valor Preditivo Positivo e Negativo 
Uma pesquisa com o objetivo de avaliar se um novo marcador sorológico é capaz 
de identificar precocemente o câncer de mama realizou 200 testes e comparou com 
os achados da mamografia. Dos 100 casos positivos na mamografia, 95 foram posi-
tivos no novo exame. Dos 100 casos negativos na mamografia 20 foram negativos 
no novo exame.
Qual é o Valor Preditivo Positivo e o Valor Preditivo Negativo desse novo teste?
Tabela 2 x 2 completa
U10
138
Estudo diagnóstico
Bioestatística e Epidemiologia
DOENTE 
(MAMOGRAFIA +)
SADIO 
(MAMOGRAFIA -) TOTAL
TESTE POSITIVO 95 80 175
TESTE 
NEGATIVO 5 20 25
TOTAL 100 100 200
Valor Preditivo Positivo (VPP)
 VPVPP
VP FP
=
+ substituir o valor
95 
95 80
VPP =
+ fazer a soma do denominador
95 
175
VPP =
 realizar a divisão
 0,5429 VPP = 
 0,5429 1 00VPP = × realizar a multiplicação (transformar em porcentagem)
54,29% VPP = 
Valor Preditivo Negativo (VPN)
 VNVPN
VN FN
=
+ substituir o valor
20 
20 5
VPN =
+ fazer a soma do denominador
20 
25
VPN =
 realizar a divisão
 0,80VPN = 
 0,80 1 00VPN = × realizar a multiplicação (transformar em porcentagem)
80% VPN = 
O valor preditivo positivo desse teste é de 54,29% e o valor preditivo negativo é de 80%.
139
U10 Estudo diagnóstico
Bioestatística e Epidemiologia
Os valores preditivos variam conforme a sensibilidade e a especificidade dos testes. 
Testes com alta sensibilidade costumam ter um alto valor preditivo negativo por possu-
írem baixa proporção de falsos negativos. É por isso que nesses testes se confia mais 
no resultado negativo. Os testes de alta especificidade têm alto valor preditivo positivo, 
já que a frequência de falsos positivos é baixa. 
Os valores preditivos também variam se um mesmo teste for aplicado em populações 
com prevalências diferentes (FLETCHER; FLETCHER; FLETCHER, 2014, p. 126). 
Por isso, mesmo em um teste com alta especificidade, um resultado positivo pode não 
ser confiável se a prevalência da doença na população for baixa. Quanto menor a pre-
valência da doença, menor o valor preditivo positivo e maior o valor preditivo negativo. 
Como a prevalência da doença pode variar muito, ao avaliar o resultado esse fator é 
mais importante do que a sensibilidade e a especificidade do teste.
EX
EM
PL
O
Cálculo dos Valores Preditivos em populações com prevalências diferentes 
da doença
Considere que a pesquisa realizou um novo teste sorológico para câncer de prósta-
ta em duas populações diferentes. A primeira população era de pessoas que faziam 
acompanhamento com o urologista e apresentavam alguma queixa de alteração ao 
urinar. A segunda população era de pessoas que faziam acompanhamento com o mé-
dico generalista na Unidade Básica de Saúde e não tinham queixas. 
Qual é a prevalência de doentes com câncer de próstata em cada grupo? Quais são 
os Valores Preditivos Positivos e Negativos para cada população?
Grupo urologista com queixa urinária
DOENTE SADIO TOTAL
TESTE POSITIVO 179 19 198
TESTE 
NEGATIVO 25 101 126
TOTAL 204 120 324
Prevalência
 204 0,6300 0,6300 1 00 63,00%
 324
total decasos ou doentesP
total da amostra
= = = = × =
 
Valor Preditivo Positivo
179 179 0,9040 0,9040 1 00 90,40% 
179 25 198
VPVPP
VP FP
= = = = = × =
+ + 
U10
140
Estudo diagnóstico
Bioestatística e Epidemiologia
DOENTE SADIO TOTAL
TESTE POSITIVO 79 36 115
TESTE 
NEGATIVO 11 198 209
TOTAL 90 234 324
Valor Preditivo Negativo
101 101 0,8016 0,8016 1 00 80,16% 
101 19 126
VNVPN
VN FN
= = = = = × =
+ + .
Grupo generalista sem queixa urinária
Prevalência
 90 0, 2778 0,2778 1 00 27,78%
 324
total decasos ou doentesP
total da amostra
= = = = × =
. 
Valor Preditivo Positivo
79 79 0,6870 0,6870 1 00 68,70%
79 36 115
VPVPP
VP FP
= = = = = × =
+ + 
Valor Preditivo Negativo
198 198 0,9474 0,9474 1 00 94,74% 
198 36 209
VNVPN
VN FN
= = = = = × =
+ + 
O grupo do urologista que tem uma prevalência maior que o grupo do generalista. O 
Valor Preditivo Positivo (VPP) é maior no grupo com maior prevalência (urologista) 
enquanto o Valor Preditivo Negativo (VPN) é maior no grupo com menor prevalência 
(generalista).
A sensibilidade e a especificidade são iguais nos dois grupos já que elas são inerentes 
ao exame. A sensibilidade é de 87,78% e a especificidade é de 84,61%.
Para aumentar a prevalência da doença e conseguir confiar mais no resultado positivo, 
várias estratégias são possíveis, como mostra o exemplo acima. Pacientes com sinais 
e/ou sintomas, histórico familiarda doença, presença de antecedentes pessoais ou 
outras características individuais têm um risco maior de desenvolver a doença. Isso 
significa que a prevalência dela em grupos com alguma dessas características é maior 
do que na população geral.
Pacientes que passam com especialistas, muito provavelmente, já apresentam 
sintomas, por isso os resultados positivos são mais confiáveis. Por outro lado, em situ-
141
U10 Estudo diagnóstico
Bioestatística e Epidemiologia
ações de alta prevalência, o resultado negativo não é confiável, já que o VPN é baixo e 
as chances de falso negativo são maiores. 
Em casos em que a prevalência da doença é muito baixa, os resultados positivos não 
são confiáveis, por isso que a realização indiscriminada de exames de rotinas em pes-
soas assintomáticas é questionável. A chance de falsos positivos é alta e isso pode 
levar a tratamentos desnecessários. É por essa razão que não existe um consenso 
na literatura sobre a realização de dosagem sorológica de PSA indiscriminada para a 
população geral. Mesmo que exista artigos com VPP altos, é preciso avaliar qual foi a 
amostra da pesquisa. 
3. TESTE DIAGNÓSTICOS MÚLTIPLOS
Uma estratégia para melhorar os valores de sensibilidade e especificidade dos testes é 
realizar diversos exames diferentes. Os múltiplos testes diagnósticos podem acontecer 
simultaneamente ou sequencialmente. Quando acontece em série, o próximo exame só 
é solicitado quando o anterior for positivo.
Os testes em paralelos referem-se a quando os exames diagnósticos são realizados 
simultaneamente. Normalmente, eles ocorrem em situações de emergência ou quan-
do o paciente tem dificuldade de locomoção e se pretende reduzir a ida a serviços de 
saúde. Eles aumentam a sensibilidade e o VPN, além de reduzirem a especificidade e 
o VPP de cada teste se ele tivesse sido realizado isoladamente. 
Uma vantagem é melhorar a sensibilidade quando os testes disponíveis não são pouco 
sensíveis, logo, são úteis quando se quer garantir que todos os casos de doença serão 
detectados. A desvantagem é a maior probabilidade de falsos positivos que leva a um 
diagnóstico errado e tratamento desnecessário do paciente. (FLETCHER; FLETCHER; 
FLETCHER, 2014, p. 135)
Os testes em séries são quando os exames acontecem em sequência a depender do 
resultado positivo do exame anterior. Eles aumentam a especificidade e o VPP, bem 
como reduzem a sensibilidade e o VPN. Eles ocorrem em atendimento ambulatorial 
para aumentar a confiança do resultado positivo. Uma vantagem é melhorar a especifi-
cidade do teste quando os exames disponíveis são pouco detalhados. Uma desvanta-
gem é o maior número de falsos negativos, que faz com que alguns doentes não sejam 
diagnosticados. (FLETCHER, FLETCHER; FLETCHER, 2014, p. 136).
Esses testes são usados quando há testes caros ou com maior risco de complicações. 
A realização do teste caro ou com maior risco só acontece caso um exame prévio tenha 
sido positivo. Por ser condicionante ao exame anterior positivo, quando se realiza testes 
em séries, menos testagens são realizadas.
U10
142
Estudo diagnóstico
Bioestatística e Epidemiologia
4. OBJETO DE APRENDIZAGEM
Uma pesquisa validou um novo teste diagnóstico para HIV com a população adulta. Na 
amostra de 363 pessoas, 178 tiveram resultado positivo. Entre os 139 doentes, somen-
te 2 testaram negativo. 
Calcule a sensibilidade, especificidade e os valores preditivos positivo e negativo. 
Avalie o teste: em que situação ele deve ser utilizado? 
Um familiar do sexo masculino com 85 anos te encaminhou o laudo do exame com resultado 
positivo para HIV. Como explicar o resultado e sua interpretação para o paciente. 
143
U10 Estudo diagnóstico
Bioestatística e Epidemiologia
REFERÊNCIAS BIBLIOGRÁFICAS
FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. Epidemiologia clínica: elementos essenciais. 5. ed. 
Porto Alegre: ArtMed, 2014.
ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia & saúde. 8. ed. Rio de Janeiro: Medbook, 
2018. 752 p.
144
UNIDADE 11
RESULTADOS: ANÁLISE 
E APRESENTAÇÃO
INTRODUÇÃO
Considere uma pesquisa que avalia se a acupuntura reduz o tempo de duração de uma 
crise de enxaqueca. Como resultado, obteve-se que quem fez acupuntura teve uma 
crise de 2,5h, em média, enquanto quem não fez teve uma crise de, em média, 3,5h. É 
possível apontar que acupuntura reduz o tempo de duração das crises? 
Para um leigo e pessoas que sofrem de enxaqueca essa redução de uma hora pode ser 
significativa, mas nem sempre para as estatísticas esses dados mostram uma associação.
Nesta unidade, abordaremos quais estratégias são utilizadas para avaliar a associação 
de variáveis a partir de dados coletados e como os resultados de uma pesquisa podem 
ser organizados e demonstrados.
1. ANÁLISE ESTATÍSTICA
Dentre as funções do conceito de bioestatística está a característica de analisar os da-
dos coletados da amostra da pesquisa. Esse processo acontece comparando variáveis 
coletadas para avaliar possíveis associações e comparando os resultados encontrados 
com o que é esperado ou o que foi encontrado em outras pesquisas. A principal ava-
liação ao ler os resultados de uma pesquisa é indagar se o que foi encontrado de fato 
representa a realidade. 
EX
EM
PL
O
Uma pesquisa avaliou a nota dos alunos em uma disciplina teve como resultado a 
taxa de reprovação de 50%, e que os alunos do sexo masculino reprovam muito mais 
do que os do sexo feminino. A conclusão dessa pesquisa foi que o sexo influencia na 
aprovação da disciplina. Ao ler esses resultados é preciso avaliar a probabilidade de 
eles serem representativos ao que acontece na população total e, portanto, generali-
zar as informações obtidas.
Existe a possibilidade de o resultado encontrado na pesquisa ser decorrente de um erro 
sistêmico ou viés. Os vieses podem acontecer em diversos momentos da pesquisa, 
desde a amostragem, na aferição ou coleta de dados, na utilização de informações de 
eventos que aconteceram há muito tempo e talvez o paciente já não se lembre corre-
tamente. É por isso que, ao definir os métodos de coleta de dados da pesquisa a partir 
do desenho de estudo, diversas estratégias podem ser realizadas a fim de reduzir ou 
impossibilitar a ocorrência de vieses. 
Outra possibilidade é que o erro da pesquisa seja em decorrência ao acaso. Define-se 
como acaso um erro aleatório que é inerente a qualquer observação. Não existe estra-
145
U11 Resultados: análise e apresentação
Bioestatística e Epidemiologia
tégia capaz de eliminar a ocorrência do acaso (FLETCHER; FLETCHER; FLETCHER, 
2014, p. 189).
SA
IB
A 
M
A
IS Se quiser se aprofundar sobre o acaso, uma dica de leitura é O andar do bêbado, de 
Leonard Mlodinow. Esse livro é um best-seller internacional que aborda o quanto os 
eventos e acontecimentos da nossa vida podem ser explicados pelo acaso. 
MLODINOW, L. O andar do bêbado. Rio de Janeiro: Zahar, 2008, p. 207.
Todo resultado de pesquisa deve sempre ser questionado se ele ocorreu, pois, de fato, 
é o que acontece no mundo real (natureza) ou se o que foi encontrado é justificado pelo 
acaso, como no caso de uma pessoa morre após utilizar uma medicação. A estatística 
consegue ajudar na definição que a morte foi em decorrência do tratamento ou ela pode 
ser justificada pelo acaso, ou seja, a pessoa iria morrer independentemente da adminis-
tração da medicação. Toda análise estatística tem a incerteza inerente do acaso.
Para decidir se os resultados são confiáveis e que se pode generalizá-los, existem méto-
dos que conseguem avaliar o acaso, os quais estimam os efeitos da variação aleatória. 
Os dois métodos mais utilizados são os testes de hipóteses e os intervalos de confiança.
1.1 TESTES DE HIPÓTESES
O teste de hipótese avalia, utilizando testes estatísticos, se uma diferença ou uma as-
sociação está presente. Por exemplo, para avaliar se existe uma diferença no tempo de 
duração de uma crise de enxaqueca em pessoas que realizaram tratamentos diferen-
tes, um teste de hipótese podeser realizado. Para avaliar se existe diferença entre a 
proporção de doentes ao comparar pessoas que foram vacinadas ou não, um teste de 
hipótese pode ser feito.
Um teste de hipótese tem, inicialmente, duas possibilidades de resposta: o que é tes-
tado é diferente ou ele é igual. Isso também acontece ao testar a associação entre as 
variáveis, ela pode existir ou não. Define-se como hipótese nula a hipótese que sempre 
se refere a não existir diferença ou associação (VIEIRA, 2016, p. 128). Ela é abreviada 
como H0 (lê-se “agá zero”). No exemplo do teste que compara o tempo da enxaqueca 
dependendo do tratamento realizado, a hipótese nula é que não há diferença entre os 
tempos de tratamento.
A hipótese alternativa refere-se à existência de diferença ou associação do que se 
está testando (VIEIRA, 2016, p. 128). Ela é abreviada como H1 (lê-se agá um). No 
exemplo do teste que compara o tempo da enxaqueca dependendo do tratamento reali-
zado, a hipótese alternativa é que há diferença entre os tempos de tratamento.
Ao final do teste, se a conclusão é aceitar a hipótese alternativa, pode-se dizer que o resul-
tado do teste foi significativo ou que a diferença é estatisticamente significante, sendo possí-
vel associar H1 com um resultado positivo do teste. Mas se a conclusão é aceitar a hipótese 
nula, pode-se dizer que o resultado do teste foi não significativo ou que a diferença não é 
estatisticamente significante, associando então H0 com um resultado negativo do teste. 
U11
146
Resultados: análise e apresentação
Bioestatística e Epidemiologia
Como qualquer teste, é possível que o resultado dele esteja errado. Logo, cada teste 
de hipótese tem quatro possibilidades de resultado (Figura 1): a hipótese nula é correta, 
a hipótese alternativa é correta, a ocorrência o erro tipo I e ocorrência do erro tipo II.
Figura 01. Possibilidades de resultados em um teste de hipótese
Diferença na natureza ou na população
Presente Ausente
Teste estatístico
significativo Correto Erro tipo I
Teste estatístico
não significativo Erro tipo II Correto
Diferença na natureza ou na população
Presente Ausente
Teste estatístico
significativo Correto Erro tipo I
Teste estatístico
não significativo Erro tipo II Correto
Fonte: adaptada de Fletcher; Fletcher; Fletcher (2014, p. 189).
O erro tipo I refere-se aos resultados falsos-positivos, ou seja, o teste mostra uma 
diferença, só que na realidade ela não existe (FLETCHER; FLETCHER; FLETCHER, 
2014, p.189). Assim, é afirmar que existe diferença entre o que se compara quando na 
verdade não existe diferença. Por exemplo, é concluir seu estudo afirmando que a acu-
puntura altera o tempo de duração da crise de enxaqueca da pessoa quando, no mundo 
real, esse tratamento não altera o tempo de duração da crise. 
O erro tipo II refere-se aos resultados falsos-negativos, ou seja, o teste não mostra 
uma diferença, quando, na realidade, ela existe (FLETCHER; FLETCHER; FLETCHER, 
2014, p. 189). É afirmar que não existe diferença entre o que se compara quando, na 
verdade, existe sim. Por exemplo, é concluir seu estudo afirmando que a acupuntura 
não altera o tempo de duração da crise de enxaqueca da pessoa quando, no mundo 
real, esse tratamento altera o tempo de duração da crise. 
EX
EM
PL
O
Definição de hipóteses e erros 
Pense que uma pesquisa deseja avaliar se a vacina reduz o número de óbitos de CO-
VID-19. A análise dos dados foi feita comparando a proporção de óbitos no grupo de 
pessoas que tomou a vacina com o grupo de quem tomou placebo. 
 ` A hipótese nula deste teste é que a proporção de óbitos nos vacinados não é dife-
rente da proporção de óbitos nas pessoas que tomaram placebo. Ou seja, não há 
diferença da proporção de óbito entre os grupos. 
 ` A hipótese alternativa deste teste é que a proporção de óbitos nos vacinados é dife-
rente da proporção de óbitos nas pessoas que tomaram placebo. Ou seja, há dife-
rença nas proporções de óbitos.
 ` O erro tipo I é afirmar que as proporções de óbitos são diferentes quando, na verdade, 
elas são iguais.
 ` O erro tipo II é afirmar que as proporções de óbitos são iguais quando, na verdade, 
elas são diferentes.
147
U11 Resultados: análise e apresentação
Bioestatística e Epidemiologia
A conclusão do teste de hipótese é decidir se aceita H0 ou se rejeita H0 e aceita H1. 
Para tomar essa decisão, utiliza-se a probabilidade de algum dos erros acontece-
rem. Denomina-se α (lê-se alfa) a probabilidade de cometer um erro tipo I e β (lê-se 
beta) a probabilidade de cometer o erro tipo II. 
Como um resultado significativo tem mais impacto, porque pode promover altera-
ções em protocolos e em cuidados, o número de falsos-positivos deve ser baixo. 
É por isso que na maioria dos casos utiliza-se α, que é a probabilidade de existir 
falsos-positivos. 
Um teste estatístico tem como principal resultado o p-valor (ou p-value, em inglês). 
O p-valor é a probabilidade do erro tipo I acontecer, ou seja, de o resultado positivo 
ter sido ao acaso e não pelo fato de que ele acontece na natureza. Probabilidade é 
expressa, preferencialmente, em número decimais, mas, para facilitar a compreen-
são, ela pode ser transformada em porcentagem.
R
EF
LI
TA
Tendo em mente uma pesquisa do tempo de crises de enxaqueca que compara o 
tratamento somente com acupuntura com o tratamento padrão, que é exclusiva-
mente medicamentoso. O resultado do teste estatístico foi um p-valor de 0,123. 
Isso significa que a probabilidade de cometer o erro tipo I é de 12,3%, ou seja, 
existe 12,3% de probabilidade de que a acupuntura tenha na realidade o mesmo 
tempo de duração da crise de enxaqueca. 
Qual valor de probabilidade de um erro que seria aceitável? Você, profissional 
da saúde, a partir desse resultado trocaria o tratamento padrão e a partir desse 
momento só prescreveria acupuntura para seus pacientes com enxaqueca em vez 
de medicamento?
Existe um consenso na comunidade científica que considera como aceitável um 
p-valor menor ou igual que 0,05. Se a probabilidade de acontecer um erro tipo I 
for menor do 5%, pode considerar que o resultado do teste é de fato significativo. 
Chama-se de nível de significância o teste do valor máximo que se aceita de pro-
babilidade de ocorrer o erro tipo I. Portanto, o nível de significância que a maioria 
das pesquisas utilizam é de 5% (VIEIRA, 2016, p. 133).
A Figura 2 resume como interpretar o p-valor considerando um nível de significân-
cia de 5%. Quando o p-valor for menor ou igual do que 0,05, considera-se que a 
probabilidade de a significância estatística não existir é, na realidade, baixa. Por 
isso, aceita-se uma hipótese alternativa. Já quando o p-valor é maior do que 0,05, 
a probabilidade da não associação de fato acontecer é alta, o que leva a aceitar a 
hipótese nula.
U11
148
Resultados: análise e apresentação
Bioestatística e Epidemiologia
Figura 02. Árvore de interpretação do resultado do teste estatístico a partir do p-valor
Fo
nt
e:
 e
la
bo
ra
da
 p
el
a 
au
to
ra
.
Considere, novamente, o exemplo da acupuntura na crise de enxaqueca. Se o p-valor 
for 0,078, deve-se aceitar a hipótese nula: o tempo das crises não é diferente, inde-
pendentemente do tratamento. Se o p-valor for de 0,032, deve-se rejeitar H0 e aceitar 
a hipótese alternativa: dependendo do tratamento, o tempo da crise é diferente. Nesse 
segundo caso há uma probabilidade de 3,2% de o resultado ser ao acaso e, na realida-
de, não existir diferença.
IM
PO
R
TA
N
TE
O p-valor não mede magnitude ou intensidade da diferença ou associação. O teste de 
hipótese e o p-valor medem apenas presença ou ausência, diferente ou igual, sendo 
associação ou não.
Por exemplo, um teste de hipótese fictício compara o tempo de ventilação mecânica 
com o peso do paciente. O p-valor < 0,0001 não significa que o tempo de ventilação me-
cânica está muito associado com o peso do paciente. Um p-valor de 0,042 ou < 0,0001 
terá a mesma conclusão, que é a associação das variáveis. A diferença de a chance do 
resultadoser ao acaso e não acontecer na realidade é maior no caso de 0,042.
Teste estatístico
O teste estatístico não impede o acaso, ele só calcula qual é a probabilidade de o erro acon-
tecer. Existem vários testes que devem ser usados em situações específicas. Para decidir 
qual realizar, é preciso primeiro saber algumas informações dos grupos e das variáveis que 
serão comparados.
A primeira parte é classificar as variáveis. A variável qualitativa ou categórica é expressa em 
categorias mutualmente excludentes, enquanto a variável quantitativa ou numérica é expres-
p-valor ≤ 0,05 p-valor > 0,05
Rejeitar H0 
Aceitar H1 Aceitar H0
Há diferença 
ou associação
Não há diferença 
ou associação
Teste estatisticamente 
significante
Teste sem significância 
estatística
149
U11 Resultados: análise e apresentação
Bioestatística e Epidemiologia
sa em números com intervalos iguais entre os valores (VIEIRA, 2016, p. 1). Para as variáveis 
quantitativas será também necessário saber se ela tem distribuição normal ou não. 
A definição se a variável tem distribuição normal pode ser por meio de um teste estatístico ou 
pressupor, teoricamente, qual é a distribuição dos dados observados se é próxima da curva 
de normalidade. Testes não paramétricos são quando uma ou mais das variáveis quantitati-
vas têm distribuição não normal. 
Para as variáveis qualitativas também será necessário contar quantas categorias de res-
posta existe. 
EX
EM
PL
O A variável peso pode ter somente duas categorias de resposta (normal ou fora do 
normal) ou ter quatro (baixo peso, peso adequado, sobrepeso e obesidade). Quanto 
menos categorias tiverem melhor será a análise.
Perceba na Tabela 1 a comparação entre duas tabelas que exemplificam que muitas ca-
tegorias reduzem o número de observações em cada célula da tabela, o que influencia 
na confiança dos resultados.
Tabela 01. Exemplo de distribuição dos dados conforme categorias das variáveis estudadas (peso e profissão)
CATEGORIA BAIXO PESO PESO ADEQUADO SOBREPESO OBESIDADE TOTAL
Técnico (A) de 
enfermagem 4 10 16 8 38
Auxiliar em 
saúde bucal 8 9 5 22
Técnico (A) 
em nutrição E 
dietética
1 2 3
Farmacêutico 
(A) 10 6 4 20
Fisioterapeuta 3 1 4
Médico (A) 7 3 1 11
Psicólogo (A) 2 4 6
Total 7 44 35 18 104
U11
150
Resultados: análise e apresentação
Bioestatística e Epidemiologia
FORMAÇÃO ADEQUADO NÃO ADEQUADO TOTAL
Curso 
superior 20 43 63
Curso técnico 
ou auxiliar 24 17 41
Total 44 60 104
Fonte: elaborada pela autora. 
O número de variáveis que serão analisadas influencia na escolha também. Grande 
parte das análises de dados acontecem com teste entre duas variáveis. Análises com 
mais de duas variáveis são mais complexas e envolvem questões de modelagem.
A próxima parte é definir se o teste é pareado ou não. Ser pareado sig-
nifica que os sujeitos dos grupos que está se comparando são a mes-
ma pessoa em momentos diferentes ou pessoas com características mui-
to similares, também é ter amostras relacionadas (VIEIRA, 2016, p. 139). 
Por exemplo, um estudo sobre estratégia de redução alimentar pode ter grupos parea-
dos se a análise for comparar o antes e o depois, havendo ou não grupos independen-
tes que comparam o peso eliminado entre o grupo controle e o intervenção.
Os testes estatísticos mais comuns e suas características são (FLETCHER; FLET-
CHER; FLETCHER, 2014, p. 193):
 ` Shapiro Wilk: avalia se uma variável quantitativa tem distribuição normal. A hipótese nula 
é que a variável tem distribuição normal; 
 ` Qui-quadrado de Pearson: avalia a associação de duas variáveis qualitativas. Às vezes 
é expresso pelo símbolo Χ2. Como o fato de: avaliar se o sexo dos alunos influencia na 
aprovação da disciplina, comparar se a proporção de aprovados em cada grupo (mascu-
lino e feminino) é diferente.
 ` Fisher: avalia a associação de duas variáveis qualitativas que tenham poucos números 
de observações ou muitas tabelas de contingência vazias. É similar ao qui-quadrado;
 ` Teste t de student: compara duas médias de uma variável quantitativa que tenha distri-
buição normal. É um teste paramétrico, pode ser pareado ou para grupos independentes. 
Por exemplo: para avaliar se a idade influencia na aprovação dos alunos é preciso testar 
se a média de idade entre os aprovados é igual à idade média dos reprovados. Se a idade 
tiver distribuição normal, o teste a ser realizado é um teste t, já que se está comparando 
as médias de uma variável normal de dois grupos;
 ` Mann-Whitney: compara duas médias de uma variável quantitativa que não tenha dis-
tribuição normal. É um teste não-paramétrico para grupos independentes. O exemplo é 
similar ao teste t, sendo a diferença a distribuição;
151
U11 Resultados: análise e apresentação
Bioestatística e Epidemiologia
 ` Wilcoxon: compara duas médias de uma variável quantitativa que não tenha distribuição 
normal. É um teste não-paramétrico para grupos pareados. O exemplo é similar ao teste 
t, sendo a diferença a distribuição;
 ` ANOVA: compara três ou mais médias de uma variável quantitativa que tenha distribuição 
normal. É um teste paramétrico para grupos independentes. Por exemplo: serve para 
avaliar se a idade média dos estudantes é diferente entre os diversos cursos da área da 
saúde;
 ` Correlação: compara duas variáveis quantitativas. É possível calcular uma medida de asso-
ciação que mede a intensidade e o quanto do desfecho pode ser explicado pela outra variável.
Antes de realizar o teste estatístico, é necessário definir, primeiro, quais variáveis ana-
lisar para que a pergunta da pesquisa e seus objetivos possam ser respondidos. É 
comum pesquisadores testarem todas as variáveis entre si, isso faz com que o número 
de testes seja grande e pelo acaso possa ser que encontre um p-valor menor que 0,05, 
mas depois não é possível discutir esse resultado, porque ele não faz sentido no as-
pecto teórico. 
Após reflexão e decisão de quais análises fazer, existe uma sequência de etapa para 
realizar um teste de hipótese:
Figura 03. Teste de hipótese
Definir hipótese nula e alternativa
Especificar o nível de significância
Escolher e realizar o teste estatístico
Interpretar o resultado do p-valor
Fonte: elaborada pela autora.
É importante definir o nível de significância antes de rodar os testes. Isso é fundamental 
para que a escolha do que é “positivo” seja feita independentemente dos resultados 
obtidos. Nas últimas décadas, tem-se mudado um paradigma de que uma boa pesquisa 
precisa ter resultados estatisticamente significantes. Uma das estratégias utilizadas é 
mudar o nível de significância para conseguir resultados positivos. Por isso que é co-
mum estar escrito no artigo “α de 0,05 definido a priori”. 
U11
152
Resultados: análise e apresentação
Bioestatística e Epidemiologia
Atualmente, tem se aceitado mais a teoria de que um resultado negativo ou de não 
associação tem importância. Os cursos de pós-graduação também discutem o porquê 
da significância de 5%. Raras pesquisas possuem outros valores, como 10% ou 1%.
1.2 INTERVALO DE CONFIANÇA
Uma outra estratégia de aferir o acaso é o intervalo de confiança de alguma estimativa. 
Considera-se estimativa uma medida estatística que resume ou descreve característi-
cas dos dados coletados na amostra do estudo. (FLETCHER; FLETCHER; FLETCHER, 
2014, p. 197) Elas são capazes de aferir magnitude real do efeito. São exemplos de 
estimativas: média, frequência relativa ou proporção, risco relativo, razão de chances. 
G
LO
SS
Á
R
IO
Medidas de associações 
Risco relativo é uma razão das incidências de um evento no grupo com a variável 
de interesse presente contra um grupo sem essa variável (ROUQUAYROL; GURGEL, 
2018, p. 701).
Razão de chances ou Odds ratio (OR) é a divisão das chances de um evento acon-
tecer entre dois grupos, aqueles com a variável de interesse presente contra aqueles 
com a ausência da variável (FLETCHER; FLETCHER; FLETCHER, 2014, p. 94).
Como as estimativas são medidas de ponto, não é possível garantir quãopróximo ela 
pode estar ao parâmetro, que é o valor observado na população toda ou na natureza. À 
vista disso, é comum que essas estimativas estejam sempre expressas com um inter-
valo de confiança. Define-se como intervalo de confiança (IC) uma faixa de valores que 
se tem confiança que o valor real está. O valor da estimativa está sempre dentro do IC.
O intervalo de confiança demonstra a certeza que se tem de que os dados da amostra 
são representativos da população. Costumeiramente, usa-se IC 95% ou que significa 
que há 95% de confiança ou probabilidade de que o parâmetro esteja dentro do inter-
valo (VIEIRA, 2016, p. 116).
R
EF
LI
TA
Em uma pesquisa de intenção de voto de uma eleição para prefeito, coletou uma 
amostra de 200 pessoas, 42% votariam no Candidato A. Será que o resultado final 
oficial da eleição será essa mesma proporção? Se o IC 95% for de 35,2% a 48,8% 
espera-se que o valor real esteja dentro da faixa. Caso isso não aconteça, pode ser 
que o erro tenha ocorrido por conta de vieses ou pelo acaso.
Toda a interpretação dos resultados, então, parte de que a pesquisa foi bem conduzida e 
que tem baixo risco de vieses. Assim, espera-se que a amostra seja representativa e, de 
preferência, com seleção aleatória. Como o intervalo de confiança estima probabilidade é 
importante reforçar que todos os eventos tenham a mesma chance de ocorrer.
153
U11 Resultados: análise e apresentação
Bioestatística e Epidemiologia
Chama-se de margem de erro a distância entre a estimativa e o limite superior e inferior 
do intervalo. Para deixar a margem de erro menor, é necessário aumentar o número de 
observações e dados coletados. Ao retomar o caso da pesquisa eleitoral, que agora ava-
lia 2.000 pessoas, o intervalo de confiança fica em 39,8% a 44,2%. Nesse exemplo, ao 
considerar que a média é 42%, a margem de erro é de 2,2%.
A grande vantagem dessa estratégia é que as estimativas de pontos avaliam magnitude 
e intensidade. Intervalos de confianças amplos não conseguem deixar claro a magnitude 
da associação. Para leigos e profissionais da saúde, a interpretação do IC é mais fácil do 
que o p-valor. Quando se quer usar o intervalo de confiança para comparar se os valores 
são diferentes, é preciso que nenhum número dos dois intervalos se sobreponha. 
EX
EM
PL
O
IM
PO
R
TA
N
TE
O candidato A ficou 42% de proporção com IC95% de 35,2 a 48,8%, enquanto o candi-
dato B ficou com 29,5% de intenção de voto com IC95% de 23,2 a 35,8%. Para um lei-
go, 29,5% é diferente dos 42% o que deixaria o candidato A eleito. Mas ao interpretar 
o intervalo de confiança, é preciso garantir que as faixas não se sobreponham. Nesse 
caso, pela análise do intervalo de confiança é possível que o Candidato B tenha ven-
cido. O parâmetro do candidato B pode ser bem no limite superior 35,7%, enquanto o 
candidato A possa estar com 35,3% perto do seu limite inferior.
As fórmulas para calcular o intervalo de confiança variam de acordo com a estimativa 
de ponto. Em todas as fórmulas vai existir um valor que será associado à porcentagem 
de confiança que se deseja.
Ao interpretar o intervalo de confiança do risco relativo e da razão de chances é pre-
ciso considerar se a característica da interação mudou. A interpretação dessas duas 
medidas acontece de forma similar. Se o valor for maior do que 1,0, indica aumento do 
risco do desfecho. Se for igual a 1,0, não existe associação entre as variáveis e se for 
menor do que 1,0, indica que a exposição reduz o risco.
Se um teste que avaliou se a presença do antecedente pessoal de insuficiência cardíaca 
influenciava na incidência de óbitos de pacientes internados na UTI, cujo o RR era de 2,22 
(IC95% 0,99 – 4,98). Ao analisar somente o valor do risco relativo encontrado com os dados 
da amostra seria possível dizer que esse antecedente aumenta em 2,2 vezes o risco de ir a 
óbito, já que o RR > 1,0. Mas, ao olhar no intervalo de confiança percebe-se que existe a pos-
sibilidade de que o valor real do RR seja 0,99, o que seria interpretar que esse antecedente 
pessoal reduz o risco de ir a óbito, pois o RR < 1,0. Nesses casos em que a abrangência do in-
tervalo de confiança engloba números menores e maiores do que 1,0, não se pode afirmar se 
a associação é verdadeira e nem qual é o sentido da interação (reduzir ou aumentar o risco).
2. USO DE SOFTWARES
Ao realizar a análise dos dados, utilizam-se softwares de tabulação e de análise estatís-
tica que facilitam o processo. É importante sempre mencionar na sessão métodos do 
trabalho qual software foi utilizado e sua versão. 
U11
154
Resultados: análise e apresentação
Bioestatística e Epidemiologia
Para a organização dos dados, normalmente, utiliza-se o Excel ou o Google Planilhas 
– eles são muito similares. Neles é possível organizar o banco dos dados coletados, 
realizar estatística descritiva, estruturar as tabelas de resultados e gerar gráficos.
Tanto o Excel como o Google Planilhas trabalham com células que são as casas da ta-
bela. Elas são nomeadas pela coluna e linha em que estão. Exemplo: a célula que está 
na segunda coluna (coluna B) e na terceira linha (linha 3) tem o nome de B3. A Tabela 2 
representa uma tabulação de um conjunto de dados de seis pessoas. O valor referente 
à célula B3 seria 2,3, que é a nota que a aluna M.C.M tirou na prova.
Tabela 02. Exemplo de tabulação dos dados
A B
1 Iniciais do nome Nota
2 V.L.M 8,1
3 M.C.M 2,3
4 G.F.M.M. 1,6
5 D.C.C.G 7,4
6 J.M.R. 9,0
7 S.E. 10
Fo
nt
e:
 e
la
bo
ra
da
 p
el
a 
au
to
ra
.
Fonte: elaborada pela autora.
Nesses softwares, é possível inserir comandos que realizam operações matemáticas 
ou funções que fazem o cálculo mais facilmente. Para que o software realize qualquer 
função ou conta é preciso iniciar digitando o sinal “=”, assim o programa sabe que ou 
uma operação matemática ou uma função deve ser realizada. A Tabela 3 mostra alguns 
comandos e funções que eles podem realizar. Para saber mais informações, busque na 
aba fórmulas. 
Tabela 03. Exemplo de comandos de análise de dados do conjunto de observações descritos na Tabela anterior
AÇÃO COMANDO RESULTADO DA OPERAÇÃO
Soma de dois valores =A1+A2 10,4
Média do conjunto de dados =MÉDIA(A2:A7) 6,4
Contagem de quantas notas foram meno-
res que 6,0 no conjunto de dados =CONT.SE(A2:A7;”<6”) 2
Existem vários pacotes e softwares estatísticos tanto nacionais como internacionais. 
Alguns são pagos e outros são de livre acesso. Nesta unidade será apresentado o sof-
tware R. Outros programas utilizados com frequência na área da saúde são o SPSS e 
o BioStat. 
155
U11 Resultados: análise e apresentação
Bioestatística e Epidemiologia
SA
IB
A 
M
A
IS
O software R é livre e aberto para download. Ele foi inicialmente desenvolvido na 
University of Auckland, e atualmente é mantido por um esforço colaborativo com uma 
equipe central. 
Para mais informações, visite: https://www.r-project.org/. Acesso em: 23 jul. 2021.
SPSS é da IBM. Ele é pago e com uma interface agradável de utilizar. 
Para conhecer, clique em: https://www.ibm.com/br-pt/products/spss-statistics. Acesso 
em: 23 jul. 2021. 
BioStat é uma opção de programa nacional de livre acesso que é mantido pelo Ins-
tituto de Desenvolvimento Sustentável Mamirauá. Ele é simples de utilizar e é em 
português. 
Visite a plataforma: https://www.mamiraua.org.br/downloads/programas/. Acesso em: 
23 jul. 2021.
O software R é muito utilizado internacionalmente em diversos campos de estudo. Ele 
tem uma versão que é o RStudio que apresenta uma interface mais agradável. Uma 
dificuldade é que os comandos, algumas funções e alguns resultados são em inglês. 
Uma vantagem é que existem pacotes que podem ser baixados com comandos específi-
cos para alguns tipos de pesquisa e análises estatísticas. Por exemplo, os dados de dis-
tribuição das residências divididas nos setores censitários é um desses pacotes. Então, 
se alguém deseja fazer um levantamento populacional com uma amostra aleatória com 
sorteio de endereços por setor seráprático com o uso desse software e pacote estatístico.
EX
EM
PL
O
Uma pesquisa avalia características de um grupo de 69 alunos que realizaram uma 
prova. Uma das análises a ser testada é se o tempo que cada aluno ficou na prova 
influencia na nota que ele tirou. Vamos considerar um nível de significância de 95%, a 
variável tempo de prova é qualitativa com duas categorias: quem demorou menos ou 
mais do que uma hora e que a variável nota é quantitativa com tem distribuição normal.
Na Figura 4, há o teste estatístico para responder essa hipótese em que a análise foi 
feita no software R.. Em azul há o comando para se realizar um teste t comparando 
as notas de dois grupos, os que fizeram a prova em um tempo menor que uma hora 
e os que fizeram em um tempo maior. O resultado é o p-valor (na Figura, p-value) de 
0,04233, o que significa que a proporção de se ter errado um erro tipo I é baixa, então, 
deve-se aceitar H1, que é dizer que existe uma diferença entre as médias de notas dos 
dois grupos. Nas últimas linhas da Figura está a média (na Figura, mean que significa 
média em inglês) de notas nos dois grupos. O grupo x é o primeiro mencionado (quem 
demorou menos tempo), e tem média de 8,18. O grupo y que é o que demorou mais 
tempo, tem média de 9,0. 
U11
156
Resultados: análise e apresentação
Bioestatística e Epidemiologia
Figura 04. Exemplo de comando e resultado de um teste estatístico no software RStudio
Fonte: captura de tela realizada pela autora do software RStudio. 
3. APRESENTAÇÃO DOS RESULTADOS
Estatística descritiva é resumir os dados coletados de cada variável. Para as variáveis 
qualitativas são descritas com frequência absoluta e relativa, enquanto as variáveis 
quantitativas são descritas com medidas de tendência central (média, moda e mediana) 
e medidas de dispersão (amplitude, percentis, desvio padrão). Tanto a estatística des-
critiva como a analítica, que foram abordadas nesta unidade, podem ser apresentadas 
em forma de texto, tabelas ou em gráficos.
A decisão de qual meio apresentar depende do destaque que se deseja ter no resulta-
do, a importância de detalhar mais as informações e a aparência visual.
3.1 GRÁFICOS
Os gráficos são representações visuais que transmitem a informação de forma visual. 
Muitas pessoas acham essa é a forma mais agradável de fazer uma comparação e 
análise dos dados, uma vez que ajudam a visualizar a distribuição das observações. 
Todos os gráficos devem apresentar legenda, título e escala. Deve ser possível com-
preender as informações descritas nele sem precisar realizar a leitura do texto auxiliar 
(VIEIRA, 2016, p. 18).
Os gráficos de barras são utilizados para resumir a frequência para categoria da va-
riável. Podem ser de frequência absoluta (contagem de pessoas que deram aquela 
resposta) ou frequência relativa (proporção de pessoas que deram a resposta). Eles 
podem ter barras horizontais ou verticais, que serão definidas pelas características dos 
dados e da variável. É possível ser com apenas uma variável ou pode mostrar a distri-
buição entre duas variáveis qualitativas (Figura 6).
157
U11 Resultados: análise e apresentação
Bioestatística e Epidemiologia
Figura 05. Exemplo de gráfico de barras horizontais com duas variáveis
Fonte: elaborada pela autora.
Fonte: elaborada pela autora.
O gráfico de setores, conhecido também como de “pizza”, é bem tradicional e de fácil 
compreensão. Normalmente, é utilizado em apresentações e pôster. Não é recomenda-
do para artigos científicos, quando há restrição do número de imagens e as informações 
podem ser descritas em forma de texto sem prejudicar a compreensão do leitor.
Figura 06. Exemplo de gráfico de pizza com a frequência absoluta para descrever uma variável
U11
158
Resultados: análise e apresentação
Bioestatística e Epidemiologia
Fonte: elaborada pela autora.
Os gráficos de dispersão são muito utilizados quando se faz um teste estatístico de 
correlação. Ele acontece quando se cruza duas variáveis numéricas, de preferência 
contínuas, que são representadas em cada eixo. Cada ponto do gráfico representa um 
indivíduo (Figura 7).
Figura 07. Exemplo de gráfico de dispersão dos dados (azul) com regressão linear simples
Os gráficos podem ter uma linha estimada a partir dos dados encontrados. Essa linha é o 
resultado do teste estatístico de regressão, a qual pode ser linear ou logística. Os pontos 
dessa reta ou curva é uma previsão. No exemplo da Figura 8 seria possível, a partir da 
regressão, prever qual seria a nota do aluno somente pelo tempo de realização da prova.
Quando a reta da regressão linear está “subindo”, pode se concluir que existe uma 
correlação positiva entre as variáveis, quando uma aumenta a outra aumenta também. 
Quando a reta está “descendo” a correlação é negativa, ou seja, as variáveis são inver-
samente proporcionais – quando uma aumenta a outra diminui. Quanto mais inclinada 
a reta, maior a intensidade da correlação. Quando a reta da regressão está próxima do 
sentido horizontal, a correlação é nula (VIEIRA, 2016, p. 57).
3.2 TABELAS
Uma tabela permite ao leitor uma melhor aplicabilidade. A estatística analítica, prefe-
rencialmente, é apresentada em forma de tabela para fornecer mais detalhamento da 
distribuição, deixando transparente os valores obtidos.
159
U11 Resultados: análise e apresentação
Bioestatística e Epidemiologia
É comum resultados de pesquisa serem descritos em grandes tabelas que contêm in-
formações de diversas variáveis. Isso acontece, principalmente, quando é um estudo 
que investiga diversos fatores que possam estar associados há um mesmo desfecho, 
por exemplo, um estudo de coorte que avaliou as causas de internação e a complicação 
de sepse. As análises bivariadas foram feitas utilizando o teste qui-quadrado. 
A tabela abaixo mostra os resultados com o p-valor das análises bivariadas e risco rela-
tivo com intervalo de confiança de 95%.
Tabela 04. Exemplo de tabela de resultado
CAUSA DE 
INTERNAÇÃO N (N=100) SEPSE N (%)
RISCO RELATIVO 
(IC 95%) P-VALOR
Pneumonia
Presente 23 21 (91,3) 3,35 (2,28 a 4,92) <0,0001
Ausente 77 21 (27,3) Ref
Apendicectomia
Presente 14 7 (50,0) 1,23 (0,69 a 2,20) 0,7173
Ausente 86 35 (40,7) Ref 
Fonte: elaborada pela autora.
Fonte: elaborada pela autora.
Nestes casos, é preciso avaliar o intervalo de confiança da estimativa e o p-valor. Pode 
ocorrer que ao interpretar o risco relativo e o IC conclua-se uma associação, mas o 
resultado do p-valor ser maior do que 0,05.
4. OBJETO DE APRENDIZAGEM.
Tabela 05. Tabela da eficácia vacinal de uma vacina fictícia contra Dengue
VACINADOS
N = 724
PLACEBO
N = 706
EFICÁCIA 
VACINAL 
(IC95)
P-VALOR
Grupo 
de 
análise
Casos Incidência (IC95) Caso Incidência (IC95)
Casos de 
dengue 
clássica
85
11,74
(9,38 – 14,52)
167
23,64 
(20,19 – 27,51)
50,39% 
(35,26 – 61,98)
0,0049
Casos de 
dengue 
hemorrá-
gica
0
0
(0 – 0,51)
7
0,99
(0,40 – 2,04)
100%
(95,42 – 100)
0,967
Considere que uma vacina contra dengue acabou de ser aprovada. Alguns dos resultados 
da pesquisa que aprovou a vacina estão descritos na Figura 8. A avaliação foi referente a 
redução de casos de dengue hemorrágica e dos casos de dengue clássica
U11
160
Resultados: análise e apresentação
Bioestatística e Epidemiologia
Reflita sobre os resultados de eficácia vacinal com o intervalo de confiança de 95% (IC95) e 
sobre os p-valores. Pelos dados da tabela é possível afirmar que a vacina é eficaz contra os 
casos de dengue? É possível confiar que a eficácia vacinal para os casos de dengue hemor-
rágica, na realidade, 100%?
161
U11 Resultados: análise e apresentação
Bioestatística e Epidemiologia
REFERÊNCIAS BIBLIOGRÁFICAS
FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. S. Epidemiologia clínica: elementos essenciais. 
5.ed. Porto Alegre: ArtMed, 2014.
ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia & saúde. 8. ed. Rio de Janeiro: Medbook, 
2018. 752 p.
VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier,2016.
162
UNIDADE 12
CAUSALIDADE E SAÚDE BASEADA 
EM EVIDÊNCIA
INTRODUÇÃO
Já se perguntou se vacina faz bem ou faz mal? Será que faz bem comer manteiga todos 
os dias? Às vezes, você encontrará artigos e evidências com resultados conflituantes. 
Como decidir em qual acreditar?
Nesta última unidade, abordaremos quais pesquisas e critérios devem ser utilizados 
para confiar nas evidências científicas disponíveis.
1. CAUSALIDADE
Definir uma relação de causa e efeito é mais complexo do que apenas mostrar uma 
associação estatística, sendo que a matemática é só uma parte do processo. É preciso 
avaliar o conjunto e garantir que todos os procedimentos e etapas sejam conduzidos 
de forma correta.
Uma pesquisa tem resultados que irão descrever e analisar os eventos investigados. 
Com os dados é possível estimar e predizer a probabilidade de um evento acontecer, 
mas é preciso lembrar que estamos tratando de uma probabilidade, e não de uma 
garantia. O acaso também influencia nas possibilidades que um quadro pode evoluir.
Definir o que causa uma doença é complexo. Ao longo dos séculos, a definição do 
processo saúde-doença mudou muito e, atualmente, a teoria predominante é que a 
saúde tem determinantes e condicionantes. Ficar doente, portanto, é complexo e tem 
influência de múltiplos fatores. 
O impacto dos elementos de risco para uma doença é influenciado pela presença de outros 
fatores e, às vezes, é mais importante a soma desses fatores os quais o paciente apresenta.
IM
PO
R
TA
N
TE
É indispensável reforçar que não é porque a pessoa é diabética que ela terá um infarto 
agudo do miocárdio; cada doença tem uma grande variedade de fatores que estão 
associados, algumas condições são mais específicas e com uma relação mais forte. 
Morar em uma casa sem abastecimento de água pela rede geral tem uma associação 
muito maior com doenças diarreicas, mas pode também contribuir para o surgimento 
de outras enfermidades.
A estatística estabelece associações ao tentar controlar o acaso. É possível gerar uma 
estimativa do efeito ou proporção que se espera com os dados coletados. A partir desse 
valor, pode-se, pelo intervalo de confiança, supor qual será o valor do parâmetro que 
de fato acontece na população. (FLETCHER; FLETCHER; FLETCHER, 2014, p. 197). 
163
U12 Causalidade e saúde baseada em evidência
Bioestatística e Epidemiologia
Outra ferramenta da estatística é calcular a probabilidade de o teste de hipótese ser 
um falso-positivo e, de fato, o que se observou na amostra não é representativo para a 
população. É um consenso um nível de significância de 5%, ou seja, um p-valor menor 
do que 0,05 é considerado que a associação é estatisticamente significante.
As relações causais não são explicadas somente pela matemática. A maneira como os dados 
foram coletados tem um impacto muito grande. Será que houve algum viés que pode impac-
tar na associação estatística encontrada? Viés é um erro sistemático que pode acontecer em 
diversos momentos e há diferentes estratégias que são capazes de ser implementadas no 
método da coleta de dados que reduzem a chance de ele acontecer (ROUQUAYROL, 2018, 
p. 705). Esses erros sistemáticos podem ocorrer na seleção da amostra quando os grupos 
que serão comparados não são similares porque houve alguma falha na amostragem. 
O viés de aferição acontece quando o equipamento ou a técnica utilizada para aferir se 
a variável foi errada ou não é confiável. Já o viés de confusão ocorre quando há uma 
associação estatística entre a variável explanatória e o desfecho, só que ela aconteceu 
por influência de uma terceira variável que realmente é o fator associado ao desfecho.
C
U
R
IO
SI
D
A
D
E
“Consumo de Chocolate, função cognitiva e prêmio Nobel”
Esse artigo ficou famoso por ser uma publicação em uma das revistas mais conceituadas 
na área da saúde. Ele faz uma correlação entre o consumo de chocolate por habitante e o 
número de prêmios Nobel que os países têm. Estatisticamente, há uma correlação forte com 
um p-valor de < 0,0001. Na discussão, é abordado que existe uma plausibilidade biológica, 
uma vez que chocolate melhora a função cognitiva, o que pode levar a ganhar um Nobel. 
MESSERLI, Franz H. Chocolate Consumption, Cognitive Function, and Nobel Laure-
ates. New England Journal of Medicine, v. 367, p. 1562-1564, out. 2012. Disponível 
em: https://www.nejm.org/doi/full/10.1056/nejmon1211064. Acesso em: 15 jun. 2021.
Como vários fatores influenciam em uma associação com significância estatística entre 
duas variáveis, é difícil determinar com certeza que “A” causa “B”. Definir a causalida-
de tem um enorme impacto em diversos setores da sociedade. Falar que agrotóxicos 
ou defensivos agrícolas causam câncer terá consequências nos setores agrícola e ali-
mentícios e na economia. Em 1965, Austin Bradford Hill, um dos pesquisadores que 
descobriu a associação entre cigarro e câncer de pulmão, sistematizou quando se pode 
definir uma relação causal. Fletcher, Fletcher e Fletcher (2014, p. 214-216), a partir da 
leitura de Hill (1965), apontam que os oito critérios de Bradford Hill são:
Figura 01. Critérios de Hill
Força
Temporalidade
Reversibilidade
Especialidade
Plausabilidade biológica
Consistência
Relação dose-resposta
Analogia
Fonte: Fletcher, Fletcher e Fletcher (2014, p. 214-216).
U12
164
Causalidade e saúde baseada em evidência
Bioestatística e Epidemiologia
EX
EM
PL
O
O critério da força avalia a intensidade da associação. Quanto maior o valor do risco 
relativo ou da razão de chances, maior a chance de existir uma relação causal. Mas 
isso não significa que associações com pouca força com certeza não têm causalidade. 
É importante reforçar que a medida do p-valor não avalia intensidade, então, um valor < 
0,0001 não significa que as chances de causalidade são maiores.
A consistência analisa se ocorre os mesmos resultados com observações diferentes. Se 
pesquisas com outras populações, em outros locais ou em outra época mostram resul-
tados similares, muito provavelmente, a associação é verdadeira. É interessante que os 
estudos tenham delineamentos diferentes para que a fraqueza de um se complemente 
com a força do outro tipo de desenho. Nem sempre haverá uma concordância entre todos 
os estudos, por isso, é preciso avaliar a qualidade das pesquisas que serão comparadas. 
Ter uma discordância com um estudo de baixa qualidade não é tão impactante.
O critério de especificidade investiga se o fator sempre causa o mesmo efeito. É um 
critério mais relevante para as doenças transmissíveis em que existe a presença do 
agente infeccioso que provoca uma única doença. A relação inversa também precisa 
ser avaliada – quando houve a doença, a causa também esteve presente? Mas, se 
considerarmos o cigarro, esse critério não é contemplado. Fumar pode causar diversas 
doenças e nem toda pessoa com câncer de pulmão fumou. A ausência dessa relação 
específica de causa e efeito não exclui a possibilidade de causalidade. 
A temporalidade examina a relação temporal. A causa sempre deve existir antes do 
efeito acontecer. Por isso que estudos longitudinais prospectivos são melhores para de-
finir a causalidade. Garantir que, no início do acompanhamento, os sujeitos da pesquisa 
não tenham a doença, certifica a temporalidade.
A relação dose-resposta investiga se a proporção da doença aumenta se a exposição 
também aumentar. Quem fuma altas quantidades de cigarros no dia tem uma taxa de 
mortalidade muito maior, ou seja, esse critério contribui muito para definir a causalidade
O critério de plausabilidade biológica sonda se existe uma cadeia de eventos biológi-
cos que justifica a exposição causar o efeito. A existência de um mecanismo fisiopato-
lógico, que fundamente a relação causal, ajuda, mas sua ausência não exclui a possi-
bilidade de causalidade. Pode ser que o caminho fisiológico ainda não foi descoberto, 
então, esse critério não é obrigatório para a definição da relação causal. 
Em 1854, John Snow – médico conhecido como opai da epidemiologia –, descobriu 
que a água fornecida por uma bomba específica de Londres causava morte por doen-
ça diarreica, mesmo quando na época não se sabia da existência de bactérias e das 
vias de transmissão da cólera.
A reversibilidade estuda se, ao remover a exposição, há uma redução dos efeitos. A 
presença desse critério aumenta as chances da relação causal. Depois de 15 anos que 
a pessoa para de fumar, ela tem o mesmo risco de ter um infarto agudo do miocárdio do 
que alguém que nunca fumou. 
O último critério é a analogia, na qual o argumento de causalidade é favorecido quando 
for possível fazer alguma associação com uma relação causal estabelecida. É mais fácil 
165
U12 Causalidade e saúde baseada em evidência
Bioestatística e Epidemiologia
provar que uma medicação usada por uma gestante causa má-formação no feto, se a 
droga tiver características similares à talidomida (um exemplo clássico de um remédio 
que causa má-formação).
Os critérios de Bradford Hill são importantes para provar que a relação é causal e não 
apenas uma associação estatística ao acaso. Não é preciso ter todos os critérios pre-
sentes, mas quanto mais números deles forem contemplados, mais credibilidade terá o 
estudo. Nem mesmo o cigarro – que hoje em dia está bem claro que fumar mata – tem 
todos os critérios, visto que a especificidade não é contemplada.
Com esse rigor de definição é difícil um artigo concluir uma relação causal, portanto, cabe ao 
leitor analisar se aquela associação tem muitas ou poucas chances de ter causalidade. Para 
isso, deve-se avaliar o rigor metodológico e a presença dos critérios, assim, com todas as 
informações você será capaz de julgar quais são as chances de a associação ser verdadeira.
EX
EM
PL
O
SA
IB
A 
M
A
IS
Um exemplo da diferença entre associação estatisticamente significante e causalida-
de é a discussão se a vacina de Sarampo Caxumba e Rubéola (SCR) causa autis-
mo. No final dos anos 1990, o movimento antivacina ganhou força com a publicação 
de um artigo científico da revista The Lancet. Esse artigo concluía que a vacina de 
Sarampo Caxumba e Rubéola (SCR) causava autismo e doenças gastrointestinais. 
Ele foi usado como a prova científica de que a vacina faz mal. A publicação em uma 
das principais revistas de área da saúde fez com que os profissionais de saúde e lei-
gos questionassem a qualidade e a eficácia das vacinas, principalmente da SCR. Em 
2010, a The Lancet fez uma retratação, mas as consequências da publicação ainda 
estão presentes.
Várias questões metodológicas são questionadas sobre a pesquisa, mas isso não impe-
diu a publicação e a interpretação de que uma associação forte era sinônimo de causa-
lidade. Para nos ajudar a confiar nas conclusões de pesquisa, as revisões são um tipo 
de estudo que resumem as evidências sobre um determinado assunto.
Vacina Sarampo Caxumba e Rubéola (SCR)
 ` O artigo original que associa a vacina SCR com autismo: 
WAKEFIELD, A. J.; et al. RETRACTED: Ileal-lymphoid-nodular hyperplasia, non-spe-
cific colitis, and pervasive developmental disorder in children. The Lancet, v. 351, n. 
9103, p. 637-641, 1998. Disponível em: https://doi.org/10.1016/S0140-6736(97)11096-
0. Acesso em: 15 jun. 2021.
 ` Para contrapor esse ideal de que a vacina faz mal, há uma revisão sistemática so-
bre a eficácia e os danos da vacina SCR que avalia artigos de 1966 a 2019:
PIETRANTOJ, C. D.; RIVETTI, A.; MARCHIONE, P.; DEBALINI, M. G.; DEMICHELI, V. 
Vaccines for measles, mumps, rubella, and varicella in children. Cochrane Database 
of Systematic Reviews, v. 4., n. CD004407. Disponível em: https://www.cochraneli-
brary.com/cdsr/doi/10.1002/14651858.CD004407.pub4/full. Acesso em: 15 jun. 2021.
U12
166
Causalidade e saúde baseada em evidência
Bioestatística e Epidemiologia
2. REVISÃO SISTEMÁTICA
As revisões sistemáticas são um tipo de estudo que resume outras pesquisas sobre um de-
terminado tema (ROUQUAYROL, 2018, p. 157). Normalmente, elas ocorrem para avaliar a 
eficácia de um tratamento ou estabelecer que as evidências até o momento não são suficien-
tes. Como os ensaios clínicos randomizados são o padrão-ouro para avaliar um tratamento, 
há revisões sistemáticas que restringem a amostra para somente esse tipo de estudo.
Existe um rigor metodológico no processo de seleção dos artigos. A coleta de dados, que 
nesse caso são os artigos, é sistemática. Os artigos selecionados devem ser publicados 
em revistas científicas com parecer de outros pesquisadores para garantir a qualidade. 
Essas revistas são indexadas em bancos de artigos, bibliotecas e repositórios, como a 
BIREME e a MEDLINE/PubMed. Os pesquisadores selecionam descritores que definem 
o escopo da pesquisa com a finalidade de restringir a busca para o que somente eles 
estão procurando. Depois dessa primeira seleção, os critérios de inclusão são aplicados. 
IM
PO
R
TA
N
TE
É fundamental não excluir muitos artigos, porque isso pode deixar a amostra não 
representativa. Então, mesmo que o artigo seja pago, ou em outra língua, deve-se 
tentar incluir ela na pesquisa.
Com frequência, dois avaliadores fazem a seleção dos artigos e, depois, os resultados 
são cruzados. Caso haja um artigo que só um avaliador selecionou, um terceiro pesqui-
sador decide se ele deve ser incluído na amostra. 
Todo o processo de seleção deve ser descrito no artigo da mesma maneira que o método de 
seleção dos sujeitos da pesquisa é descrito. Normalmente, um fluxograma resume o processo.
Figura 02. Exemplo de fluxograma do processo de seleção dos artigos
950 artigos encontrados nas 
bases de dados
625 restaram após a remo-
ção dos artigos duplicados
130 artigos cujos resumos 
foram avaliados
495 artigos excluídos por: 
- Não serem em português ou inglês 
- Não estarem completos 
- Outros critérios de exclusão
85 artigos excluídos por: 
- Não serem ensaio clínico randomizado 
- Não terem grupo controle 
- Outros critérios !
!
Amostra final: 
45 artigos
Fonte: elaborada pela autora. 
167
U12 Causalidade e saúde baseada em evidência
Bioestatística e Epidemiologia
O resultado da revisão sistemática são as características dos artigos. A metanálise 
é uma análise estatística que combina os resultados analíticos de cada estudo para 
chegar a uma única estimativa de ponto (ROUQUAYROL, 2018, p. 157). É uma análise 
estatística interessante porque, ao juntar várias pesquisas, o número amostral aumenta 
o que melhora o poder do teste. 
EX
EM
PL
O A título de exemplo, combina-se o risco relativo de cada artigo para se chegar em um 
risco relativo total. Cada artigo tem um peso diferente na composição da estimativa 
final a depender da característica da amostra e dos resultados individuais.
A metanálise pode ser apresentada pelo gráfico de Forest (Forest plot, em inglês). A 
Figura 3 é um exemplo do gráfico com resultados fictícios de oito estudos. Sempre ha-
verá uma tabela com as informações e o gráfico com a representação da estimativa de 
ponto e o intervalo de confiança. A última linha é a estimativa de ponto combinada que 
no gráfico é representado pela imagem de losango, que também descreve o IC.
Figura 03. Exemplo de gráfico Forest
Estudos
Combinado
OR (IC 95%)
0,53 (0,39-0,73)
N
147
Estudo A
Estudo B
Estudo C
Estudo D
Estudo E
Estudo F
Estudo G
0,58 (0,37-0,89)
0,16 (0,02-1,52)
0,25(0,07-0,83)
0,70 (0,33-1,47)
0,35 (0,08-1,45)
0,14 (0,02-1,21)
1,02 (0,37-2,83)
30 
19 
6 
11 
30 
30 
31
0.000 0.125 0.177 0.250 0.354 0.500 0.707 1.00 2.50
Legenda: N: número de observações da amostra. 
OR: odds ratio. 
IC: intervalo de confiança. 
Fonte: elaborada pela autora. 
Para interpretar o gráfico de Forest, é preciso relembrar que as medidas de associações 
odds ratio (razão de chances) e risco relativo se interpretam de forma similar. Se o valor 
for maior do que 1,0, indica aumento do risco do desfecho, mas se for igual a 1,0, não 
existe associação entre as variáveis. Quando for menor do que 1,0, indica que a exposi-
ção reduz o risco.Outro ponto importante é que se o valor 1,0 estiver dentro do intervalo 
de confiança, não é possível garantir a presença de uma associação entre as variáveis.
U12
168
Causalidade e saúde baseada em evidência
Bioestatística e Epidemiologia
No gráfico de Forest, há uma linha vertical no 1,0 para visualmente ficar claro quais 
estudos há dentro do IC com o valor 1,0. Na Figura 3, os estudos B, D, E, F e G estão 
nessa condição em que não se pode garantir associação, mas seus resultados são 
usados para gerar o valor combinado de associação. 
Vamos considerar que o gráfico de Forest (Fig. 3) resume estudos que comparam a as-
sociação do uso de um medicamento com morte por determinada doença. Mesmo que 
só os estudos A e C concluam associação, o valor combinado de OR e o seu intervalo 
de confiança só tem valores menores do que 1,0. Isso significa que essa metanálise tem 
evidência estatística de que o uso da medicação reduz o risco de morte. 
Na revisão sistemática, o viés de publicação está presente, porque pesquisas que 
só tiveram resultados sem significância estatística têm mais dificuldade de publicação 
(FLETCHER; FLETCHER; FLETCHER, 2014, p. 227). Rejeitar artigos que demonstram 
a não associação entre as variáveis faz com que a revisão sistemática seja tendenciosa 
para ter resultados que corroborem a associação. É preciso ficar atento se os critérios 
de exclusão não estão enviesando a amostra quando se restringe a língua que o artigo 
é escrito ou para apenas textos de acesso livre. 
SA
IB
A 
M
A
IS
Aprofunde seus conhecimentos acerca de revisão sistemática com a leitura do 
artigo abaixo:
CAMPOS, A. C. V. et al. Prevalence of functional incapacity by gender in elderly people 
in Brazil: a systematic review with meta-analysis. Revista Brasileira de Geriatria e 
Gerontologia [online], v. 19, n. 3, p. 545-559, mai.-jun. 2016. Disponível em: https://
doi.org/10.1590/1809-98232016019.150086. Acesso em: 15 jun. 2021.
A qualidade dos estudos também precisa ser avaliada. Se a revisão sistemática resume 
artigos de baixa qualidade, seu resultado não será confiável. Existem diversas escalas 
para avaliar a qualidade do artigo. É possível colocar como critério de exclusão artigos 
que pontuaram pouco nas escalas e, assim, fazer sua revisão e metanálise somente 
com pesquisas fortes.
A escala PEDro é específica para ensaios clínicos da fisioterapia com avaliação de 11 
critérios. Há a escala Downs e Black que avalia 27 critérios e pode ser utilizada para 
várias áreas. A Biblioteca Cochrane também tem uma escala de avaliação. De modo 
geral, todas elas avaliam a presença dos vieses, como o de seleção, de relato e de afe-
rição, os cegamentos dos participantes da pesquisa e a análise estatística.
Assim como existem escalas que avaliam os estudos primários, há as que avaliam a 
qualidade da revisão sistemática. As duas escalas mais utilizadas são a AMSTAR, com 
14 itens, e a PRISMA, com 27 itens. É importante conhecer quais são os critérios utili-
zados para que, ao escrever o artigo, o pesquisador deixe claro o que foi feito a fim de 
que o avaliador possa pontuar.
As revisões sistemáticas devem ser lidas rotineiramente pelos profissionais da saúde, 
visto que elas facilitam a busca e o acesso às informações. Mas não é pelo fato de 
169
U12 Causalidade e saúde baseada em evidência
Bioestatística e Epidemiologia
ser uma revisão que é possível confiar nos resultados – sempre deve-se questionar a 
qualidade do procedimento metodológico e da análise estatística. Atualmente existem 
bancos de dados e bibliotecas virtuais que se especializaram em revisões sistemáticas, 
algumas gratuitas e outras com acesso pago. 
SA
IB
A 
M
A
IS
Bancos de dados e bibliotecas virtuais gratuitas:
 ` Biblioteca Cochrane é especializada em tratamento e até coordena alguns ensaios 
clínicos. Disponível em: https://www.cochranelibrary.com/ (Acesso em: 15 jun. 
2021).
 ` Epistemonikos é uma base de dados de evidências com grande número de re-
visões sistemáticas. Disponível em: https://www.epistemonikos.org/en/ (Acesso 
em:15 jun. 2021).
 ` Health Evidence é um repositório atualizado constantemente com pesquisas acer-
ca de gestão, finanças e prestações de serviços em sistemas de saúde. Disponível 
em: https://healthevidence.org/ (Acesso em: 15 jun. 2021).
3. SAÚDE BASEADA EM EVIDÊNCIA
Saúde baseada em evidência (SBE) é uma abordagem de atuação dos profissionais 
de saúde que é pautada nas melhores evidências científicas (ROUQUAYROL, 2018, p. 
167). Para avaliar a qualidade das evidências são utilizadas ferramentas e conceitos de 
metodologia em pesquisa, da epidemiologia e da estatística. Esse é um conceito am-
pliado do termo medicina baseada em evidência (MBE), mas, muitas vezes, as pessoas 
usam a terminologia mais antiga se referindo à atuação de outros profissionais.
É difícil para um profissional de saúde se manter atualizado depois de formado. Mesmo 
durante os estudos é possível que o professor não esteja ciente das mais recentes 
atualizações. Quando existiam poucas revistas, era comum o profissional fazer uma as-
sinatura e receber o exemplar em casa para se atualizar. Agora que há muitas revistas e 
um acesso facilitado é difícil conseguir separar o que ler. A revisão sistemática facilita o 
acesso às informações, mas, mesmo assim, há profissionais que atuam conforme o que 
ele percebe que funciona e não no que as evidências falam que é o melhor tratamento. 
Os delineamentos de estudo têm uma hierarquização da confiança na conclusão a par-
tir da qualidade metodológica e análise dos dados. A ordem de prioridade é:
 ` Revisão sistemática: com metanálise por resumir os estudos primários e agrupar carac-
terísticas diferentes. 
 ` Ensaio clínico: estudo experimental e longitudinal com a comparação de dois grupos: a 
intervenção e o controle. As variáveis são muito controladas e, portanto, reduzem a chan-
ce de viés de confusão ou outra interferência. De preferência, o ensaio clínico deve ser 
randomizado e duplo cego para melhorar a qualidade dos dados.
 ` Coorte: estudo observacional longitudinal, normalmente, prospectivo. Assim como nos 
ensaios clínicos, consegue medir a incidência e o risco de uma exposição “causar” uma 
doença, além disso, garante a temporalidade da associação.
U12
170
Causalidade e saúde baseada em evidência
Bioestatística e Epidemiologia
IM
PO
R
TA
N
TE
 ` Caso-controle: estudo observacional longitudinal e retrospectivo. Consegue medir a as-
sociação entre exposição e desfecho, mas não garante a temporalidade. É mais rápido e 
prático do que o estudo coorte.
 ` Estudo transversal: estudo descritivo em um único período de tempo. As associações 
são frágeis já que não garantem temporalidade e fatores de confundimento.
 ` Série de casos e relato de casos: descrevem a evolução clínica de um grupo pequeno 
de pessoas que apresentavam um quadro similar. A amostra é enviesada. É útil para des-
crição de casos incomuns ou de uma possível nova doença.
 ` Opiniões de especialistas e experiência prática: não existe método de pesquisa e 
análise estatística. É o pensamento de um especialista sobre o assunto e sobre o que ele 
vive no seu cotidiano de atendimento. Algumas revistas científicas têm uma sessão para 
publicação de opiniões de especialistas.
Os estudos ecológicos não entram na lista porque as associações concluídas neles 
não podem ser inferidas para indivíduos.
Recomendações clínicas é uma maneira fácil de resumir as evidências e comunicar os 
profissionais de saúde. O Sistema GRADE (Grading of Recommendations, Assessment, 
Development and Evaluation) gradua as informações, o que facilita para o profissional 
a interpretação se uma prática é recomendada e a qualidade das evidências coletadas 
(ALMEIDA FILHO; BARRETO, 2011, p. 358). Ele avalia intervenções de saúde. 
As recomendações são classificadas pela força em (1) forte ou (2) fraca. As evidên-
cias são divididas em quatro níveis de qualidade: (a) alta, (b) moderada, (c) baixa, (d) 
muitobaixa. Dessa forma, uma intervenção classificada pela GRADE como 2c é uma 
recomendação fraca com evidências de baixa qualidade. Há também uma avaliação da 
clareza da relação risco/benefício. 
CONCLUSÃO
Como profissionais de saúde, é nosso papel questionar se o que está sendo divulgado 
e realizado é de fato correto, ou seja, é nossa função procurar as respostas baseadas 
em evidências. Mas não se deve acreditar em qualquer evidência – precisa ser cientí-
fica, com métodos definidos e análises estatísticas, além disso, a pesquisa precisa ser 
transparente e sem conflitos de interesse. 
É preciso julgar qualquer pesquisa, mesmo que ela seja feita por pessoas famosas ou 
publicadas em revistas importantes. Será que o procedimento metodológico foi correto? 
Teve algum erro? A amostra é representativa? Posso confiar nos resultados? Com tais 
respostas, avaliamos a pesquisa e decidimos nossas condutas. Por isso, é indispensá-
vel que estejamos sempre atualizados.
171
U12 Causalidade e saúde baseada em evidência
Bioestatística e Epidemiologia
4. OBJETO DE APRENDIZAGEM
Faça a leitura dos apêndices A, B, C, D e F (páginas 95 a 163) que descrevem o método 
da revisão sistemática e como a avaliação da evidência foi feita para chegar à conclusão do 
protocolo brasileiro de detecção precoce de câncer de mama. 
O objetivo é conhecer um processo de recomendação clínica, desde as etapas da busca de 
artigos para a revisão sistemática até a avaliação das evidências. 
INSTITUTO NACIONAL DE CÂNCER JOSÉ ALENCAR GOMES DA SILVA – INCA. Diretrizes 
para a detecção precoce do câncer de mama no Brasil. Rio de Janeiro: INCA, 2015. Dispo-
nível em https://www.inca.gov.br/sites/ufu.sti.inca.local/files//media/document//diretrizes_de-
teccao_precoce_cancer_mama_brasil.pdf. Acesso em: 15 jun. 2021.
U12
172
Causalidade e saúde baseada em evidência
Bioestatística e Epidemiologia
REFERÊNCIAS BIBLIOGRÁFICAS
ALMEIDA FILHO, N. de; BARRETO, M. L. Epidemiologia & Saúde: Fundamentos, Métodos e Aplicações. 
Rio de Janeiro: Guanabara Koogan, 2011.
FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. S. Epidemiologia clínica: elementos essenciais. 5. 
ed. Porto Alegre: ArtMed, 2014.
HILL, A. B. The environment and disease: association or causation? Proceedings of the Royal Society 
of Medicine, v. 58, n. 5, p. 295-300, maio, 1965. Disponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/
PMC1898525/. Acesso em: 15 jun. 2021.
ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia & saúde. 8. ed. Rio de Janeiro: Medbook, 
2018. 752 p.
VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016.
	Introdução à Bioestatística 
e Epidemiologia
	2. Definição de epidemiologia
	3. Método de pesquisa 
	4. Objeto de Aprendizagem
	Coleta, organização e descrição dos dados
	2. Resultados
	3. Objeto de Aprendizagem
	Estatística descritiva
	2. Probabilidade
	3. Distribuição normal
	4. Anormalidades
	5. Objeto de aprendizagem
	Epidemiologia descritiva
	2. Série ou relato de casos
	3. Estudos ecológicos
	4. Distribuição de eventos por pessoas, tempo e lugar
	5. Objeto de Aprendizagem
	Indicadores de Saúde
	2. Incidência e prevalência
	3. Indicadores de natalidade, fecundidade e morbidade
	4. Objeto de Aprendizagem
	Transição demográfica e epidemiológica
	2 Transição demográfica e epidemiológica
	3. Objeto de Aprendizagem
	Estudos observacionais analíticos
	2. Estudo de prognóstico
	3. Estudo caso-controle
	4. Objeto de Aprendizagem
	Medidas de associações
	1. Risco relativo e risco atribuível
	2. Razão de chances (odds ratio)
	3. Análise de sobrevida
	4. Objeto de Aprendizagem
	Estudos experimentais
	2. Objeto de aprendizagem
	Estudo diagnóstico
	2. Medidas
	3. Teste diagnósticos múltiplos
	4. Objeto de Aprendizagem
	Resultados: análise 
e apresentação
	2. Uso de softwares
	3. Apresentação dos resultados
	4. Objeto de Aprendizagem.
	Causalidade e saúde baseada em evidência
	2. Revisão sistemática
	3. Saúde baseada em evidência
	4. Objeto de Aprendizagem
	_GoBack
	_heading=h.gjdgxs
	MTBlankEqn
	_heading=h.30j0zll
	_GoBack
	_GoBack
	_Hlk65805682
	_Hlk65805762
	_Hlk65808120
	_Hlk66233823
	_GoBack
	_Hlk66227510
	_Hlk65802407
	_Hlk65802407
	_Hlk69462932
	_Hlk69483313
	_GoBack
	_Hlk67732154
	MTBlankEqn

Mais conteúdos dessa disciplina