Buscar

USF_PED_ Bioestatística_e_Epidemiologia_completo

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 172 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 172 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 172 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

BIOESTATÍSTICA 
E EPIDEMIOLOGIA
FOTO CAPA
RENATA CRISTOFANI MARTINS
BIOESTATÍSTICA E 
EPIDEMIOLOGIA
Renata Cristofani Martins
2021
PRESIDENTE 
Frei Thiago Alexandre Hayakawa, OFM
DIRETOR GERAL 
Jorge Apóstolos Siarcos 
REITOR 
Frei Gilberto Gonçalves Garcia, OFM 
VICE-REITOR 
Frei Thiago Alexandre Hayakawa, OFM
PRÓ-REITOR DE ADMINISTRAÇÃO E PLANEJAMENTO 
Adriel de Moura Cabral 
PRÓ-REITOR DE ENSINO, PESQUISA E EXTENSÃO 
Dilnei Giseli Lorenzi 
COORDENADOR DO NÚCLEO DE EDUCAÇÃO A DISTÂNCIA - NEAD 
Renato Adriano Pezenti
GESTOR DO CENTRO DE SOLUÇÕES EDUCACIONAIS - CSE
Fernando Rodrigo Andrian
CURADORIA TÉCNICA
Michele Lacerda Pereira Ferrer
DESIGNER INSTRUCIONAL 
Paloma Larissa Souza Guimarães de Lima
 REVISÃO ORTOGRÁFICA
Daniela Mandú
PROJETO GRÁFICO
Centro de Soluções Educacionais - CSE
DIAGRAMADORES
Daniel Luis Landucci
Lucas Ichimaru Testa
CAPA
Daniel Luis Landucci
© 2021 Universidade São Francisco
Avenida São Francisco de Assis, 218
CEP 12916-900 – Bragança Paulista/SP
CASA NOSSA SENHORA DA PAZ – AÇÃO SOCIAL FRANCISCANA, PROVÍNCIA 
FRANCISCANA DA IMACULADA CONCEIÇÃO DO BRASIL – 
ORDEM DOS FRADES MENORES
RENATA CRISTOFANI MARTINS
Renata Cristófani Martins possui Bacharel em Enfermagem pela Escola de Enferma-
gem da Universidade de São Paulo (2005), Licenciatura Plena em Enfermagem pela 
Faculdade de Educação da Universidade de São Paulo (2010), mestrado e doutorado 
pelo Programa de Saúde Pública da Faculdade de Saúde Pública Universidade de São 
Paulo (2012 e 2017). Sua linha de pesquisa é epidemiologia, estatística vital e morta-
lidade. Foi integrante da pesquisa “Uma nova ferramenta para a codificação e seleção 
automáticas da causa de morte: adequação do Software Iris para uso no Brasil” com 
financiamento da FAPESP. Trabalhou dois anos como enfermeira de uma Equipe de 
Saúde da Família e cinco anos como professora de curso técnico de enfermagem. Atu-
almente é professora universitária na Universidade São Francisco nos diversos cursos 
da área da saúde ministrando os componentes curriculares Bioestatística aplicada à 
saúde, Epidemiologia, Saúde pública e Prática médica e sociedade IV. Em 2020, oi 
a pesquisadora responsável pelo inquérito populacional de prevalência de anticorpos 
para Sars-Cov-2 em Bragança Paulista (SP).
A AUTORA
SUMÁRIO
UNIDADE 01: INTRODUÇÃO À BIOESTATÍSTICA E EPIDEMIOLOGIA ............8
1. Definição de bioestatística ..................................................................................8
2. Definição de epidemiologia .................................................................................9
3. Método de pesquisa ...........................................................................................11
4. Objeto de Aprendizagem .....................................................................................16
UNIDADE 02: COLETA, ORGANIZAÇÃO E DESCRIÇÃO DOS DADOS ............18
1. Coleta de dados ..................................................................................................18
2. Resultados ..........................................................................................................21
3. Objeto de Aprendizagem .....................................................................................28
UNIDADE 03: ESTATÍSTICA DESCRITIVA ............................................................32
1. Medidas de dispersão .........................................................................................32
2. Probabilidade ......................................................................................................38
3. Distribuição normal ..............................................................................................40
4. Anormalidades .....................................................................................................42
5. Objeto de aprendizagem .....................................................................................43
UNIDADE 04: EPIDEMIOLOGIA DESCRITIVA ......................................................48
1. Estudo transversal, de prevalência e seccional ..................................................48
2. Série ou relato de casos ......................................................................................50
3. Estudos ecológicos .............................................................................................50
4. Distribuição de eventos por pessoas, tempo e lugar ................................................. 52
5. Objeto de Aprendizagem .....................................................................................55
UNIDADE 05: INDICADORES DE SAÚDE ............................................................58
1. Conceito, histórico e características de um bom indicador ................................58
2. Incidência e prevalência ......................................................................................59
3. Indicadores de natalidade, fecundidade e morbidade .........................................64
4. Objeto de Aprendizagem .....................................................................................69
UNIDADE 06: TRANSIÇÃO DEMOGRÁFICA E EPIDEMIOLÓGICA ...................74
1. Indicadores de mortalidade ................................................................................74
2 Transição demográfica e epidemiológica .............................................................84
3. Objeto de Aprendizagem .....................................................................................88
UNIDADE 07: ESTUDOS OBSERVACIONAIS ANALÍTICOS ...............................90
1. Estudo Coorte .....................................................................................................90
2. Estudo de prognóstico .........................................................................................95
3. Estudo caso-controle ...........................................................................................97
4. Objeto de Aprendizagem .....................................................................................100
UNIDADE 08: MEDIDAS DE ASSOCIAÇÕES .......................................................102
1. Risco relativo e risco atribuível ............................................................................104
2. Razão de chances (odds ratio) ...........................................................................108
3. Análise de sobrevida ...........................................................................................111
4. Objeto de Aprendizagem .....................................................................................114
UNIDADE 09: ESTUDOS EXPERIMENTAIS .........................................................116
1. Ensaio clínico ......................................................................................................116
2. Objeto de aprendizagem .....................................................................................126
UNIDADE 10: ESTUDO DIAGNÓSTICO ................................................................128
1. Definição .............................................................................................................128
2. Medidas ...............................................................................................................131
3. Teste diagnósticos múltiplos ................................................................................141
4. Objeto de Aprendizagem .....................................................................................142
UNIDADE 11: RESULTADOS: ANÁLISE E APRESENTAÇÃO .............................144
1. Análise estatística ................................................................................................144
2. Uso de softwares .................................................................................................153
3. Apresentação dos resultados ..............................................................................1564. Objeto de Aprendizagem. ....................................................................................159
UNIDADE 12: CAUSALIDADE E SAÚDE BASEADA EM EVIDÊNCIA ................162
1. Causalidade ........................................................................................................162
2. Revisão sistemática ............................................................................................166
3. Saúde baseada em evidência .............................................................................169
4. Objeto de Aprendizagem .....................................................................................171
8
UNIDADE 1
INTRODUÇÃO À BIOESTATÍSTICA 
E EPIDEMIOLOGIA
INTRODUÇÃO
Muitas pessoas, mesmo sem saber, já usa-
ram fundamentos e partes da estatística e 
da epidemiologia em seu dia a dia. Ao or-
ganizar uma festa, por exemplo, usamos o 
conceito de estatística para preparar a lista 
de compras de comida. Se no churrasco 
teremos 20 convidados e, conforme as 
informações encontradas na internet, em 
média, o consumo de carne por pessoa é 
100g, comprar 2kg de carne será suficiente 
para o evento? Saber o sexo e a idade dos 
convidados influencia na minha compra? 
Será que posso confiar na informação que 
eu encontrei na internet? Para responder essas perguntas, você utilizará conceitos de 
estatística e epidemiologia.
“Estatística é a ciência que fornece os princípios e os métodos para coleta, organização, 
resumo, análise e interpretação de informações” (VIEIRA, 2016, p. 1).
Im
po
rt
an
te
!
1. DEFINIÇÃO DE BIOESTATÍSTICA
Contar, medir, comparar e resumir informações são ações que estão presentes no cotidiano 
de todas as pessoas, independentemente da profissão. No entanto, a forma com que esses 
processos são realizados influencia na qualidade da informação obtida. A mídia divulga que 
um em cada cinco brasileiros terão hipertensão arterial sistêmica, mas saber que essa infor-
mação foi obtida em uma pesquisa com 50 indígenas no Canadá ou em uma população com 
2.500 pessoas de todos os estados do Brasil mudaria o quanto você confia na informação?
A estatística não se resume a números e cálculos, ela considera todo o processo desde 
o modo em que os dados são coletados e analisados até a forma com que eles são 
interpretados e divulgados.
Figura 01. Estatística
Fo
nt
e:
 1
23
rf.
9 Bioestatística e Epidemiologia
U1 Introdução à Bioestatística e Epidemiologia
Epidemiologia é “[...] ciência que estuda o processo saúde-doença em coletividades 
humanas, analisando a distribuição e os fatores determinantes do risco de 
doenças, agravos e eventos associados à saúde, propondo medidas específicas 
de prevenção, controle ou erradicação de doenças, danos ou problemas de saúde 
e de proteção, promoção ou recuperação da saúde individual e coletiva, produzindo 
informação e conhecimento para apoiar a tomada de decisão no planejamento, 
administração e avaliação de sistemas, programas, serviços e ações de saúde”. 
(ROUQUAYROL; GURGEL, 2018, p. 9, grifos nossos)
IM
PO
R
TA
N
TE
!
2. DEFINIÇÃO DE EPIDEMIOLOGIA
Historicamente, a epidemiologia conta sobre os eventos relacionados à saúde, como nas-
cimentos, casos de doenças e mortes. Um exemplo clássico se refere a John Snow, o pai 
da Epidemiologia moderna, que, no século XIX, investigou a epidemia de cólera em Lon-
dres, avaliando os casos e onde eles aconteceram para que, a partir dessas informações, 
conseguisse propor hipóteses causais e estratégias para reduzi-los. Esse marco amplia a 
atuação da epidemiologia para investigações sistemáticas de eventos com a finalidade de 
levantar hipóteses, definir meios de transmissão da doença e estratégias de ação 
Com o passar do tempo, a epidemiologia ampliou seu objeto de estudo para além das 
doenças transmissíveis, investigando o processo saúde-doença. Dessa forma, começa 
a busca por fatores de risco ou fatores determinantes para acontecimento de especí-
ficas doenças, como o câncer, por exemplo. Nesse sentido, estrutura-se desenhos de 
estudos que possibilitam definir fatores causais.
2.1 CONCEITOS BÁSICOS
Para responder uma questão de estudo, uma parte importante da pesquisa se refere à 
composição e definição das variáveis do estudo. Variáveis são valores ou informações 
obtidas diretamente ou podem ser resultado de um agrupamento, classificação ou 
cálculo de medidas coletadas. Elas podem ser características individuais, determinantes 
do processo saúde-doença, fatores de risco, eventos clínicos e desfechos, como morte, 
presença de doença, deficiência, sintomas e qualidade de vida.
A epidemiologia classifica as variáveis de um estudo típico em três tipos, de acordo com 
Fletcher et al. (2014, p. 6), uma variável independente é o suposto fator de risco ou 
causa que se estuda, ela pode explicar a causa do problema; uma variável dependen-
te, por sua vez, é o suposto desfecho ou efeito que se estuda, ela mede o fenômeno 
que se quer explicar, pode sofrer influência das variáveis independentes, como a rela-
ção entre cigarro e câncer de pulmão. Segundo Pereira (2004, p. 46), nesse caso, a 
variável dependente seria o câncer de pulmão, pois sua presença pode ser influenciada 
pela variável independente cigarro. Por fim, uma variável externa não faz parte direta 
da questão principal, mas pode estar relacionada e afetar a relação entre a variável 
independente e dependente. Um fator de confusão é um exemplo de variável externa. 
U1
10Bioestatística e Epidemiologia
Introdução à Bioestatística e Epidemiologia
A qualidade de uma pesquisa é avaliada a 
partir da presença de erros cometidos. Nes-
se contexto, viés é um erro sistemático e 
ao delinear o projeto é preciso pensar em 
estratégias metodológicas que diminuam a 
chance desse erro acontecer.
Existem três principais tipos de vieses: o viés 
de seleção, viés de aferição e viés de con-
fusão ou de confundimento. O primeiro, 
ocorre quando se comparam grupos com ca-
racterísticas diferentes que não são as variá-
veis principais, mas que influenciam no des-
fecho. Isso acontece porque a seleção da amostra foi falha é que alguma característica 
não foi considerada, por exemplo, ao fazer uma pesquisa sobre uma possível medicação 
que emagrece, a pesquisa não considerou o grau de atividade física dos sujeitos. Então, 
aqueles que tomaram o remédio e emagreceram podem ser fisicamente ativos e os que 
não tomaram a medicação sejam sedentários. Como a seleção da amostra nos grupos não 
considerou a atividade física, não é possível considerar que o emagrecimento de fato foi por 
causa da medicação, pois foram comparados grupos com características diferentes.
Figura 02. Variáveis e vieses de pesquisa
Fo
nt
e:
 1
23
rf.
O viés de aferição ocorre quando o erro é na aferição de alguma variável, como 
usar uma balança não calibrada, realizar a técnica incorreta de aferição da pres-
são arterial ou usar equipamentos diferentes para aferir alguma variável. 
O viés de confusão ou de confundimento ocorre quando duas variáveis po-
dem influenciar o efeito que uma tem sobre um desfecho ou quando se con-
funde qual variável influencia no desfecho. Desse modo, será que uma variável 
realmente causa o desfecho ou essa associação não existe e a verdadeira 
causa na verdade é outra variável? 
Um fator de confusão está associado à exposição, ele deve ter uma associação causal 
com o desfecho e não deve ser uma etapa do caminho da exposição gerar o desfecho. 
Por exemplo, uma pesquisa demonstra uma associação de depressão como fator cau-
sal para ter câncer de pulmão. 
Nesse contexto, um fator de confundimento é o tabagismo, pois fumar causa câncer 
de pulmão e fumar está associado à depressão, pois esse é um hábito apresentado 
frequentemente em pacientes com câncer de pulmão. Portanto, o viés de confusão 
ocorre com a variável tabagismo, que impacta da associação principal da pesquisa, 
depressão e câncer de pulmão.
11 Bioestatística e Epidemiologia
U1 Introdução à Bioestatística e Epidemiologia3. MÉTODO DE PESQUISA 
Uma pesquisa tem várias etapas, logo, ao desenvolver o método que será utilizado na coleta 
e análise dos dados devemos realizar diversas escolhas. Essas decisões devem ser feitas 
com o objetivo de melhorar a qualidade da pesquisa, mas, como nem sempre isso é possível, 
o pesquisador pode ser obrigado a escolher a opção mais viável e não a mais adequada. 
Para ajudar na decisão do pesquisador é importante saber as vantagens e desvan-
tagem de cada possibilidade. Assim, ter o conhecimento de quais são os possíveis 
vieses que podem acontecer são conhecimentos essenciais para desenhar o estudo 
de maneira a contornar as dificuldades.
IM
PO
R
TA
N
TE
!
3.1 AMOSTRAGEM
Uma das primeiras etapas ao realizar ou avaliar uma pesquisa é decidir quem serão os 
participantes. Por exemplo, considere que você se deseja realizar uma pesquisa sobre 
a frequência do uso de drogas, lícitas e ilícitas, nos universitários que moram no Brasil. 
Pela facilidade de acesso, você aplica um questionário com os estudantes da Univer-
sidade São Francisco (USF) que estão cursando o componente curricular de Bioesta-
tística e Epidemiologia. Nesse contexto, realizar a coleta de dados dessa maneira trará 
resultados confiáveis e compatíveis com o objetivo da pesquisa?
Na pesquisa, considera-se população o grupo de pessoas que tem a característica que 
desejamos estudar, já a amostra é composta pelos indivíduos que foram selecionados 
para a pesquisa (VIEIRA, 2016, p. 91). No exemplo da pesquisa sobre drogas, a po-
pulação é: todos os universitários que moram no Brasil e a amostra é: todos os alunos 
que responderam ao questionário. Uma amostra pode ser adequada se for capaz de 
fornecer resultados similares aos que existem na população.
Na maioria dos casos, usa-se uma amostra principalmente pela economia do tempo e 
custo, como não é viável fazer exame laboratorial em todos os moradores da cidade 
para saber a proporção de munícipes que tem alguma doença. Segundo Viera (2016, 
p. 92-93), as pesquisas que realizam levantamento de dados de toda a população são 
chamadas de censo e não precisam de amostragem. 
Outro motivo para usar amostras é em ca-
sos em que não é possível estudar toda 
a população. Por exemplo, você deixou 
uma embalagem de leite aberta a noite 
inteira fora da geladeira e, agora, precisa 
saber se o leite já estragou. Se a análise 
da qualidade for feita com todo o conteú-
do do pacote, mesmo que o resultado seja 
que é possível consumir o leite, não seria 
possível realizar isso já que todo o produto 
foi utilizado no teste. Nesse caso, é obrigatório o uso de uma amostra de pequena 
quantidade do produto para que, se possível, utilizar o restante.
Figura 03. Amostragem
Fo
nt
e:
 1
23
rf.
U1
12Bioestatística e Epidemiologia
Introdução à Bioestatística e Epidemiologia
O uso de amostra tem um valor científico impactante, pois, ao usar menos sujeitos é 
possível coletar dados mais completos. Se a amostragem foi realizada corretamente, os 
valores reais que devemos encontrar na população estarão dentro de uma margem de 
erro do valor encontrado na amostra (VIEIRA, 2016, p. 93-94).
As características das pessoas da amostra impactam na qualidade do resultado. Por 
isso, as descrições dos sujeitos da pesquisa e de todas as etapas de seleção desses 
indivíduos são essenciais para avaliar a qualidade dos resultados.
IM
PO
R
TA
N
TE
!
Métodos amostrais
É possível obter uma amostra por diversos métodos. Assim, escolher qual método utilizar 
é uma decisão dos pesquisadores a partir de suas características, vantagens e desvanta-
gens. Logo, é de extrema importância que o método seja seguido exatamente como defi-
nido e que sua descrição permita que ele seja reproduzido. Nesse sentido, muitas pessoas 
comparam os métodos de uma pesquisa com uma receita culinária, em que é preciso deixar 
claro todas as etapas para que outros consigam realizar e chegar no mesmo resultado.
Uma amostra probabilística ou aleatória é quando a seleção dos sujeitos de pesqui-
sa é feita ao acaso. Na prática, isso significa que a seleção foi feita por sorteio. Nessa 
técnica, um princípio importante é que todos os indivíduos da população têm a mesma 
probabilidade conhecida de participarem da amostra. Para que ela possa ser executada 
é necessário conhecer e identificar toda a população. 
Considere uma pesquisa da cidade de Votorantim (SP), com o objetivo de investigar quais 
são as medicações que os residentes com diabetes mellitus usam. Nesse caso, a população 
se trata dos diabéticos que moram na cidade. Seria possível ter conhecimento de quem são 
todos indivíduos da população antes de realizar o sorteio? Ainda não temos um cadastro obri-
gatório e único com informações de saúde da população, independentemente de as pessoas 
serem ou não usuárias do Sistema Único de Saúde (SUS). Por não ser possível listar todos 
os diabéticos da cidade, não é possível obter uma amostra aleatória para essa pesquisa.
A amostra pode ser aleatória simples quando o sorteio acontece a partir de toda a popu-
lação. Esse método é utilizado quando a população é homogênea e não existem caracte-
rísticas individuais que irão atrapalhar a análise dos dados. Porém, há casos que alguns 
subgrupos podem ter características diferentes que influenciem nos dados coletados. 
Ao fazer uma avaliação sobre a disciplina Estudo do Ser Humano Contemporâneo da 
USF, pode-se considerar que os estudantes terão avaliações similares independente do 
curso ou área de conhecimento que cursam? Nesse contexto, podemos supor que os 
alunos da área de humanas devem gostar mais da disciplina do que os alunos de exa-
tas, portanto, a população não é homogênea. Em casos como o descrito anteriormente, 
a amostra pode ser aleatória estratificada. Esse método é usado quando a população 
tem subgrupos (estratos) que podem ter comportamentos diferentes. 
13 Bioestatística e Epidemiologia
U1 Introdução à Bioestatística e Epidemiologia
Para selecionar a amostra, deve-se dividir a população nos subgrupos e sortear os su-
jeitos em cada estrato, desse modo, podemos garantir a representação de cada subgru-
po. Normalmente, os estratos são sexo, idade e/ou classe social, mas eles podem ser 
divididos conforme as características da população. A distribuição do número de partici-
pantes da pesquisa em cada extrato deve ser proporcional a distribuição dos subgrupos 
na população. Se a população é distribuída com 30% sexo masculino e 70% feminino, 
uma amostra estratificada de 10 indivíduos deve selecionar 7 mulheres e 3 homens.
Exemplo 1
Considere uma pesquisa com o objetivo de avaliar a proporção de pessoas com depressão entre 
os estudantes matriculados na Universidade São Francisco. Entre 10.350 estudantes, 33% são 
bolsistas. Para obter resultados significativos será necessária uma amostra com 75 pessoas.
Uma amostra aleatória simples seria obtida a partir do sorteio de 75 pessoas entre os 10.350 
estudantes. Já uma amostra aleatória estratificada seria obtida dividindo a população entre 
bolsistas e pagantes, depois sorteando 50 pessoas entre os pagantes e 25 entre os bolsistas 
para manter a proporção com a população.
Uma amostra semiprobabilística tem parte do processo de seleção aleatório. A amostra 
sistemática tem regras pré-estabelecidas que devem ser seguidas sistematicamente. 
A parte aleatória acontece por meio de um sorteio que indica o valor que deve ser sor-
teado e repetido sistematicamente. Para utilização desse método, é necessário que 
a população esteja distribuída em ordem e, por isso, esse é um método comum para 
seleção de prontuários. A primeira etapa é dividir a população em grupos, em que o 
número de grupos deve ser igual ao número de indivíduos na amostra. A segunda etapa 
se trada de sortear um número dentro de uma faixa de valor que é definida pelo número 
de pessoas em cada grupo. Após o sorteio, deve-se selecionar a pessoa que ocupa a 
posição sorteada em cada grupo. Se a população é de 250 pessoas e se desejauma 
amostra de 10 indivíduos, a amostra sistemática será a seleção da sétima pessoa de 
cada grupo considerando que o sorteio de 1 a 25 deu 7.
A amostra por conglomerados seleciona grupos de pessoas definidos por algum moti-
vo que são encontrados na população, como um município, uma clínica ou uma escola. 
Nesse caso, o sorteio não é dos sujeitos e sim dos conglomerados. Para utilização desse 
método, o pesquisador deve ter acesso a todos os conglomerados possíveis, ou o pesqui-
sador corre o risco de ter uma amostra que não tem acesso. A vantagem dessa amostra 
é concentrar a coleta em menos locais, em vez de sortear entre todas as internações do 
município e correr o risco de ter que coletar dados em múltiplos hospitais, com esse mé-
todo é possível sortear o conglomerado e realizar a pesquisa em um único local.
Em alguns casos, mais de um método amostral é utilizado. Isso acontece frequente-
mente quando o primeiro método é por conglomerado, pois, dentro de um conglome-
rado pode ter uma quantidade maior do que a necessária. Então, utiliza-se de outro 
método para uma seleção dos indivíduos dento do conglomerado selecionado.
A amostra por cotas seleciona com o objetivo de garantir representatividade e propor-
ção igual a população, a lógica desse método é similar a cotas de vagas para acesso 
U1
14Bioestatística e Epidemiologia
Introdução à Bioestatística e Epidemiologia
aos processos seletivos. A amostra é dividida garantindo vagas para pessoas com ca-
racterísticas diferentes, em que os grupos de cotas são similares aos estratos, frequen-
temente divididos por sexo, idade e/ou classe social. O preenchimento das vagas é por 
acesso, desse modo, nesse método não existe sorteio. Nesse contexto, é comum que o 
entrevistador fique em locais de alto movimento para tentar encontrar pessoas que pre-
encham as características das cotas. Essa é uma estratégia muito utilizada em razão 
de sua praticidade e baixo custo. 
Exemplo 3
Exemplo 2
Considere uma pesquisa com o objetivo de avaliar a proporção de pessoas com depressão entre 
os estudantes matriculados na Universidade São Francisco. Entre 10.350 estudantes, 33% são 
bolsistas. Para obter resultados significativos será necessária uma amostra com 75 pessoas.
Uma amostra de conveniência seria obtida distribuindo o questionário on-line para todos os 
estudantes por meio de grupos de redes sociais.
Considere uma pesquisa com o objetivo de avaliar a proporção de pessoas com depressão 
entre os estudantes matriculados na Universidade São Francisco. Entre 10.350 estudantes, 
33% são bolsistas. Para obter resultados significativos será necessária uma amostra com 75 
pessoas.
Uma amostra sistemática seria obtida sorteando um número de 1 a 138 (considere que o 
resultado foi o número 84). A amostra será a octogésima quarta pessoa de cada grupo de 
138 pessoas.
Já uma amostra por conglomerados seria obtida sorteando uma sala de aula e os participan-
tes da pesquisa seriam quem assiste aula nesse local.
Uma amostra por cotas teria 50 vagas para pagantes e 25 vagas para bolsistas. Para realizar 
a pesquisa, o pesquisador poderia ficar na entrada principal da universidade e perguntar para 
cada aluno se eles eram bolsistas ou pagantes. As primeiras pessoas que preenchessem os 
critérios seriam selecionadas.
A amostra de conveniência ou não probabilística é composta por pessoas que o 
pesquisador tem fácil acesso. Nesse método, não existe sorteio ou alguma etapa que 
garanta aleatoriedade e representatividade da população. Ele é similar ao método 
amostral por cotas, em que a diferença é que, por conveniência, não há os grupos de 
características específicas. Essa é uma das estratégias mais utilizadas por ser muito 
prática e barata, normalmente, os profissionais que desenvolvem pesquisa usam esse 
método ao fazerem a pesquisa somente com os seus pacientes. 
Pessoas leigas podem explicar esse método descrevendo que a seleção das pessoas ocor-
reu ao acaso, conforme encontravam as pessoas na rua. Para estatística, o termo acaso está 
relacionado à aleatoriedade de um evento acontecer e não a ausência de método de coleta.
15 Bioestatística e Epidemiologia
U1 Introdução à Bioestatística e Epidemiologia
Tamanho da amostra
A vantagem da amostra é não precisar avaliar a população inteira. Entretanto, o tama-
nho da amostra tem que ser pequeno para otimizar tempo e recursos, mas grande o su-
ficiente para ter significância estatística. Quanto maior o tamanho da amostra, maiores 
as chances dos valores encontrados (estimativas) serem próximos aos valores reais en-
contrados na população (parâmetros). Para saber se um novo tratamento é eficaz, não 
se pode avaliar somente 10 pessoas, é preciso de um número suficiente que consiga 
garantir que o que foi observado não é uma exceção.
Desse modo, para saber o tamanho ideal existem cálculos que definem o número ideal 
para a amostra ter significância e qualidade. De acordo com a situação, pode-se utilizar 
fórmulas diferentes. Normalmente, os critérios que precisam ser definidos ao fazer o 
cálculo são: margem de erro, nível de confiança e proporção na população.
3.2 INFERÊNCIA ESTATÍSTICA
Uma vez que se obtém os resultados é preciso avaliar a qualidade deles e o quanto é 
possível usá-los para supor que é assim que eventos acontece na população. Então, 
primeiramente, avalia-se a validade interna que define a grau que os resultados represen-
tam a amostra. Um bom estudo sem vieses e erros sempre tem alta validade interna. Por 
sua vez, a validade externa define o quanto o resultado pode representar a população.
Nesse sentido, chama-se de inferência estatística a ação de generalizar os resultados 
da sua amostra para a população. Para fazer a inferência é necessário avaliar as carac-
terísticas da amostra e refletir se ela é representativa da população.
Uma amostra é tendenciosa quando suas características não são similares a popula-
ção. Dessa forma, toda amostra tendenciosa ocorre por viés de seleção. Uma pesquisa 
sobre uso de drogas entre brasileiros teve uma amostra somente de alunos universitá-
rios. Com os dados obtidos não é possível concluir que todos os brasileiros se compor-
tam como na amostra. 
Portanto, para utilizar os resultados da pesquisa para embasar sua conduta profissio-
nal, o estudo tem que ter alta validade interna e externa. Ela não pode ter vieses e uma 
amostra tendenciosa.
Procure nos artigos científicos se os autores deixam claro o método amostral utilizado. 
Será que descrever como foi feita a seleção facilita a avaliação de validade da pesqui-
sa e da presença de vieses? Sem a descrição do método amostral é possível definir a 
presença de viés de seleção?
PA
R
A 
R
EF
LE
TI
R
U1
16Bioestatística e Epidemiologia
Introdução à Bioestatística e Epidemiologia
4. OBJETO DE APRENDIZAGEM
Faça um quadro comparativos dos diferentes métodos amostrais
MÉTODO AMOSTRAL CARACTERÍSTICA VANTAGEM DESVANTAGEM EXECUÇÃO
Aleatória
Simples
Estratificada
Sistemática
Por conglomerados
Por cotas
Conveniência
17 Bioestatística e Epidemiologia
U1 Introdução à Bioestatística e Epidemiologia
REFERÊNCIAS BIBLIOGRÁFICAS
FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. Epidemiologia clínica: elementos essenciais. 5. ed. 
Porto Alegre: ArtMed, 2014.
PEREIRA, J. C. R. Análise de dados qualitativos: estratégias metodológicas para as ciências da saúde 
humanas e sociais. São Paulo: Edusp, 2004.
ROUQUAYROL, M. Z.; GURGEL, M. Rouquayrol: epidemiologia e saúde. 8. ed. Rio de Janeiro: Medbook, 
2018.
VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016.
18
UNIDADE 2
COLETA, ORGANIZAÇÃO E 
DESCRIÇÃO DOS DADOS
Figura 01. Tipos de variáveis
VARIÁVEIS
QUALITATIVAS 
OU 
CATEGÓRICA
NOMINAL ORDINAL DISCRETA CONTÍNUA
QUANTITATIVA 
OU 
NUMÉRICA
Fonte: elaborada pela autora.
INTRODUÇÃO
Uma parte importante para avaliar a qualidade da pesquisa é ter uma adequada coleta 
dos dados. Qual informação coletar, como aferir e qual instrumento utilizar sãodefini-
ções importantes que um pesquisador deve fazer. Desse modo, toda escolha influencia 
na qualidade e nas análises utilizadas, mas não basta somente coletar corretamente, é 
preciso transmitir os dados e resumir as informações.
1. COLETA DE DADOS
Ao desenhar uma pesquisa é preciso definir quais variáveis coletar e como conduzir 
esse processo. As variáveis são as informações de interesse que a pesquisa pretende 
estudar e suas características influenciam nas análises estatísticas que serão realiza-
das que, por sua vez, definem os resultados. 
A classificação estatística das variáveis está esquematizada na Figura 1, em que as va-
riáveis qualitativas ou categóricas são expressadas por categorias mutualmente exclu-
dentes. Por exemplo, sexo é uma variável qualitativa porque a reposta é por categoria 
(masculino ou feminino) e só é possível ter uma resposta possível.
A variável qualitativa pode ser ordinal quando as categorias possuem uma ordem na-
tural. A ordenação é um consenso e não pode estar associada a juízo de valor pessoal. 
Uma pesquisa de satisfação que tem toda pergunta estruturada com as possibilidades 
de resposta: ruim, satisfatório e bom. Essa é uma variável qualitativa, pois as respostas 
são categorias e é ordinal porque as respostas têm uma ordenação. Um questionário 
fechado tem as possíveis respostas em ordem, mas isso não quer dizer que exista uma 
ordem natural nas respostas para classificá-la como ordinal. Nesse contexto, podemos 
19 Bioestatística e Epidemiologia
U2 Coleta, organização e descrição dos dados
apresentar outros exemplos como escolaridade (ensino infantil, fundamental, médio e 
superior) e tamanho do edema (1+, 2+, 3+, 4+).
A variável qualitativa pode ser nominal quando as categorias não têm uma distribuição 
ordinal. Uma grande parte das variáveis são desse tipo. Na declaração de nascido vivo, 
por exemplo, a variável tipo de parto é coletada com possibilidades de resposta: cesáreo, 
vaginal e ignorado. Apesar das evidências científicas e do juízo de valor que parto vaginal 
é melhor, a ordenação não é natural e, portanto, tipo de parto é uma variável qualitativa 
nominal. Além disso, são outros exemplos de variável qualidade nominal: município de 
residência ou droga ilícita utilizada (maconha, cocaína, crack, LSD, entre outras).
Ademais, algumas variáveis qualitativas nominais podem, também, ser dicotômicas. 
Isto é, quando só há duas respostas possíveis e que elas são excludentes, por exemplo: 
faz uso de tabaco (sim/não), presença ou ausência de pressão alta. Normalmente, as 
respostas desse tipo de variáveis são sim e não.
As variáveis quantitativas ou numéricas são expressas por números com intervalos 
entre os valores iguais, por exemplo, peso e altura. Por sua vez, o grau de estadiamen-
to, apesar de ter respostas numéricas (estadiamento I, II, III e IV), não é uma variável 
quantitativa porque os intervalos entre os graus não são conhecidos. 
As variáveis quantitativas podem ser discretas quando as respostas são valores ou 
uma faixa de valores possíveis. Geralmente, essas respostas apresentam números in-
teiros e resultados de uma contagem. Por exemplo, número de partos é uma variável 
quantitativa, em que o resultado é numérico, e é discreta, porque a pessoa contou quan-
tos partos teve e não se pode ter metade de um parto.
Por fim, a variável quantitativa contínua pode ter números decimais e resultados 
são obtidos por aferição. O peso de cada sujeito da pesquisa é aferido em uma 
balança e tem a possibilidade de um resultado decimal, 75,1 kg. Dessa forma, todo 
exame laboratorial de análises clínicas são variáveis quantitativas contínua, pois os 
resultados são sempre uma proporção.
1.1. DESEMPENHO DAS AFERIÇÕES
Como e com quais instrumentos a coleta de dados foi realizada influencia na qualidade 
da pesquisa. Por isso, vários instrumentos têm seus desempenhos avaliados para jul-
gar o quanto eles conseguem aferir. 
A validade avalia a capacidade de um instrumento medir o que se propõe a medir. Esse 
conceito, por sua vez, é similar ao conceito de acurácia que mede o quanto os dados 
aferidos representam a realidade. A confiabilidade está relacionada com a precisão e 
reprodutibilidade do instrumento, avaliando o quão próximos as aferições estão repe-
tidas. A responsividade avalia se o instrumento consegue registrar mudanças após 
alteração clínica do quadro. Já a interpretabilidade avalia o grau de dificuldade de 
interpretar os dados e, também, avalia o intervalo de variação que o instrumento conse-
gue medir e a capacidade de registrar alterações extremas.
U2
20Bioestatística e Epidemiologia
Coleta, organização e descrição dos dados
Figura 02. Precisão e acurácia de quatro instrumentos diferente considerando 
que o local correto a ser acertado é o meio do desenho
Fonte: elaborada pela autora.
Os dois principais critérios para avaliar a qualidade de um instrumento são: a precisão 
e a acurácia. Para compreender melhor os conceitos, avalie a Figura 2. Considere que 
cada instrumento aferiu quatro vezes e que o valor que eles deveriam acertar está no 
centro do desenho, desse modo, quais instrumentos têm alta precisão e acurácia?
Após analisar a Figura 2, o instrumento amarelo se mostra impreciso e tem baixa vali-
dade; o instrumento verde, por sua vez, é preciso porque as aferições estão próximas, 
mas tem baixa validade já que estão longe do centro; o instrumento azul tem precisão 
e acurácia intermediárias; por fim, o instrumento vermelho tem alta precisão e acurácia.
As escalas são ferramentas utilizadas por muitos profissionais da saúde para avaliar 
características dos indivíduos e os fatores determinantes de saúde, como o Mini 
Exame do Estado Mental (MEEM). Essas escalas ao serem criadas, traduzidas ou 
adaptadas para diferentes populações devem passar por uma avaliação de validade 
de conteúdo, de critério e de construto. A validade de conteúdo refere-se à capaci-
dade que a escala tem de abranger todos os aspectos do problema a ser medido, 
assim como a clareza na medição do problema. 
A validade de critério, por outro lado, compara os resultados do teste em questão com 
outros exames ou características mensuráveis. Segundo Pasquali (2009), a validade 
de construto leva em consideração a consistência interna (correlação entre cada item e 
o restante dos itens da escala) e a capacidade do instrumento em medir uma variável 
latente (um construto que não pode ser medido diretamente). 
21 Bioestatística e Epidemiologia
U2 Coleta, organização e descrição dos dados
2. RESULTADOS
Os dados são os valores ou as respostas obtidas. A análise dos dados começa com 
a estatística descritiva na qual a principal função é o resumo e a descrição das infor-
mações obtidas. As variáveis qualitativas são resumidas com frequência absoluta e 
relativa de cada categoria de resposta. As variáveis quantitativas, normalmente, são 
resumidas com medidas de tendência central e medidas de dispersão.
Frequência absoluta e relativa
A frequência absoluta é a contagem dos casos de cada categoria da variável. Por 
exemplo, na variável sexo, a frequência absoluta é de 18 para os homens e 36 para as 
mulheres. A frequência relativa é uma proporção resultante de uma divisão. A frequ-
ência relativa pode ser apresentada por coeficientes, taxas, porcentagens e índices. Ao 
resumir dados das variáveis qualitativas é comum expressar a frequência relativa em 
porcentagem após a menção da frequência absoluta. 
Fórmula de cálculo de frequência relativa por porcentagem:
 1 00
 
frequencia absoluta
tamanhoda amostra
×
 
1
EX
EM
PL
O
Considere uma amostra de 54 pessoas, das quais 36 são mulheres e 18 são 
homens. O cálculo da frequência relativa em porcentagem para cada respos-
ta dos homens é:
 1 00
 
frequencia absoluta
tamanhoda amostra
×
 substituir a fórmula com os dados.
18 1 00
54
= ×
 fazer a divisão (18 ÷ 54).
0,3333 1 00= × fazer a multiplicação.
33,33%= 
Já nas mulheres, temos:
 
 36 1 00 100 0,6667 1 00 66,67%
 54
frequencia absoluta
tamanhoda amostra
× = × = × =
U2
22Bioestatística e Epidemiologia
Coleta, organização e descrição dos dados
Ao descrever variáveis quantitativas, a utilização da frequência para cada pos-
sibilidade de resposta pode não resumir os dados. A dificuldade em realizar uma 
frequência simples é que dados quantitativos frequentemente têm diversas res-
postas, não agrupando os dados e resumindo as informações. Para esses casos, 
recomenda-se a utilização de frequência agrupada, na qual criam-se agrupamen-
tos de categorias de dados.
Os agrupamentos de categorias de dados poder ser definidos, a partir da distri-
buição dos dados da amostra ou de critérios predefinidos. Assim, é comum para 
idade de adultos distribuir em faixas de 20 a 29 anos ou de 30 a 39 anos. O inter-
valo de valores deve ser igual em todas as faixas. Desse modo, é importante que 
as categorias criadas tenham uma sequência que garanta que todo número esteja 
incluso em somente uma única categoria. Por exemplo, se existem as categorias 
de 20 a 30 anos e de 30 a 40 anos, um sujeito com 30 anos pode erroneamente 
ser incluído em duas categorias.
O exemplo a seguir mostra que a distribuição agrupada é mais adequada para 
variáveis quantitativas.
Os dois tipos de frequência podem ser apresentados ao longo do texto, confor-
me exemplo acima. Outra opção é descrever, no texto, usando o número abso-
luto seguido da porcentagem entre parênteses, por exemplo, quanto a sexo 36 
(66,67%) eram mulheres. 
Além disso, há a possibilidade de realizar uma tabela de distribuição de frequência, 
em que ela é organizada com três colunas, a primeira que terá as possibilidades 
de respostas, a segunda que terá a frequência absoluta (as vezes abreviada como 
“N”) e a terceira que terá a frequência relativa (normalmente, abreviada com “%”). A 
primeira linha da tabela mostra os títulos de cada coluna e a última linha é o Total, 
conforme a tabela a seguir.
Tabela 01. Tabela de distribuição de frequência
SEXO FREQUÊNCIA ABSOLUTA (N)
FREQUÊNCIA RELATIVA 
(%)
Feminino 36 66,67%
Masculino 18 33,33%
Total 54 100%
Fonte: elaborada pela autora.
23 Bioestatística e Epidemiologia
U2 Coleta, organização e descrição dos dados
No cotidiano das secretarias de saúde, os dados do número de casos das doenças 
de notificações compulsórias são divulgados, portanto, é importante que em qualquer 
divulgação de dados seja utilizada frequência absoluta e relativa. 
Uma pesquisa entrevistou 8 universitários com os dados descritos na tabela a seguir. 
Crie uma tabela de distribuição simples e agrupada de frequência absoluta (N) e rela-
tiva (%) da variedade idade.
IDADE 20 21 57 40 23 20 21 21
Distribuição simples
IDADE N %
20 2
 
2 100 0,25 100 25% 
8
× = × =
21 3
 
3 100 0,375 100 37,5%
8
× = × =
23 1
 
1 100 0,1225 100 12,25%
8
× = × =
40 1
 
1 100 0,1225 100 12,25%
8
× = × =
57 1
 
1 100 0,1225 100 12,25%
8
× = × =
Total 8 100%
 
Distribuição agrupada
IDADE N %
20 a 39 anos 6
 
6 100 0,25 100 75%
8
× = × =
40 a 59 anos 2
 
2 100 0,25 100 25%
8
× = × =
Total 8 100%
EX
EM
PL
O
U2
24Bioestatística e Epidemiologia
Coleta, organização e descrição dos dados
Ao realizar qualquer cálculo das medidas de tendência central é importante que todos 
os dados coletados sejam analisados. Então, mesmo que existam valores repetidos, 
todas as observações devem participar dos cálculos.
IM
PO
R
TA
N
TE
!
Nesse sentido, a medida de tendência mais tradicional é a média aritmética. Por sua 
vez, ela é obtida somando todos os valores dos dados e depois dividindo a soma pelo 
número de dados observados.
Fórmula da média:
2 xx
n
∑
=
 ou 
 
 
soma dos dadosMédia
númerodedados
=
A frequência absoluta tem como principal função demonstrar o impacto que aquele 
agravo, evento ou desfecho tem na sociedade. Outra aplicabilidade é que, a partir dos 
números de casos, os serviços de saúde podem planejar atendimentos e possíveis 
demandas. Sobre a pandemia de covid-19, por exemplo, divulgar o número de mortes 
diários causou uma comoção entre os brasileiros e, também, fez com que os municípios 
se preparassem para o suporte de estrutura e insumos que será necessário para os 
atendimentos. Já a frequência relativa tem como principal função comparar. 
O número de óbitos total por covid-19 em 9 de fevereiro de 2021 nos Estados Unidos 
da América (EUA) foi de 459.993 e no Reino Unido foi 112.798. Somente utilizando o 
número absoluto de casos, o EUA parece estar pior na pandemia por causa do maior 
número de casos. Agora ao complementar as informações com a frequência relativa, 
a comparação fica melhor. Com esse mesmo exemplo, a proporção de mortes por co-
vid-19 por 1 milhão de habitantes no Reino Unido é de 1.661,58 e nos Estados Unidos 
da América é de 1.389,7. Por isso, cabe reforçar que para qualquer comparação é ne-
cessário usar alguma frequência relativa.
2.2 MEDIDAS DE TENDÊNCIA CENTRAL
Na descrição e resumo das variáveis quantitativas, frequentemente, utiliza-se no míni-
mo uma medida de tendência central e uma medida de dispersão. As medidas de ten-
dência central definem um ponto dentro do conjunto amostral que resume os dados.
25 Bioestatística e Epidemiologia
U2 Coleta, organização e descrição dos dados
Em que:
x = um dado.
∑ = somatória.
x∑ = somatória de todos os dados.
n = número de dados.
CÁLCULO MÉDIA
Uma pesquisa entrevistou 8 universitários com os dados descritos na 
tabela a seguir. 
IDADE 20 21 57 40 23 20 21 21
Média:
 
 
x soma dos dadosx
n númerodedados
∑
= =
 
20 20 21 21 21 23 40 57
8
+ + + + + + +
=
Portanto, a média desses dados é 27,88 anos.
EX
EM
PL
O
 –
 C
Á
LC
U
LO
 M
ÉD
IA
Nesse exemplo, considere que, na amostra de 8 pessoas, o pesquisador seja incapaz de 
coletar a idade de um sujeito. Nesse caso, o número de dados é 7, que é a informações 
que se deve colocar na parte de baixo na fórmula, já que só tem idade de sete indivíduos.
A mediana é a segunda medida de tendência central. O seu valor divide o conjunto 
de dados ordenados no meio, isso significa que metade das observações tem valores 
abaixo da mediana e metade acima. 
= 27,88
223
8
= 
substituir a fórmula com os dados.
somar os valores.
.......................................................... realizar a divisão.
U2
26Bioestatística e Epidemiologia
Coleta, organização e descrição dos dados
Para calcular a mediana, a primeira etapa é 
organizar os dados em ordem crescente (do 
menor para o maior). A segunda etapa é en-
contrar em qual local é o ponto de corte para 
dividir o conjunto ao meio. Quando o número 
de dados for ímpar, a mediana será um valor 
do conjunto. Conjunto A: {2,6,12,17,21} tem 
cinco observações (número ímpar), portanto, 
a mediana é valor do conjunto. Consideran-
do que ele já está ordenado, o valor que está 
na posição central e consegue dividir o con-
junto em dois grupos de dois é o 12. Logo, a 
mediana do conjunto A é 12.
Quando o número de dados for par, a me-
diana será a média dos dois valores centrais. Como será sempre uma média de dois 
valores, a conta será sempre igual, primeiro deve-se somar os valores centrais e depois 
dividir a soma por 2.
Conjunto B: {7, 9, 13, 15} tem número quatro observações (número par), portanto, a 
mediana é a média dos dois valores centrais. Considerando que ele já está ordena-
do, a posição central que consegue dividir o conjunto em dois grupos de dois é um 
valor entre 9 e 13. Para calcular a mediana, nesse caso, é preciso fazer a média 
entre 9 e 13. Assim, o cálculo da mediana será 
 
 
soma dos dados
númerodedados
=
 
9 13
2
+
=
 
22 11.
2
=
 
Ou seja, a mediana do conjunto B é 11.
Figura 03. Distribuição de dados
Fo
nt
e:
 1
23
rf.
Cálculo mediana 
Uma pesquisa entrevistou 8 universitários com os dados descritos na tabela a seguir. 
IDADE 20 21 57 40 23 20 21 21
Mediana
1) Colocar em ordem crescente: 20 20 21 21 21 23 40 57.
2) Número par de observações (oito).3) Achar os valores centrais: 21 e 21.
4) Realizar o cálculo: 
21 21
2
+
=
 
42 21
2
=
.
A mediana desses dados é 21 anos.
EX
EM
PL
O
27 Bioestatística e Epidemiologia
U2 Coleta, organização e descrição dos dados
A terceira medida de tendência central é a moda. A moda é o dado mais frequente, ou 
seja, dentro do conjunto é o valor que mais se repete. É possível que um conjunto tenha 
mais do que uma ou não tenha moda. Para facilitar reconhecer qual é a moda, pode-se 
fazer uma análise de frequência absoluta antes ou ordenar o conjunto para ficar mais 
fácil conseguir reconhecer os valores repetidos.
Cálculo moda 
Uma pesquisa entrevistou 8 universitários com os dados descritos na tabela a seguir. 
IDADE 20 21 57 40 23 20 21 21
Moda: faça uma contagem (frequência absoluta) dos dados. A idade que mais se 
repete é 21, com três votos.
IDADE 20 21 23 40 57 TOTAL
N 2 3 1 1 1 8
Logo, a moda desses dados é 21 anos.
EX
EM
PL
O
A média é influenciada pelos valores dos dados. Desse modo, se no conjunto de obser-
vações tiverem valores extremos, ou seja, distante de onde a maioria dos valores está, 
a média será afetada. Essa desvantagem da média é a vantagem da mediana, que não 
é influenciada por valores extremos. Se analisarmos os exemplos de cálculo para essas 
duas medidas, podemos observar que a média está mais alta que a mediana por causa 
dos valores extremos (40 e 57).
A vantagem da média é que ela pode sofrer manipulações matemáticas e é mais co-
nhecida. Já a mediana não consegue sofrer muitas manipulações matemáticas. Quanto 
à moda, a vantagem é a praticidade de conhecer e calcular a medida. No entanto, a 
desvantagem é que os resultados não são significativos em grupos pequenos.
A escolha de qual medida usar dependerá dos dados da pesquisa. As características, 
vantagens e desvantagens de cada medida influenciará na escolha da medida que 
descreverá melhor os dados.
U2
28Bioestatística e Epidemiologia
Coleta, organização e descrição dos dados
3. OBJETO DE APRENDIZAGEM
Considere que uma sala de aula formou três grupos, cada um com 10 alunos. A tabela abaixo 
descreve as características dos alunos em cada grupo.
IDENTIFICAÇÃO GRUPO TIME QUE TORCE NÚMERO DE IRMÃOS
Aluno 1 A Santos 0
Aluno 2 A Santos 0
Aluno 3 A Guarani 3
Aluno 4 A Ponte Preta 2
Aluno 5 A Palmeiras 1
Aluno 6 A Ponte Preta 0
Aluno 7 A Ponte Preta 2
Aluno 8 A Guarani 1
Aluno 9 A Ponte Preta 2
Aluno 10 A Palmeiras 0
Aluno 11 B Bragantino 1
Aluno 12 B São Paulo 1
Aluno 13 B Santos 2
Aluno 14 B Bragantino 3
Aluno 15 B Palmeiras 0
Aluno 16 B Guarani 2
Aluno 17 B São Paulo 1
Aluno 18 B Bragantino 2
Aluno 19 B Guarani 4
Aluno 20 B São Paulo 2
Aluno 21 C Corinthians 1
Aluno 22 C Santos 3
Aluno 23 C Corinthians 2
Aluno 24 C São Paulo 0
Aluno 25 C Santos 5
Aluno 26 C São Paulo 3
Aluno 27 C Ponte Preta 2
Aluno 28 C Santos 4
Aluno 29 C Corinthians 2
Aluno 30 C Palmeiras 5
Fonte: própria autora
29 Bioestatística e Epidemiologia
U2 Coleta, organização e descrição dos dados
a. Monte uma tabela de frequência da variável Time que torce de todos os alunos da sala. A 
tabela deve conter frequência absoluta e frequência relativa.
b. Calcule as medidas de tendência central da variável Número de irmãos de cada grupo 
de aluno. Reflita se existe diferença entre os grupos e se dentro de cada grupo qual é a 
medida de tendência central que melhor resume essa variável.
U2
30Bioestatística e Epidemiologia
Coleta, organização e descrição dos dados
FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. Epidemiologia clínica: elementos essenciais. 5. ed. 
Porto Alegre: ArtMed, 2014.
PASQUALI, L. Psicometria. Revista da Escola de Enfermagem da USP, São Paulo, v. 43, especial, p. 992-
999, 2009. Disponível em: http://dx.doi.org/10.1590/S0080-62342009000500002. Acesso em: 23 fev. 2021.
VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016.
REFERÊNCIAS BIBLIOGRÁFICAS
about:blank
32
UNIDADE 3
ESTATÍSTICA DESCRITIVA
INTRODUÇÃO
O que é “normal”? Estar fora do “normal” faz alguém estar doente? Se uma pessoa 
chora todo dia por um mês após perder uma pessoa querida, isso é considerado normal 
ou é depressão? Como se definiu qual o limite entre febre e temperatura normal? Será 
que toda pessoa com temperatura de 37,3ºC está sem febre?
Normal é um termo relativo, com base na sociedade e que varia ao longo do tempo, por 
isso, a saúde utiliza o termo padrão. Qual é a frequência cardíaca padrão de um adul-
to? Aqui o termo padrão tem o significado de ser o que ocorre com maior frequência, 
o evento mais comum de acontecer. Dessa forma, as informações abordadas nessa 
unidade ajudarão a desvendar esses mistérios e a interpretar as informações.
1. MEDIDAS DE DISPERSÃO
Para resumir e descrever um conjunto de dados de uma variável numérica, utiliza-se 
medidas de tendência central e medidas de dispersão. As medidas de tendência central 
informam um ponto que resume os dados, mas só ter um ponto central não descreve o 
quanto os dados variam.
Considere o conjunto A {12,13,14,15,16} e o conjunto B {4,10,12,20,24}. Os dois conjun-
tos têm média 14, mas eles não são similares. Os dados do conjunto A variam pouco, 
enquanto em B a variação é maior, pois, para descrever é preciso de no mínimo uma 
medida central e uma de dispersão.
Uma medida de dispersão é a amplitude que é a diferença entre o valor máximo e o 
mínimo. Assim, é possível apenas citar o valor mínimo e máximo. Para facilitar o cálculo 
da amplitude, recomenda-se colocar os dados em ordem crescente para ajudar no re-
conhecimento dos valores extremos.
Fórmula da amplitude:
1 Amplitude Valor máximo Valor mínimo= −
33 Bioestatística e Epidemiologia
U3 Estatística descritiva
Cálculo de Amplitude
Uma pesquisa entrevistou 6 universitários com os dados descritos na tabela a seguir. 
IDADE 20 21 57 40 23 18
Amplitude:
1) Colocar em ordem crescente: 18 20 21 23 40 57
2) Realizar o cálculo: 57 18 39− =
A amplitude desses dados é 39 anos.
Ex
em
pl
o 
A segunda medida de dispersão é o quartil. O percentil é um ponto de corte que divide 
os dados ordenados, por exemplo, o percentil 85 divide as observações de modo que 
85% dos dados estão entre o valor mínimo e o valor do percentil 85. Quartil são os pon-
tos de corte que dividem o conjunto em quatro partes igual, portanto, o primeiro quartil é 
o percentil 25, o segundo é o percentil 50 e o terceiro é o percentil 75. O segundo quartil 
é sinônimo de mediana já que os dois dividem as observações na metade. A figura a 
seguir esquematiza os três pontos de corte no conjunto de dados.
Figura 01. Esquema da localização dos quartis
A
25% 25% 25% 25%
B C
Fonte: elaborada pela autora. 
Para calcular os quartis, a primeira etapa é organizar os dados em ordem crescente 
(do menor para o maior). A segunda etapa, por sua vez, é encontrar o segundo quartil. 
Quando o número de dados for ímpar, o segundo quartil será um valor do conjunto, e 
quando for par, ele será a média dos dois valores centrais. 
“A” é o primeiro quartil, “B” é o segundo quartil ou mediana e “C” é o terceiro quartil.
U3
34Bioestatística e Epidemiologia
Estatística descritiva
A terceira etapa é dividir em dois grupos, de modo que o ponto de corte é a mediana. 
Quando o número de dados for ímpar, o segundo quartil será um valor do conjunto que 
deverá estar presente nos dois dos grupos. Quando o número de dados for par, todos 
os dados serão distribuídos nos grupos, independentemente dos dados centrais serem 
utilizados para calcular a mediana.
A quarta etapa é encontrar o local do ponto de corte para dividir o grupo ao meio: o primei-
ro quartil é o ponto que divide na metade o grupo de dados com as observações de menor 
valor; o terceiro quartil é o ponto que divide na metade o grupo de dados com as observa-
ções de maior valor. Assim, no grupo, quando o número de dados for ímpar, o quartil será 
um valor do conjunto, mas quando for par será a média dos dois valores centrais.
O conjuntoA: {2,6,12,17,21} tem número cinco observações (número ímpar), 
portanto, o ponto que divide esse conjunto na metade é uma observação. 
Considerando que ele já está ordenado, o valor que está na posição central e 
consegue dividir o conjunto em dois grupos de dois é o 12. 
O conjunto B: {7, 9, 13, 15} tem número quatro observações (número par), logo, 
o ponto que divide esse conjunto na metade é a média dos dois valores centrais. 
Como ele já está ordenado, a posição central que consegue dividir o conjunto em 
dois grupos de dois é um valor entre 9 e 13. Nesse caso, é preciso fazer a média 
entre 9 e 13, logo, 
 
soma dos dados
númerodedados
= 9 13
2
+
= 22 11.
2
= 
Cálculo quartil número par de observações 
Uma pesquisa entrevistou seis universitários com os dados descritos na tabela a seguir:
IDADE 20 21 57 40 23 18
Quartis:
1) Colocar em ordem crescente: 18 20 21 23 40 57
2) Número par de observações (seis). 
2a) Achar os valores centrais: 21 e 23
2b) Realizar o cálculo do 2º quartil: 
21 23
2
+
=
 
44 22
2
=
3) Dividir em grupo: Grupo Z: 18 20 21
EX
EM
PL
O
35 Bioestatística e Epidemiologia
U3 Estatística descritiva
EX
EM
PL
O
 Grupo Y: 23 40 57
4) número ímpar de observações em cada grupo (três).
4a) Achar o 1º quartil no grupo Z: 20
4a) Achar o 3º quartil no grupo Y: 40
Desses dados, o primeiro quartil é 20 anos, o segundo quartil (mediana) é 22 anos e 
o terceiro quartil é 40 anos.
Cálculo quartil número ímpar de observações 
Uma pesquisa entrevistou sete universitários com os dados descritos na tabela a seguir: 
IDADE 20 57 40 18 24 26 18
Quartis:
1) Colocar em ordem crescente: 18 18 20 24 26 40 57
2) Número ímpar de observações (sete).
2a) Achar o 2º quartil: 24 
3) Dividir em grupo (no caso do 2º quartil ser uma observação, essa estará nos dois 
grupos): Grupo Z: 18 18 20 24
 Grupo Y: 24 26 40 57
4) Número par de observações em cada grupo (quatro).
4a) Achar o 1º quartil no grupo Z: 
18 20
2
+
= 
38 19
2
=
4a) Achar o 3º quartil no grupo Y: 
26 40
2
+
= 
66 33
2
=
Nesses dados, o primeiro quartil é 19 anos, o segundo quartil (mediana) é 24 anos e 
o terceiro quartil é 33 anos.
EX
EM
PL
O
U3
36Bioestatística e Epidemiologia
Estatística descritiva
A terceira medida de dispersão é o desvio padrão, que descreve o quanto os dados 
estão distribuídos em torno da média. Então, toda vez que usar desvio padrão, deve-se 
usar também a média. O desvio padrão é calculado como a raiz quadrada de variância. 
SA
IB
A 
M
A
IS
Para saber mais sobre o conceito de variância, leia a obra Introdução à Bioestatística 
(p. 47-51), de Sonia Vieira, lançado em 2016.
Disponível na biblioteca digital em: https://integrada.minhabiblioteca.com.br/#/
books/9788595150911/epubcfi/6/20%5B%3Bvnd.vst.idref%3DaB9788535277166000
042%5D!/4/2/6/12/2/4/4%400:0. Acesso em: 15 mar. 2021.
Fórmula de desvio-padrão de uma amostra:
( )22
2
 
1
x
x
ns
n
−
=
−
∑
∑2
Em que: x é um dado; ∑ representa somatória; x∑ é a somatória de todos os dados; 
2x∑ é a somatória dos quadrados dos dados; e n é o número de dados.
Apesar de existir a possibilidade de realizar manualmente os cálculos de medidas de 
tendência central e de dispersão, a rotina do pesquisador é que softwares façam os cál-
culos. Para utilizar a fórmula de desvio padrão para amostra, primeiramente, é necessário 
calcular as somatórias para obter todos os valores que devem ser inseridos na fórmula. 
EX
EM
PL
O
Cálculo de desvio padrão 
Uma pesquisa entrevistou quatro crianças com idades de 2, 6, 10 e 12 anos.
 
Desvio Padrão:
1) Calcular os valores da somatória:
2
6
10
12
x 2x
22 4=
26 36=
210 100=
212 144=
2 284x =∑ 30x =∑
about:blank
about:blank
about:blank
37 Bioestatística e Epidemiologia
U3 Estatística descritiva
EX
EM
PL
O
2) Coloque os valores na fórmula. Atente-se para não confundir onde colocar 
x∑ e 
2x∑ , e para não sumir com a potência. Como n é o número de dados, nesse caso, 
4n = . 
( ) ( )
2
2
2
2 2
30
284
4 
1 4 1
x
x
ns
n
− −
= =
− −
∑
∑
3) Resolver a conta:
( )2
2
30
284
4
4 1
−
=
−
 realizar a potência 
230
2
900284
4
4 1
−
=
−
 realizar a divisão 
900
4
2
284 225
4 1
−
=
−
 realizar as duas subtrações
2
59
3
= realizar a divisão
2 19,67= realizar a raiz quadrada
4, 43= 
O desvio padrão é de 4,43 anos.
1.1 VANTAGENS E DESVANTAGENS
A vantagem da amplitude ou da menção do valor mínimo e máximo é incluir todos os 
valores, mas, por outro lado, é uma medida muito afetada por valores extremos. Para 
descrever a idade dos óbitos ocorridos em um mês, o pesquisador relata que a idade 
variou de horas de vida até 106 anos. Com esse intervalo grande não é possível saber 
como de fato está a distribuição de óbitos.
Os quartis conseguem fornecer mais dados da dispersão e não são afetados por va-
lores extremos. A distância interquartílica, que é a distância entre o primeiro e terceiro 
quartil, é um valor consegue descrever se metade da amostra está afastada ou próxima 
a mediana. Uma desvantagem dos quartis é que existem métodos diferentes de calcu-
U3
38Bioestatística e Epidemiologia
Estatística descritiva
lá-los, até mesmo entre os softwares, apesar da diferença entre eles ser pequena. Além 
disso, eles não são adequados para manipulações matemáticas.
O desvio padrão é adequado para manipulações matemática e é utilizado para outras 
análises estatísticas. Ele é uma medida extremamente adequada para descrever vari-
áveis com distribuição normal, no entanto, quando a amostra não tem uma distribuição 
normal, o desvio padrão não deve ser utilizado.
2. PROBABILIDADE
A teoria clássica de probabilidade é aquela em que, normalmente, abordamos no Ensi-
no Médio, em que calculávamos qual a probabilidade de se tirar uma carta de baralho 
específica ou de tirar um número no dado. As características dos fenômenos probabilís-
ticos se mantem no campo da saúde. 
A probabilidade de um evento único acontecer é calculada pela definição básica, conforme a 
fórmula a seguir. Ela é somente para eventos mutualmente exclusivos e igualmente prováveis 
e eventos independentes ou condicionantes. Normalmente, ela é expressa por número entra 
0 a 1, mas, frequentemente, usa-se a porcentagem para ficar mais fácil de compreender.
Fórmula de probabilidade (evento único):
 
 
númerodeeventos esperados
númerodeeventos possíveis
3
No ensino médio, aprende-se que a probabilidade de se ter um filho do sexo masculino 
é de 50%. Para chegar a esse valor, utilizamos a seguinte Equação 3, logo:
( )
( )
1 
 2 
eventoesperado nascer homemnúmerodeeventos esperados
número deeventos possíveis eventos possíveis nascer homemou mulher
=
 
1
2 
= 0,5 x 100 = 50%
Contudo, como podemos calcular a probabilidade de uma criança nascer com uma 
anomalia congênita? Nesse caso, podemos considerar que é 50% também, já que só 
existem dois eventos esperados (nascer com ou sem anomalia)?
Na área da saúde, as probabilidades de eventos, como a chance de ficar doente ou de 
se curar, são calculadas a partir do que é observado na população. Então, pesquisas 
descritivas que contam os eventos são muito importantes para termos as probabilida-
des. Logo, qual a probabilidade de ter uma criança com anomalia congênita?
=
39 Bioestatística e Epidemiologia
U3 Estatística descritiva
Pelas informações divulgadas pelo Ministério da Saúde, em 2019, no Brasil nasceram 
2.849.146 crianças, em que 24.838 nasceram com anomalias. Preenchendo a fórmula com 
esses valores, temos que: 
 
 
númerodeeventos esperados
númerodeeventos possíveis = 
24.838
2.849.146 = 0,00872 ×100 = 0,87%.
O cálculo realizado é similar ao de frequência relativa. Portanto, dependendo de qual foi a 
amostra e como os dados foram coletados, pode-se considerar que a probabilidade de um 
evento acontecer é a frequência relativa que alguma pesquisa demostrou que ela acontece.
PA
R
A 
R
EF
LE
TI
R
Pelo ISA-Capital de 2008, a proporção de pessoas com mais de 20 anos quetinham 
Hipertensão Arterial Sistêmica (HAS) foi de 22%. Uma nutricionista atendeu em um 
dia 20 consultas de adultos ou idosos e nenhum deles tinha HAS. De acordo com a 
probabilidade, ela deveria ter atendido 4 hipertensos (22% de 20 consultas = 0,22 x 
20 = 4,4). Considerando que a proporção de hipertensos na população está correta, o 
que será que aconteceu para a probabilidade errar?
 ` O número de pessoas atendidos é baixo e pode ter ocorrido um viés de seleção e 
a amostra não representar a população.
 ` Ao acaso, naquele dia, não houve hipertensos. Mas nos outros dias da semana, ela 
atendeu mais de 5 doentes.
 ` O público-alvo da nutricionista é específico para pessoas jovens e saudáveis e, 
portanto, a amostra não representa a população total.
 ` Existem pessoas que não estão diagnosticadas com HAS, mas já tem a doença e, 
provavelmente, alguns dos 20 pacientes estavam nessa situação.
Para profissionais da saúde, a principal característica de probabilidade é que ela não é 
capaz de determinar resultados. Então, por mais que eu tenha o gene marcador de cân-
cer, que me dá 95% de probabilidade de desenvolver a doença, isso não significa que 
eu de fato eu terei câncer. Além disso, pode-se soma a isso a interpretação da chance 
é subjetiva, isto é, alguém pode achar que 95% de chance de ter câncer é muito alta 
e querer, portanto, fazer tratamentos precoces e cirurgias para evitar a doença. Outra 
pessoa pode achar que uma sobrevida de 5% alta e que vai aproveitar esse resultado 
para aproveitar a vida. A reação das pessoas às probabilidades de eventos relaciona-
dos a sua saúde é muito variável. Por isso, toda vez que se for discutir probabilidade de 
sucesso do tratamento, de voltar a andar ou de “voltar ao normal”, é importante deixar 
claro que probabilidade não garante um futuro. 
A longo prazo, por sua vez, é possível que a proporção de eventos observados se aproxime 
da probabilidade do evento acontecer. Nesse sentido, considere que a média de sobrevida 
após um diagnóstico de câncer de pulmão é de 1 ano. Um profissional começa seu trabalha 
em uma clínica de oncologia e, com o passar do tempo e de atendimentos, ele observará 
que a maioria dos casos de fato morrem próximo de 1 ano de diagnóstico. No entanto, ha-
verá exceções, desde quem morreu dias depois ou de quem demorou 5 anos para falecer. 
U3
40Bioestatística e Epidemiologia
Estatística descritiva
Com a experiência, os dados vão cada vez mais se aproximar da distribuição normal. 
Contudo, sempre há a chance de alguém ser a exceção, que em estatística pode ser 
chamado de ponto fora da curva (outlier). Ao ter um diagnóstico, não é possível saber 
em qual parte da curva você ficará, mas é possível saber quais são as probabilidades.
Portanto, as probabilidades devem ser usadas no cotidiano do profissional de saúde. O 
uso da probabilidade ocorre principalmente como referência para decisão de condutas 
e possíveis pré-conceitos que ajudam no atendimento. Dessa forma, é preciso ter um 
equilíbrio e saber quando usar e como transmitir a informação para pacientes ou usuários. 
3. DISTRIBUIÇÃO NORMAL
Os matemáticos no século XIX observaram que, 
em grande escala ou na natureza, os eventos bio-
lógicos tendem a seguir uma mesma distribuição 
de frequência. Desse modo, pode-se pressupor 
que as variáveis de uma pesquisa tenham distri-
buição normal ou testar estatisticamente se a cur-
va dos dados observados é similar. 
A Figura 2 representa que os eventos tendem a 
se repetir próximo a posição central e que poucos 
casos acontecem longe do esperado. Portanto, a 
curva do gráfico representa a distribuição normal 
e, também, pode ser chamada de curva de Gauss. 
A distribuição normal tem características bem co-
nhecidas que são iguais para todas as variáveis 
que apresentem a distribuição. O comportamento 
da variável será independente do valor das me-
didas de tendência e dispersão e do que se está 
medindo (peso, tempo de sobrevida e tempera-
tura corpórea). Dessa forma, variáveis contínuas 
tendem a formar curvas mais próximas à teórica 
por conseguir aferir os valores de forma contínua.
A curva da distribuição normal é em formato de sino 
e é simétrica em torno da média, isso faz com que 
a mediana e a moda sejam iguais a média. Toda a 
população está sobe a curva, em que metade tem valores menores do que a média.
A distribuição da frequência de eventos em torno da média é uma constante. Assim, por 
meio de cálculos matemático, chegou-se a proporção descrita na Figura 3. 
Figura 02. Esquema que descreve 
a distribuição normal
Fo
nt
e:
 1
23
rf.
41 Bioestatística e Epidemiologia
U3 Estatística descritiva
 ` 68,26% dos dados estão a um desvio padrão (𝜎) da média (µ).
 � Fórmula limite inferior µ σ= − .
 � Fórmula limite superior .µ σ= +
 ` 95,44% dos dados estão a dois desvios padrões (2𝜎) da média (µ).
 � Fórmula limite inferior 2µ σ= − .
 � Fórmula limite superior 2µ σ= + .
 ` 99,72% dos dados estão a três desvios padrões (𝜎) da média (µ).
 � Fórmula limite inferior 3µ σ= − .
 � Fórmula limite superior 3µ σ= + .
Figura 03. Frequência relativa dos eventos a partir de distâncias de desvios-padrões (𝜎) da média (µ)
Fonte: 123rf.
Para calcular os limites mínimos e máximos que estão na proporção de casos, é só 
somar ou subtrair do desvio padrão da média. Considere que, o tempo de duração de 
sintomas de uma doença febril tem distribuição normal, em que a média de duração dos 
sintomas é de 7 dias com um desvio padrão de 1,4 dia. Essas medidas foram calcula-
U3
42Bioestatística e Epidemiologia
Estatística descritiva
das em uma amostra representativa com tamanho amostral adequado e o estudo não 
apresentou vieses. Pelas características da distribuição normal, temos:
 ` 68,26% dos casos dessa doença teriam de 5,6 a 8,4 dias de sintomas.
 � Fórmula limite inferior 7 1,4 5,6µ σ= − = − = .
 � Fórmula limite superior 7 1,4 8,4µ σ= + = + = .
 ` 95,44% dos casos dessa doença teriam de 4,2 a 9,8 dias de sintomas.
 � Fórmula limite inferior ( )7 2 1,4 7 2,8 4,2µ σ= − = − × = − = .
 � Fórmula limite superior ( )7 2 1,4 7 2,8 8,4.µ σ= + = + × = + =
 ` 99,72% dos casos dessa doença teriam de 5,6 a 8,4 dias de sintomas.
 � Fórmula limite inferior ( )7 3 1,4 7 4,2 0µ σ= − = − × = − = .
 � Fórmula limite superior ( )7 3 1, 4 7 4,2 11,2µ σ= + = + × = + = .
Com as diversas frequências que a curva de distribuição normal fornece, pode-se pen-
sar em probabilidades de eventos acontecerem e na definição de situações normais.
4. ANORMALIDADES
Há várias estratégias para definir se um comportamento, resultado, sinal ou sintoma 
está dentro do padrão ou “normal”. Nesse sentido, a mais comum e mais utilizada é a 
definição de que é normal tudo que acontece com grande frequência. A principal refe-
rência são os padrões da curva de distribuição normal, em que há um consenso de que 
tudo que está dentro de 2 desvios padrões da média (95,44%) é normal. 
Se a pessoa se encontra nos extremos da curva de Gauss, ela pode ser uma pessoa 
saudável com padrões de referência fora do comum ou pode ser uma pessoa doen-
te. Desse modo, cabe julgar outras características, sinais e sintomas do paciente. Por 
exemplo, ao atender uma pessoa com temperatura de 37,3ºC que está com calafrios 
e dor no corpo, pode-se considerar que ela está com febre apesar de o valor da tem-
peratura estar dentro do normal, ao mesmo tempo que uma pessoa com 38ºC e sem 
nenhum sintoma pode estar saudável.
Com isso, outro critério que se pode usar para definir normalidade é apresentar uma 
forma clínica diferente do que é considerado um bom estado de saúde. O quanto de 
choro é considerado fora do normal para alguém de luto ou todo choro é patológico? 
Se ao tratar a provável anormalidade e a pessoa melhorar é possível definir que o 
quadro era anormal.
43 Bioestatística e Epidemiologia
U3 Estatística descritiva
5. OBJETO DE APRENDIZAGEM
A definição de normalidade ou alteração de peso nas crianças foi feita a partir dos con-
teúdosaprendidos na unidade de hoje. A Organização Mundial da Saúde (OMS) dispo-
nibiliza as curvas de crescimento (peso, altura e índice de massa corpórea por peso) 
com pontos de corte, a partir de percentis ou de escore z (1). A Figura 4 é um exemplo 
de curva de peso por idade, em que as curvas com escore z usa como base o desvio 
padrão, em que 1 escore significa 1 desvio padrão. 
Peso-por-idade MASCULINO
De 0 a 2 anos (escore z)
Pe
so
 (K
g)
Idade (meses e anos completos)
0
1 2 3 4 5 6 7 8 9 10 11
1 ano
Meses
2 anos
1 2 3 4 5 6 7 8 9 10 11
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
Fonte: OMS ([s.d.], [n. p.]).
A caderneta de saúde da criança (BRASIL, 2017) é a carteira de vacinação com diver-
sas outras informações sobre o crescimento e o desenvolvimento dela. Entre as infor-
mações disponíveis nesse impresso temos a Figura 5, que compara pontos de corte em 
percentis e em desvio padrão (escore z).
Figura 04. Gráfico da curva de crescimento de peso por idade de crianças do sexo 
masculino de 0 a 2 anos com ponto de corte a partir do escore z
U3
44Bioestatística e Epidemiologia
Estatística descritiva
Figura 05. Medidas de dispersão escores z e percentis
+3,0 escores z
+2,0 escores z
+1,881 escore z
+0,674 escore z
-0,674 escore z
97º percentil
75º percentil
25º percentil
+1,645 escore z 95º percentil
+1,282 escore z 90º percentil
+1,0 escore z
Média
99,85º percentil
97,72º percentil
84,2º percentil
50º percentil
15,8º percentil
2,28º percentil
0,15º percentil
= mediana
( 110% A/I 120% P/I)~= ~=
-1,0 escore z
-2,0 escore z
-3,0 escore z
( 90% A/I 80% P/I)~= ~=
-1,282 escore z 10º percentil
-1,645 escore z 5º percentil
-1,881 escore z
-2,67 escore z
3º percentil
0,4º percentil
Fonte: Brasil (2017, p. 52). 
Pela OMS ([s.d.]), a definição de normalidade do peso é a partir de onde a criança está 
no gráfico. Logo, as definições variam conforme a idade e variável (peso, altura ou ín-
dice de massa corpórea).
Tabela 01. Pontos de corte e classificação do peso para a idade para crianças de 0 a 10 anos
PONTO NO GRÁFICO CLASSIFICAÇÃO DO PESO
> +2 escores z Peso elevado para idade.
≥ -2 e ≤ +2 escores z Peso adequado para idade.
≥ -3 e ≤ -2 escores z Peso baixo para idade.
< -3 escores z Peso muito baixo para idade.
Fonte: Brasil (2011, p. 15).
Uma criança brasileira do sexo masculino que fará 2 anos de idade daqui dois dias pesa 
16,5kg. Após colocar esses valores na curva de crescimento (Figura 4), o que tem mais 
chance de ser real:
45 Bioestatística e Epidemiologia
U3 Estatística descritiva
a. A criança tem padrões fora do frequente, então, aquele peso é adequado para ela; ou
b. A probabilidade desse menino ter uma anormalidade é baixa, então, pode-se considerar 
que o peso não é adequado para a idade?
Comentário: O mais provável é que a criança esteja com peso elevado para a idade e, 
portanto, algum tipo de orientação dietética deve ser realizada. A probabilidade é baixa 
(menor de 4,56%) da criança estar com peso adequado e ter características diferentes 
da maioria da população e, por isso, estar fora da faixa de normalidade da curva. Nesse 
sentido, as informações sobre a altura e o índice de massa corpórea (IMC), que também 
tem seus gráficos, pode ajudar na interpretação do dado. Se só no peso a criança está 
acima da curva de 2 escores z, significa que a criança está acima do peso. Outra estra-
tégia que contribui para a avaliação é acompanhar o peso da criança ao longo do tempo, 
a fim de saber se ela está seguindo as inclinações das curvas de referência ou teve um 
aumento fora do esperado.
U3
46Bioestatística e Epidemiologia
Estatística descritiva
REFERÊNCIAS BIBLIOGRAFICAS
BRASIL. Ministério da Saúde. Caderneta de saúde da criança: menino. 11 ed. Brasília, DF: Ministério da 
Saúde, 2017. Disponível em: http://bvsms.saude.gov.br/bvs/publicacoes/caderneta_saude_crianca_meni-
no_11ed.pdf. Acesso em: 9 fev. 2021.
BRASIL. Ministério da Saúde. Secretaria de Atenção à Saúde. Departamento de Atenção Básica. Orienta-
ções para a coleta e análise de dados antropométricos em serviços de saúde: Norma Técnica do Sis-
tema de Vigilância Alimentar e Nutricional - SISVAN. Brasília, DF: Ministério da Saúde, 2011. Disponível em: 
http://189.28.128.100/dab/docs/portaldab/publicacoes/orientacoes_coleta_analise_dados_antropometricos.
pdf. Acesso em: 9 fev. 2021.
FLETCHER, R. H.; FLETCHER, S. W.; FLETCHER, G. Epidemiologia clínica: elementos essenciais. 5. ed. 
Porto Alegre: ArtMed, 2014.
ORGANIZAÇÃO MUNDIAL DA SAÚDE (OMS). Curva de crescimento peso por idade meninos de 0 a 2 anos 
– escore z. Disponível em: 
https://www.who.int/docs/default-source/child-growth/child-growth-standards/indicators/weight-for-age/cht-w-
fa-boys-z-6-2.pdf?sfvrsn=ec5b30eb_6. Acesso em: 9 fev. 2021.
ORGANIZAÇÃO MUNDIAL DA SAÚDE (OMS). Documentos com padrões de crescimento de crianças. Dispo-
nível em: https://www.who.int/tools/child-growth-standards/standards. Acesso em: 9 fev. 2021.
VIEIRA, S. Introdução à bioestatística. 5. ed. Rio de Janeiro: Elsevier, 2016.
about:blank
about:blank
about:blank
about:blank
about:blank
about:blank
48
UNIDADE 4
EPIDEMIOLOGIA DESCRITIVA
INTRODUÇÃO
É possível saber a proporção de pessoas que tem diabetes ou que usam drogas ilíci-
tas? Ao longo do tempo, será que o número de casos de AIDS reduziu no Brasil? Neste 
país, será que há regiões que têm mais ou menos casos que as outras? A AIDS é mais 
frequente em algum tipo de população? As informações abordadas nessa unidade aju-
darão você a entender como essas informações podem ser obtidas.
Nesta unidade, abordaremos os tipos de estudos epidemiológicos, que são classifica-
dos como descritivos ou analíticos. Os estudos analíticos buscam associações entre 
variáveis, como fatores de risco para doença ou desfechos possíveis de um evento. 
Enquanto os estudos descritivos têm como objetivo principal descrever características 
da doença, pessoas, locais ou tempo, como também para identificar casos, analisar 
tendências, fazer diagnóstico situacional da população e gerar hipóteses.
Além disso, há outra classificação quanto a intervenção estudada, por exemplo, os 
estudos observacionais têm as intervenções decididas por profissionais de saúde que 
não pertencem a equipe da pesquisa. A pesquisa, por sua vez, só observa o que foi 
realizado. Já nos estudos experimentais, a decisão de qual intervenção o participante 
da pesquisa será submetido é realizada pelos pesquisadores.
1. ESTUDO TRANSVERSAL, DE PREVALÊNCIA E SECCIONAL
O estudo transversal é descritivo e observacional. Esse nome tem origem da definição que as 
informações são coletadas em um único ponto do tempo, como se a linha do tempo sofresse 
um corte transversal ou como uma fotografia, ele também pode ser chamado de estudo sec-
cional ou de prevalência. A principal característica do estudo transversal é que as informações 
das variáveis dependentes e independentes são coletadas simultaneamente.
Figura 01. Esquema do desenho de estudo transversal
Pessoa com presença 
de uma ou mais 
variáveis independentes.
Pessoa com presença 
de uma ou mais 
variáveis independentes.
Pessoas com presença da 
variável dependente
Pessoas com presença da 
variável dependente
Fonte: elaborada pela autora.
49 Bioestatística e Epidemiologia
U4 Epidemiologia descritiva
Dessa forma, a principal finalidade desse tipo estudo é medir e descrever frequências 
de doenças e fatores de risco. Normalmente, ele é utilizado para descrever doenças 
comuns e de longa duração, como levantamentos de dados que descrevem dados já 
registrados e os inquéritos populacionais de saúde que buscam as informações para 
complementar os dados coletados por outros meios. 
A Pesquisa Nacional de Saúde (PNS) é o inquérito de saúde da população brasileira, por 
meio de entrevistas com amostra de base domiciliar e de âmbito nacional, realizada em 
parceria com o Instituto Brasileiro

Outros materiais