Logo Passei Direto
Buscar
Material
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

ACESSE AQUI O SEU 
LIVRO NA VERSÃO 
DIGITAL!
PROFESSORAS
Dra. Izabel Galhardo Demarchi
Me. Renata Cristina Souza Chatalov
Bioestatística e 
Epidemiologia
https://apigame.unicesumar.edu.br/qrcode/8985
FICHA CATALOGRÁFICA
C397 CENTRO UNIVERSITÁRIO DE MARINGÁ. 
Núcleo de Educação a Distância. DEMARCHI, Izabel Galhardo; 
CHATALOV, Renata Cristina Souza.
Bioestatística e Epidemiologia. 
Izabel Galhardo Demarchi, Renata Cristina Souza Chatalov.
Maringá - PR.: Unicesumar, 2021. 
328 p.
“Graduação - EaD”. 
1. Bioestatística 2. Epidemiologia 3. Ciências Biológicas. EaD. 
I. Título. 
CDD - 22 ed. 615 
CIP - NBR 12899 - AACR/2
ISBN 978-65-5615-521-0
Impresso por: 
Bibliotecário: João Vivaldo de Souza CRB- 9-1679
Pró Reitoria de Ensino EAD Unicesumar
Diretoria de Design Educacional
NEAD - Núcleo de Educação a Distância
Av. Guedner, 1610, Bloco 4 - Jd. Aclimação - Cep 87050-900 | Maringá - Paraná
www.unicesumar.edu.br | 0800 600 6360
 
PRODUÇÃO DE MATERIAIS
DIREÇÃO UNICESUMAR
NEAD - NÚCLEO DE EDUCAÇÃO A DISTÂNCIA
Reitor Wilson de Matos Silva Vice-Reitor Wilson de Matos Silva Filho Pró-Reitor de Administração Wilson de Matos Silva Filho 
Pró-Reitor Executivo de EAD William Victor Kendrick de Matos Silva Pró-Reitor de Ensino de EAD Janes Fidélis Tomelin 
Presidente da Mantenedora Cláudio Ferdinandi
Diretoria Executiva Chrystiano Mincoff, James Prestes, Tiago Stachon Diretoria de Graduação e Pós-graduação Kátia Coelho Diretoria 
de Cursos Híbridos Fabricio Ricardo Lazilha Diretoria de Permanência Leonardo Spaine Head de Graduação Marcia de Souza Head 
de Metodologias Ativas Thuinie Medeiros Vilela Daros Head de Tecnologia e Planejamento Educacional Tania C. Yoshie Fukushima 
Head de Recursos Digitais e Multimídias Franklin Portela Correia Gerência de Planejamento e Design Educacional Jislaine Cristina 
da Silva Gerência de Produção Digital Diogo Ribeiro Garcia Gerência de Recursos Educacionais Digitais Daniel Fuverki Hey 
Supervisora de Design Educacional e Curadoria Yasminn T. Tavares Zagonel Supervisora de Produção Digital Daniele Correia
Coordenador de Conteúdo Sidney Edson Mella Junior Revisão Textual Meyre Aparecida Barbosa da Silva Editoração 
Matheus Silva de Souza Ilustração Bruno Cesar Pardinho, Geison Odlevati Ferreira Fotos Shutterstock. 
Tudo isso para honrarmos a 
nossa missão, que é promover 
a educação de qualidade nas 
diferentes áreas do conhecimento, 
formando profissionais 
cidadãos que contribuam para o 
desenvolvimento de uma sociedade 
justa e solidária.
Reitor 
Wilson de Matos Silva
A UniCesumar celebra os seus 30 anos de 
história avançando a cada dia. Agora, enquanto 
Universidade, ampliamos a nossa autonomia 
e trabalhamos diariamente para que nossa 
educação à distância continue como uma das 
melhores do Brasil. Atuamos sobre quatro 
pilares que consolidam a visão abrangente do 
que é o conhecimento para nós: o intelectual, o 
profissional, o emocional e o espiritual.
A nossa missão é a de “Promover a educação de 
qualidade nas diferentes áreas do conhecimento, 
formando profissionais cidadãos que contribuam 
para o desenvolvimento de uma sociedade 
justa e solidária”. Neste sentido, a UniCesumar 
tem um gênio importante para o cumprimento 
integral desta missão: o coletivo. São os nossos 
professores e equipe que produzem a cada dia 
uma inovação, uma transformação na forma 
de pensar e de aprender. É assim que fazemos 
juntos um novo conhecimento diariamente.
São mais de 800 títulos de livros didáticos 
como este produzidos anualmente, com a 
distribuição de mais de 2 milhões de exemplares 
gratuitamente para nossos acadêmicos. Estamos 
presentes em mais de 700 polos EAD e cinco 
campi: Maringá, Curitiba, Londrina, Ponta Grossa 
e Corumbá), o que nos posiciona entre os 10 
maiores grupos educacionais do país.
Aprendemos e escrevemos juntos esta belíssima 
história da jornada do conhecimento. Mário 
Quintana diz que “Livros não mudam o mundo, 
quem muda o mundo são as pessoas. Os 
livros só mudam as pessoas”. Seja bem-vindo à 
oportunidade de fazer a sua mudança! 
Aqui você pode 
conhecer um 
pouco mais sobre 
mim, além das 
informações do 
meu currículo.
Graduada em Engenharia Ambiental e Sanitária, Tecnolo-
gia Ambiental, com especialização em Gestão Ambiental 
e Mestrado em Engenharia Urbana. Docente desde 2012, 
nos cursos de Engenharia Civil e Engenharia Elétrica. 
No final de 2012 iniciou as atividades na educação à 
distância. Tem experiência com a disciplina de estatís-
tica há mais de 8 anos e vasta experiência na escrita de 
materiais nesta área. Além da área de Bioestatística, tem 
afinidade também pela área de tratamento de efluentes, 
resíduos sólidos e licenciamento ambiental.
Lattes: http://lattes.cnpq.br/7312835687328748
http://lattes.cnpq.br/7312835687328748
https://apigame.unicesumar.edu.br/qrcode/8463
Aqui você pode 
conhecer um 
pouco mais sobre 
mim, além das 
informações do 
meu currículo.
Doutora em Ciências da Saúde pela Universidade Esta-
dual de Marin gá-UEM (2015) e graduação em Farmácia 
(2005) com habilitação em Análises Clínicas (2006) pela 
Universidade Estadual do Oeste do Pa raná-UNIOESTE. 
Atualmente, é professora assistente na Universidade 
Estadual de Maringá. Tem experiência em Saúde Pú-
blica, Epidemio logia e Imunologia Clínica, desde 2009. 
Desenvolve projetos de pes quisa, extensão e de ensino 
nas áreas de Epidemiologia e Imunologia Clínica, com 
ênfase em doenças infecciosas.
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4267101H6
Quando identificar o ícone de QR-CODE, utilize o aplicativo Unicesumar 
Experience para ter acesso aos conteúdos on-line. O download do aplicativo 
está disponível nas plataformas: Google Play App Store
Ao longo do livro, você será convidado(a) a refletir, questionar e transformar. Aproveite 
este momento.
PENSANDO JUNTOS
EU INDICO
Enquanto estuda, você pode acessar conteúdos online que ampliaram a discussão sobre 
os assuntos de maneira interativa usando a tecnologia a seu favor.
Sempre que encontrar esse ícone, esteja conectado à internet e inicie o aplicativo 
Unicesumar Experience. Aproxime seu dispositivo móvel da página indicada e veja os 
recursos em Realidade Aumentada. Explore as ferramentas do App para saber das 
possibilidades de interação de cada objeto.
REALIDADE AUMENTADA
Uma dose extra de conhecimento é sempre bem-vinda. Posicionando seu leitor de QRCode 
sobre o código, você terá acesso aos vídeos que complementam o assunto discutido
PÍLULA DE APRENDIZAGEM
Professores especialistas e convidados, ampliando as discussões sobre os temas.
RODA DE CONVERSA
EXPLORANDO IDEIAS
Com este elemento, você terá a oportunidade de explorar termos e palavras-chave do 
assunto discutido, de forma mais objetiva.
https://apigame.unicesumar.edu.br/qrcode/3881
BIOESTATÍSTICA E EPIDEMIOLOGIA
Você já teve a curiosidade de conhecer um pouco mais sobre o que faz um profissional 
da área da saúde? Pensou? Me diga quais áreas você irá atuar: Diagnóstico, Medica-
mentos, Imagenologia, Alimentos, Industria, Epidemiologia, Área Ambiental? Você sabia 
que as técnicas utilizadas na área de Bioestatística e Epidemiologia poderão te ajudar 
em seu cotidiano, na maioria das tuas áreas de atuação? Você sabe como? 
Com os conhecimentos obtidos na disciplina de Bioestatística e Epidemiologia, você 
aplicará os conceitos destas áreas no campo da biologia e da saúde, sendo essencial 
para problematização, para o planejamento, coleta de dados, análise crítica e principal-
mente como ferramenta para auxílio da tomada de decisão e gestão de saúde.
Na disciplina da Bioestatística muitas vezes, você vai trabalhar com análise de dados, 
certo? Para isso é importante que você entenda como “tratar” esses dados provenien-
tes de uma pesquisa. Assim, sugerimos que você faça uma pesquisa no site do IBGE 
e veja quais são as regras para construir um quadro e uma tabela. Depois faça uma 
análise dos dados populacionais, e também, no painel de indicadoressobre a questão 
de saúde e saneamento do Brasil. Esta aproximação servirá de base para trabalharmos 
os conceitos da epidemiologia.
Você percebeu como é fácil construir uma tabela a partir de dados fidedignos? É impor-
tante que você não se esqueça das regras específicas, pois delas dependem um bom 
resultado e interpretação adequada das informações levantadas. 
Neste estudo iniciaremos com a oportunidade de conhecer a origem da Bioestatística, 
sua definição, sua importância, bem como entender que as técnicas estatísticas são 
essenciais para uma pesquisa. Além disso, você vai compreender como fazer uma 
coleta de dados utilizando as principais técnicas de amostragem, como construir tabe-
las e compreender suas regras. Vamos aprender também a elaborar gráficos e fazer 
sua leitura e interpretação. É fundamental entender como ocorre a análise dos dados 
oriundos de uma pesquisa para que se possa analisar situações quanto à frequência, 
incidência, ocorrências, dentre outras variáveis. Informações de como trabalhar com 
as medidas de posição, separatrizes, variabilidade podem ajudar em experimentos, em 
resultados e em possíveis situações que envolvam as incertezas, e são imprescindíveis 
para futura atuação profissional. Na parte de bioestatística, finalizamos com um as-
sunto muito importante para sua formação, a inferência estatística, que visa por meio 
de testes, analisar uma amostra e fazer projeções para a população. 
Na segunda parte deste livro estudaremos os princípios básicos de epidemiologia. 
Esta ciência traz ferramentas fundamentais para os profissionais de saúde, e possui 
interfaces com outras disciplinas, como a estatística, a geografia, a ecolo gia, a ética, a 
sociologia e a clínica. Inicialmente apresentaremos os conceitos, objetivos e perspectivas 
históricas da epidemiologia, incluindo a compreensão do processo saúde-doença, os 
fatores etiológicos (preditores), a causa lidade e as medidas preventivas. Na sequência 
estudaremos os métodos epidemiológicos utilizados para a compreensão da distribuição 
das doenças, a coleta de dados das populações/indivíduos, os indicadores de saúde e 
a estrutura e funções da Vigilância Epidemiológica. As medidas de frequência, preva-
lência e incidência serão detalhadas na Unidade III, permitindo que você compreenda 
a distri buição dos casos de acordo com a duração e tempo da doença. Além disso, 
também serão definidas e interpretadas nesta unidade as medidas de associação. Na 
Unidade IV, definiremos os desenhos de estudos epidemiológicos, compreendendo 
os principais estudos descritivos e analíticos. Serão apresentados os estudos do tipo 
transversal, caso-controle, coorte e ensaios clínicos humanos e não humanos (os ditos 
experimentais). Por fim, na última unidade mostraremos algumas das aplicações da 
epidemiologia na saúde, como a Epidemiologia Moderna, Genética, Ambiental, Clínica 
baseada em evidências, Social, e Hospitalar. Abordaremos também a aplicação da 
epidemiolo gia para o planejamento e gestão em saúde, que subsidiam as tomadas 
de decisões das políticas públicas ou privadas, para a avaliação dos serviços de saúde 
ofereci dos à população. 
Na prática, este conhecimento traz a você, futuro(a) profissional de saúde, um dife-
rencial. Você pode perceber que em seu campo profissional certamente utilizará a 
Bioestatística e Epidemiologia de várias maneiras, como por exemplo, para testar uma 
hipótese, para analisar condições determinantes a saúde da população, para conduzir 
experimentos científicos tecnicamente na análise de fenômenos e nas aplicações no 
campo das ciências biológicas, exatas e da saúde. 
Como você pode ter observado, os conhecimentos de Bioestatística e Epidemiologia são 
fundamentais na formação do profissional de saúde. Você já sabia de toda sua impor-
tância? Já conhecia suas aplicações? Podemos constatar que sem uma devida analisa e 
trabalho dos dados, somos apenas uma pessoa com opinião. Vamos mergulhar juntos 
no universo desta disciplina, para que você seja um profissional diferenciado. Vamos lá?
APRENDIZAGEM
CAMINHOS DE
1 2
43
5
13
71
41
117
VISÃO GERAL E 
PRINCÍPIOS DA 
BIOESTATÍSTICA
6 199
INDICADORES 
DE SAÚDE E 
A VIGILÂNCIA 
EPIDEMIOLÓGICA
MEDIDAS DE 
POSIÇÃO E 
DISPERSÃO
TABELAS E 
GRÁFICOS
CORRELAÇÃO 
REGRESSÃO LINEAR 
E INFERÊNCIA 
ESTATÍSTICA
EPIDEMIOLOGIA: 
DEFINIÇÃO, 
OBJETIVOS E 
PERSPECTIVAS 
HISTÓRICAS
155
7 225 8 255
PRINCIPAIS 
DESENHOS 
DE ESTUDOS 
EPIDEMIOLÓGICOS
MEDIDAS DE 
FREQUÊNCIA E DE 
ASSOCIAÇÃO
9 287
EPIDEMIOLOGIA 
APLICADA EM 
SAÚDE
1
Olá, aluno(a), esta unidade será essencial para sua trajetória profis-
sional na área da saúde. Por meio dela, você terá oportunidade de 
conhecer a origem da Bioestatística, sua definição, sua importância 
bem como entender que as técnicas estatísticas são essenciais para 
uma pesquisa, além disso, você compreenderá como fazer uma 
coleta de dados utilizando as principais técnicas de amostragem. 
Vamos lá?
Visão Geral e 
Princípios da 
Bioestatística
Me. Renata Cristina Souza Chatalov
14
UNICESUMAR
Ao iniciar a leitura deste material, você deve estar se perguntando, 
por que eu, futuro(a) profissional da saúde, preciso da Bioestatística? 
Qual a sua importância? Como ela pode influenciar minha vida? 
Será que realmente utilizarei a Bioestatística no meu dia a dia como 
profissional da saúde?
Para que possamos compreender, utilizaremos um exemplo bem 
amplo e possível para todos os profissionais da saúde. Imagine que 
você, já graduado em Ciências Biológicas, estará atuando em sala de 
aula como docente de disciplinas comuns à formação das futuras 
gerações de profissionais da saúde, é provocado por seus alunos a 
realizar um experimento. Isso mesmo, um experimento, no qual os 
alunos coloquem em prática o que estão aprendendo. Você tem uma 
ideia bem interessante, propondo aos seus alunos: vamos fazer uma 
pesquisa de campo? Rapidamente, os alunos ficam todos animados, 
com a possibilidade de fazer uma pesquisa de campo. Assim, você 
como professor da disciplina, inicia uma provocação com a sua 
turma, fazendo as seguintes perguntas: Qual será o problema de 
pesquisa? Quais serão os objetivos desta pesquisa? Porque faremos 
essa pesquisa? O que faremos com os resultados disso tudo? Qual o 
tema? Qual a relevância desse tema? Quanto custará? Aonde vamos?
Diante de tantas perguntas, as respostas que devem ser apresen-
tadas pelos estudantes parecem simples, contudo, para que a sua 
provocação seja efetiva e a reflexões dos discentes sejam significa-
tivas para a aprendizagem deles, será necessário, que os estudantes 
alcancem tais respostas, com base em um planejamento. Logo, antes 
de realizar o experimento com seus alunos, ter um planejamento de 
pesquisa e um método (como será feita a pesquisa) fazem-se neces-
sários. Mas como a bioestatística pode me ajudar com essa questão? 
Para isso, convido você a fazer a leitura do artigo intitulado 
Qual a importância da Bioestatística e da Epidemiologia na área 
da saúde? a fim de conhecer um dos exemplos para a aplicação da 
Bioestatística. Nesse artigo, você verá que 
a Bioestatística está presente em diversas 
áreas de nossa vida, entre elas, a Epide-
miologia. Nessa leitura, é evidenciada a 
relação da Bioestatística e da Epidemio-
logia em aspectos, como quantificação e 
análise dos eventos em saúde. Acesse o 
Qrcode a seguir:
https://apigame.unicesumar.edu.br/qrcode/8444
15
UNIDADE 1
Sabemos que a dengue ainda é uma epidemia em várias regiões do mundo. Sendo assim, considere 
que você já é um profissional da saúde e está atuando na Secretaria de Saúde de seu município e deseja 
realizar um experimento a respeito dos casos de dengue em um dos bairros do município. Porém o 
bairro em questão possui 35 mil pessoas, segundo dados da prefeitura. Você tem o prazo de uma semana 
para fazer a pesquisa e dispõem de pouca mão de obra e poucos recursos financeiros. Neste contexto, 
você se questiona: como será possível fazer essa pesquisa? É aí que a Bioestatísticapode ajudar. Uti-
lizando técnicas de estatística, como a amostragem, na qual você poderá selecionar algumas pessoas 
que farão parte da sua amostra, mas que seja representativa para toda população do bairro. Considere 
esta situação hipotética apresentada e, para que possamos nos ambientar com tal prática, que tal nos 
apropriarmos de uma das aplicações da Bioestatística e colocarmos a mão na massa? Vamos lá? Faça 
uma pesquisa com os membros de sua família, perguntando se eles têm tomado cuidado com ações 
preventivas contra dengue. 
Diante de tudo isso que discutimos até o momento, faça suas anotações em um Diário de Bordo. 
Aqui, neste espaço, você pode anotar suas primeiras impressões até o momento. Escreva os resultados 
de sua pesquisa com seus familiares, anotando, também, as dificuldades para realizar a pesquisa e os 
pontos a melhorar. Faça esta reflexão.
DIÁRIO DE BORDO
16
UNICESUMAR
Até o momento, estudamos que o futuro profissional da saúde, usará a Bioestatística na prática, e que 
ela é fundamental para sua formação. Mas o que ela significa? Como podemos conceituá-la? A Bioesta-
tística é um ramo da estatística que traz aplicações no campo das Ciências Biológicas e da Saúde, sendo 
fundamental para problematização, planejamento, coleta de dados, crítica e sumarização dos dados, 
avaliação, análise e interpretação de todos os dados que resultam nas pesquisas de campo (RODRI-
GUES; LIMA; BARBOSA, 2017). Conhecer a Bioestatística é essencial para as áreas da: Epidemiologia, 
à Ecologia, à Psicologia Social e à Medicina baseada em evidência. 
Se a Bioestatística, porém, deriva da própria Estatística, como definir Estatística? Para Parenti, Silva 
e Silveira (2017, p. 13):
 “
Estatística é a ciência por meio da qual se faz inferências sobre um fenômeno aleatório 
específico com base em uma amostra relativamente limitada. A área de estatística tem 
duas subáreas: estatística matemática e estatística aplicada. A estatística matemática se 
preocupa com o desenvolvimento de novos métodos de inferência estatística e requer 
conhecimento detalhado de matemática complexa para a sua execução. A estatística 
aplicada envolve a aplicação dos métodos de estatística matemática em assuntos espe-
cíficos, como economia, psicologia e saúde pública.
Desde a Antiguidade, a estatística está presente na vida do homem. Ela é utilizada como fonte de dados, 
que, por sua vez, são dados ou teorias utilizadas para explicar uma informação de alguma coisa. Para 
Parenti (2018, p. 14):
17
UNIDADE 1
 “
É a ciência que tem por objetivo orientar a coleta, o resumo, a apresentação, a análise 
e a interpretação de dados. Apesar de estarmos habituados à análise de informações 
populacionais, principalmente quando tratamos de censos demográficos, ela também 
pode ser usada como fonte em outras ciências e, no nosso caso, especialmente nas 
ciências ligadas à vida e aos seres vivos.
Podemos observar que a estatística está voltada para problematização de estudos, coleta de dados, 
tabulação, apresentação e análise de dados.
No futuro, o pensamento estatístico será tão necessário para a cidadania eficiente como saber 
ler e escrever. 
(H. G. Wells) 
Depois que vimos o que significa a estatística e como ela pode ser útil em nossa vida, com um va-
lor importante para todos nós conheceremos suas duas vertentes. A estatística pode ser dividida 
em estatística descritiva e inferencial. A estatística descritiva, segundo Arango (2011), é a parte da 
estatística que é encarregada do levantamento, organização, classificação e descrição dos dados em 
tabelas, gráficos ou outros recursos visuais, além do cálculo de parâmetros representativos desses 
dados. Enquanto a estatística inferencial trata do ramo da estatística, que tem por intuito fazer 
afirmações a partir de dados observados, ou seja, fazer projeções para uma população com dados 
baseados em amostras.
Assim, mais do que dados, a estatística dá-nos oportunidade de olhar as informações coletadas, 
fazer análise de modo crítico e pode ser utilizada dentro da área das Ciências Biológicas e da Saúde 
em vários contextos, tais como levantamento de dados, diagnósticos, contagem de ocorrências, análise 
de dados pandêmicos, comprovação da utilização de medicamentos, entre outros (PARENTI, 2018). 
No nível da iniciação, a estatística não deve ser apresentada como um ramo da Matemática. A boa 
estatística não deve ser identificada com rigor ou pureza matemáticos, mas ser mais, estreitamente, 
relacionada com pensamento cuidadoso. Em particular, os alunos devem apreciar como a Estatística é 
associada com o método científico: “observamos a natureza e formulamos questões, cogitamos dados 
que lançam luz sobre essas questões, analisamos os dados e comparamos os resultados com o que tínha-
mos pensado previamente, levantamos novas questões e assim sucessivamente” (HOGG, 2001, p. 342).
Geralmente, um profissional da Estatística deve ter bons conhecimentos matemáticos, além de interpre-
tação para criação de novos métodos estatísticos. Por outro lado, Hogg (2001) apresenta-nos que a eficácia 
no ensino de estatística para acadêmicos de áreas não exatas dará-se conforme forem relacionados os 
18
UNICESUMAR
conteúdos com as habilidades e as competências em questão bem como a utilização de exemplos voltados 
à área de formação. 
Sendo assim, a Bioestatística é uma ramificação da estatística aplicada que utiliza métodos estatísticos 
para problemas biológicos e médicos. Evidentemente, estas áreas da estatística se sobrepõem de alguma 
maneira. Em alguns casos, por exemplo, em razão de uma aplicação da Bioestatística, os métodos padrão 
não se aplicam e devem ser modificados. Nessas situações, os bioestatísticos empenham-se para desenvolver 
novos métodos.
Nas áreas das Ciências Biológicas e da Saúde, não é diferente, nestas áreas, cabe aos pesquisadores a 
avaliação dos dados, a interpretação de resultados e a análise das conclusões, com aplicações, por exemplo, 
em atividades desenvolvidas em determinado ambiente. Além disso, em tais áreas, a Bioestatística oferece 
a possibilidade de análise e interpretação de informações sobre medicamentos, equipamentos, avaliação 
de protocolos e artigos científicos (GLANTZ, 2014).
Uma boa maneira de aprender a Bioestatística e seu papel no processo de pesquisa é seguir o fluxo de 
uma pesquisa desde o início do estágio de planejamento até a conclusão, momento em que, geralmente, a 
pesquisa com os resultados alcançados é publicada.
Assim, a questão está em como direcionar o aprendizado da estatística de maneira que o profissional 
da área da saúde possa utilizar estes conceitos. Para isso, é importante que você conheça todas as etapas do 
método científico. 
O método científico é um conjunto de estratégias, ferramentas e ideias resultantes da expe-
riência humana e consequentes do acúmulo de saberes, que, estruturadas e sistematizadas, 
possibilitam alcançar um objetivo, que é responder a uma pergunta, afinal, toda pesquisa 
científica é baseada em uma pergunta.
Fonte: Parenti, Silva e Silveira (2017, p. 25).
A seguir, veremos alguns exemplos da utilização do método científico com perguntas, tais como:
• Qual é a incidência de dengue na cidade de São Paulo?
• Quantos casos da covid-19 ocorreram na cidade de Curitiba?
• Se uma pessoa consumir alimentos transgênicos, ela poderá elevar o risco de doenças gástricas? 
Uma Variável corresponde ao que estamos estudando, ela pode ser dividida em: qualitativa e quanti-
tativa. Uma variável qualitativa nominal é referente a um atributo, enquanto uma variável qualitativa 
ordinal refere-se a uma ordem, hierarquia. Por sua vez, uma variável quantitativa contínua refere-se a 
medições, e uma variável quantitativa discreta trata de contagem. 
19
UNIDADE 1
Figura 1 - Variável qualitativa x Variável quantitativa / Fonte: o autor.
Descrição da Imagem: a Figura 1 apresenta um fluxograma da Variável. Ela está dividida em duas variáreis: a qualitativa 
e a quantitativa. A variável qualitativaestá dividida em nominal e ordinal. Para a variável qualitativa nominal temos 
uma característica única, e, na variável qualitativa ordinal, a hierarquia. Já a variável quantitativa discreta, trata-se de 
contagem e, para a variável quantitativa, contínua as medições.
Assim, o método científico nos traz maneiras para respondermos as perguntas que estão presentes em 
nossos estudos, e a estatística está presente em seus passos, que são: 
a) Fazer observações: nesta etapa da pesquisa, é preciso olhar a todas as variáveis ao redor do 
pesquisador, fazer anotações, investigação, definir o algo de sua pesquisa, delimitar sua pesquisa. 
b) Definir uma questão: nesta etapa do método científico, o pesquisador especificará o que quer 
saber em relação ao que está sendo estudado. É importante que a questão em si seja tangível. 
c) Formular uma hipótese: nesta etapa, o pesquisador irá fundamentar seu conhecimento 
prévio para explicar o fenômeno observado, direcionando para um parâmetro a ser estudado. 
Nesta etapa o pesquisador pode utilizar alguns testes estatísticos, tais como testes de hipóteses. 
d) Coletar dados: depois que são definidos e delimitados todos os critérios da pesquisa, será definido 
como serão coletados os dados, e nesta etapa, a estatística ajudará o pesquisador, pois, na prática, 
muitas vezes, ele utilizará amostras, e a estatística traz as maneiras de como fazer essas coletas. 
e) Analisar os dados: nesta fase, depois de coletar os dados, é preciso analisar os dados coletados, 
fazer a tabulação para apresentação em tabelas e gráficos. 
f) Conclusões: depois de passar por todas as etapas anteriores, o pesquisador faz sua conclusão 
do seu estudo, é importante observar que a estatística é uma ferramenta que ajudará na tomada 
de decisões. 
20
UNICESUMAR
Podemos observar com mais detalhes a seguir, na Figura 2:
Figura 2 - Etapas para a construção de uma pesquisa científica / Fonte: o autor.
21
UNIDADE 1
Assim, quando a Estatística é apresentada a um aluno de graduação, ele poderá perguntar: Se a Esta-
tística é essencial às pesquisas, ela é importante para quem quer atuar no meio científico? A resposta a 
este questionamento é sim. Em especial quando falamos em construção do conhecimento. Na prática, 
é preciso estudar sempre, estar atualizado, à medida que novos estudos, sobretudo, da sua área de in-
teresse ou atuação são divulgados. Nesse entendimento, um profissional que trabalha em sala de aula 
pode utilizar a pesquisa em sua área de atuação e se basear em conhecimentos estatísticos, para fazer 
uma publicação científica, por exemplo.
Assim, a estatística também tem função de auxiliar a pesquisa científica e precisa estar alinhada aos 
conhecimentos e ao objeto de estudo, como: estudar uma dada enfermidade, a ação de um medicamento, 
entre outros. Dessa maneira, a Bioestatística está relacionada aos segmentos de ciências da vida, como: 
Ciências Biológicas, Enfermagem, Ecologia, Saúde Pública, Saúde Coletiva, Epidemiologia, Genética, 
entre outros. Dessa forma, “um pesquisador, ao agrupar as informações de determinado estudo, nor-
malmente, ele trabalhará com os resultados provenientes de uma coleta de dados, como contagens, 
experimentos e outros” (PARENTI, 2018, p. 4). Esses dados são chamados de dados primários uma 
vez que o primeiro a ter acesso aos mesmos é o próprio pesquisador, ou a sua equipe. Considera-se 
que o pesquisador tenha trabalhado de forma a garantir um nível adequado de qualidade de dados e 
que as limitações dos mesmos sejam conhecidas.
São usuais, no entanto, nos estudos, os dados secundários provenientes de outras fontes, tais como: pu-
blicações de artigos em periódicos científicos, artigos ou comunicações em eventos científicos ou institutos 
de pesquisa e estatísticas. Como os dados secundários não foram obtidos, diretamente, pelo pesquisador e 
sua equipe, verifica-se que a qualidade deles pode estar prejudicada. Contudo, pelo menos nos exemplos de 
Descrição da Imagem: a Figura 2 apresenta as etapas para a construção de uma pesquisa científica. Apresenta-
mos a fase 1 - Fazer observações. Nesta fase, o pesquisador é motivado pela pesquisa e interessado em conhecer 
melhor o mundo em que vive. Faz a observação dos fatos, fenômenos, comportamentos e atividades e percebe 
que muitas coisas já são conhecidas e outras ainda não. Além disso, define o objeto de investigação, que é o alvo 
da sua pesquisa, o que ele deseja investigar de fato. Caso o objeto de estudo seja passível de mensurações, o 
pesquisador começa a perceber que a estatística vai ser bastante útil em seu processo de construção de conheci-
mento. Por exemplo: diante dos tempos atuais, um pesquisador quer saber a dinâmica do novo Corona vírus em 
uma cidade, para isso, o pesquisador deve compreender esse vírus, a partir de quantificações de novos casos da 
doença, número de internações hospitalares, número de óbitos, quanto foi gasto para controlar e prevenir. Na 
fase 2, apresentamos como definir uma questão. Nesta etapa, o pesquisador especificará o que quer saber em 
relação ao que está sendo estudado. O pesquisador define, pontualmente, sua pergunta de estudo e precisa ser 
bem objetiva, estabelecendo quem serão os sujeitos da pesquisa e se haverá comparações entre grupos. Trata-se 
de uma etapa essencial para que se possa escolher como será utilizada a estatística de análise de dados, que se 
será baseada principalmente na pergunta formulada e no desenho estabelecido. A seguir vem a fase 3 - Formular 
uma hipótese. Aqui o pesquisador fundamentará seu conhecimento prévio para imaginar o que poderia explicar 
o fenômeno observado, isto é, o que poderia responder àquela questão que já foi definida anteriormente. Caso 
essa hipótese seja direcionada a um parâmetro, aqui os testes estatísticos poderão ajudar o pesquisador. Coleta 
de dados está na fase 4. Nesta fase, depois de definidos todos os critérios que delimitarão a população, o pesqui-
sador deverá estabelecer como será feita a coleta de dados, e tem à disposição técnicas baseadas na estatística 
de amostragem para que possam auxiliar o pesquisador selecionar a amostra que representará essa população. A 
penúltima fase, a quinta fase é a Análise de dados. O pesquisador avalia os dados coletados na pesquisa, podendo 
extrapolar dados amostrais. Podem ser apresentados sob forma de tabelas e gráficos e técnicas estatísticas. Na 
última fase, que é a 6, temos a Conclusão. A partir das informações obtidas, o pesquisador pode fazer compara-
ções com estudos prévios fazendo reflexões sobre o estudo realizado por ele. Essas técnicas estatísticas podem 
orientar os pesquisadores nas tomadas de decisões.
22
UNICESUMAR
fontes de dados secundários que foram mencionados, espera-se que a qualidade seja elevada. No caso de 
periódicos científicos, a qualidade está relacionada, normalmente, ao prestígio da publicação. É importante, 
que nesta jornada de construção e consolidação do saber e de sua trajetória acadêmica, você compreenda e 
internalize que a qualidade das informações presentes nos periódicos e nos artigos são de extrema impor-
tância. Não é necessário mencionar, aqui, o cuidado que se deve expressar com pesquisas e informações 
provenientes de fontes não confiáveis. Cabe mencionarmos os impactos e os perigos relacionados com a 
propagação de informações irreais, em especial no contexto da saúde. Provavelmente, você recebeu alguma 
corrente no WhatsApp, no início da pandemia do novo coronavírus, contendo alguma informação sem 
a devida indicação da fonte científica e que parecesse, no mínimo, duvidosa. Acertei? Isso aconteceu com 
grande parte da população e nos faz refletir sobre a problemática envolvida em tal prática. Nesse contexto, 
como profissionais da saúde, devemos, por obrigações éticas, pautar nossas decisões mediante a consulta 
de pesquisas confiáveis publicadas e divulgadas em periódicos com relevância e robustez científica. 
Para que possamos nos habituar à consulta de fontes confiáveis ede 
prestígio científico, o uso de plataformas específicas se faz necessá-
rio, como é o caso da plataforma Sucupira, que possibilita, por meio 
de sua ferramenta de consulta, verificar o Qualis do periódico, pelo 
qrcode: Para acessar, use seu leitor de QR Code.
Para entendermos melhor a análise estatística, dois conceitos são primordiais ao entendimento da 
análise estatística de dados: população e amostra.
Uma população (N) refere-se a um conjunto de elementos que têm, pelo menos, uma característica 
em comum, como todos os acadêmicos dos cursos da área de saúde da UniCesumar. Uma popula-
ção pode ser composta de um número tão grande de elementos que, muitas vezes, não conseguimos 
quantificar. Nesse caso, dizemos que a população é de tamanho infinito. Supondo que faremos uma 
pesquisa para investigar hábitos alimentares dos funcionários de um hospital, podemos entender que 
nossa população (que estamos estudando) é finita, porque teremos o número de pessoas que trabalham 
neste hospital. No entanto, se tivermos como objetivo de pesquisa investigar os hábitos alimentares dos 
indivíduos adultos residentes em uma grande cidade, o tamanho populacional pode ser bastante amplo.
Quando temos um estudo em que usamos toda a população, denominamos censo. Entretanto, em 
boa parte dos estudos, a obtenção de todos os dados de todos os elementos da população pode ser 
inviável, devido às dificuldades de acesso aos indivíduos, o tempo para concluir a coleta das informa-
ções, os custos financeiros e entre outras limitações. Nesse caso, utilizam-se informações provenientes 
de uma amostra, ou seja, de uma parte da população. 
https://apigame.unicesumar.edu.br/qrcode/8445
23
UNIDADE 1
Assim, podemos definir amostra (n) como sendo um subconjunto finito da população, isto é, uma 
parte representativa da população, por exemplo: se como população temos todos os alunos dos cursos 
de Saúde da UniCesumar, uma amostra seriam os alunos do primeiro ano do curso.
Uma característica importante da amostra que não podemos esquecer, é que ela seja representativa 
da população da qual foi retirada, isto é, deve ter características similares às daquela população. Uma 
amostra representativa é uma miniatura da população, como podemos observar na Figura 3. No en-
tanto uma amostra que não representa, adequadamente, a respectiva população é chamada enviesada 
ou tendenciosa.
Figura 3 - Seleção de uma amostra 
Um Censo refere-se a um levantamento ou registro estatístico de certa população, de acordo 
com alguns critérios, tais como: sexo, idade, religião, estado civil e profissão. No entanto esse 
conceito está relacionado com a definição clássica de Censo, ou seja, a ideia de Censo Demo-
gráfico. De acordo com a definição de população que foi dada anteriormente, que população 
é um conjunto de elementos com, pelo menos, uma característica em comum, a contagem 
populacional pode estar relacionada ao número de estabelecimentos industriais, rebanhos de 
animais, tamanho de propriedades rurais, número de estabelecimentos bancários etc. Esses cen-
sos são denominados: Censo Industrial, Censo Agropecuário e Censo Comercial e de Serviços.
(IBGE)
Descrição da Imagem: a figura apresenta dois círculos e, em cada círculo, existem grupos de indivíduos com 
diferentes características. O grupo maior é destinado à representação de uma população e está ao lado esquer-
do, enquanto o grupo menor que se refere à amostra e se posiciona à direita. Há uma seta que sai da população 
para a amostra, representando uma parcela da população, contudo, nesta amostra, observam-se características 
representativas da população.
24
UNICESUMAR
Façamos, juntos, uma nova reflexão. Considere o seguinte cenário hipotético. Você objetiva realizar 
uma pesquisa para avaliar os hábitos relacionados à saúde dos habitantes adultos de uma cidade de 
porte médio e, para tanto, realizou a coleta de dados, por meio de entrevistas realizadas na praça de 
alimentação de um shopping Center do município em questão.
É importante considerar que, nesse caso hipotético descrito, a amostra selecionada, ou seja, o públi-
co presente na praça de alimentação de um shopping pode fazer com a que pesquisa não alcance seu 
objetivo de verificar os hábitos alimentares de uma população, direcionando você a uma conclusão 
errada sobre tais hábitos. E por que isso aconteceu? Porque não houve nenhum critério para a seleção 
desta amostra. 
Uma das formas de se garantir que a amostra seja representativa quanto à população, consiste 
na utilização de técnicas estatísticas, com as quais, ainda em nosso exemplo hipotético apresentado, 
poderíamos dividir a cidade em setores, em bairros, e para cada setor seria selecionado determinado 
número de habitantes para participarem da pesquisa. Dessa maneira, você conseguiria uma amostra 
mais representativa da população.
É preciso observar que, por mais cuidados que tenhamos na seleção dos elementos que farão parte 
da amostra, ela jamais será, perfeitamente, igual à população em todas as suas características, visto que 
ela é uma fatia da totalidade dos indivíduos. Entretanto uma estratégia importante para obtermos 
amostras tão representativas quanto possível consiste em usar os chamados planos probabilísticos, 
que, com base em técnicas estatísticas, definem como os indivíduos serão melhor selecionados para 
a composição da amostra.
Agora que já sabemos a definição de população e amostra, que tal analisar um exemplo para 
diferenciar, na prática, estes termos que estudamos? Vamos lá? Uma médica pediatra quer 
fazer uma análise estatística do uso de medicamentos homeopáticos por pacientes de um a três 
anos de idade. Ela deseja comparar os efeitos do uso destes medicamentos com os alopáticos. 
Os medicamentos homeopáticos são produzidos de forma diferente dos fitoterápicos, através 
de dinamização. Neste tipo de terapia, são, também, utilizados, além de princípios ativos de 
origem vegetal, outros de origem animal, mineral e sintética. Um tratamento homeopático não 
busca eliminar apenas os sintomas da doença, e sim estimular o organismo a se fortalecer. 
Logo, o tratamento homeopático é eficaz para curar o doente, e não apenas aliviá-lo. Já o tra-
tamento alopático busca, por meio de medicamentos de ação química, eliminar os sintomas 
e manifestações da doença por meio do chamado princípio dos contrários. Por exemplo: uso 
de laxantes na prisão de ventre.
Fonte: CRFESP (2019).
25
UNIDADE 1
Para que possamos avançar, considere o exemplo presente em nosso elemento #Explorando Ideias# 
apresentado anteriormente. Suponha que a médica inicia sua pesquisa definindo a população para 
estudo (todos os seus pacientes que se enquadrem na faixa etária apresentada). Depois disso, ela selecio-
nará dois tipos de amostras diferentes para oferecer a medicação ao paciente, assim terá como amostras:
• Amostra 1: que será composta pelos pacientes cujos pais optaram por medicamentos ho-
meopáticos. Sistematicamente, sua análise terá como indicador o número de vezes em que as 
crianças apresentaram alguma alteração na saúde no período de um ano bem como o tipo de 
doença que apresentaram.
• Amostra 2: será composta pelos pacientes cujos pais não utilizam medicamentos homeopáticos 
nos tratamentos indicados pela pediatra. 
Para dar continuidade em sua pesquisa, a médica realiza os registros e as verificações necessárias ao 
longo de um ano, de acordo com a proposta inicial da pesquisa, e, ao término deste prazo, ela poderá, 
por intermédio dos dados obtidos, verificar se a sua hipótese inicial foi comprovada, ou não. Assim, os 
dados poderão ser utilizados em desdobramentos da mesma pesquisa, ou provocar a necessidade de 
uma nova coleta de dados. A vantagem deste tipo de análise é que ele oportuniza ao profissional mais 
segurança na tomada de decisões, além de melhores e mais confiáveis argumentos junto aos pacientes 
e aos clientes e maior sucesso nas abordagens escolhidas.
Você pode estar se perguntando agora, mas, e na prática, comofica?
Um ganho para os profissionais das áreas de Biológicas e da Saúde consiste no conhecimento sobre 
diferentes experimentos de uma maneira mais clara e objetiva para obtenção de dados concretos que 
podem interferir na qualidade do seu trabalho. Façamos uma nova reflexão, com base em um novo 
cenário hipotético:
 “
Considere que um profissional da saúde trabalhe em dois laboratórios que ficam localiza-
dos em regiões distintas, porém, em uma mesma cidade. No laboratório 1, o profissional 
atende pacientes de baixa renda que quase não fazem consultas nem exames. Já no labo-
ratório 2 o mesmo profissional, atende pacientes que tem uma rotina elevada de consultas 
e exames. Assim, note que esse profissional consegue, ainda que intrinsicamente, analisar 
como está a frequência na procura de exames, em relação aos dois laboratórios e conse-
quentemente, em relação ás duas regiões da mesma cidade. Para tanto, esse profissional 
considera que a população será composta pelos pacientes do laboratório 1 e laboratório 
2, já a amostra será composta pelos pacientes que procuraram atendimento nos últimos 
6 meses. Caso queira verificar com detalhamento, descrição e por meio da Estatística, esse 
profissional poderá elaborar uma tabela para cada laboratório, para agrupar os dados 
que vão servir de parâmetro. Ao finalizar sua pesquisa, o profissional poderá analisar e 
levantar informações que lhe possibilitem concluir com propriedade estatística em qual 
dos laboratórios será necessário um maior estoque, mais colaboradores, dentre outras 
informações voltadas a gestão (PARENTI, 2018, p. 17-18). 
26
UNICESUMAR
De acordo com Parenti, Silva e Silveira (2017), o conceito de variáveis é 
referente a características individuais do que estamos estudando como 
unidade ou objeto de estudo, como: o gênero, o peso, a estatura. Dessa 
maneira, as variáveis representam quaisquer características que possam 
modificar o resultado da pesquisa. Em Bioestatística, assim como em 
Estatística, como já mencionado anteriormente que as variáveis estão 
classificadas em: quantitativas e qualitativas. Assim, as quantitativas 
são referentes a atributos que podem ser medidos ou mensurados, e as 
qualitativas somente a atributos (que não sejam numéricos). Retomando 
estes conceitos, dizemos que:
• Variáveis quantitativas: referentes a valores numéricos, por 
exemplo: peso, altura, número de espécies em uma floresta, nú-
mero de nascidos vivos em uma maternidade, enfim, as variáveis 
quantitativas se adequam às necessidades da pesquisa e repre-
sentam valores referentes ao universo pesquisado. Podem ser 
divididas em discretas ou contínuas. As variáveis quantitativas 
discretas são referentes a contagens ou números inteiros, como 
por exemplo: número de nascidos vivos em uma maternidade, 
número de óbitos de uma cidade. Também podem ser classifica-
das em contínuas, que são referentes a mensurações ou medidas, 
tais como: peso de uma pessoa, estatura de um indivíduo, entre 
outros.
• Variáveis qualitativas: referentes a atributos não mensuráveis, 
como gênero, etnia, entre outros. Podem ser divididas em no-
minais ou ordinais. Uma variável é qualitativa nominal quando 
temos, por exemplo, uma espécie. Já uma variável é qualitativa 
ordinal quando são referentes a atributos que podem ser clas-
sificados de acordo com uma hierarquia, como a prestação de 
um serviço, sendo do melhor ao pior.
As variáveis quantitativas e qualitativas são muito utilizadas em todos 
os tipos de pesquisas que usam dados estatísticos (CRESPO, 2009). A 
seguir, vejamos alguns exemplos que podem auxiliar no entendimento 
da finalidade e do conceito de cada uma, assim como as diferenças 
entre elas. Vamos supor que temos que fazer uma pesquisa que tenha 
por objetivo analisar a relação entre o hábito de fumar e o desenvol-
vimento de doenças pulmonares. Para essa pesquisa, fará-se presente 
uma série de variáveis diferentes com as quais poderemos trabalhar, 
tais como (Figura 4):
27
UNIDADE 1
Figura 4 - Análise das variáveis / Fonte: a autora.
Descrição da Imagem: a figura 4 apresenta as análises das variáveis. De cima pra baixo: Variáveis quantitativas 
discretas: analisar a relação entre o número de cigarros que são consumidos por dia por cada um dos pacientes 
com a idade de início do consumo de cigarros e a idade atual; Variáveis quantitativas contínuas: avaliar o peso 
dos pacientes bem como o estado de saúde; Variáveis qualitativas nominais: fazer uma relação entre o gênero 
dos investigados ao hábito de fumar; Variáveis qualitativas ordinais: fazer um registro quanto o grau/estágio da 
doença pulmonar que os pacientes se encontram, classificando-os em: inicial, intermediário e terminal.
Dessa forma, é fundamental e muito importante destacar qual será a variável que o pesquisador es-
colherá para analisar no seu objeto de estudo. Parenti, Silva e Silveira (2017) trazem-nos conceitos 
de pesquisa experimental, que objetivam identificar as relações entre duas variáveis. No método 
experimental, deve-se provocar variações na ocorrência de uma variável e verificar se ela é a causa de 
algum efeito em outra, por exemplo: podemos utilizar diferentes medicamentos para determinada 
doença e observar os seus resultados. Na pesquisa correlacional, não tem como provocar mudanças 
nas variáveis, assim, o pesquisador observa as alterações e seus efeitos, elencando as variáveis que serão 
observadas, por exemplo: avaliar os efeitos das alterações naturais de temperatura em determinado 
ambiente e nos seres que vivem ali. A pesquisa de levantamento tem variáveis não interferentes, 
como uma pesquisa eleitoral, que terá como universo a população da cidade, do estado ou do país. A 
amostra deve ser composta por número representativo de cada segmento da sociedade, por exemplo 
pessoas que podem votar que farão parte desta amostra. Existem, ainda, outros tipos de pesquisa que 
atendem às necessidades específicas de cada objeto de estudo e que terão suas características próprias, 
como os estudos de caso e as observações.
28
UNICESUMAR
Neste sentido, é relevante que o pesquisador tenha em mente: Qual é o meu objeto de pesquisa? Qual 
é meu público-alvo? Quais hipóteses desejo comprovar com a minha pesquisa? Que tipo de pesquisa 
se adéqua melhor ao meu objeto de estudo? Respondidas estas questões, o pesquisador pode pensar 
em quais metodologias poderá usar para sua investigação. Com a escolha da metodologia, virão as 
decisões sobre como tratar os dados estatísticos levantados, que tipos de questões deverão ser feitas, 
se os dados serão quantitativos ou qualitativos e, assim, sucessivamente.
Como você pôde perceber, falamos bastante do conceito de amostra. Mas por que esse conceito é 
tão importante dentro de uma pesquisa? Na prática, temos situações em que não se torna viável o uso 
de uma população, e o pesquisador precisa utilizar uma amostra. Mas quais são essas situações? De 
acordo com Barbetta (2014), as técnicas de amostragem são utilizadas quando temos:
1. Economia: geralmente, nas pesquisas, é muito mais econômico trabalharmos com amostra, ou 
seja, com uma pequena parcela da população, do que como um todo. Supondo que você precisa 
fazer uma pesquisa em um bairro que tem 25 mil pessoas, imagine o custo para entrevistar todas 
as pessoas que fazem parte da população deste bairro? Fica mais econômico selecionarmos 
uma amostra, ou seja, uma parte de moradores do bairro para fazer parte da entrevista, do que 
trabalharmos com 25 mil pessoas.
2. Tempo: muitas vezes, o pesquisador não tem tempo suficiente para estudar toda população, 
por exemplo, ele tem por objeto de pesquisa saber se as pessoas em um bairro fazem reciclagem. 
Nesse bairro tem 25 mil pessoas, e o pesquisador tem cinco dias para fazer a pesquisa, nesse 
caso, ele deverá recorrer a uma técnica de amostragem para dar continuidade à sua pesquisa. 
3. Confiabilidade e operacionalidade: quando o pesquisador precisa reduzir o número de 
elementos, na qual ele poderá dar maisênfase aos casos individuais estudados. 
Para Barbetta (2014), entretanto, existem situações em que as técnicas de amostragens não são viáveis, 
tais como:
Ao decidir realizar uma pesquisa na área da saúde, é imprescindível que o pesquisador conhe-
ça as normas estabelecidas pelo Conselho Nacional da Saúde por intermédio da Resolução 
Nº 01/88, de 13 de junho de 1988. Essas normas referem-se a questões éticas que envolvem 
pesquisas com seres humanos, em relação à dignidade, à adequação aos princípios éticos 
e científicos, à privacidade do indivíduo e aos possíveis riscos que o estudo possa acarretar.
Fonte: Brasil (1988, on-line).
29
UNIDADE 1
1. Quando a população pequena: nesse caso, quando a população é pequena, fica melhor estu-
dar todos os elementos do que uma parte apenas, imagine a situação: um professor tem quinze 
alunos em uma turma e quer saber quantos praticam a reciclagem em suas casas. Nesse caso, 
por se tratar de uma população pequena, vale a pena o professor trabalhar com todos seus 
quinze alunos, do que com uma parte deles apenas.
2. Quando a característica é de fácil mensuração: este caso ocorre por exemplo, quando a po-
pulação é de fácil acesso, e quando não compensa elaborar um plano de amostragem. Considere 
que um professor quer saber dentre os alunos de sua escola, quantos são a favor de participar 
da feira de ciências, para isso, ele pode entrevistar, ou colocar urnas na escola e incentivar a 
participação de todos na própria escola.
3. Necessidade de alta precisão: por exemplo, o Instituto Brasileiro de Geografia e Estatística 
(IBGE) faz o censo demográfico, a cada dez anos, para conhecer as características da popula-
ção brasileira. Nesse caso, a pesquisa é feita com toda população, e não com parte da amostra.
Segundo Arango (2011), um conceito importante que se deve ter em mente quando se trata de le-
vantamento de dados é o de que o sucesso nas conclusões tiradas acerca da população com base nas 
informações colhidas de uma ou mais amostras depende da criteriosa seleção desta(s). Dessa forma, se 
os dados forem mal coletados, certamente, carregarão suas distorções para qualquer análise que se faça 
deles. Toda pesquisa tem suas limitações, nos seus resultados, decorrentes da metodologia empregada 
na investigação. Para termos sucesso nas conclusões em uma pesquisa, é preciso ter a metodologia 
bem descrita bem como o passo a passo do estudo. 
Basicamente, existem dois tipos de validade, validade interna e validade externa. A validade 
interna diz se as conclusões de uma pesquisa são corretas para a amostra estudada. Essa va-
lidade é pré-requisito para a validade externa. A validade externa diz se as conclusões de uma 
pesquisa são aplicáveis à população da qual a amostra se originou ou a outras populações.
A limitação dos resultados de uma pesquisa científica deve ser discutida à luz dos possíveis erros 
metodológicos (vieses) que constituem ameaças à validade da pesquisa. Busca-se, então, um nível de 
confiança que é possível depositar nos resultados e conclusões a partir de uma análise criteriosa dos 
possíveis erros e suas causas. Chamamos de viés um erro sistemático (vício, distorção) e não intencional, 
proveniente de questões metodológicas. Existem dois fatores que influenciam no correto levantamento 
dos dados: a representatividade e a fidedignidade.
30
UNICESUMAR
A representatividade é um fator associado à forma de amostragem. Assim, de uma maneira qual, 
quando selecionamos uma amostra, buscamos reproduzir as características observáveis da população. 
Este procedimento é conhecido como critério de proporcionalidade e, quando ele é considerado, diz-se 
que a amostra é representativa da população em questão. No entanto, para que isto seja possível, as 
características da população devem ser, previamente, conhecidas. Contudo a disponibilidade de in-
formações prévias sobre a estrutura populacional para um estudo nem sempre é a ideal, de forma que, 
normalmente, a fonte de informação acaba sendo um outro estudo ou dados estatísticos secundários, 
extraídos de institutos de pesquisa, por exemplo. 
Na falta de informações sobre a composição da população em estudo, trata-se de que a escolha 
seja a mais isenta possível, adotando-se algum critério de aleatoriedade (escolha ao acaso), como um 
sorteio (ARANGO, 2011). Todavia, quando os dados necessários para o conhecimento dos atributos da 
população estão disponíveis e são ignorados ou manipulados, a amostra resultante seria considerada 
tendenciosa. Conclusões e estimativas efetuadas com base nessa amostra não possuiriam consistência.
Para entender melhor este conceito, vejamos o exemplo: imagine um estudo feito por biólogos e 
biomédicos para verificar a incidência de Escherichia coli em determinado município. O exame da 
água é fundamental para distribuição, principalmente quando destinada ao consumo humano. Assim, 
parece claro que o estudo deverá ser realizado por amostragem domiciliar da água, pois seria inviável 
testar todos os domicílios. Supondo ainda que existem outras informações, como: a classificação das 
áreas geográficas (rural e urbana, por exemplo), a localização dos bairros, a população dos bairros e a 
taxa de atendimento com água tratada. Podemos observar o resultado com o exemplo de amostragem 
com as informações no Quadro 1.
Quadro 1 - Exemplo de amostragem com informações 
População (N) Número de Habitantes Taxa de Atendimento com Água Tratada
Rural 1.000 0%
Urbana 9.000 89%
Bairro A 2.000 100%
Bairro B 2.000 87%
Bairro C 5.000 80%
Fonte: adaptado de Arango (2011).
Com essas informações, uma amostra representativa da população de domicílios deveria observar que:
• Todos os locais sejam alcançados pela pesquisa, observando-se a distribuição geográfica (área 
urbana, com seus três bairros e área rural). Não sendo possível, por simples conveniência, efetuar 
a pesquisa somente em domicílios urbanos no bairro A.
• Seja considerada, nesse caso, a população de cada setor geográfico. A amostra deverá ser cons-
tituída de partes proporcionais idênticas às da população. Assim, 10% da amostra seriam cons-
tituídos por domicílios rurais, 20% do bairro A etc. Na falta das populações, poderiam ser 
empregados pesos para a constituição da amostra, de acordo com o pesquisador.
• Exista total aleatoriedade na escolha dos domicílios.
31
UNIDADE 1
Estes aspectos são importantes para evitar caracterizar a amostra como tendenciosa e, consequen-
temente, adquirir credibilidade, sem espaço para gerar conclusões duvidosas.
Outro aspecto que deve ser levado em conta no trabalho de levantamento de dados e cons-
tituição das amostras é o da fidedignidade dos dados ou das informações, relacionada com a 
precisão dos dados ou com a sua qualidade.
A falta de precisão pode ser ocasionada por vários motivos. De uma maneira geral, podemos 
ter as situações: equipamentos que não sejam aferidos corretamente, falta de calibração de equipa-
mentos, questionário mal elaborado (no caso de entrevistas, com perguntas tendenciosas) e falhas 
na hora da coleta. No primeiro caso, o uso de balança mal calibrada, réguas com defeito, coletor 
de amostra (de água, por exemplo) inadequado, amostras em mau estado de conservação pode 
causar erros nas medições. Existem, também, alguns exames laboratoriais, como os que implicam 
contagem e estão sujeitos à falha. Nesses casos, durante o levantamento dos dados da amostra, é 
recomendado, para minimizar as falhas, utilizar os mesmos aparelhos.
Já no segundo caso, existem informações que carregam grande margem de erro. Por exemplo, 
suponha que um questionário contenha a seguinte pergunta: Quanto tempo faz desde que você foi 
ao médico pela última vez? Mesmo que a pessoa entrevistada tenha boa vontade em responder e 
não esteja tencionando falsear a resposta, ela pode encontrar dificuldades em realmente precisar 
o tempo solicitado pela pergunta. A razão da resposta do entrevistado poder apresentar uma falha 
de informação é simplesmente o fato de queum conjunto de informações não é, devidamente, 
registrado e, para obtê-las, às vezes, não existe alternativa a não ser contar com a memória do en-
trevistado. Outro exemplo de uma questão que poderia suscitar erros seria: Já dirigiu embriagado? 
Tratando-se de um tema que, em boa parte dos casos, cria constrangimento ao entrevistado, ou 
ele pode falsear a sua resposta, exagerando ou escondendo a verdadeira informação. Pelos mais 
variados motivos, desde a precária memória em alguns casos, passando pelo medo e a própria 
fantasia do entrevistado, é comum a falta de precisão das respostas. Por este motivo, os questioná-
rios de levantamento de dados devem ser elaborados com extremo cuidado, evitando perguntas 
vagas ou que deem margem a respostas muito subjetivas. Naturalmente, seus resultados devem 
ser tomados com grande cautela.
Agora que já sabemos que a amostragem é importante nas pesquisas e que é utilizada na prática, 
conheceremos algumas técnicas estatísticas de amostragem. Já estudamos em nossa disciplina, 
que a população (N) refere-se ao universo da pesquisa, como sendo um conjunto de elementos 
que tenha pelo menos uma característica em comum (CRESPO, 2009). E a amostra (n) é uma 
parte da população. Por exemplo, ao utilizarmos como população todos os pacientes internados 
em determinado hospital, pode-se definir que serão parte da pesquisa apenas os internados em 
leitos ímpares ou os que permanecerem internados por mais de dois dias. O critério de escolha 
para a determinação da amostra seguirá as necessidades e os objetivos da pesquisa, desde que 
sejam imparciais, não tendenciosos e representativos da população. Para isso, deve-se definir a 
população que se busca e a característica investigada.
 
32
UNICESUMAR
As técnicas de amostragem podem ser divididas em probabilísticas e não probabilísticas. A amostra-
gem probabilística considera que todos os elementos da população tenham a mesma probabilidade 
(diferente de zero) de compor a amostra. A não probabilística é definida por elementos não aleatórios.
Uma amostragem probabilística é aquela em que todos os elementos da população tem a mesma 
chance de compor a amostra, podendo ser dividida em:
a) Amostragem casual simples ou aleatória simples: refere-se a um evento de seleção simples, 
como o caso de um sorteio. Para compreendermos por meio de exemplos, considere a população 
o total de pacientes que se consultam em um hospital X. Com o objetivo de investigar os tipos de 
patologias que os pacientes apresentam, um sorteio é realizado para direcionar os selecionados 
a um estudo clínico. Ao realizar um sorteio, compreendemos que a amostragem foi realizada 
de forma casual simples ou aleatória simples. Vejamos outro exemplo: a população de outro 
estudo é composta por pacientes de um hospital (500 pessoas), considere que o pesquisador 
almeja desenvolver uma pesquisa com 10% desta população, ou seja, a amostra será composta 
por 50 pacientes deste hospital. Para tanto, ele realizará um sorteio simples dos 50 pacientes 
que comporão a amostra, o que caracteriza uma seleção por amostragem casual simples. 
Na Figura 5, podemos observar um exemplo de um sorteio simples, de amostragem aleatória. No 
exemplo hipotético, temos doze pessoas, enumeradas de um a doze, considere que deste total obtere-
mos uma amostra composta por quatro pessoas. Considere que, após um sorteio simples, as pessoas 
selecionadas foram os indivíduos com os números: 2, 5, 8 e 11. Logo, estas pessoas passam a compor 
a amostra. 
A definição da amostra de uma pesquisa clínica é dividida em quatro fases:
• Critérios de inclusão: quais são as características necessárias para a participação do estu-
do. Por exemplo: no estudo de determinada patologia, estarão incluídos os pacientes que 
apresentam os sintomas há menos de cinco anos.
• Critérios de exclusão: quais características podem eliminar os candidatos ao estudo. No 
exemplo, estarão excluídos todos os pacientes que apresentam sintomas há mais de cinco 
anos.
• Escolha da técnica de amostragem: o que dependerá dos objetivos a que a pesquisa se 
propõe.
• Consentimento livre e esclarecido: em que o paciente ou sujeito participante da pesquisa 
afirma conhecer as condições e o seu desejo de contribuir.
Fonte: Pereira (2003).
33
UNIDADE 1
Figura 5 - Amostragem casual simples, sorteio simples 
Descrição da Imagem: a fi-
gura representa um sorteio 
simples no qual temos doze 
pessoas enumeradas de um 
a doze. Uma seta indica a rea-
lização de um sorteio no qual 
as pessoas sorteadas passam 
a compor a amostra. A nova 
composição da amostra se dá 
com os representantes da po-
pulação enumerados com os 
números 2, 5, 8 e 11.
b) Amostragem sistemática: os elementos são escolhidos a partir de um fator que se repete. Para 
que ocorra, a população deve estar ordenada de forma aleatória, como em uma lista ou fila. Por 
exemplo, a partir das fichas de consultas da mesma Unidade Básica de Saúde (UBS), retira-se 
a 15, depois a 30, a 45, e assim sucessivamente, até atingir um número de pacientes desejado, 
que deve ser proporcional ao número da população de pacientes atendidos. Ou define-se que 
a pesquisa se dará com os pacientes que estiveram em consulta no mês de maio. Para exem-
plificar, você pode observar a Figura 6, na qual temos treze pessoas em uma fila (ordenada). 
Considere que selecionaremos uma amostra composta por cinco pessoas. Para tanto, podemos 
utilizar a equação 1 a seguir:
 n
NI=
Uma ferramenta importante para a realização de seleção de amostras aleatórias são os de-
nominados números aleatórios. Estes são números, compreendidos em um intervalo, cuja 
probabilidade de serem selecionados é igual, como em um sorteio. Em programas como o 
Excel®, a função geradora de números aleatórios permite definir o intervalo do sorteio e por 
tipo de número, inteiro ou real. Para isto utiliza a função ALEATORIO ou ALEATORIOENTRE, de-
pendendo da versão. No último caso, a função é acompanhada de um argumento que permite 
mudar o intervalo do sorteio. Por exemplo: ALEATORIOENTRE (a, b) sorteia números entre a e b.
(H. G. Arango)
34
UNICESUMAR
Em que:
I = intervalo 
N = População
n = amostra
Para isso, temos: 
5
13I=
Portanto, escolheremos (ou sortearemos) a primeira pessoa que comporá a amostra, e contará o in-
tervalo de 3 em 3. Supondo que determinamos que a primeira pessoa da fila será a primeira a compor 
a amostra, somaremos mais três, a próxima pessoa será a número 4, depois, somaremos mais 3, será a 
número 7, somamos mais 3 e teremos a pessoa na posição 10, e, por último, somamos mais 3 e teremos 
a pessoa na posição 13. Assim, a amostra torna-se sistemática, ou seja, foi definido por meio de um sis-
tema antes de selecionar a amostra, que esta será composta pelos indivíduos nas posições: 1, 4, 7, 10 e 13.
Figura 6 - Amostragem Sistemática 
Descrição da Imagem: na figura, temos a amostragem Sistemática em que se observa uma imagem composta 
por 13 pessoas, foi calculado, anteriormente, que o sistema será de 3 em 3, ou seja, sistematizado para a seleção 
dos indivíduos que estão na posição: 1, 4, 7, 10 e 13 que passam a compor a amostra.
c) Amostragem estratificada: será a amostragem escolhida quando a população estiver es-
tratificada. O tamanho dos estratos deve ser proporcional aos seus tamanhos na população 
de origem. Como a população de um hospital é composta por 500 pessoas, divididas em 200 
homens e 300 mulheres, supondo que o pesquisador, deseja 10% de uma amostra, assim, a 
amostra será composta por 50 pessoas, divididas em: 20 homens e 30 mulheres. Na Figura 7, 
temos um modelo de amostragem estratificada, em que os grupos foram divididos para, em 
seguida, serem selecionados uma amostra. 
35
UNIDADE 1
Figura 7 - Amostragem Estratificada 
Descrição da Imagem: na figura, temos a amostragem estratificada, na qual temos um grupo de pessoas dividi-
das em dois grupos, o primeiro grupo composto doze pessoas, e o segundo grupo composto por nove pessoas. 
Descriçãoda Imagem: a figura 8 é composta por cinco grupos de três pessoas, sendo destacado dois grupos 
compostos por três pessoas. 
d) Amostragem por conglomerados: o agrupamento se dará por proximidade física, indepen-
dentemente de outras características, ou seja, por um conglomerado. Por exemplo: a amostra 
será composta por um grupo de pacientes do hospital A, que moram na mesma rua da unidade. 
Na Figura 8, você pode observar um exemplo de amostragem por conglomerados, supondo que 
há pessoas em locais diferentes, e você fez um sorteio com dois locais diferentes, sua amostra 
será composta por essas pessoas nestes locais diferentes. 
 
Figura 8 - Amostragem por conglomerados 
36
UNICESUMAR
Temos um resumo das técnicas de amostragem probabilística com suas divisões bem como suas pala-
vras chaves e um exemplo. Podemos perceber que a amostragem probabilística (Figura 9), que se trata 
daquela amostragem que todos os elementos podem fazer parte da amostra é dividida em: amostra-
gem casual simples - sorteio simples; amostragem sistemática - definição de um sistema; amostragem 
estratificada - subdivisão de grupos e amostragem por conglomerados - territórios. 
Figura 9 - Resumo das técnicas de amostragem probabilística / Fonte: a autora.
Descrição da Imagem: na figura, temos um resumo da amostragem probabilística; primeiro temos a amostragem 
casual, que é um sorteio simples, como: Sortear 5% de uma população de 100 pessoas. Temos a amostragem 
sistemática, que é a definição de um sistema, e como exemplo temos: Amostra composta por 25 casas em um 
intervalo definido de cinco em cinco. Temos a amostragem estratificada composta pela subdivisão de grupos, e 
como exemplo temos: População composta por 1000 pessoas, 800 homens e 200 mulheres, definido 10%. Portanto, 
80 homens e 20 mulheres. Por fim, temos a amostragem por conglomerados, que é locais/cluster, como exemplo 
temos: em uma cidade sortear um bairro dentre todos os conglomerados. 
Além disso, a amostragem também pode ser não probabilística, isso significa que existe uma escolha 
deliberada dos elementos da amostra e, dependendo dos critérios do pesquisador, temos:
• Amostragem por acessibilidade ou por Conveniência: a seleção se dará a partir de elementos 
que estejam ao alcance do pesquisador. Essa amostragem não tem verdadeiro valor estatístico e 
serve mais como forma de buscar dados iniciais para a pesquisa, como a amostra ser composta 
por um grupo de dados formado com perguntas feitas a pessoas em um shopping da cidade. 
Na Figura 10, você pode observar que as pessoas participantes da amostra são selecionadas de 
acordo com os critérios estabelecidos pelo pesquisador.
37
UNIDADE 1
Figura 10 - Amostragem por conveniência 
Descrição da Imagem: na figura, temos a amostragem por conveniência e temos um grupo de 15 pessoas, e a 
pessoa sorteando, por conveniência 5, pessoas destacadas na figura. 
• Amostragem por julgamento ou intencional: neste caso, a seleção ocorre a partir do julga-
mento do pesquisador, por exemplo, quando se quer fazer uma pesquisa com o intuito de se 
comprovar que o consumo de carne tem influência sobre a saúde das pessoas. Escolhe-se Porto 
Alegre - RS como base para a coleta da amostragem por se considerar que seja a capital onde 
mais se consome este alimento no Brasil.
• Amostragem por cotas: neste caso, oferece mais rigor à coleta, sendo que a fixação das cotas 
deve seguir critérios que caracterizam a amostra como representativa da população. No exemplo 
da carne, primeiro é feita uma análise da população de Porto Alegre e, depois, são definidas as 
proporções entre homens, mulheres, as faixas etárias e os estratos sociais. Em seguida, serão 
entrevistados um número de pessoas correspondente à proporcionalidade de cada um desses 
grupos. Dessa maneira, haverá uma amostragem significativa de toda a população da cidade.
Temos um resumo das técnicas de amostragem não probabilística (Figura 11) com suas divisões bem 
como suas palavras chaves e um exemplo. Podemos perceber que a amostragem por conveniência 
ou acessibilidade é aquela em que os elementos que comporão a amostra estão de fácil acesso do 
pesquisador; a amostragem por julgamento é aquela em que há interferência, ou seja, julgamento do 
pesquisador, e, na amostragem por cotas, as cotas são fixas pelo pesquisador, em seguida, é feita a coleta 
de dados que comporão a pesquisa. 
38
UNICESUMAR
Amostragem não 
probabilística
Amostragem por 
conveniência ou 
acessibilidade
Amostragem por 
julgamento
Amostragem por 
cotas
Elementos 
a partir do 
alcance do 
pesquisador
Julgamento do 
pesquisador Fixa cotas
Ex.: Aplicação de 
questionários/
entrevistas em 
uma escola para 
levantamentos de 
dados iniciais. 
Ex.: De�ne 
proporções e 
cotas, para então 
fazer a coleta de 
dados. 
Ex.: Um pesquisador 
passa a integrar um 
grupo de pesquisa 
de um laboratório 
em especí�co por 
compreender que o 
laboratório tem 
condições e 
expertise em sua 
área de interesse.
Figura 11 - Amostragem não probabilística / Fonte: a autora.
Assim podemos observar que as técnicas de amostragem podem ser muito úteis para os pesquisadores, 
Parenti, Silva e Silveira (2014) salientam que é importante que os investimentos em pesquisa possam 
ser ampliados, aproximando a teoria do cotidiano, e que o tipo de pesquisa e as ferramentas usadas em 
geral não requerem alto investimento, mas a geração de informações adequadas a respeito de doenças 
e tratamentos fará a diferença na vida de cada um. 
Dessa forma, podemos citar várias linhas de investimentos necessários nos dias de hoje, como o 
aumento da resistência bacteriana, a ausência de tratamentos eficazes para doenças endêmicas em países 
pobres, como a dengue, as pesquisas em saúde mental, entre outros. Os diferentes tipos de amostragem 
podem se mostrar bastante úteis no cotidiano dos profissionais da área biológica e da saúde, pois auxilia 
tanto na administração de consultórios e clínicas quanto na determinação de estratégias de tratamentos, 
medicamentos e outras. Dependendo dos objetivos propostos pela pesquisa, o desafio é determinar 
que tipo de amostragem escolher para que os dados obtidos sejam um reflexo real da investigação.
É possível perceber que as pesquisas, geralmente, requerem atenção especial dos profissionais da área 
biológica e da saúde tanto para atualização e frequente busca por alternativas e novos procedimentos 
quanto para alimentar a própria necessidade de busca. O médico, o enfermeiro, o farmacêutico, o biólo-
go, enfim, todos os profissionais dessa área devem estar atentos às possibilidades e aos conhecimentos 
desenvolvidos em pesquisas.
Descrição da Imagem: a 
Figura 11 apresenta-nos 
a amostragem não pro-
babilística, iniciando pela 
Amostragem por conve-
niência ou acessibilidade, 
que se trata de elemen-
tos a partir do alcance do 
pesquisador. Temos, por 
exemplo, a aplicação de 
questionários/entrevistas 
em uma escola para le-
vantarmos dados iniciais. 
Depois, a amostragem por 
julgamento, que se trata de 
julgamento do pesquisa-
dor. Temos como exemplo: 
um pesquisador supõe que 
o departamento de Biolo-
gia tem mais publicações e 
ele pesquisa lá a partir dis-
so. Por fim, a Amostragem 
por cotas, nas quais são fi-
xadas as cotas, por exem-
plo: define proporções e 
cotas para, então, fazer a 
coleta de dados. 
39
UNIDADE 1
Você percebeu que a Bioestatística será bem aplicada em seu futuro profissional? Ao escolher as áreas 
das Ciências Biológicas e da Saúde verá que, para realizar uma pesquisa, será necessário entender o 
conceito de população (N) e amostra (n) bem como entender os meios de pesquisa e a técnica de 
amostragem que será utilizada. Como exemplo você pode fazer uma pesquisa com seus alunos em um 
colégio, com o objetivo de saber se eles praticam ou não a reciclagem. Mas, no momento em que for fazer 
essa pesquisa, se o colégio tem 5.000 alunos, e você tem um tempo curto para fazê-la, pode recorrer a 
uma técnica de amostragem queestudamos aqui nesta unidade, na disciplina de Bioestatística e fazer 
essa pesquisa com uma amostra representativa da população. Além disso, quando você vai a campo, 
por exemplo, fazer uma coleta de água em um rio para verificar a qualidade da água, ao retirar essa 
amostra de água (está utilizando uma técnica de amostragem) e ao leva-la ao laboratório para estudar 
parâmetros físico-químicos e microbiológicos, saindo o resultado, ao interpretar, você estará fazendo 
uma projeção da qualidade da água daquele rio, então, você utilizou a técnica de estatística inferencial. 
Você sabia que os professores da área das Ciências Biológicas e da 
Saúde podem contribuir para a conscientização e prevenção para 
saúde ao trabalhar educação ambiental em sala de sala de aula? Tra-
ta-se de um tema muito importante e que traz engajamento entre as 
turmas. Imagine que você fará um trabalho com seus alunos sobre 
caracterização de resíduos sólidos (lixo) e composição gravimétrica, 
para isso, existe uma norma específica, a NBR 10.007/2004, que traz 
vários métodos, e você pode fazer com seus alunos. Em nossa roda de 
conversa, traremos uma explicação dessa norma e como fazer o mé-
todo de quarteamento. Ouça e replique com seus alunos, vamos lá?
O artigo Desenho da Amostra da Pesquisa Nacional de Saúde 2013, 
publicado pela revista científica Epidemiologia Serviços de Saúde, no 
ano de 2015, aborda a questão da importância de um plano amostral, 
uma população alvo, e técnicas de amostragem bem como a con-
dução de uma pesquisa. O trabalho apresenta a forma como foram 
elaborados os questionários propostos na pesquisa, as técnicas de 
amostragem e a tabulação dos resultados oriundos da pesquisa. 
Recomendo a leitura para aprofundamento, por meio de um estudo científico dos aspectos 
que estudamos nesta unidade. Boa leitura! Para acessar, use seu leitor de QR Code.
https://apigame.unicesumar.edu.br/qrcode/8446
https://apigame.unicesumar.edu.br/qrcode/8458
40
M
A
P
A
 M
EN
TA
L
Olá, aluno (a), chegamos à avaliação e, aqui, você fará um Mapa de Empatia que consiste em fazer 
a autoavaliação de uma forma mais divertida de tudo que foi estudado até agora nesta unidade. 
Vamos lá? Você se identificará e se perguntará como fará um mapa sobre as técnicas de estatística 
e amostragem. Vejamos, você poderá pensar em como estas informações tratadas nesta unidade 
como as técnicas de estatística poderão ajudar você em uma pesquisa, em que se tem as etapas 
de planejamento, coleta de dados, agrupamento dos dados (tabelas e gráficos) análise e avaliação 
podem ajudar em uma pesquisa científica, em sua vida profissional ou, até mesmo, em sala de 
aula. Também, verá como as técnicas de amostragem podem ajudar a trabalhar, corretamente, 
com uma amostra que seja representativa da população. Então, comece escrevendo seu nome, 
sua idade e preencha com comentários, tópicos ou perguntas sobre si mesmo dentro do quadro 
da empatia. E, no final, você verá o tanto de coisas que descobrirá sobre este tema proposto. 
Assim, utilize o Mapa de Empatia para refletir e se expressar nas questões a seguir: 
O que pensa e sente?
Qual a importância da Bioestatística para sua formação?
Como você pode aplicar isso tudo que você aprendeu em sala de aula?
O que vê?
O que você já viu em relação na prática utilizando técnicas estatísticas?
O que escuta?
O que você já tinha ouvido falar sobre Bioestatística?
Você já tinha ouvido falar em técnicas de amostragem?
Consegue entender suas importâncias nas pesquisas?
O que fala e faz?
O que você achou do conteúdo estudado até o momento? Faz sentido um futuro professor da 
área da Saúde ou da área das Ciências Biológicas estudar técnicas de Estatística? Quais são suas 
aplicações?
As dores
Quais são suas dificuldades?
Você acha que vem coisas mais difíceis na disciplina? 
Consegue entender como os conceitos e exemplos são essenciais para sua compreensão?
Os ganhos 
O que você ainda acha que tem que estudar para entender melhor a Bioestatística?
2
Olá, aluno(a), esta unidade será fundamental para sua futura atua-
ção profissional na área das Ciências Biológicas e da Saúde. Aqui, 
aprenderá a construir tabelas bem como compreenderá suas re-
gras. Além disso, aprenderá a elaborar gráficos e fará suas leitura 
e interpretação.
Tabelas e Gráficos
Me. Renata Cristina Souza Chatalov
42
UNICESUMAR
Para começarmos a nossa jornada nesta unidade, compartilharei 
uma experiência profissional para que possamos problematizar e, 
consequentemente, refletir. A primeira vez que participei de uma 
pesquisa de campo foi para fazer um diagnóstico para elaboração 
de um Plano de Gerenciamento de Resíduos Sólidos (PGRS), em 
uma empresa de revenda de peças para automóveis. Para aprovei-
tar ao máximo o tempo na empresa e a visita in loco, elaborei um 
check list bem simples que trazia informações sobre: tipo de resíduo, 
quantidade gerada (kg/mês) e como estava sendo feita a destinação 
final deste resíduo neste momento. 
Depois de fazer a visita, coletar os dados, foi preciso trabalhar 
nesses dados, afinal, não poderia entregar à empresa o check list 
em que fiz a coleta de dados. Assim, a partir dos dados coletados, 
elaborei uma tabela bem organizada dentro das normas da ABNT 
e também fiz um gráfico apontando o resíduo que era gerado em 
maior quantidade, assim, poderia indicar o que meu cliente poderia 
fazer para cumprir a legislação e minimizar os custos que ele tinha 
com a destinação final de resíduos. 
Agora que contei uma experiência vivenciada por mim, nesta 
situação apresentada, como você acredita que eu deveria ter traba-
lhado com dados a partir de coletas? Como eu deveria ter construí-
do uma tabela? E os gráficos?
Assim, os gráficos e as tabelas são as principais formas de 
apresentação dos resultados de uma pesquisa. Conhecer as re-
gras e as normas específicas que regem a construção de tabe-
las, além de aprender o passo a passo para sua construção é 
importante e imprescindível para a compreensão e, também, para 
orbitarmos neste universo estatístico e bioestatístico. É importante, 
também, compreendermos, corretamente, como construir e inter-
pretar gráficos. Podemos perceber que a Bioestatística pode ajudar 
com as regras e as etapas para a construção de uma tabela ou um 
gráfico. Sabemos que muitos alunos têm a dificuldade de lidar com 
tabelas e gráficos. 
43
UNIDADE 2
Para isso, convido você a fazer a leitura do artigo intitulado Análise e inter-
pretação de tabelas e gráficos estatísticos. A fim de utilizar dados interdisci-
plinares. Nesse artigo, você verá o ensino e a aprendizagem da Estatística bem 
como a utilização de procedimentos e conceitos. Acesse o qrcode a seguir:
Como apresentamos na Unidade 1, os dados sobre a dengue, daremos 
continuidade no mesmo exemplo, tudo bem? Sabemos que esta nossa situação 
é hipotética, e você, graduando (a) na área de Biológicas e da Saúde, que está 
atuando em sala de aula, quer fazer um experimento a respeito dos casos de dengue do seu bairro. 
Desta forma, faça uma pesquisa em forma de formulário com dez pessoas, que podem ser membros 
de sua família ou mesmo colegas de trabalho, contendo a seguinte pergunta: Você já teve dengue?, com 
isso, as possíveis respostas do seu formulário serão: ( ) Sim ou ( ) Não.
Organize estes dados com a quantidade de pessoas que responderam sim e a quantidade de pes-
soas que responderam não. Em seguida, construa uma tabela ou um gráfico, mediante os resultados 
desta pesquisa e, ao fazê-lo, você já estará utilizando mais uma técnica apresentada pela bioestatística. 
Diante disso, convido você, a fazer suas anotações em um Diário de Bordo, a fim de anotar suas 
primeiras impressões até o momento. Escreva os resultados de sua pesquisa, depois de fazer o gráfico 
ou a tabela, reflita sobre como você pode trabalhar essa questão em sala de aula ou em outra ocupaçãodentro do seu segmento de trabalho.
DIÁRIO DE BORDO
https://apigame.unicesumar.edu.br/qrcode/8447
44
UNICESUMAR
Em nosso encontro anterior, estudamos a importância da pesquisa e como a Bioestatística pode-nos 
auxiliar no planejamento, na coleta de dados, nas técnicas de amostragem. Mas, e depois, o que fa-
zemos com os dados? Eles podem ser apresentados sob forma de tabelas e gráficos. Vamos começar 
pelas tabelas. 
Uma apresentação tabular de dados é a representação das informações por intermédio de uma 
tabela. Uma tabela é um meio bastante eficiente de mostrar dados levantados, facilitando a sua com-
preensão e interpretação. Além disso, auxilia o entendimento global e o relacionamento entre as 
variáveis representadas.
Conheça as normas para apresentação dos dados em tabelas bem como definições, termi-
nologia e simbologia:
IBGE – Normas de apresentação tabular (IBGE, 1993).
NBR 14724:2011 - Informação e documentação - Trabalhos acadêmicos – Apresentação 
(ABNT, 2011).
Na construção de tabelas, os dados são apresentados em colunas verticais e linhas horizontais, con-
forme a classificação dos resultados da pesquisa. Algumas orientações preliminares são as seguintes 
(ARANGO, 2011, p. 31):
45
UNIDADE 2
1. Para construção de uma tabela é importante que ela seja: simples, clara e objetiva. 
Assim, é apropriado que grandes volumes de informação sejam descritos em várias 
tabelas, ao invés de serem apresentados em uma única tabela; 
2. Uma tabela precisa ser auto-explicativa, ou seja, sua compreensão não deve ser vin-
culada do texto. Dessa forma, nenhuma “casa” da tabela deve ficar em branco, sempre 
apresentando um símbolo ou número, caso houver duas ou mais tabelas em um texto, 
deverão receber um número de identificação, que será referido no texto. 
3. As colunas externas de uma tabela não devem ser fechadas. 
4. Na parte superior e inferior, as tabelas devem ser fechadas por linhas horizontais.
5. A utilização de linhas verticais para separação de colunas no corpo da tabela é op-
cional. 
6. Ao fazer arredondamentos de números, é importante que seja mantida uniformidade 
quanto ao número de casas decimais. 
7. Os totais e os subtotais devem ser destacados, como por exemplo, em negrito. 
8. A tabela deve ser maior no sentido vertical que no horizontal. Contudo, se uma 
tabela apresentar muitas linhas e poucas colunas (estreita demais), convém separá-la 
em uma maior quantidade de colunas. Neste caso, as colunas deverão ser separadas 
por linhas duplas. 
Sendo assim, uma tabela pode ser dividida, hierarquicamente, em dois componentes chamados: prin-
cipais e secundários. Os componentes principais são (ARANGO, 2011, p. 32):
1. Corpo: referente ao conjunto das informações, dos dados que foram coletados e que 
aparecem no decorrer da tabela, no sentido horizontal e vertical. 
2. Coluna indicadora: é a divisão em sentido vertical, onde aparece a designação da 
natureza do conteúdo da linha. 
3. Cabeçalho: indica a natureza do conteúdo de cada coluna.
4. Casa: refere-se as divisões que aparecem no corpo da tabela.
Segundo Arango (2011, p. 32), as partes secundárias compreendem: 
1. Título: geralmente apresentado na parte superior da tabela, devendo ser sempre o mais claro e 
completo possível. Para isso, é importante que o título responda as perguntas: O quê? Quando? 
Onde? relativas ao fato estudado.
2. Rodapé: é um espaço na parte inferior da tabela, utilizado para colocar informações necessá-
rias referentes aos dados. Geralmente no rodapé, são colocadas as informações sobre a fonte 
(origem) dos dados e/ou informações complementares que podem auxiliar na leitura na tabela, 
para que a mesma não fique carregada de informações. 
3. Notas: também devem ser colocadas no rodapé, depois da fonte, de forma sintética. Normal-
mente as notas têm caráter geral, referindo-se à totalidade da tabela. Devem ser enumeradas em 
algarismos romanos, quando existirem duas ou mais de duas (as vezes o asterisco é utilizado). 
46
UNICESUMAR
4. Chamadas: as chamadas têm caráter particular, referindo-se a um item específico da tabela. 
São enumeradas em algarismos arábicos, entre parênteses (podem também ser utilizados 
símbolos gráficos). 
Depois de compreendidas as partes secundárias, observaremos a simbologia comumente utilizada em 
tabelas estatísticas, como mostra o exemplo do Quadro 1 e seus significados. 
Quadro 1 - Símbolos utilizados em tabelas estatísticas
Símbolo Significado Função
- Hífen Quando o valor numérico é nulo
... Reticências Quando não dispõe de dado
? Interrogação Quando há dúvida sobre a exatidão do valor
0; 0,0 ou 0,00 Zero Quando o valor for menor que 0,5
# Parágrafo Quando o dado retifica informação anteriormente publicada
X Letra x Quando o dado for omitido para evitar identificação
Fonte: adaptado de Arango (2011).
E, na tabela, quanto aos números, é importante observar que:
1. Todo número inteiro constituído de mais de três algarismos deve ser agrupado de três em três, 
da direita para a esquerda, separando cada grupo por um ponto (p. ex.: 56.342.901). 
2. Exceto: 
I. Algarismos que representam o ano (p. ex.: 2010). 
II. Números de telefone (p. ex.: 3222-2222). 
III. Placas de veículos (p. ex.: AAA 2222). 
3. A parte decimal de um número deverá ser separada da parte inteira pela vírgula (p. ex.: 0,56).
4. A unidade de medida não leva o “s” do plural nem o ponto final como abreviação (p. ex.: cm, 
m, kg etc.). 
5. 4. Os símbolos de medida aparecem depois do número, sem espaço entre eles (p. ex.: 4,2m; 3h).
Agora que você já viu todos os elementos que compõem uma tabela, que tal vermos um exemplo? Já 
estudamos que uma tabela tem como objetivo apresentar os dados agrupados, de maneira que uma 
pessoa interessada pode visualizar e compreender o que querem dizer aqueles dados. Você conhecerá, 
agora, os principais tipos de tabelas, que podem ser: 
 Simples. 
e) Dupla entrada. 
f) Distribuição de frequência.
Uma tabela simples é aquela em que contém a variável que estamos estudando com sua respectiva con-
tagem, ou seja, com sua frequência. A Tabela 1 apresenta uma tabela simples, com seus elementos básicos:
47
UNIDADE 2
Você sabe qual é a diferença entre Tabela e Quadro? Um quadro, geralmente, traz informa-
ções qualitativas (podendo trazer informações quantitativas em alguns casos) e é fechado nas 
bordas laterais, enquanto uma tabela traz informações quantitativas, referentes a contagens, 
a frequências, e as bordas laterais são abertas. 
Além disso, uma tabela simples pode ser temporal, geográfica ou específica (categórica). Uma tabela 
é considerada temporal quando as observações da variável ocorrem de acordo com tempo. A Tabela 
2 traz um exemplo de série temporal ou histórica: 
 Tabela 2 - Casos de dengue no decorrer dos anos em uma cidade
Ano Número de casos de dengue
2010 20
2011 30
2012 45
2013 25
2014 50
Total 170
 Fonte: o autor.
Uma tabela simples, também, pode ser geográfica, quando a variável analisada é referente ao local ou 
território. Um exemplo de série geográfica pode ser observado na Tabela 3.
Título
Coluna
Casa ou 
célula
Linhas
Rodapé
Corpo
Topo
Tabela 1 - Casos de dengue nos bairros de uma cidade no mês de fevereiro de 2020 
Bairro Número de casos
Centro 12
Zona 01 2
Zona 02 3
Zona 03 5
Zona 04 1
Total 23
 Fonte: o autor.
Como podemos observar, no exemplo da Tabela 1, há todos os elementos básicos apresentados.
48
UNICESUMAR
Tabela 3 - Alunos matriculados em um curso de Ciências Biológicas no estado do 
Paraná no ano de 2010
Cidade Número de alunos matriculados
Maringá 500
Londrina 450
Apucarana 300
Ponta Grossa 400
Curitiba 650
Total 2.300
Fonte: o autor.
Uma tabela simples, também, pode ser específica ou categórica, 
quando a variável analisada é referente a categorias específicas. Um 
exemplo de série geográfica pode ser analisado na Tabela 4.
Tabela 4 - Número de alunos de uma instituição de ensino superior (EAD) no ano 
de 2015
Curso Número de alunosmatriculados
Economia 150
Administração 380
Ciências Biológicas 275
Agronomia 250
Engenharia Civil 140
Total 1.195
Fonte: o autor.
Uma tabela, também, pode ser de dupla entrada, isso significa que 
temos a necessidade de apresentar em uma única tabela, mais dados 
estudados em uma variável, para isso, é preciso fazer uma junção 
de duas ou mais séries (CRESPO, 2009). 
Ao fazer esta junção dos dados para serem apresentados em uma 
única tabela, teremos: duas ordens de classificação, uma vertical (na 
coluna) e uma horizontal (nas linhas). Para apresentar uma tabela de 
dupla entrada, temos a Tabela 5, que trata do número de matrículas 
da Educação Básica do ano de 2019, e os dados estão apresentados 
(dupla entrada) a seguir:
49
UNIDADE 2
Tabela 5 - Número de Matrículas da Educação Básica, por Etapa de Ensino, segundo a Região Geográfica, a Unidade da Federação 
e o Município - 2019
Região 
Etapa de Ensino
Educação 
Infantil
Ensino 
Fundamental
Ensino 
Médio
Educação 
Profissional 
Técnica de 
Nível Médio
Educação 
Profissional 
- Formação 
Inicial 
Continuada 
(FIC)
Educação 
de 
Jovens e 
Adultos 
(EJA)
Educação 
Especial
Norte 690.631 3.015.573 781.394 124.007 2.651 346.815 117.487
Nordeste 2.349.305 7.889.261 2.112.466 554.150 14.414 1.338.224 352.573
Sudeste 3.919.235 10.349.288 2.992.471 786.331 8.617 985.163 449.539
Sul 1.347.509 3.550.498 986.056 317.365 12.069 378.387 232.504
Centro 
-Oeste 666.098 2.119.110 593.504 93.121 2.024 225.079 98.864
Brasil 8.972.778 26.923.730 7.465.891 1.874.974 39.775 3.273.668 1.250.967
Fonte: adaptada de Inep (2020, on-line).
Na Tabela 5, podemos observar que a região (coluna) é referente às regiões no Brasil, já as etapas de 
ensino: Educação Infantil, Ensino Fundamental, Ensino Médio, Ensino Profissional, Educação de 
Jovens e Adultos e Educação Especial são analisados, também, nas colunas e linhas. Temos, então, um 
exemplo de tabela com a dupla entrada, ou seja, mais que uma variável sendo estudada, na qual pode-
mos analisar as regiões brasileiras (geográficas) e etapas de ensino (categorias). Lembre-se de que, em 
uma tabela de dupla entrada: cada uma das respostas combinadas fica agregada em uma única célula. 
Agora que você já conhece as tabelas simples bem como os tipos de série e a dupla entrada, que 
tal aprendermos a construir uma tabela do zero? Mas, antes, precisamos relembrar alguns conceitos 
matemáticos fundamentais aqui na Bioestatística, pois os cálculos das frequências precisam de duas 
grandezas: razão e proporção. Definir razão pode se tornar uma tarefa inglória se formos atrás de 
todos os significados para este termo (ARANGO, 2011). Aqui, trataremos da parte que aplicaremos 
na disciplina de Bioestatística, vejamos alguns exemplos:
Supondo que um corpo tem seis metros de comprimento, e outro corpo três metros, ao dividirmos 
o comprimento de um pelo outro, teremos:
6
3
2=
Ainda, podemos afirmar que, o corpo é duas vezes o tamanho do menor, ou, ainda, que tem a metade 
do comprimento do maior, e esta divisão chamamos de razão. 
A razão 
1
2
 pode ser representada como 1:2, o que significa que cada metro do corpo menor cor-
responde a 2 metros do corpo maior. 
50
UNICESUMAR
Outro exemplo: dos 1.200 pacientes que procuram a emergência hospitalar na última semana, 240 
eram idosos. A razão de idosos que procuraram a emergência esta semana foi de:
240 1200 240 240
1200 240
1
5
� �
�
�
�
( )
( )
Isto é, a cada cinco pacientes, um deles era idoso. 
Segundo Parenti (2017, p. 49):
 “
Os conceitos de razão e proporção estão relacionados entre si. Assim, a razão entre o 
quociente (divisão) entre dois números e a proporção é a igualdade entre duas razões. As 
proporções são aplicadas em situações em que as informações devem ser comparadas 
e são calculadas pelo uso de ‘regra de três simples’. 
Para entender melhor a proporção, vejamos o exemplo a seguir: para produzir 600 pães no refeitório de um 
hospital, são utilizados 100 kg de farinha. Sendo assim, quantos pães podem ser feitos com 25 kg de farinha?
600 100
25
100 600 25
100 1500
1500
100
150
x
x
x
x
x
=
=
=
=
=
. .
Assim, podemos dizer que é possível produzir 150 pães com 25 kg de farinha. 
Agora que já relembramos os conceitos matemáticos necessários para construir uma tabela de 
frequências, você aprenderá passo a passo como elaborar. Vamos lá?
Primeiramente, trabalharemos com a organização dos dados: você organiza dados numéricos 
criando disposições ordenadas ou distribuídas. Para preparar seus dados coletados com o intuito de 
organizá-los, inicialmente, decidiremos se precisaremos analisar suas variáveis numéricas com base 
em grupos que sejam criados pelos valores de uma segunda variável categórica. Esta decisão afetará o 
modo como você prepara os dados. 
De acordo com Levine, Stephan e Szabat (2016), caso decida analisar suas variáveis numéricas em 
grupos que sejam definidos pelos valores de uma segunda variável categórica, você deve, então, decidir 
se utilizará um formato empilhado ou não empilhado. Em um formato empilhado, todos os valores 
de uma variável numérica aparecem em uma única coluna, enquanto uma segunda coluna, em sepa-
rado, contém os valores categorizados que identificadas a qual subgrupo pertence cada um dos valores 
numéricos. Em um formato não empilhado, os valores de uma variável numérica são divididos por 
subgrupos e colocados em colunas separadas. 
51
UNIDADE 2
Vamos ao exemplo supondo que você pretende comparar os custos em restaurantes localiza-
dos na cidade com os custos em restaurantes localizados em bairros. Para preparar esses dados 
de forma não empilhada, poderia ser criada uma coluna para a variável custo com alimentação e 
outra coluna para a variável localização, uma variável categórica com os valores de cidade e bairros. 
Observe o custo de 20 refeições, no Quadro 2 a seguir:
Quadro 2 - Disposição de dados não empilhados
Custos de Refeições em Restaurantes no Centro da Cidade (em R$)
25 21 35 50 60 50 50 50 40 60
70 50 25 29 33 35 35 35 50 50
Custos de Refeições em Restaurantes em bairros da Cidade (em R$)
35 20 20 20 25 25 30 40 40 30
25 25 20 35 35 25 20 20 40 35
Fonte: o autor.
Você pode observar que, desta forma, fica um pouco mais complexo trabalharmos com os dados. 
Este modelo de não empilhados foi apresentado para que você tenha ciência de como trabalhar com 
os dados. Mas se observarmos esses dados, fica difícil tomarmos conclusões acerca dos custos das 
refeições, como qual valor (em R$) que mais aparece (mais se repete), certo? Nem qual percentual 
deste valor pago dentre estas 20 refeições. Podemos facilitar a análise dos nossos dados quando 
trabalhamos com a disposição de dados ordenados, ou seja, quando colocamos os dados em rol. 
Segundo Levine, Stephan e Szabat (2016), uma disposição ordenada organiza os valores de uma 
variável em ordem de classificação, partindo do menor valor para o maior, ou seja, organizamos os 
dados em uma lista (crescente). Uma disposição ordenada pode ajudar a obter mais entendimento 
entre a amplitude dos valores em seus dados e é, particularmente, útil quando você tem mais do 
que um valor se repetindo. Veja, no Quadro 3, os mesmos dados apresentados anteriormente, de 
maneira ordenada.
Quadro 3 - Disposição de dados não empilhados em rol
Custos de Refeições em Restaurantes no Centro da Cidade (em R$)
21 25 33 35 35 50 50 50 50 60
25 29 35 35 40 50 50 50 60 70
Custos de Refeições em Restaurantes em bairros da Cidade (em R$)
20 20 20 25 25 25 30 35 35 40
20 20 20 25 25 30 35 35 40 40
Fonte: o autor.
52
UNICESUMAR
Analise, no Quadro 3, que fica bem mais fácil trabalhar com os dados seguindo uma ordem cres-
cente, ou seja, do menor valor para o maior valor. Outro exemplo clássico de rol que, certamente, 
você já viu em sala de aula, é a lista de presença dos seus alunos. Os nomes estão em ordem alfa-
bética, ou seja, em um rol, assim, fica mais fácil para localizar algum aluno, porque os dados estão 
organizados.Além disso, o rol é um passo importante para construção de tabelas de frequências. 
Mas o que são tabelas de frequências? Trata-se de uma distribuição, de modo tabular, os valores de 
uma variável numérica em um conjunto de classes (linhas) numericamente ordenadas. Podemos 
ter uma distribuição de frequências com intervalo de classes e sem intervalo de classes. 
Primeiro, você aprenderá a construir uma distribuição de frequências sem intervalo de classes, 
utilizando a contagem de uma variável qualitativa nominal. Vejamos a situação a seguir: em pro-
fessor do curso de Enfermagem, aplicou um questionário para entender, qual(is) disciplina(s) os 
alunos tinham como preferência em uma turma. Para isso, selecionou uma turma com 40 alunos 
e fez a seguinte pergunta: “Qual disciplina você mais gosta neste ano?” Dentre as opções dadas 
aos alunos eles tiveram:
• Anatomia Humana.
• Biologia celular e molecular.
• Parasitologia.
• Bioestatística.
Os votos dos 40 alunos podem ser verificados a seguir (Quadro 4).
Quadro 4 - Votos dos 40 alunos de uma turma sobre a preferência de disciplinas (brutos)
Dados Brutos
Anatomia Humana Anatomia Humana Bioestatística Biologia Celular e 
Molecular
Bioestatística Parasitologia Bioestatística Bioestatística
Parasitologia Parasitologia Parasitologia Parasitologia
Biologia celular e 
molecular
Biologia celular e 
molecular
Biologia celular e 
molecular
Biologia Celular e 
Molecular
Anatomia Humana Parasitologia Anatomia Humana Biologia Celular e 
Molecular
Anatomia Humana Anatomia Humana Anatomia Humana Biologia Celular e 
Molecular
Bioestatística Parasitologia Bioestatística Biologia Celular e 
Molecular
Parasitologia Parasitologia Parasitologia Biologia Celular e 
Molecular
Parasitologia Parasitologia Parasitologia Parasitologia
Parasitologia Parasitologia Parasitologia Parasitologia
Fonte: o autor.
53
UNIDADE 2
Para facilitar a construção da nossa tabela, faremos um rol, utilizando as disciplinas com ordem alfa-
bética (Quadro 5).
Quadro 5 - Votos dos 40 alunos de uma turma sobre a preferência de disciplinas (em rol)
Dados em rol
Anatomia Humana Bioestatística Biologia celular e 
molecular
Parasitologia
Anatomia Humana Bioestatística Biologia celular e 
molecular
Parasitologia
Anatomia Humana Bioestatística Parasitologia Parasitologia
Anatomia Humana Biologia celular e 
molecular
Parasitologia Parasitologia
Anatomia Humana Biologia celular e 
molecular
Parasitologia Parasitologia
Anatomia Humana Biologia celular e 
molecular
Parasitologia Parasitologia
Anatomia Humana Biologia celular e 
molecular
Parasitologia Parasitologia
Bioestatística Biologia celular e 
molecular
Parasitologia Parasitologia
Bioestatística Biologia celular e 
molecular
Parasitologia Parasitologia
Bioestatística Biologia celular e 
molecular
Parasitologia Parasitologia
Fonte: o autor.
Agora que temos os dados em rol, construiremos a tabela de frequências (Fi), que se trata de agrupar 
os dados em uma tabela, contando quantas vezes cada variável (nesse caso, cada disciplina) se repetiu, 
isso é o que chamamos de frequência. Para isso, organizamos a tabela (utilizando a ordem alfabética), 
contendo todos os elementos (título, cabeçalho, linhas, entre outros). Utilizando os dados em rol, 
construiremos uma tabela de frequências com a preferência de 40 alunos de uma turma do curso de 
Enfermagem (Tabela 6).
Tabela 6 - Distribuição de frequências referentes à preferência de 40 alunos de uma turma do curso de Enfermagem
Disciplina Contagem Frequência (Fi)
Anatomia Humana III III I 7
Bioestatística III III 6
Biologia Celular e Molecular III III III 9
Parasitologia III III III III III III 18
Total 40
Fonte: o autor.
54
UNICESUMAR
Como você pode observar, inserimos a coluna contagem somente para você entender como funciona 
a distribuição de frequência, geralmente, ela não aparece, mas como é a primeira vez que você está 
construindo essa tabela, elaboramos essa coluna para melhor entendimento. 
Observe que, na disciplina Anatomia Humana, a repetição, ou seja, a contagem foi de sete alunos, 
portanto, a frequência desta classe (desta linha) é igual a sete. Já na segunda classe, ou seja, segunda linha, 
temos a disciplina Bioestatística, com votos de seis alunos, portanto, a frequência para esta disciplina 
é igual a seis. Enquanto na terceira classe, a contagem para disciplina de Biologia Celular e Molecular 
é igual a nove, sendo assim, na coluna frequência, inserimos a informação que é igual a nove. Por fim, 
na última classe, com a disciplina Parasitologia, teve a preferência de 18 alunos. 
Uma classe em uma distribuição de frequência corresponde ao número de linhas desta tabela, 
exceto cabeçalho e total. 
Podemos, entretanto, reconstruir esta tabela, inserindo algumas colunas complementares que são 
importantes em uma distribuição de frequência, tais como:
a) Frequência Relativa (FR %): corresponde à proporção entre a frequência da classe pelo total de 
números observados, e a equação a seguir apresenta-nos como calcular a frequência relativa.
Fr Fi
n
(%) .� �
�
�
�
�
� 100
Em que:
Fr (%) = Frequência relativa (em percentual)
Fi = Frequência da classe 
n = número total de elementos (ou somatória das frequências, correspondente ao total).
b) Frequência Acumulada (Fac): referente à frequência de todos os valores inferiores ao limite 
superior da classe, ou seja, repete-se a primeira frequência, em seguida, vamos somando com 
as posteriores. 
c) Frequência Relativa Acumulada (FRAC %): trata-se de uma classe em que a frequência acu-
mulada da classe, dividindo pelo total da distribuição, ou seja, pelo total. A equação referente 
à frequência acumulada pode ser observada a seguir:
Frac Fac
n
(%) .� �
�
�
�
�
� 100
55
UNIDADE 2
Em que:
Frac (%) = Frequência relativa acumulada (em percentual)
Fi = Frequência acumulada da classe 
n = número total de elementos (ou somatória das frequências, correspondente ao total).
Agora, você aprenderá a construir a tabela de distribuição de frequências com estas colunas comple-
mentares (Tabela 7). Vamos lá!
 Tabela 7 - Distribuição de frequências referentes a preferência de 40 alunos de uma turma do curso de Enfermagem
Disciplina Frequência (Fi) FR (%) Fac FRAC (%)
Anatomia 
Humana 7
7
40
100 17 5�
�
�
�
�
� �. , 7
7
40
100 17 5�
�
�
�
�
� �. ,
Bioestatística 6
6
40
100 15�
�
�
�
�
� �. 7 6 13� �
13
40
100 32 5�
�
�
�
�
� �. ,
Biologia 
Celular e 
Molecular
9
9
40
100 22 5�
�
�
�
�
� �. , 13 9 22� �
22
40
100 55�
�
�
�
�
� �.
Parasitologia 18
18
40
100 45�
�
�
�
�
� �. 22 18 40� �
40
40
100 100�
�
�
�
�
� �.
Total 40 100
 Fonte: o autor.
Como você pode observar, apresentamos as colunas FR (%), Fac e FRAC (%) com todas as fórmulas 
e resoluções. Na coluna FR (%), utilizamos a equação a seguir: 
Fr Fi
n
(%) .� �
�
�
�
�
� 100
Em seguida, substituímos cada valor da frequência, dividimos pelo total (que neste caso é igual a 40), 
e temos que a proporção de alunos que preferem a disciplina Anatomia Humana é de 17,5%. Essa 
coluna também serve para situações em que queremos saber a proporção em percentual, por exemplo: 
qual o percentual de alunos que preferem a disciplina de Biologia Celular e Molecular? Simplesmente, 
basta olhar na coluna FR (%) e responder que: 22,5% dos alunos preferem a disciplina Biologia Ce-
lular e Molecular. Neste momento, você pode estar se questionando, quando construirá tabelas de 
frequências e se é preciso apresentar todos os cálculos nesta tabela. A resposta é: não, necessariamente. 
No exemplo apresentado, fizemos a resolução completa apresentando os cálculos em cada uma das 
classes para que você possa visualizar a equação correspondente bem como a substituição dos valores 
para compor a tabela. 
56
UNICESUMAR
Na maioria das vezes, quando elaboramos estas tabelas, normalmente, não apresentamos os cálculos. 
Agora, você verá a mesma tabela, sem apresentar os cálculos (Tabela 8). 
 
Tabela 8 - Distribuição de frequênciasreferentes a preferência de 40 alunos de uma turma do curso de Enfermagem (sem os cálculos)
Disciplina Frequência (Fi) FR (%) Fac FRAC (%)
Anatomia Humana 7 7 7 17,5
Bioestatística 6 15 13 32,5
Biologia Celular e 
Molecular 9 22,5 22 55
Parasitologia 18 45 40 100
Total 40 100
Fonte: o autor.
Além disso, temos como ir tirando prova real para verificar se os cálculos apresentados estão corretos. 
Observe a seguir:
a) Na linha Total, observe que a somatória das frequências deve ser igual ao número de elemen-
tos coletados, ou seja, para este caso, foram entrevistados 40 alunos do curso de Enfermagem, 
então, a somatória deve ser igual a 40.
b) Na coluna FR %, analise que a somatória das frequências relativas em percentual, a somatória 
deve ser igual a 100, correspondente a 100 por cento. Caso sua somatória dê, por exemplo, 98%, 
é necessário conferir os cálculos anteriores. 
c) Na coluna Frequência Acumulada (Fac): aqui, somamos as frequências das classes com as 
frequências posteriores, certo? Mas a prova real, trata-se do último valor encontrado na colu-
na FAC ser igual ao total de elementos analisados, ou seja, o valor dever ser igual ao total da 
somatória da coluna frequência. 
d) Na coluna Frequência Relativa Acumulada (FRAC %): o último valor correspondente à variável 
analisada deve ser igual a 100.
Como você pode perceber, não precisamos apresentar todos os cál-
culos nas colunas complementares da tabela de distribuição de fre-
quências. Neste vídeo, apresentarei o passo a passo da construção 
das colunas complementares bem como reescreverei essa tabela 
sem cálculos. Acesse o vídeo e fique por dentro desse conteúdo.
https://apigame.unicesumar.edu.br/qrcode/8464
57
UNIDADE 2
Não se esqueça: o coração da sua tabela é a coluna frequência, por isso, é importante estes valores 
serem distribuídos de maneira correta. 
Coletar dados.1º passo 
2º passo Colocar os dados em rol (ordem crescente).
3º passo Construir a tabela e contar as frequências (repetições).
4º passo Construir as colunas Fr (%), FAC e FRAC (%).
5º passo Como garantia con�ra seus dados, principalmente a coluna frequência.
Figura 1 - Passo a passo para construção de uma tabela de frequências simples, sem intervalo de classes / Fonte: o autor.
Em uma tabela de distribuição de frequências, você sabia que po-
demos tirar a prova real dos cálculos nas colunas complementares? 
Sim, isso é possível e, para entender como fazer essa prova real, con-
vido você a acessar este vídeo e fazer comigo o passo a passo. Você 
verá que não terá erro. Fique por dentro deste plus aqui em nossa 
disciplina. 
Descrição da Imagem: na figura, temos a sequência dos passos para a construção de uma distribuição de frequências 
sem intervalo de classes, temos: 1º passo – coletar os dados; 2º passo – colocar os dados em rol; 3º passo – construir 
a tabela e contar as repetições; 4º passo – fazer as colunas frequência relativa (FR %), frequência acumulada (FAC) e 
frequência relativa acumulada FRAC (%), e o passo 5 – conferir os dados. 
https://apigame.unicesumar.edu.br/qrcode/8465
58
UNICESUMAR
Até agora, vimos como trabalhar com uma distribuição de frequências, sem intervalo de classes, mas 
com uma variável quantitativa discreta. Vejamos um exemplo: supondo que um diretor de uma escola 
anotou durante 30 dias o número de atendimento aos pais e obteve o seguinte resultado:
Dados Brutos
3 3 2 4 5
2 2 2 4 4
2 3 3 5 2
4 2 3 2 3
1 2 3 2 2
3 4 2 3 2
1º passo: colocaremos os dados em rol. 
Dados em Rol 
2 2 2 3 4
2 2 2 3 4
2 2 3 3 4
2 2 3 3 4
2 2 3 3 5
2 2 3 4 5
2º passo: Construir a tabela, distribuir as frequências.
Tabela 9 - Distribuição de frequências referentes ao atendimento do diretor de uma escola durante 
30 dias consecutivos
Atendimentos Número de dias (Fi) FR(%) FAC FRAC(%)
2 14
14
30
100 46 7�
�
�
�
�
� �. , 14
14
30
100 46 7�
�
�
�
�
� �. ,
3 9
9
30
100 30�
�
�
�
�
� �. 14 9 23� �
23
30
100 76 7�
�
�
�
�
� �. ,
4 5
5
30
100 16 7�
�
�
�
�
� �. , 23 5 28� �
28
30
100 93 3�
�
�
�
�
� �. ,
5 2
2
30
100 6 6�
�
�
�
�
� �. , 28 2 30� �
30
30
100 100�
�
�
�
�
� �.
Total 30 100
Fonte: o autor.
59
UNIDADE 2
3º passo: construir as colunas complementares (já 
realizado na própria tabela). Agora é só conferir mais 
uma vez a tabela e verificar se está tudo de acordo. 
As tabelas têm a função de condensar infor-
mações, em alguns casos, o número de dados é tão 
grande, que dificulta a análise, para estes casos, são 
utilizadas tabelas com dados agrupados em inter-
valos de classes.
Imagine a seguinte a situação: você já atuando 
como professor de cursos de Saúde, aplica uma pro-
va a seus alunos. Para entender o desempenho dos 
seus alunos nesta avaliação, você pode fazer uma 
lista com as notas dos seus alunose colocá-las or-
denadas. A seguir temos as notas dos alunos desta 
turma (dados brutos).
3,0 3,0 6,0 9,0 10,0
3,0 9,5 8,5 6,5 6,5
3,0 5,0 7,0 7,0 7,0
4,0 7,0 6,0 6,5 8,0
9,0 4,5 9,5 8,0 8,5
6,0 7,0 10,0 7,5 8,5
Agora, colocaremos os dados em rol, observe a 
seguir: 
3,0 5,0 6,5 7,5 9,0
3,0 6,0 7,0 8,0 9,0
3,0 6,0 7,0 8,0 9,5
3,0 6,0 7,0 8,5 9,5
4,0 6,5 7,0 8,5 10,0
4,5 6,5 7,0 8,5 10,0
Agora, construiremos a tabela de distribuição de 
frequências sem intervalo de classes (Tabela 10).
 Tabela 10 - Distribuição de frequências referente 
às notas de seus alunos (sem intervalo de classes)
Notas Número de alunos
3,0 4
4,0 1
4,5 1
5,0 1
6,0 3
6,5 3
7,0 5
7,5 1
8,0 2
8,5 3
9,0 2
9,5 2
10,0 2
Total 30 
Fonte: o autor.
Você pode observar que temos uma tabela com 
mais de dez classes, ou seja, mais do que dez linhas 
(exceto cabeçalho e total). Agora, imagina, quando 
formos inserir as colunas complementares, quan-
tos números terá nossa tabela? 
Para melhorar essa tabela, podemos cons-
truir uma distribuição de frequências com 
intervalo de classes para condensar melhor as 
informações da tabela. Ao elaborar uma distri-
buição de frequências com intervalo de classes, 
precisamos seguir os passos:
1º passo: colocar os dados em rol.
2º passo: determinar a amplitude total, que se 
trata da diferença entre o maior valor do conjunto 
de dados pelo menor valor do conjunto de dados, 
resolvido pela equação:
60
UNICESUMAR
AT Xmáx Xmín� �
Em que:
AT = Amplitude Total
Xmáx = Maior valor do conjunto de dados
Xmín = menor valor do conjunto de dados
3º passo: determinar o número de classes. Para uma distribuição de frequências com intervalo de 
classes, os números de linhas são definidos pela equação a seguir:
k n=
Em que:
K = número de classes
n = número total de elementos
Obs.: é muito importante que o número de classes seja arredondado. 
4º passo: determinar a amplitude do intervalo, ou seja, a distância entre o limite inferior da classe e o 
limite superior da classe, dado pela equação:
h AT
k
=
Em que:
h = Amplitude do intervalo
AT = Amplitude total
k = número de classes
O arredondamento de dados é importante em uma distribuição de 
frequências com intervalo de classes, principalmente no item número 
de classes. Para relembrar como se faz o arredondamento de dados, 
assista ao vídeo a seguir.
Para acessar, use seu leitor de QR Code.
https://apigame.unicesumar.edu.br/qrcode/8449
61
UNIDADE 2
5º passo: construa a tabela, faça as colunas complementares, distribuindo, corretamente, as frequências. 
A seguir, temos um resumo dos passos que devem ser seguidos para construir uma distribuição de 
frequências com intervalo de classes (Figura 2).
Colocar os dados em Rol.1º passo 
2º passo Calcular Amplitude Total: AT = Xmáx-Xmín.
3º passo Calcular nº de classes = raiz (n).
4º passo Calcular amplitude do intervalo: h = AT/k.
5º passo Construir a tabela de frequências, respeitando o intervalo encontrado 
respeitando os limites inferior e superior.
Figura 2 - Passo a passo para construção de uma tabela de frequências com intervalo de classes / Fonte: o autor.
Descrição da Imagem: na figura, temos uma sequência dos passos para a construção de uma distribuição de fre-
quênciascom intervalo de classes: 1º passo – rol; 2º passo – cálculo da AT; 3º passo – cálculo do número de classes 
(linhas); 4º passo – cálculo da amplitude do intervalo, e o passo 5 – construção da tabela respeitando o intervalo de 
classes entre os limites. 
Para entender melhor a construção de uma distribuição de frequências com intervalo de classes, observe 
os dados a seguir, que são referentes às notas de alunos do curso de Ciências Biológicas: 
62
UNICESUMAR
1º passo: colocar os dados em rol ordenado (crescente).
3,0 5,0 6,5 7,5 9,0
3,0 6,0 7,0 8,0 9,0
3,0 6,0 7,0 8,0 9,5
3,0 6,0 7,0 8,5 9,5
4,0 6,5 7,0 8,5 10,0
4,5 6,5 7,0 8,5 10,0
2º passo: agora, determinaremos a Amplitude do Intervalo:
AT Xmáx Xmín� �
AT � � �10 0 3 0 7 0, , ,
3,0 5,0 6,5 7,5 9,0
3,0 6,0 7,0 8,0 9,0
3,0 6,0 7,0 8,0 9,5
3,0 6,0 7,0 8,5 9,5
4,0 6,5 7,0 8,5 10,0
4,5 6,5 7,0 8,5 10,0
3º passo: em seguida, determinaremos o número de classes (k).
k n=
k
k arredondando
=
= =
30
5 47 5,
4º passo: agora, resolveremos a amplitude do intervalo, utilizando a equação a seguir: 
h AT
k
=
h
h
=
=
7
5
1 4,
Sabemos, até o momento, que nossa tabela terá:
5 linhas (classes)
Intervalo será de 1,4 em 1,4 (entre limites)
63
UNIDADE 2
Antes de construir nossa tabela de frequências, precisamos entender o que são limites inferiores e 
superiores. Temos quatro maneiras de utilizar os limites inferiores e superiores:
1. |------- Nesta primeira notação, incluímos o limite inferior e excluímos o limite superior.
2. -------| Nesta notação, excluímos o limite inferior e incluímos o limite superior.
3. ------- Nesta notação, excluímos ambos os limites.
4. |------| Nesta notação, incluímos ambos os limites. 
Qual delas usar? Utilizaremos a primeira notação, que inclui limite inferior e exclui limite superior, 
mas, em alguns casos, somente na última classe, teremos que usar a quarta notação, que inclui ambos 
os limites, isso pode ocorrer para que o maior valor do conjunto de dados seja contado. 
Como já temos todas as informações, construiremos nossa tabela (Tabela 11):
Tabela 11 - Distribuição de frequências referente às notas de seus alunos (com intervalo de classes)
Notas
Número 
de 
alunos 
(Fi)
FR(%) FAC FRAC (%) Ponto médio (xi)
3,0 |----- 4,4 5
5
30
100 16 7�
�
�
�
�
� �. , 5
5
30
100 16 7�
�
�
�
�
� �. , 3 0 4 4 2 3 7, , ,�� � � �
4,4 |----- 5,8 2
2
30
100 6 6�
�
�
�
�
� �. , 5+2=7
7
30
100 23 3�
�
�
�
�
� �. , 4 4 5 8 2 5 1, , ,�� � � �
5,8 |----- 7,2 11
11
30
100 36 7�
�
�
�
�
� �. , 7+11=18
11
30
100 36 7�
�
�
�
�
� �. , 5 8 7 2 2 6 5, , ,�� � � �
7,2 |----- 8,6 6
6
30
100 20�
�
�
�
�
� �. 18+6=24
24
30
100 80�
�
�
�
�
� �. 7 2 8 6 2 7 9, , ,�� � � �
 8,6 |-----| 10,0 6
6
30
100 20�
�
�
�
�
� �. 24+6=30
30
30
100 100�
�
�
�
�
� �. 8 6 10 0 2 9 3, , ,�� � � �
Total 30 100
Fonte: o autor.
Agora, temos a tabela resolvida, observe que, na última classe, tivemos que utilizar a notação que inclui 
limite inferior e inclui limite superior |-----|, isso foi feito para que a nota 10,0 fosse incluída na contagem.
Observe, nesta tabela, que há uma coluna complementar a mais, a coluna ponto médio, que é de-
terminado pela equação:
Xi Li Ls� � �( ) 2
64
UNICESUMAR
Em que:
Xi = Ponto médio
Li = Limite inferir do intervalo de classe (independentemente da notação)
Ls = Limite superior do intervalo de classe (independentemente da notação)
É importante ficar atento porque só existe ponto médio em uma distribuição de frequências com 
intervalo de classes. O ponto médio será importante, em nossa próxima unidade, no cálculo da média. 
Você sabia que um professor pode trabalhar dados da Educação Bá-
sica e do Ensino Superior, fazendo consulta no próprio INEP? E que 
estes dados podem ser utilizados para entender o comportamento 
dos alunos do país? E que você pode trabalhar isso em sala de aula 
utilizando esses dados? Nossa roda de conversa traz uma explicação 
do trabalho de coleta dos dados do INEP e da organização em tabe-
las, planilhas e gráficos. Assista e replique em sala de aula, vamos lá?
Outra maneira de apresentar os dados provenientes de uma pesquisa são os gráficos (Figura 3). Um 
gráfico tem por objetivo apresentar uma ideia visual do comportamento de um conjunto de valores, 
tem a vantagem de facilitar a compreensão de determinada situação que queira ser descrita, permitindo 
a interpretação rápida de suas principais características (ARANGO, 2011). 
https://apigame.unicesumar.edu.br/qrcode/8459
65
UNIDADE 2
É importante frisar que um gráfico não traz tantas informações quanto a uma tabela. E você vai se 
perguntar: usarei gráfico ou tabelas em minhas pesquisas? A resposta é: fica a critério do pesquisador, 
ou seja, a pessoa que está fazendo a pesquisa pode utilizar gráficos ou tabelas, ou fazer uma mesclagem 
entre eles. Os gráficos estão sempre presentes em trabalhos científicos, artigos, congressos, seminários, 
simpósios, em que é preciso comunicar um grande volume de informações com tempo limitado, de 
forma compreensível e agradável. 
Temos vários modelos de gráficos, que veremos a seguir:
a) Gráfico de colunas: quando temos as categorias apresentadas no eixo horizontal e a frequên-
cia no eixo vertical (BARBETTA, 2014). Para construção do gráfico de colunas, utilizaremos 
os dados referentes às matrículas na Educação Infantil, retirados do INEP (2019). A Figura 3, 
apresenta um gráfico de colunas:
Figura 3 - Gráfico de Colunas / Fonte: adaptada de Inep (2020).
Descrição da Imagem: a figura traz um gráfico de colunas em que as barras estão na direção vertical, primeiro com 
a região Norte em que temos 690.631 alunos, seguida da região Nordeste com 2.349.305 alunos, seguida da região 
Sudeste com 3.919.235, após, com a região Sul, 1.347.509 alunos e, por fim, a região Centro-Oeste com 666.098 alunos. 
Como você pode observar, na horizontal, temos as regiões do país e, na vertical temos o número de 
matrículas na Educação Básica. Caso você queira saber o número de matriculados na região Norte, 
por exemplo, basta olhar na região Norte e verificar que há pouco mais do que 500.000 matrículas, 
no ano de 2019.
66
UNICESUMAR
b) Gráfico de barras: em que cada variável é representada por uma barra de comprimento 
proporcional à sua ocorrência (BARBETTA, 2014). Temos as barras na vertical, na Figura 4.
Figura 4 - Gráfico de Barras / Fonte: adaptada de Inep (2020).
Descrição da Imagem: a figura traz um gráfico de colunas em que as barras estão na direção horizontal: de baixo 
para cima aparece primeiro a região Norte em que temos 690.631 alunos, seguida da região Nordeste com 2.349.305 
alunos, seguida da região Sudeste com 3.919.235, após, a região Sul com 1.347.509 alunos e, por fim, a região Centro-
-Oeste com 666.098 alunos. 
Descrição da Imagem: a figura traz um gráfico de linhas com os meses de janeiro a dezembro, apresentando a evo-
lução do índice pluviométrico no período. 
c) Gráfico de linhas: são gráficos bem interessantes no uso de séries temporais, ou seja, a variável 
predominante é o fator tempo (cronológico), esse tipo de gráfico mostra informações da série 
estudada em pontos e que são marcados por segmentos de linha reta. A Figura 5 apresenta-nos 
um gráfico de linhas. 
Figura 5 - Gráfico de linhas / Fonte: o autor.
67
UNIDADE 2
Na Figura 5, com o gráfico de linhas, você pode observar que o aumento no índice pluviométrico é apresentado 
mês a mês (tempo), e, para interpretar esse gráfico, basta visualizar que podemos concluir que o mês 
de julho foi que apresentou maior quantidade de chuvas. 
d) Gráfico de setores: também conhecido como gráfico de pizza, é um gráfico circular, em que 
os valores são representados proporcionais às respectivas frequências. Para a construção deste 
gráfico, utilizaremos os dados referentes às preferências de alunos de uma turma do curso de 
Ciências Biológicas (Figura 6). 
Figura 6 - Gráfico de setores / Fonte: o autor.
Neste tipo de gráfico, podemos verificar a proporção dentre as disciplinasque os alunos escolheram 
como preferidas. Fica nítida a preferência pela disciplina Zoologia I, seguida da disciplina Biologia 
Celular e Molecular, sendo a menos preferida a disciplina Anatomia Humana, para esta turma men-
cionada no exemplo. 
e) Histograma: é a representação gráfica de uma distribuição de frequências, pode ser construído 
a partir de uma distribuição de frequências sem intervalo de classes ou com intervalo de classes. 
Aqui cada retângulo justaposto representa uma classe (Figura 7).
Descrição da Imagem: a figura traz um gráfico em formato de pizza, circular, sendo que a proporção maior está com 
45% na disciplina Zoologia I, seguida de 23% na disciplina Biologia Celular e Molecular, seguida da disciplina Bioesta-
tística com 15% e, por fim, a disciplina Anatomia com 7%.
68
UNICESUMAR
Figura 7 - Histograma / Fonte: o autor.
Na Figura 7, que representa um histograma, para interpretação, você deve olhar as notas bem como a 
quantidade de alunos, observe que, no primeiro retângulo, temos cinco alunos com notas maiores ou 
iguais a 3,0 e menores do que 4,4, e assim sucessivamente. Você pode, também, construir todos os seus 
gráficos em suas pesquisas com o auxílio do Microsoft Excel®, basta inserir todos os dados, selecionar 
e escolher o modelo que melhor represente os dados com que está trabalhando. Dessa maneira, fica a 
critério do pesquisador a utilização de tabelas e gráficos para apresentar os resultados de uma pesquisa, 
podendo seu uso ser intercalado. 
Você percebeu o quanto a construção de tabelas e gráficos pode ser significativa e aplicada na sua 
profissão? Existem muitas possibilidades. Você pode trabalhar com pesquisa e apresentar os resultados 
em tabelas e gráficos, com dados disponíveis no próprio INEP sobre a Educação Básica ou, até mesmo, 
coletar dados de seus alunos, construir tabelas e gráficos para entender o comportamento de sua turma 
em alguns quesitos (dê preferência por disciplinas, notas, frequências, evasões, entre outros) Veja que 
tudo isso está relacionado e que a Bioestatística está presente em sua na vida diária.
Descrição da Imagem: a figura representa um histograma, em que temos gráficos na vertical, juntos, ou seja, sem 
espaço entre as barras, iniciando com cinco alunos com notas maiores ou iguais a 3,0 e menores do que 4,4; dois alunos 
com notas maiores ou iguais a 4,4 e menores do que 5,8; onze alunos com notas maiores ou iguais a 5,8 e menores 
que 7,2; seis alunos com notas maiores ou iguais a 7,2 e menores do que 8,6 e seis alunos com notas maiores ou iguais 
a 8,6 e menores ou iguais a 10,0.
69
UNIDADE 2
Vimos, em nossos estudos, como as técnicas de estatística são fundamentais para tomada de decisões e 
que, para organizar uma tabela, precisamos seguir algumas normas específicas que foram apresentadas 
no decorrer dessa unidade. Além disso, os gráficos também podem ser utilizados para visualizar o 
resultado de uma pesquisa. Assim, ao tabular os resultados da pesquisa propostos no início de nosso 
estudo, mais especificamente na experimentação, em que colocamos uma situação hipotética, que rea-
lizará um experimento para saber se as pessoas de um bairro (ou membros da família tiveram dengue). 
Aqui, na ação, após toda coleta de dados a partir de um formulário elaborado por você, certamente, terá 
resultados a serem tabulados. É isso mesmo, com todas as técnicas estudadas, você poderá criar tabelas 
de frequências, colunas complementares para melhorar os resultados obtidos e, a partir de então, tomar 
decisões. Supondo que suas respostas sejam que, dentro de um grupo de dez pessoas, oito responderam 
que já tiveram dengue, ou seja, 80% dos entrevistados, como profissional da área de Ciências Biológicas 
e Saúde, o que você pode propor? Com base nesse estudo, pode propor palestras para sensibilização 
da população, um dia D de combate ao foco de dengue, orientar, disseminar informações acerca dos 
cuidados que devemos ter com a dengue. Aqui, você pode perceber, que usamos uma técnica estatística, 
e a partir de então, foram feitas ações de melhoria no combate a dengue. 
Você sabia que, como futuro da saúde e, possivelmente, um profissio-
nal da Educação, faz parte do exercício de cidadania e profissional a 
consulta de dados básicos para articulação, conscientização e tomada 
de decisão? Para tanto, uma sugestão seria iniciarmos consultando a 
sinopse Estatística da Educação Básica. Esta sinopse trata-se de dados 
relacionados à matrícula de acadêmicos, ao estabelecimento, às regiões, ao rendimento 
escolar para as diferentes modalidades de ensino brasileiras: Ensino Regular (Educação 
Infantil e Ensino Fundamental e Médio), Educação Especial e Educação de Jovens e Adultos. 
Você pode consultar os dados dessa sinopse que serão apresentados, detalhadamente, por 
cidade, estado e região, e trabalhar com eles os apresentando em tabelas mais reduzidas. 
Tudo isso pode variar de acordo com a sua necessidade como futuro professor. Esses dados 
podem ser consultados no qrcode a seguir. Para acessar, use seu leitor de QR Code.
https://apigame.unicesumar.edu.br/qrcode/8451
70
M
A
P
A
 M
EN
TA
L
Caro(a) estudante, a utilização de tabelas e gráficos são a forma de apresentar resultados oriundos 
de uma pesquisa, como vimos em nossa unidade, existem normas específicas para sua elaboração 
e confecção. A partir desta conceitualização, desenvolva um Mapa Mental que aborde os con-
ceitos com que trabalhamos nesta unidade: Tabelas e Gráficos. Procure colocar as informações 
pertinentes sobre cada uma das relações apresentadas na área de Biológicas e da Saúde. 
3
Olá, aluno(a), esta unidade será fundamental para sua aprendiza-
gem e para sua futura profissão. Por meio dela, você terá oportuni-
dade de entender como ocorre a análise dos dados oriundos de uma 
pesquisa para que possa analisar situações quanto à frequência, 
à incidência, às ocorrências, entre outras variáveis imprescindíveis 
para futura atuação profissional. Você aprenderá, nesta unidade, a 
trabalhar com as medidas de posição, separatrizes e variabilidade. 
Medidas de Posição e 
Dispersão
Me. Renata Cristina Souza Chatalov
72
UNICESUMAR
Para que possamos continuar nossas reflexões, vamos nos apropriar dos conceitos 
e resgataremos os exemplos e a trajetória das unidades anteriores. Neste momen-
to de sua leitura, você, provavelmente, deve estar se perguntando: “agora que já 
coletei os dados, organizei em tabelas, qual a próxima etapa? O que posso fazer 
com eles? Por que estou aprendendo tudo isso? Em que será útil no meu dia a 
dia? Para que possamos problematizar e refletir, compartilharei outra história que 
foi muito relevante em minha trajetória. Vou nos transportar para a primeira vez 
em que entrei em uma escola como professora da disciplina Estatística. Naquele 
momento, eu tinha várias expectativas quanto à minha atuação como docente. 
Aquele ambiente inspirava o conhecimento e o meu desejo de ensinar. No entanto, 
já em sala de aula, quando fiz a primeira explicação/apresentação a respeito do 
que se tratava a disciplina de cálculo, explicitei que, também, trabalharíamos com 
a interpretação de dados e informações e notei que isso foi uma surpresa para 
os estudantes daquela turma. Na aula seguinte, fiz uma revisão de conteúdos de 
Matemática Básica, como fração, multiplicação e expressão numérica, quando 
percebi a necessidade de mais aulas relembrando este conteúdo com meus alunos. 
Então, para ter um parâmetro de como estava a turma, fiz um teste, sem valer 
nota, mas para ter um diagnóstico real de como poderia trabalhar. Depois que 
fiz as correções dos testes, calculei a média, a variância e o desvio padrão daquela 
turma e entendi que havia muita dispersão, ou seja, parte da turma necessitava de 
uma atenção especial em cálculos básicos de matemática, outra parte era inter-
mediária, e outra parte tinha gabaritado o teste. Com essa turma heterogênea, era 
preciso cuidado e atenção, e isso me desafiava nesta primeira experiência comoprofessora. Com este relato de minha história, desejo que, nesta unidade, você se 
atente aos conteúdos que desbravaremos e compreender juntos, que tratam de 
formas de se calcular as medidas de posição e dispersão e sobre como perceber 
o quanto estas são importantes em nossa tomada de decisões. 
Você percebeu que, como professora da disciplina Estatística, utilizei medidas 
de dispersão para mensurar o conhecimento prévio da turma em Matemática 
Básica e, com base nos resultados, fui traçando um planejamento pedagógico 
pensando na melhor maneira do aprendizado da minha turma. Agora que en-
tendemos que a estatística pode nos ajudar a construir elementos para tomada 
de decisões, você, também, pode se apropriar destes preceitos para a tomada de 
decisão em sua trajetória profissional e verá que essas medidas ajudarão você a 
interpretar os resultados de que precisa em um conjunto de dados. 
73
UNIDADE 3
Portanto, peço que faça a leitura do artigo intitulado 
Medidas de dispersão: os valores estão próximos entre si ou 
variam muito? Nesse artigo, você terá uma explicação das 
medidas de dispersão e o que os resultados apresentam 
entre si. Acesse o qrcode:
Depois da leitura do artigo anterior, vamos pôr a mão 
na massa? Trabalharemos, agora, com dados coletados em 
uma turma. Sugiro que levante as notas dos seus colegas de turma, no primeiro, no 
segundo, no terceiro e no quarto módulo. Em seguida, determine a média para cada 
aluno(a), e analise o desempenho de sua turma. Construa esta organização e faça esta 
análise, e você já estará utilizando mais uma técnica apresentada pela Bioestatística. 
Caso prefira, pode extrapolar este contexto de nosso exemplo para outras áreas da 
sua vida, como com as contas de luz, água ou internet, ao longo do último ano. 
Sendo assim, provoco você a fazer uma autoanálise sobre a sua aprendizagem de 
tudo que foi explicado até agora, pois este processo mostrará que estas medidas o aju-
darão a interpretar os resultados de que precisa em um conjunto de dados. O que você 
encontrou até aqui? Todas estas informações auxiliarão você? Diante disso, convido 
você, acadêmico, a fazer suas anotações em um Diário de Bordo. Construa uma tabela 
à mão com esses dados, a fim de anotar suas primeiras impressões até o momento. 
DIÁRIO DE BORDO
https://apigame.unicesumar.edu.br/qrcode/8455
74
UNICESUMAR
Neste momento, caro(a) estu-
dante, estudaremos as medi-
das de posição, as separatrizes 
e a dispersão. As medidas de 
tendência central possibilitam 
representar um conjunto de 
dados com apenas um número 
(MARTINEZ, 2015). As medi-
das de posição mais utilizadas e 
as que estudaremos são: a mé-
dia, a moda e a mediana.
Média
Mediana
Moda
Figura 1 - Medidas de tendência central (ou medidas de posição)
Fonte: o autor.
Descrição da Imagem: a figura apresenta as três medidas de tendência 
central, ou podemos dizer, as medidas de posição mais utilizadas: média, 
mediana e moda.
Figura 1 - Lorem ipsum dolor sit amet, consectetur adipiscing elit / Fonte: ipsum sit amet (p. 00). 
75
UNIDADE 3
A medida de posição média é a medida de tendência central mais conhecida e mais importante para 
um conjunto de valores. Tenho certeza de que você já a utilizou no seu dia a dia, pois é bem simples 
de ser calculada. Para o cálculo da média, basta somar todos os valores e, em seguida, dividir pelo total 
de elementos. A média amostral é representada por um x com uma barra em cima ( X ), e a média 
populacional pela letra grega µ (lê-se mi). Mesmo sendo representadas de maneira diferente, a forma 
de calcular é a mesma. 
Para calcularmos a média, quando temos dados desagrupados, ou seja, sem estarem em tabelas, 
podendo ser brutos ou em rol, é dada por:
f) Média Populacional: 
µ
X
N
i
Em que:
µ = Média Populacional
∑ = Somatória
Xi = Valor de cada elemento
N = Total da População
g) Média Amostral: 
X
X
n
i� �
Em que:
 X = Média Amostral 
∑ = Somatória
Xi = Valor de cada elemento
n = Total da Amostra
Cada uma dessas medidas envolve fórmulas e aplicações diferentes, tornando a Bioestatística 
ainda mais fascinante. “As medidas de tendência central só podem ser calculadas para variáveis 
quantitativas” (PARENTI; SILVA; SILVEIRA, 2017, p. 116).
76
UNICESUMAR
Como você pode observar, o cálculo da média é o mesmo tanto para a população quanto para a amos-
tra. Aposto que, neste momento, você está se questionando: mas como funciona na prática? Sempre 
que não for mencionado que os dados são populacionais, você pode considerar uma amostra, e isso 
acontece porque, geralmente, o trabalho com amostras tem um custo e um tempo menor do que o 
trabalho com população. Você pode observar que, na área das Ciências Biológicas e da Saúde, o uso 
de amostras é recorrente. 
Para compreender melhor o que eu desejo explicar para você aqui, o cálculo da média, vejamos um 
exemplo. As idades (em anos) de oito pessoas que estão apresentadas, a seguir:
38, 40, 49, 67, 33, 57, 54 e 64
A média amostral, denotada por x (lê-se “xis barra”), é dada por:
X
X
n
i� �
X
X
n
x x x xn
n
i� �
� �� 1 2 3.......
Assim:
X
X
�
� � � � � � �
� �
38 40 49 67 33 57 54 64
8
402
8
50 25,
Você pode observar que a média é apresentada na mesma unidade de medida da variável analisada. E 
como interpretamos uma média de 50, 25 anos? Em primeiro lugar, tendo a média como uma medida 
de tendência central, podemos afirmar que as idades das oito pessoas de nossa amostra estão em torno 
de 50, 25 anos. A Figura 2 ajuda-nos a visualizar a média e os dados apresentados.
Figura 2 - Apresentação dos dados e da média / Fonte: o autor.
Descrição da Imagem: a imagem apresenta uma reta com os valores de dois em dois, iniciando em 30, 32, 34, 36 
e terminando em 68; a média está representada, na reta, no valor de 50, 25 anos, os valores estão apresentados na 
dispersão e marcados pontos em: 33,38, 40, 49, 54, 57, 64 e 67.
77
UNIDADE 3
Dessa forma, lembre-se de que a média é uma medida-resumo, isto é, ela visa sintetizar em um único 
valor todas as nossas observações amostrais. Em outras palavras, afirmarmos que a idade de 50, 25 anos 
é um valor que tem por intuito representar as idades de todas as oito pessoas analisadas. No entanto 
você pode observar que a média é um resumo incompleto de nosso conjunto de dados uma vez que 
ela não informa o tamanho da dispersão de nossos dados a seu redor. Observe que, com a média de 
50, 25 anos, temos pessoas com 33 anos, com 48 e com 67. Para explicar toda esta dispersão, existe o 
desvio padrão, que discutiremos um pouco mais à frente. 
Supondo que, agora, temos uma amostra composta por oito mulheres, e a variável que nos interessa 
é o número de filhos, para isso, temos:
1, 1, 1, 2, 2, 3, 3, e 4 
A variável analisada é de natureza quantitativa discreta. A média amostral é:
X
X
n
i� �
X
X
X
�
� � � � � � �
�
�
1 1 1 2 2 3 3 4
8
17
8
2 125,
Se o número de filhos é uma variável discreta, e não temos casas decimais, seria possível ter uma média 
de 2,125 filhos? Ainda que a variável estudada não admita casas decimais, a sua média pode sim ter 
casas decimais. Entretanto, neste exemplo apresentado, basta uma casa decimal para a média, aí po-
demos utilizar a regra de arredondamento e dizer que as famílias têm, em média, 2,1 filhos. Também 
podemos ter interesse em calcular a média, em dados qualitativos apresentados em tabelas. Vejamos 
o exemplo, na Tabela 1, a seguir:
 Tabela 1 - Média das estaturas (em cm) de 30 adolescentes, conforme a classificação de seus pesos
Grupo Frequência (Fi) Média da Estatura (cm)
Portadores de sobrepeso 6 145,5
Portadores de obesidade 14 148,8
Portadores de peso adequado 10 149,3
 Fonte: o autor.
Para calcular a média neste caso, trabalharemos com a média ponderada, dada pela equação:
X
X fi
n
i� � .
78
UNICESUMAR
Em que:
X = média
Xi = cada um dos valores (ou ponto médio)
n = número total de elementos (ou somatória das frequências)
Temos:
X
X fi
n
i� � .
X
X
X
�
� �
�
� �
( . ,) ( . , ) ( . , )
. , .
6 145 5 14 148 8 10 149 3
30
873 2 083 32 1 493
30
��
�
4 449 32
30
148 31
. ,
,X
Em vez de calcular dessa maneira, para facilitar, você pode, dentro da sua tabela, criar uma coluna 
complementar e chamá-la de xi.fi, colocar os resultados em cada classe da multiplicação da frequência 
pelo valor da variável e, depois, somar com o total na Tabela 2. Vejamos a seguir:
Tabela 2 - Média das estaturas (em cm) de 30 adolescentes, conforme a classificação de seus pesos com coluna complementar
Grupo Frequência (Fi) Média da Estatura (cm) Fi.Xi
Portadores de sobrepeso 6 145,5 ( . , )6 145 5 873=
Portadores de obesidade 14 148,8 ( . , ) . ,14 148 5 2 083 2=
Portadores de peso adequado 10 149,3 ( . , ) .10 149 3 1 493=
Total 30 4.449,2
Fonte: o autor.
Agora, com o resultado da somatória das frequências pela variável, utilizamos a mesma equação. Veja 
como fica:
X
X fi
n
i� � .
X
X
=
=
4 449 32
30
148 31
. ,
,
79
UNIDADE 3
Você, também, poderá encontrar situações, no seu cotidiano, já atuando como profissional, em que 
você precisará calcular a média de idade de seus pacientes, ou, ainda, calcular médias de seus alunos 
utilizando os dados quantitativos. Vejamos um exemplo hipotético em que analisaremos as notas de 
uma turma do curso de Biomedicina, na Tabela 3 a seguir:
 Tabela 3 - Notas de 30 alunos do Curso de Biomedicina
Nota Número de alunos
7,0 8
8,0 12
9,0 6
10,0 4
Total 30
 Fonte: o autor.
Para que o professor saiba a média em questão, ele realizará uma análise simples, multiplicará a nota 
(variável que está sendo estudada) pelo número de alunos, em seguida dividirá pelo total da turma, 
que, neste caso, é de 30 alunos. Utilizando a equação da média, temos:
X
X fi
n
i� � .
X
X
X
X
�
� � �
�
� � �
�
�
( . ) ( . ) ( . ) ( . )
,
7 8 8 12 9 6 10 4
30
56 96 54 40
30
246
30
8 2
Outra opção para calcular, como vimos anteriormente, é criar a coluna complementar, ficando, desta 
forma, na Tabela 4:
 Tabela 4 - Notas de 30 alunos do Curso de Biomedicina
Nota Número de alunos xi.fi
7,0 8 56
8,0 12 96
9,0 6 54
10,0 4 40
Total 30 246
 Fonte: o autor.
80
UNICESUMAR
Resolvendo a média, temos:
X
X fi
n
i� � .
X
X
=
=
246
30
8 2,
E se tivermos uma tabela de frequências com intervalo de classes, como calculamos 
a média? Utilizaremos a mesma equação, mas precisaremos calcular o ponto médio. 
Vejamos um exemplo: as notas dos alunos do curso de Biomedicina estão apresen-
tadas na Tabela 5 a seguir.
Tabela 5 - Distribuição de frequências referente às notas de 
alunos do Curso de Biomedicina (com intervalo de classes)
Notas Número de alunos (Fi)
3,0 |----- 4,4 5
4,4 |----- 5,8 2
5,8 |----- 7,2 11
7,2 |----- 8,6 6
 8,6 |-----| 10,0 6
Total 30
 Fonte: o autor.
Na Tabela 6, temos as notas dos alunos do curso para calcularmos a média. A fim 
de facilitar, inseriremos uma coluna complementar, determinaremos o ponto médio 
primeiro, utilizando a equação a seguir: 
Xi Li Ls� � �( ) 2
Em que:
Xi = Ponto médio
Li = Limite inferior do intervalo de classe (independente da notação)
Ls = Limite superior do intervalo de classe (independente da notação)
Agora, com a coluna complementar na tabela, determinaremos o ponto médio de 
cada classe, na Tabela 6.
81
UNIDADE 3
Tabela 6 - Distribuição de frequências referente às notas de alunos do Curso de Biomedicina (com intervalo de classes)
Notas Número de alunos (Fi) Ponto médio (xi)
3,0 |----- 4,4 5 3 0 4 4 2 3 7, , ,�� � � �
4,4 |----- 5,8 2 4 4 5 8 2 5 1, , ,�� � � �
5,8 |----- 7,2 11 5 8 7 2 2 6 5, , ,�� � � �
7,2 |----- 8,6 6 7 2 8 6 2 7 9, , ,�� � � �
 8,6 |-----| 10,0 6 8 6 10 0 2 9 3, , ,�� � � �
Total 30
Fonte: o autor.
Agora que temos o ponto médio, basta inserir uma coluna complementar “xi.fi” e utilizar a equação 
da média, que já trabalhamos, anteriormente. Reescrevendo, na Tabela 7, temos:
Tabela 7 - Distribuição de frequências referente às notas de alunos do Curso de Biomedicina (com intervalo de classes)
Notas Número de alunos (Fi) Ponto médio (xi) xi.fi
3,0 |----- 4,4 5 3 0 4 4 2 3 7, , ,�� � � � ( . , ) ,5 3 7 18 5=
4,4 |----- 5,8 2 4 4 5 8 2 5 1, , ,�� � � � ( . , ) ,2 5 1 10 2=
5,8 |----- 7,2 11 5 8 7 2 2 6 5, , ,�� � � � ( . , ) ,11 6 5 71 5=
7,2 |----- 8,6 6 7 2 8 6 2 7 9, , ,�� � � � ( . , ) ,6 7 9 47 4=
 8,6 |-----| 10,0 6 8 6 10 0 2 9 3, , ,�� � � � ( . , ) ,6 9 3 55 8=
Total 30 203,4
Fonte: o autor.
Determinando a média, temos:
X
X fi
n
i� � .
X
X
=
=
203 4
30
6 78
,
,
A média da turma é 6,78, arredondando temos que a média da turma de Biomedicina é de 6,8.
82
UNICESUMAR
A medida de tendência central mais conhecida e mais utilizada é a média, mas não é sempre 
que ela é a mais apropriada para representar os dados, às vezes, a mediana é mais adequada 
para representar um conjunto de dados. Isso ocorre sempre que a variabilidade dos dados 
for alta, pois a média é afetada por valores extremos, e a mediana não, ela apenas leva em 
consideração os valores centrais.
Fonte: Parenti, Silva e Silveira (2017, p. 120).
É importante não confundir moda com maioria. A moda é a observação mais frequente, mas 
isso não implica, necessariamente, que a moda corresponde à maioria das observações.
(E. Z. Martines).
83
UNIDADE 3
Outra medida de posição importante é a moda. Você deve ter ouvido falar da expressão: “música que 
está na moda”, “roupa que está na moda”, isso significa que tem muita frequência, muitas pessoas ouvindo 
a mesma música, muitas pessoas usando mesmo estilo de roupa. Aqui na Bioestatística, esse conceito é 
bem válido. Assim, para Martinez (2015), a moda é a observação que ocorre com maior frequência no 
conjunto de dados, ou seja, o valor que mais se repete. Imagine que em uma loja de calçados femininos 
foram vendidos 20 pares de sapatos em um único dia. Os pares tinham estas numerações: 
34 37 34 36 36
35 36 37 33 36
36 36 36 36 39
36 35 34 36 36
A numeração que aparece com mais frequência é o número 36. Significa que é uma informação muito 
importante ao gerente da loja, pois indica que ele não pode deixar de ter calçados 36 em seu estoque, 
porque vendem com mais frequência. 
Em outro exemplo, suponha que, em uma turma de 1º ano de Nutrição, as idades dos 20 alunos (em 
anos completos) são: 
30 25 19 18 18
18 18 18 18 18
19 20 23 25 27
24 22 22 18 18
Podemos descrever, adequadamente, as idades destes alunos dizendo que a idade mais frequente, ou 
moda, é 18 anos. No entanto, em alguns casos, a moda pode não ser a medida mais apropriada para 
caracterizar os dados. Como os valores a seguir são os níveis séricos de triglicérides (em mg/dl) em 
uma amostra de sete pacientes:
189, 72, 109, 140, 140, 140, 135
84
UNICESUMAR
A moda, neste exemplo, seria 140 mg/dl, sendo o valor mais frequente. Mas será que a moda é a medida 
de posição que melhor caracteriza esses dados? Talvez a média ou a mediana (que veremos a seguir) 
sejam mais úteis para esta finalidade. Em algumas situações, a moda pode não ser única. Por exemplo, 
o tempo de aleitamento materno (em meses) de 8 crianças usuárias de um serviço de saúde: 
1, 2, 3, 3, 4, 6, 6
Neste exemplo, temos dois valores mais frequentes, 3 e 6 meses. Podemos dizer que se trata de uma 
série bimodal, ou seja, dois valores de moda. Novamente, a média ou a mediana podem ser mais 
úteis para descrever os dados desse exemplo. Podemos não ter moda em um conjunto de dados, caso 
nenhum número se repita mais vezes do que outro. Quando isso acontece, chamamos a distribuição 
de amodal. Se tivermos mais do que duas modas, teremos uma distribuição multimodal (PARENTI; 
SILVA; SILVEIRA, 2017).
Em alguns casos podemos ter interesse em saber a moda, mas os dados estão apresentados em tabela, 
como fazer? Bem simples, basta olharmos os dados e a coluna frequência, assim, vamos encontrar a 
classe modal, para então sabermos a moda. Observe os dados a seguir, na Tabela 8.
Tabela 8 - Notas de alunos do Curso de Nutrição
Nota Número dealunos
7,0 8
8,0 12
9,0 6
10,0 4
Total 30
Fonte: o autor.
Para determinar a moda em tabelas, primeiramente, procuraremos a classe modal. Para isso, basta 
observar na coluna que tem a maior frequência. Em nosso exemplo, a segunda classe tem doze alunos, 
que corresponde ao valor que aparece com mais frequência, portanto, esta é a classe modal. 
Em tabelas de frequências, também, podemos ter mais do que uma moda. Analise a seguir, na 
Tabela 9.
Tabela 9 - Notas de alunos do Curso de Nutrição
Nota Número de alunos
7,0 4
8,0 10
9,0 6
10,0 10
Total 30
Fonte: o autor.
Classe modal
Classe modal
Classe modal
85
UNIDADE 3
Neste caso, as notas que aparecem com maior frequência são 8 e 10, temos uma série bimodal, ou seja, 
com duas modas. E quando temos dados em tabelas de frequências com intervalo de classes, como fica? 
Primeiro passo é localizar a classe modal, ou seja, a classe que tem a maior frequência e, em seguida, 
utilizar a equação a seguir:
Mo Li h Fi Fi
Fi Fi Fi Fi
� �
�
� � �
�
� �
.( )
( ) ( )
1
1 1
Em que:
Mo = Moda
Li = Limite da classe inferior (na classe modal)
h = Amplitude do intervalo (distância entre Li e Ls)
Fi = Frequência da classe
Fi−1 = Frequência da classe anterior
Fi+1 = Frequência da classe posterior
Para entender melhor, vejamos o exemplo na Tabela 10.
Tabela 10 - Distribuição de frequências referente às notas de alunos do Curso de Nutrição (com intervalo de classes)
Notas Número de alunos (Fi)
3,0 |----- 4,4 5
4,4 |----- 5,8 2
5,8 |----- 7,2 11
7,2 |----- 8,6 6
 8,6 |-----| 10,0 6
Total 30
Fonte: o autor.
Determine a moda. Para calcular a moda, procuraremos, na tabela, na coluna frequências, a maior 
frequência para indicar a classe modal. Podemos observar que a moda está na terceira classe da tabela, 
mas qual a moda? Determinaremos a seguir:
Mo Li h Fi Fi
Fi Fi Fi Fi
� �
�
� � �
�
� �
.( )
( ) ( )
1
1 1
Mo
Mo
Mo
� �
�
� � �
� �
�
� �
5 8 1 4 11 2
11 2 11 6
5 8 1 4 9
9 5
5 8
,
, .( )
( ) ( )
,
, .( )
( ) ( )
,
112 6
14
5 8 0 9
6 7
,
, ,
,
Mo
Mo
� �
�
86
UNICESUMAR
Encontramos que a nota que representa a moda é igual a 6,7; mas os dados não foram dados em rol, 
com esta equação, encontramos o valor mais aproximado, observem que este valor está dentro dos 
valores estabelecidos nos limites inferiores e superiores. Para Parenti, Silva e Silveira (2017), a mediana 
é definida como sendo o valor central da distribuição dos dados ordenados, e este divide a distribuição 
ao meio, sendo que metade dos valores será menor ou igual à mediana, e a outra metade será maior ou 
igual à mediana. Até o momento, quando calculávamos a média e a moda, fazíamos, diretamente, sem 
ter que colocar os dados em rol, mas, para calcular a mediana, obrigatoriamente, devemos colocar os 
dados em rol. Supondo que temos as idades de cinco alunos do curso de Nutrição, que são dadas a seguir:
25 22 18 23 24
Encontre a mediana entre as idades dos alunos. Sabemos que a mediana divide o conjunto de dados 
em duas partes iguais, não seria correto fazer simplesmente assim:
25 22 18 23 24
Dessa forma está errada, pois a idade de 18 anos não é o que divide o conjunto de dados em rol, pois, 
na mediana, estes dados devem ser ordenados, portanto:
18 22 23 24 25
Agora, temos a mediana, que é igual à idade de 23 anos. 
Vejamos outro exemplo: idades (em anos) de sete pessoas estão apresentadas a seguir:
38, 40, 49, 67, 33, 57, 54 
Primeiro passo: colocar os dados em rol:
33, 38, 40, 49, 54, 57, 67
Encontrando a mediana, temos:
33, 38, 40, 49, 54, 57, 67
Mediana igual a 49. Agora, representaremos, na Figura 3, para que você consiga analisar os valores 
antes e depois da mediana.
Mediana
Mediana
87
UNIDADE 3
Figura 3 - Representação na mediana / Fonte: o autor.
Descrição da Imagem: a figura apresenta uma representação da mediana onde se encontra uma reta com os valo-
res de dois em dois, iniciando em 30, 32, 34, 36 e terminando em 68, a mediana está representada no valor de 49, os 
valores estão apresentados na dispersão e marcados pontos em: 33, 38, 40, 49, 54, 57, 64 e 67.
Se substituirmos a maior idade de 67 para 75 anos, o que aconteceria com a mediana? Seu valor se 
modificaria? O número do meio continuaria sendo 49 anos. Esta é uma característica importante 
da mediana: ela não é sensível a valores atípicos de nosso conjunto de dados, e entendemos por valor 
atípico um número bastante grande ou pequeno em relação aos demais.
No cálculo da mediana, temos duas situações quando temos o conjunto de dados com números 
pares e ímpares. Quando tivermos um número ímpar de elementos, a mediana será exatamente o valor 
central. Também pode ser calculado pela equação a seguir:
p n� �( )1
2
Em que:
P = posição do elemento que está à mediana
n = número de elementos
Por exemplo: Notas de sete alunos do curso de Nutrição:
7,0 6,0 5,0 5,5 9,0 8,0 9,0
Colocando os dados em rol:
5,0 5,5 6,0 7,0 8,0 9,0 9,0
88
UNICESUMAR
Utilizando a equação, temos:
p n� �( )1
2
p
p
p
�
�
�
�
( )7 1
2
8
2
4
O ‘p’ encontrado igual a 4, não é a mediana, mas sim o valor que ocupa a posição mediana, ou seja, com 
os dados em rol, a mediana ocupa a 4ª posição:
5,0 5,5 6,0 7,0 8,0 9,0 9,0
1ª 2ª 3ª 4ª 5ª 6ª 7ª
Podemos visualizar que a mediana é a nota 7,0, que ocupa a 4ª posição.
Quando tivermos um número par de elementos, a mediana será uma média simples entre os ele-
mentos que ocupam a posição central o valor central. Pode ser calculado por:
p n
p n
1
2
2
2
1
�
� �
Em que:
P = posição do elemento que está à mediana
n = número de elementos
Por exemplo: Notas de oito alunos do curso de Nutrição:
7,0 6,0 5,0 5,5 9,0 8,0 9,0 7,5
Colocando os dados em rol:
5,0 5,5 6,0 7,0 7,5 8,0 9,0 9,0
89
UNIDADE 3
Utilizando a equação, temos:
p n
p n
1
2
2
2
1
�
� �
p posição
p posição
1
2
8
2
4
8
2
1 5
� �
� � �
ª
ª
Temos:
5,0 5,5 6,0 7,0 7,5 8,0 9,0 9,0
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª
Agora, tiraremos uma média simples entre o elemento que está na quarta e na quinta posição:
Md
Md
Md
�
�
�
�
( , , )
,
,
7 0 7 5
2
14 5
2
7 25
Muitas vezes, podemos ter o interesse em calcular a mediana em dados agrupados em tabelas, para 
isso, precisaremos que nossa Tabela 11 tenha a coluna frequência acumulada (FAC). 
Tabela 11 - Notas de 30 alunos do Curso de Nutrição
Nota Número de alunos FAC
7,0 8 8
8,0 12 20
9,0 6 26
10,0 4 30
Total 30
Fonte: o autor.
Para encontrar a mediana, como os dados já se encontram agrupados em uma tabela de frequências, 
por meio da coluna frequência acumulada, vamos localizar o elemento que ocupa a posição mediana, 
como nosso conjunto de dados é par, temos:
90
UNICESUMAR
p n
p n
1
2
2
2
1
�
� �
p posição
p posição
1
2
30
2
15
30
2
1 16
� �
� � �
ª
ª
Agora com na coluna FAC, vamos localizar os elementos que ocupam a 15ª e a 16ª posição. Veja na 
tabela 12, a seguir: 
Tabela 12 - Notas de 30 alunos do Curso de Nutrição
Nota Número de alunos FAC
7,0 8 8 (ocupa até a 8ª posição)
8,0 12 20 (da 9ª até 20ª)
9,0 6 26 (da 21ª até 26ª)
10,0 4 30 (da 27ª até 30ª)
Total 30
Fonte: o autor.
Para este caso, o elemento que ocupa a 15ª e 16ª posição está na segunda classe é a nota 8,0, portanto, 
a nota mediana desta turma é 8,0. E se tivesse uma nota em uma classe, e outra na classe posterior? 
Simples, bastaria tirar a média simples entre as duas notas.
Também podemos ter interesse em calcular a mediana em uma distribuição de frequências com 
intervalo de classes. Para determinar a mediana, utilizamos a seguinte equação:
Md Li
h n Fac
Fi
� �
� �.( )2 1
Em que:
Md = Mediana
Li = Limite da classe inferior (na classe mediana)
h = Amplitude do intervalo (distância entre Li e Ls)
n = número de elementos
Fi = Frequência da classe
Fac−1= Frequência acumulada da classe anterior
Agora, entenderá como calcular a mediana em dados agrupados em uma distribuição de frequências 
comintervalo de classes. Observe na Tabela 13 a seguir.
Classe mediana
91
UNIDADE 3
Tabela 13 - Distribuição de frequências referente às notas de alunos do Curso de Nutrição (com intervalo de classes)
Notas Número de alunos (Fi) FAC
3,0 |----- 4,4 5 5
4,4 |----- 5,8 2 7
5,8 |----- 7,2 11 18
7,2 |----- 8,6 6 24
8,6 |-----| 10,0 6 30
Total 30
Fonte: o autor.
Para resolvermos, temos primeiro que encontrar a posição mediana na coluna FAC. Como nosso 
conjunto de dados é par, temos:
p n
p n
1
2
2
2
1
�
� �
p posição
p posição
1
2
30
2
15
30
2
1 16
� �
� � �
ª
ª
Podemos observar, na tabela, que os dados estão na 3ª classe. Trabalharemos com estes dados e subs-
tituiremos na equação da mediana. 
Md Li
h n Fac
Fi
� �
� �.( )2 1
Md
Md
Md
Md
� �
�
� �
�
� �
�
5 8
1 4 30
2
7
2
5 8 1 4 15 7
11
5 8 1 4 8
11
5
,
, .( )
,
, .( )
,
, .( )
,,
,
, ,
,
8 11 2
11
5 8 1 02
6 82
�
� �
�
Md
Md
92
UNICESUMAR
Temos que a nota mediana da turma é igual a 6,8. 
Compilaremos tudo que aprendemos em uma aplicação: Em uma maternidade, a enfermeira está 
anotando os pesos dos recém-nascidos na manhã de um domingo, quando cinco bebês nasceram. Os 
dados são (em kg):
3,850 4,210 3,950 4,300 3,850
Vamos calcular as medidas de tendência central para estes dados:
a) Média: 
X
X
n
i� �
X
X
X
� � � � �
�
�
3 850 4 210 3 950 4 300 3 850
20 16
5
4 032
, , , , ,
,
,
Em média, os bebês daquela manhã de domingo pesavam 4,032 kg.
b) Moda: valor que mais se repete, portanto é 3,850 kg. Assim: O valor mais frequente para o peso 
dos recém-nascidos naquela maternidade é de 3,850 kg.
c) Mediana: colocar os dados em rol: 
3,850 3,850 3,950 4,210 4,300
p n� �( )1
2
p
p
p
�
�
�
�
( )5 1
2
6
2
3
A mediana será o terceiro elemento do conjunto de dados ordenados. Portanto, 3,950. Assim: metade 
das crianças nascidas na maternidade pesava menos de 3,950kg, e a outra metade pesava mais do que 
3,950 kg.
93
UNIDADE 3
Outras medidas que você pode utilizar são as separatrizes que dividirão as séries em partes iguais, e as 
principais são: mediana (que já estudamos), quartis, decis e percentis. Os quartis dividem uma série 
de dados em quatro partes iguais, assim, temos: 1º quartil, 2º quartil e 3º quartil (CRESPO, 2009). Esta 
representação encontra-se na Figura 4, a seguir.
25%25% 25% 25%
Q1 Q2
(mediana)
Q3
Figura 4 - Representação dos quartis / Fonte: o autor.
A medida de tendência central mais conhecida e mais utilizada é a média, mas não é sempre 
que ela é a mais apropriada para representar os dados, às vezes, a mediana é mais adequada 
para representar um conjunto de dados. Isso ocorre sempre que a variabilidade dos dados 
for alta, pois a média é afetada por valores extremos, e a mediana não, ela, apenas, leva em 
consideração os valores centrais.
Fonte: Parenti, Silva e Silveira (2017).
Descrição da Imagem: a figura traz a representação dos quartis, onde se encontram Três Quartis. De cima para bai-
xo, vem o primeiro Quartil (Q1), que apresenta 25% dos dados menores e 75% maiores; logo abaixo, vem o segundo 
Quartil (Q2), onde temos 50% dos dados menores e 50% maiores, é a medida que coincide com a mediana, e no último 
e terceiro Quartil (Q3) temos 75% dos dados menores e 25% maiores.
94
UNICESUMAR
Assim, como pode observar na Figura 5, segundo Crespo (2009) temos os três quartis: 
Primeiro Quartil (Q1): temos 25%
 dos dados menores e 75% maiores.
Segundo Quartil (Q2): temos 50% dos
 dados menores e 50% maiores, é a
 medida que coincide com a mediana.
Terceiro Quartil (Q3): temos 75% dos
 dados menores e 25% maiores.
Figura 5 - Três Quartis / Fonte: Crespo (2009).
Descrição da Imagem: a figura apresenta os Três Quartis. De cima para baixo, vem o primeiro Quartil (Q1), que apre-
senta 25% dos dados menores e 75% maiores; logo abaixo, vem o segundo Quartil (Q2), onde temos 50% dos dados 
menores e 50% maiores, é a medida que coincide com a mediana, e no último e terceiro Quartil (Q3), temos 75% dos 
dados menores e 25% maiores.
Para calcular, é bem simples, basta organizar a série de dados em rol, e utilizar as equações a seguir:
1º Quartil (Q1): P n� �0 25 1, .( )
2º Quartil (Q2): P n� �0 50 1, .( )
3º Quartil (Q3): P n� �0 75 1, .( )
Por exemplo, calcularemos Q1, Q2 e Q3 para um grupo que tem idades de oito pessoas: 
38, 40, 49, 67, 33, 57, 54 e 64
Primeiro passo: colocar os dados em rol.
95
UNIDADE 3
33, 38, 40, 49, 54, 57, 64, 67
a) 1º Quartil (Q1): 
P n� �0 25 1, .( )
P
P
P
� �
�
�
0 25 8 1
0 25 9
2 25
, .( )
, .
,
Neste caso, o Q1, será uma média simples entre 2º e 3º elemento:
Q
Q
Q
1 38 40
2
1 78
2
1 39
�
�
�
�
( )
b) 2º Quartil (Q2): 
P n� �0 50 1, .( )
P
P
P
� �
�
�
0 50 8 1
0 50 9
4 5
, .( )
, .
,
Neste caso, o Q2, será uma média simples entre 4º e 5º elemento:
Q
Q
Q
2 49 54
2
1 103
2
1 51 5
�
�
�
�
( )
,
c) 3º Quartil (Q3): 
P n� �0 75 1, .( )
P
P
P
� �
�
�
0 75 8 1
0 75 9
6 75
, .( )
, .
,
96
UNICESUMAR
Neste caso, o Q3 será uma média simples entre 6º e 7º elemento:
Q
Q
Q
3 57 64
2
1 121
2
1 60 5
�
�
�
�
( )
,
Outra medida separatriz é o decil. Este divide uma série em dez partes iguais (CRESPO, 2009). As 
equações para calcular estão apresentadas a seguir:
1º Decil (D1): P n� �0 10 1, .( )
2º Decil (Q2): P n� �0 20 1, .( )
3º Decil (Q3): P n� �0 30 1, .( )
4º Decil (Q4): P n� �0 40 1, .( )
5º Decil (Q5): P n� �0 50 1, .( )
6º Decil (Q6): P n� �0 60 1, .( )
7º Decil (Q7): P n� �0 70 1, .( )
8º Decil (Q8): P n� �0 80 1, .( )
9º Decil (Q9): P n� �0 90 1, .( )
Por exemplo: calcular D3 e D4 e para um grupo que tem idades de oito pessoas: 
38, 40, 49, 67, 33, 57, 54 e 64
Primeiro passo: colocar os dados em rol.
33, 38, 40, 49, 54, 57, 64, 67
3º Decil (D3): P n� �0 30 1, .( )
P
P
P
� �
�
�
0 30 8 1
0 30 9
2 7
, .( )
, .( )
,
O 3º decil será o elemento que ocupa a posição 2,7, arredondando para 3º, assim, nosso terceiro decil 
é igual a 40.
97
UNIDADE 3
4º Quartil (Q4):
P n� �0 40 1, .( )
P
P
P
� �
�
�
0 40 8 1
0 40 9
3 6
, .( )
, .( )
,
O 4º decil será o elemento que ocupa a posição 3,6, arredondando para 4º, assim, nosso quarto decil é 
igual a 49. Como percentil, temos como definição: os noventa e nove valores que separarão uma série 
de dados em cem partes iguais (CRESPO, 2009). Pode ser calculado por meio das equações a seguir:
5º Percentil (P5): P n� �0 05 1, .( )
25º Percentil (P25): P n� �0 25 1, .( )
50º Percentil (P50): P n� �0 50 1, .( )
75º Percentil (P75): P n� �0 75 1, .( )
90º Percentil (P90): P n� �0 90 1, .( )
Por exemplo: calcular P50 e P75 e para um grupo que tem idades de oito pessoas: 
38, 40, 49, 67, 33, 57, 54 e 64
Primeiro passo: colocar os dados em rol.
33, 38, 40, 49, 54, 57, 64, 67
50º Percentil (P50): P n� �0 50 1, .( )
P n� �0 50 1, .( )
P n
P
P
P
� �
� �
�
�
0 50 1
0 50 8 1
0 50 9
4 5
, .( )
, .( )
, .( )
,
Portanto, o P50 é igual ao elemento que está na 4,5ª posição, portanto uma média simples entre 49 e 54:
( )
,
49 54
2
103
2
51 5� � �
98
UNICESUMAR
75º Percentil (P75): P n� �0 75 1, .( )
P n
P
P
P
� �
� �
�
�
0 75 1
0 75 8 1
0 75 9
6 75
, .( )
, .( )
, .( )
,
Portanto, o P75 é igual ao elemento que está na 6,75ª posição, portanto uma média simples entre 57 e 64:
( )
,
57 64
2
121
2
60 5� � �
Além das medidas separatrizes, temos as medidas de dispersão, que são importantes no processo 
decisório. Com as medidas de dispersão e variabilidade, é possível entender a homogeneidade ou a 
heterogeneidade dos dados (PARENTI; SILVA; SILVEIRA, 2017). As medidas de dispersão são avaliadas 
em conjunto com as medidas de tendência central. Com as medidas de dispersão, podemos analisar 
como os dados estão se comportando em torno da média, da moda e da mediana. É importante salientar 
que, apesar de dois conjuntos de dados terem a mesma média, eles podem não ter o mesmo compor-
tamento e a mesma variabilidade, para isso, é importante analisaros dados e fazer estas comparações 
para entender o comportamento dos dados. 
Não podemos interpretar as medidas de tendência central isoladamente. Para verificar se as 
medidas de variabilidade representam bem os dados, precisamos calcular e analisar as medi-
das de variabilidade.
(E. Z. Martinez)
Vejamos outro exemplo. Seja a estatura (em cm) observada em duas amostras de adolescentes saudáveis, 
denotaremos essas amostras por A e B. As estaturas dos adolescentes da amostra A são: 
149 156 157 158 159 160 161 164
As estaturas dos adolescentes da amostra B são: 
132 138 152 157 160 171 176 178
99
UNIDADE 3
Ao calcular a média da amostra A e B, ambas são 158 cm. As medianas de ambas as amostras (A e 
B) são iguais a 158,5. Assim, as amostras A e B possuem médias e medianas idênticas. Mas o fato de 
as amostras A e B possuírem medidas de posição iguais (média e mediana) permite-nos afirmar que 
adolescentes das amostras A e B são semelhantes em relação à estatura?
Vejamos a Figura 6 que apresenta o grupo A e B.
Figura 6 - Grupo A e B / Fonte: o autor.
Descrição da Imagem: a figura faz a representação do Grupo A e B. Nestas duas imagens, apresenta-se o grupo A 
com valores distribuídos na reta em: 149 156 157 158 159 160 161 164, e a média representando 158; no grupo 
A, a figura apresenta os pontos (dados) mais próximos da média; já o grupo B com valores distribuídos na reta em: 
132 138 152 157 160 171 176 178, no grupo B, a figura traz os pontos mais distantes, ou seja, mais dispersos 
da média, que é igual a 158. 
Na Figura 6, podemos observar as dispersões destas observações. Percebemos que, embora as medidas 
de locação sejam iguais, as amostras têm diferença quanto à dispersão dos dados. Na amostra A, as 
observações possuem uma dispersão menor em relação à média de 158 cm, já na amostra B, as obser-
vações encontram-se mais dispersas em relação a mesma média amostral. Se dissermos somente que a 
média das estaturas é de 158 cm, estaremos dizendo que nossas observações amostrais flutuam em torno 
de 158 cm, mas não temos informação do tamanho da dispersão dos dados em relação a essa média. 
Com isso, podemos evidenciar que as medidas de posição (média, moda e mediana), muitas vezes, 
dão um resumo incompleto do comportamento de nossos dados uma vez que elas não nos dizem 
nada a respeito da dispersão dos dados. Assim, torna-se tão importante a apresentação de medidas de 
variabilidade dos dados.
100
UNICESUMAR
Vamos conhecer estas medidas de dispersão? Iniciamos pela Amplitude total, de acordo com Mar-
tinez (2015), a amplitude é dada pela distância entre o maior valor do conjunto de dados pelo menor 
valor do conjunto de dados. Assim, a amplitude total só leva em consideração os extremos, não chega 
a comparar os valores da distribuição com a média destes dados. É calculada pela equação a seguir:
AT Xmáx Xmín� �
Em que:
AT = Amplitude total
Xmáx = Maior valor do conjunto de dados
Xmín = Menor valor do conjunto de dados
Por exemplo, temos oito pessoas cujas idades são apresentadas a seguir: 
38, 40, 49, 67, 33, 57, 54 e 64
A pessoa mais velha tem 64 anos, e a mais nova, 33 anos. A amplitude amostral é, portanto: 
AT Xmáx Xmín� �
AT
AT
� �
�
64 33
31
Podemos interpretar a AT como sendo a maior diferença que é possível encontrar entre duas quaisquer 
observações de nossa amostra (MARTINEZ, 2015). Assim, a AT deve ser utilizada com certa cautela 
para descrever a amplitude de nossos dados, dado que ela é, fortemente, influenciada por valores atí-
picos, sendo não recomendado seu uso sozinha para interpretação de variabilidade dos dados. 
Outra medida de dispersão é a variância, calculada com todos os dados da série e comparada 
cada um deles com a média. A variância mede a distância de cada um dos valores em relação à média 
(MARTINEZ, 2015). Por uma questão matemática, precisamos elevar ao quadrado cada uma dessas 
distâncias para podermos eliminar o sinal. Depois disso, fazemos a média dos quadrados destas dife-
renças. Lembre-se de que não teremos variância negativa, certo? 
Caso a variância esteja sendo calculada para os dados de uma população, representaremos este 
valor pela letra grega sigma ao quadrado σ2. Em vez de dividirmos por n-1, dividimos o somatório 
por N, sendo que n é o número de elementos da amostra, e N é o número de elementos da população. 
A variância populacional e amostral é calculada por:
a) Variância Populacional
σ
µ2
2
�
�� ( )X
N
i
101
UNIDADE 3
Em que:
s2 = Variância Populacional
Xi = Cada valor/elemento
µ = média populacional
N = Número de elementos 
Σ = Somatória
b) Variância Amostral
S
X X
n
i2
2
1
�
�
�
� ( )
Em que:
S2 = Variância Amostral
Xi = Cada valor/elemento
X = média amostral
 n −1= Número de elementos (menos 1)
Σ = Somatória
Como você pode observar, a única diferença na prática do cálculo da variância populacional e amostral 
é que, na variância amostral, tiraremos um elemento na hora de fazer a divisão. É válido lembrar que, 
na maioria das situações, utilizamos amostras, por questão de custo, da forma de coletar, entre outros. 
Entenderá na prática.
Temos oito pessoas cujas idades são apresentadas a seguir: 
38, 40, 49, 67, 33, 57, 54 e 64
Determinaremos a variância amostral. Lembrando que precisaremos da média para calcular a variância. 
a) A média amostral
X
X
n
i� �
X
X
�
� � � � � � �
� �
38 40 49 67 33 57 54 64
8
402
8
50 25,
102
UNICESUMAR
Agora que relembramos a média, calcularemos a variância amostral, substituindo os valores na equação:
S
X X
n
i2
2
1
�
�
�
� ( )
S2
2 2 2 238 50 25 40 50 25 49 50 25 67 50 25 33 50
�
� � � � � � � � �( , ) ( , ) ( , ) ( , ) ( ,225 57 50 25 54 50 25 64 50 25
8 1
12 25
2 2 2 2
2
2
) ( , ) ( , ) ( , )
( , ) (
� � � � � �
�
�
� �S �� � � � � � � � �10 25 1 25 16 75 17 25 6 75 3 75 13
2 2 2 2 2 2, ) ( , ) ( , ) ( , ) ( , ) ( , ) ( ,775
7
150 06 105 06 1 56 280 56 297 56 45 56
2
2
)
( , ) ( , ) ( , ) ( , ) ( , ) ( ,S � � � � � � )) ( , ) ( , )
. ,
,
� �
�
�
14 06 189 06
7
1 083 48
7
154 78
2
2
S
S
Como você pode observar, a variância calcula a soma dos quadrados das distâncias em relação à média. 
Como elevamos todos os termos ao quadrado, a nossa unidade de medida também fica alterada. Se, 
por exemplo, estivermos calculando a variância da altura de alunos do curso de Ciências Biológicas, e a 
medida está em cm, todos os elementos determinados estarão em cm2. Sendo assim, nós não podemos 
comparar a variância, diretamente, com a média ou com outras medidas, pois precisaremos extrair a 
raiz da variância, e a isso denominamos desvio padrão.
Como desvio padrão é a raiz quadrada da variância, calculamos pela equação a seguir:
a) Desvio padrão populacional:
s s= 2
Em que:
s = desvio padrão Populacional
s2 = variância populacional
b) Desvio padrão amostral:
S S= 2
Em que:
S = desvio padrão amostral
S2= variância amostral
Determinando o desvio padrão, do exercício anterior, temos:
103
UNIDADE 3
S S= 2
S
S
=
=
154 78
12 44
,
,
A variabilidade entre as idades do grupo analisado é de 12,44 anos. 
Se quisermos comparar a variabilidade de duas ou mais amostras (ou populações), para Parenti, 
Silva e Silveira (2017), podemos fazer esta comparação somente com o uso do desvio padrão. Mas 
podemos comparar utilizando o coeficiente de variação, que nos dará em percentual a variabilidade 
dos dados, determinado por:
a) Coeficiente de variação (populacional):
CV (%) .� �
�
�
�
�
�
σ
µ
100
Em que:
CV% = Coeficiente de variação
σ = desvio padrão populacional
µ = média populacional
b) Coeficiente de variação (amostral):
CV S
X
(%) .� �
�
�
�
�
� 100
CV% = Coeficiente de variação
S = desvio padrão amostral
X = média amostral
Determinando o CV% amostral do exercício anterior, temos:
CV S
X
(%) .� �
�
�
�
�
� 100
CV
CV
CV
(%)
,
,
.
(%) , .
(%) , %
� �
�
�
�
�
�
� � �
�
12 44
50 25
100
0 2475 100
24 75
104
UNICESUMAR
Quandoutilizado o coeficiente de variação, sempre que quisermos 
descobrir qual grupo de dados é mais homogêneo, ou seja, que tem 
menor variabilidade em torno da média, optaremos pelo grupo 
que tiver o menor percentual do coeficiente de variação, pois, se o 
CV(%) for muito elevado, pode ser que a média não seja melhor 
medida para representar os dados, devido à variabilidade em torno 
dela (MARTINEZ, 2015). 
Supondo que, no curso de Ciências Biológicas, a média da turma 
A, na disciplina de Bioestatística, é 6,5, e o desvio padrão 1,2, e, na 
turma B, a média é de 6,8, e o desvio padrão é de 2,0, qual das duas 
turmas tem menor variabilidade dos dados? Determine, por meio 
do Coeficiente de variação. Para resolução, basta observar que já 
temos a média calculada e o desvio padrão também, é, simplesmen-
te, calcularmos o CV (%). 
Para turma A, temos:
CV S
X
(%) .� �
�
�
�
�
� 100
CV
CV
CV
(%)
,
,
.
(%) , .
(%) , %
� �
�
�
�
�
�
�
�
1 2
6 5
100
0 1846 100
18 46
Já para turma B, temos:
CV S
X
(%) .� �
�
�
�
�
� 100
CV
CV
CV
(%)
,
,
.
(%) , .
(%) , %
� �
�
�
�
�
�
�
�
2 0
6 8
100
0 2941 100
29 41
Portanto, a turma que tem uma variabilidade menor é a turma A, 
em que o CV foi de 18,46%. 
105
UNIDADE 3
Observe um resumo dos cinco passos para o Cálculo do Coefi-
ciente de Variação. Seguindo este passo a passo, temos o exemplo 
na Figura 7.
1. Calcular a média
2. Calcular a média
3. Calcular desvio padrão
4. Calcular coe�ciente de variação
5. Interpretar: conjunto de dados 
homogêneos ou heterogêneos.
Figura 7 - Passos para cálculo do coeficiente de variação / Fonte: o autor.
Descrição da Imagem: na figura, apresentam-se os cinco passos para 
cálculo do coeficiente de variação. Apresentamos uma sequência desses 
passos. No primeiro passo, temos o cálculo da média, no segundo passo, a 
determinação do cálculo da variância; o terceiro passo, o cálculo do desvio 
padrão; no quarto passo, temos o cálculo do coeficiente de variação, e no 
quinto passo, interpretamos o resultado: conjunto de dados homogêneos 
ou heterogêneos. 
106
UNICESUMAR
Também podemos ter interesse em calcular: variância, desvio padrão, em dados que aparecem em 
tabelas de frequências. Vejamos a seguir:
a) Cálculo das medidas de variabilidade em tabelas de frequências sem intervalo de classes: 
as notas de 30 alunos do curso de Ciências Biológicas estão apresentadas na distribuição de 
frequências a seguir:
Tabela 14 - Notas de 30 alunos do Curso de Ciências Biológicas
Nota Número de alunos
7,0 8
8,0 12
9,0 6
10,0 4
Total 30
Fonte: o autor.
O primeiro passo é sabermos a média, antes de calcular a variância amostral, para isso, temos:
X
X fi
n
i� � .
X
X
X
X
�
� � �
�
� � �
�
�
( . ) ( . ) ( . ) ( . )
,
7 8 8 12 9 6 10 4
30
56 96 54 40
30
246
30
8 2
Agora que já sabemos a média, utilizaremos a equação a seguir:
S
X X fi
n
i2
2
1
�
�
�
� ( ) .
Em que:
S2 = Variância Amostral
Xi = Cada valor/elemento
X = média amostral
 n −1= Número de elementos (menos 1)
Σ = Somatória
Fi = frequência 
107
UNIDADE 3
Para facilitar nosso cálculo, abriremos uma coluna a mais em nossa distribuição de frequência e inse-
riremos o numerador da equação da variância, conforme Tabela 15.
Tabela 15 - Notas de 30 alunos do Curso de Ciências Biológicas
Nota Número de alunos ( ) .X X fii �
2
7,0 8 ( , , ) . ,7 0 8 2 8 11 522� �
8,0 12 ( , , ) . ,8 0 8 2 12 0 482� �
9,0 6 ( , , ) . ,9 0 8 2 6 3 842� �
10,0 4 ( , , ) . ,10 0 8 2 4 12 962� �
Total 30 28,3
Fonte: o autor.
Com os dados da somatória de ( ) .X X fii −
2
, substituiremos na equação:
S
X X fi
n
i2
2
1
�
�
�
� ( ) .
Agora que temos o resultado e substituindo o valor “28,3” encontrado na tabela, por meio da coluna
( ) .X X fii −
2 , temos:
S
S
S
2
2
2
28 3
30 1
28 3
29
0 9759
�
�
�
�
,
,
,
Com o resultado da variância, conseguimos calcular o desvio padrão:
S S= 2
S
S
=
=
0 9759
0 9878
,
,
Podemos calcular o coeficiente de variação:
CV S
X
(%) .� �
�
�
�
�
� 100
108
UNICESUMAR
CV
CV
CV
(%)
,
,
.
(%) , .
(%) , %
� �
�
�
�
�
�
�
�
0 9878
8 2
100
0 1205 100
12 05
b) Cálculo das medidas de variabilidade em tabelas de frequências com 
intervalo de classes: 
As notas dos alunos de uma turma de Ciências Biológicas estão apresentadas na 
tabela a seguir. Determine o CV.
Tabela 16 - Distribuição de frequências referente às notas de alunos do Curso de Ciências 
Biológicas (com intervalo de classes)
Notas Número de alunos (Fi) Ponto médio (xi)
3,0 |----- 4,4 5 3 0 4 4 2 3 7, , ,�� � � �
4,4 |----- 5,8 2 4 4 5 8 2 5 1, , ,�� � � �
5,8 |----- 7,2 11 5 8 7 2 2 6 5, , ,�� � � �
7,2 |----- 8,6 6 7 2 8 6 2 7 9, , ,�� � � �
 8,6 |-----| 10,0 6 8 6 10 0 2 9 3, , ,�� � � �
Total 30
Fonte: o autor.
Para isso, calcularemos na sequência:
1. Média amostral.
2. Variância amostral.
3. Desvio padrão amoral.
4. Coeficiente de variação.
Iniciaremos calculando a variância amostral. Assim, para o seu cálculo, a equação 
utilizada para tabelas sem ou com intervalo de classes, é a mesma que acabamos de 
ver. A única diferença na prática é que: em uma distribuição de frequências com 
intervalo de classes, nosso “Xi” será o ponto médio, e não simplesmente a variável 
estudada. Lembre-se de que o ponto médio é fundamental para se calcular a média 
desse tipo de distribuição de frequência. 
Calculando a média amostral, temos:
109
UNIDADE 3
Tabela 17 - Distribuição de frequências referente às notas de alunos do Curso de Ciências Biológicas (com intervalo de classes)
Notas Número de alunos (Fi) Ponto médio (xi) xi.fi
3,0 |----- 4,4 5 3 0 4 4 2 3 7, , ,�� � � � ( . , ) ,5 3 7 18 5=
4,4 |----- 5,8 2 4 4 5 8 2 5 1, , ,�� � � � ( . , ) ,2 5 1 10 2=
5,8 |----- 7,2 11 5 8 7 2 2 6 5, , ,�� � � � ( . , ) ,11 6 5 71 5=
7,2 |----- 8,6 6 7 2 8 6 2 7 9, , ,�� � � � ( . , ) ,6 7 9 47 4=
 8,6 |-----| 10,0 6 8 6 10 0 2 9 3, , ,�� � � � ( . , ) ,6 9 3 55 8=
Total 30 203,4
Fonte: o autor.
Determinando a média, temos:
X
X fi
n
i� � .
X
X
=
=
203 4
30
6 78
,
,
Arredondando, temos que a média da turma de Ciências Biológicas é de 6,8. Com o resultado da mé-
dia, vamos reescrever a tabela, para determinar a variância amostral, para utilizar a equação a seguir:
S
X X fi
n
i2
2
1
�
�
�
� ( ) .
Com a tabela ajustada, temos:
Tabela 18 - Distribuição de frequências referente às notas de alunos do curso de Ciências Biológicas (com intervalo de classes)
Notas Número de alunos (Fi) Ponto médio (xi) ( ) .X X fii �
2
3,0 |----- 4,4 5 3 7, ( , , ) . ,3 7 6 8 5 48 052� �
4,4 |----- 5,8 2 5 1, ( , , ) . ,5 1 6 8 2 5 782� �
5,8 |----- 7,2 11 6 5, ( , , ) . ,6 5 6 8 11 0 992� �
7,2 |----- 8,6 6 7 9, ( , , ) . ,7 9 6 8 6 7 262� �
 8,6 |-----| 10,0 6 9 3, ( , , ) . ,9 3 6 8 6 37 52� �
Total 30 99,58
Fonte: o autor.
110
UNICESUMAR
Agora que calculamos a variância na tabela, é só substituir na equação:
S
X X fi
n
i2
2
1
�
�
�
� ( ) .
Substituindo, na equação, pelos valores encontrados na Tabela 18, temos:
S
S
S
2
2
2
99 58
30 1
99 58
29
34 34
�
�
�
�
,
,
,
Logo após, determinaremos o desvio padrão: 
S S= 2
S
S
=
=
34 34
5 86
,
,
Agora, com o desvio padrão, podemos calcular o CV(%):
CV S
X
(%) .� �
�
�
�
�
� 100
CV
CV
CV
(%)
,
,
.
(%) , .
(%) , %
� �
�
�
�
�
�
�
�
5 86
6 8
100
0 8671 100
86 71
No caso desta turma, com um coeficiente de variação de 86,71%, podemos concluir que há uma dis-
persão muito grande das notas, e que a média pode não ser a medida ideal para interpretar estes dados. 
Mas quando olhamos para os dados com mais cautela, temos alunos que tiraram 3,0; 4,0; 5,0; 10. E o 
que isso quer dizer? Como conclusão, temos que essa turma apresenta uma grande dispersão no quesito 
nota, porque o resultado encontrado de 86,71% é superior a 50%. Isso quer dizer que existem alunos 
que estão indo bem na disciplina, mas também existem alunos que não estão aprendendo. 
Assim, podemos refletir: com tanta dispersão, o que posso melhorar para que todostenham um 
aprendizado? As medidas de dispersão podem ajudar neste caminho. Agora que temos os dados em 
mãos, podemos trabalhar para melhorar a maneira de ensinar nesta turma. 
111
UNIDADE 3
Caro(a) estudante, finalizamos esta unidade compreendendo o processo pelo qual as medidas de posi-
ção, as separatrizes e a dispersão podem ajudar a trabalhar melhor com os dados e auxiliar no processo 
decisório. Como educadores e profissionais da saúde, temos que ter a consciência da importância da 
Bioestatística, pois, como vimos, ela traz a preocupação de entender como os dados podem trazer 
indicativos para um professor em sala de aula. 
A partir das medidas de posição, você conseguirá trabalhar com seus dados, entendendo o com-
portamento dos mesmos, e com as medidas de dispersão, como você percebeu, conseguimos entender 
se a média é representativa, ou não, para o conjunto de dados. Dentro da Bioestatística, você poderá 
observar os resultados de sua pesquisa sendo uma ferramenta, essencial para a tomada de decisões, e 
que estará presente no seu futuro profissional. 
Você sabia que um profissional da área de Biológicas ou da Saúde, 
também, pode ser um pesquisador? Pode pesquisar na área de meio 
ambiente, saúde, laboratorial, e é vasto o campo para esse profis-
sional. Nossa Roda de Conversa trará como as medidas de posição 
e dispersão podem ajudar na interpretação de resultados em uma 
pesquisa. Assista e replique em sala de aula. Vamos lá?
Você sabia que a área da Biologia, além 
das questões ambientais, educacionais, 
engloba a área da saúde? Assim, você 
pode consultar periódicos com aplicação 
da Bioestatística, e convido a fazer as lei-
turas dos artigos, a seguir: Para acessar, 
use seu leitor de QR Code.
Artigo 1 Artigo 2
https://apigame.unicesumar.edu.br/qrcode/8460
https://apigame.unicesumar.edu.br/qrcode/8454
https://apigame.unicesumar.edu.br/qrcode/8453
112
A
G
O
R
A
 É
 C
O
M
 V
O
C
Ê
1. Um profissional de Ciências Biológicas que atua em um laboratório fará uma compra de 
um componente específico de para uma análise laboratorial, para isso, fez uma pesquisa 
com dois fornecedores diferentes. Para comparar o nível de impurezas presentes nas 
compras feitas aos dois fornecedores, o biólogo solicitou a medição de porcentagem 
de impurezas presentes em cada um dos grupos, obtendo o que segue resultado:
Fornecedor A: 1,8 2,5 1,5 1,2 1,0
Fornecedor B: 1,6 2,5 1,2 2,3 1,5
Para saber qual dos fornecedores traz mais impurezas, o biólogo utilizou uma medida 
que estudou na disciplina de Bioestatística, o coeficiente de variação. Os resultados 
do C.V. (%) foram: 37% para o fornecedor A, e 30% para o fornecedor B. Mediante os 
resultados obtidos, analise as afirmativas a seguir. 
I) O fornecedor A apresenta uma maior dispersão, por isso, terá a preferência de 
compra pelo biólogo.
II) O fornecedor B apresenta uma menor dispersão de impureza, por isso, é mais uni-
forme às impurezas. 
III) Por meio do coeficiente de variação, conseguimos medir qual dos fornecedores traz 
uma menor impureza, e isso pode influenciar na aquisição do material.
É correto o que se afirma em:
a) I, apenas.
b) I e II, apenas.
c) I e III, apenas. 
d) II e III, apenas.
e) I, II e III.
2. A tabela a seguir apresenta o tempo de duração (em dias) para se realizar análises de 
água. Os laboratórios estão credenciados em uma cidade no estado do Paraná. 
Tabela 1 - Duração de análises de água
Tempo (dias) Nº de análises (Fi) Fac
4 |---- 6 20 20
6 |---- 8 3 23
 8 |---- 10 7 30
Total 30
Fonte: o autor.
113
A
G
O
R
A
 É
 C
O
M
 V
O
C
Ê
Considerando esta informação, a mediana é igual a: 
a) 1,2.
b) 3,2.
c) 4,9.
d) 5,5.
e) 6,7
3. Um Biólogo fez pesquisa em site de uma revista e perguntou sobre as áreas da biologia 
de que os profissionais mais gostavam. Os participantes eram internautas e responde-
ram, voluntariamente, a pergunta. As respostas estão apresentadas na Tabela a seguir.
Tabela 2 - Áreas da Biologia
Áreas Número de respostas
Educação Ambiental 24
Anatomia 23
Botânica 10
Fisiologia 7
Bioquímica 36
Total 100
Fonte: o autor.
Com base nesta pesquisa, a área da Biologia que representa a moda é:
a) Educação Ambiental.
b) Anatomia.
c) Botânica.
d) Fisiologia.
e) Bioquímica.
4. As notas obtidas por 20 alunos do curso de Ciências Biológicas, na disciplina de Bioes-
tatística, estão apresentadas na Tabela a seguir:
Tabela 3 - Nota dos 20 estudantes na disciplina de Estatística
Notas Frequência (Fi)
4 1
5 1
6 3
8 12
9 3
Total 20
Fonte: o autor.
114
A
G
O
R
A
 É
 C
O
M
 V
O
C
Ê
Diante destas informações, a média dessa turma foi igual a:
a) 5,9.
b) 6,7.
c) 7,5.
d) 7,9.
e) 8,3.
5. Um professor de Ciências Biológicas está realizando um trabalho de Educação Ambien-
tal voltado à prevenção da dengue. Depois de realizar as coletas de dados, as ações 
preventivas foram feitas e, para finalizar seu relatório, o professor fez uma pesquisa 
com 400 moradores de um bairro com o objetivo de saber o grau de satisfação dos 
moradores com o resultado do trabalho dele e de seus alunos. Os resultados estão 
apresentados na tabela a seguir. 
Tabela 4 - Satisfação dos moradores junto ao Projeto de Educação Ambiental
Grau de satisfação dos moradores Frequência (Fi)
Muito insatisfeito 12
Insatisfeito 45
Satisfeito 173
Bastante Satisfeito 170
Total 400
Fonte: o autor.
A classe modal da pesquisa de moradores consiste na:
a) Primeira classe.
b) Segunda classe.
c) Terceira classe.
d) Quarta classe.
e) O conjunto de dados é amodal.
115
M
EU
 E
SP
A
Ç
O
116
M
EU
 E
SP
A
Ç
O
4
Olá, aluno(a), nesta unidade, trabalharemos com a correlação e a 
regressão linear, em que duas variáveis são analisadas (X e Y), assim, 
poderemos verificar se existe uma relação entre elas (correlação) e 
faremos o ajuste da reta (regressão), estimando valores. Além disso, 
trabalharemos com um assunto muito importante para sua forma-
ção: a inferência estatística, que visa, por meio de testes, analisar 
uma amostra e fazer projeções para a população. 
Correlação Regressão 
Linear e Inferência 
Estatística
Me. Renata Cristina Souza Chatalov
118
UNICESUMAR
Ao iniciar a leitura deste material, você pode já se perguntar: porque estudar correlação e regressão 
linear? Terei que fazer estimações de y a partir de x conhecido? Para que fazer um teste de hipóteses? 
Quando você estuda um comportamento conhecido e pode fazer estimações ou testar uma amostra, 
estará, certamente, utilizando uma técnica importante que será trabalhada aqui em Bioestatística. 
A correlação e a regressão linear ajudarão você a mensurar a força da relação entre X e Y, e a reta de 
regressão linear, você poderá fazer estimativas para Y a partir de X conhecido e, 
com isso, poderá trabalhar dentro de um modelo matemático conhecido, que 
ajudará em sua pesquisa. Já a inferência estatística trata-se de um conjunto de 
técnicas que tem por objetivo principal analisar uma população, por meio de 
evidências de uma amostra, para isso, temos: teste de hipóteses e intervalo de con-
fiança, que estudaremos. Convido a fazer a leitura do artigo, acessando o qrcode:
Assim, convido você a fazer um levantamento de artigos, reportagens, 
que tragam situações envolvendo correlação linear, regressão linear e inferência estatística. Faça um 
compilado e comece a identificar que os testes de hipóteses poderão ajudá-lo na tomada de decisões.
E aí, conseguiu fazer o experimento sugerido? Anote todas suas primeiras impressões até o momento, 
escreva os resultados de sua pesquisa aqui no Diário de Bordo. Este espaço é seu!
DIÁRIO DE BORDO
https://apigame.unicesumar.edu.br/qrcode/8498
119
UNIDADE 4
Agora, partindo para a conceitualização da última unidade, avaliaremos se há uma associação entre 
duas variáveis com características quantitativas, que é objetivo de inúmeros estudos em ciências bio-
lógicas e/ou da saúde. Por exemplo: um biomédico pode ter interesse se há relação entre a quantidadede chumbo em medida na água e no volume de efluentes despejados em certo rio; um profissional 
da área da saúde pode querer saber se existe relação entre a pressão arterial e idade das pessoas; um 
professor pode querer saber a relação entre peso e altura, e assim por diante. 
Quando existe a necessidade de analisar a relação entre essas duas variáveis, chamamos de 
correlação. 
Vejamos um exemplo: um professor de enfermagem deseja saber se existe correlação entre o tempo 
dedicado ao estudo e o desempenho dos alunos na disciplina Bioestatística. Assim, ele selecionou oito 
alunos, assim, podemos observar o número de horas (x) e nota obtida na prova de Bioestatística (y) 
para cada aluno(a). 
Tabela 1 - Relação entre as horas de estudo e nota na disciplina de Bioestatística
Acadêmico Horas de Estudo (x) Nota em Bioestatística (y)
A 8 10
B 8 8
C 6 4
D 5 8
E 4 6
F 7 9
G 5 7
H 1 2
Fonte: o autor.
Descrição da Imagem: a figura mostra um gráfico de dispersão em que o eixo (X) está na horizontal, representando 
as horas de estudo dos alunos; no eixo Y, que está na vertical, temos as notas distribuídas dos oitos alunos. 
120
UNICESUMAR
Se fosse perguntado a você, neste momento: existe uma relação entre as horas de estudo e nota da 
prova? Ao observar a Tabela 1, você conseguiria responder com facilidade? Provavelmente, não. Por 
quê? Fica difícil concluir algo somente observando a tabela, pois temos grande variação nos dados. Por 
isso, o primeiro passo é tentar organizar esses dados em um gráfico para visualizar melhor a relação 
entre as variáveis X e Y.
Para analisarmos se há correlação entre as variáveis X e Y, inicialmente, os dados são representados 
em um gráfico cartesiano de pontos, que chamamos de diagrama de dispersão. Cada ponto do gráfico 
corresponde a um aluno e é marcado segundo seu valor para X e para Y (Figura 1).
Figura 1 - Gráfico de dispersão sobre a relação entre horas de estudo (X) e nota na disciplina de bioestatística (y) / Fonte: o autor.
Analisando a Figura 1, podemos observar que os alunos que se dedicaram estudando por mais horas 
tiveram um desempenho melhor, e os que dedicaram menos horas ao estudo, a ter um desempenho 
pior na prova. Entretanto podemos observar que temos algumas exceções, como o aluno “C” que se 
dedicou horas de estudo e sua nota foi 4. Isso significa que, embora pareça existir uma correlação entre 
estas duas variáveis, ela não é perfeita.
Para sabermos com mais precisão, existe outra maneira, que é avaliar a correlação e usar um coe-
ficiente, que tem a vantagem de ser um valor numérico. 
Descrição da Imagem: na figura, temos um gráfico de dispersão em que o eixo (X) está na horizontal, e o eixo Y está 
na vertical, ao observar a dispersão, pode-se visualizar uma reta no sentido crescente, porque r = +1. 
121
UNIDADE 4
 “
 O coeficiente de correlação produto-momento (r) é uma medida da intensidade de 
associação existente entre duas variáveis quantitativas, e sua fórmula de cálculo foi 
proposta por Karl Pearson em 1896. Por essa razão, é também denominado coeficiente 
de correlação de Pearson. Por ter sido o primeiro a ser proposto (vários outros foram 
criados depois), muitas vezes r recebe simplesmente nome de coeficiente de correlação 
(MARTINEZ, 2015, p. 85).
O coeficiente de correlação pode variar entre -1 e +1. Quando temos valores negativos de r, temos cor-
relação do tipo inversa, ou seja, à medida que X aumenta Y diminui. Já quando temos valores positivos 
para r ocorrem quando a correlação é direta, ou seja, X e Y variam no mesmo sentido. Por exemplo, 
temos que as taxas sanguíneas de insulina e glicose apresentam correlação negativa; enquanto a taxa 
do hormônio glucagônio tem correlação positiva com a glicemia (MARTINEZ, 2015).
É importante salientar que, quando temos uma correlação linear negativa, não significa que é uma 
correlação ruim, apenas o sentido do gráfico será decrescente. O valor máximo (tanto r = +1 como r 
= -1) é obtido quando todos os pontos do diagrama estão em uma linha reta inclinada. Quando temos 
uma correlação linear igual a r +1, significa que temos uma correlação linear perfeita e positiva, como 
você pode observar na Figura 2.
Figura 2 - Correlação quando r = +1 / Fonte: o autor.
Descrição da Imagem: na figura, temos um gráfico de dispersão em que o eixo (X) está na horizontal e o eixo Y está 
na vertical, ao observar a dispersão, pode-se visualizar uma reta no sentido decrescente, à medida que x cresce y 
decresce, pois r = -1. 
Descrição da Imagem: na figura, há um gráfico de dispersão em que o eixo (X) está na horizontal, e o eixo Y está na 
vertical; ao observar a dispersão, podemos observar que a figura não tem uma reta crescente nem decrescente, pois 
o r é igual a 0,09.
122
UNICESUMAR
Quando temos uma correlação linear igual r -1, significa que temos uma correlação linear perfeita e 
negativa, como você pode observar na Figura 3.
Figura 3 - Correlação quando r = -1 / Fonte: o autor.
Por outro lado, quando não existe correlação entre X e Y, os pontos se distribuem de maneira que não 
temos uma relação, podendo ser em formato de nuvens circulares ou formatos não definidos, não 
tendo uma tendência crescente ou decrescente (Figura 4).
Figura 4 - Correlação quando r = 0,09 / Fonte: o autor.
Descrição da Imagem: na figura, há um gráfico de dispersão em que o eixo (X) está na horizontal e o eixo Y está na 
vertical, ao observar a dispersão, temos que os dados estão dispersos, mas tem uma tendência crescente, pois o r é 
igual a 0,65.
Descrição da Imagem: a figura apresenta um gráfico de dispersão em que o eixo (X) está na horizontal, e o eixo Y 
está na vertical; ao observar a dispersão, temos que os dados estão dispersos, mas tem uma leve tendência crescente, 
pois o r é igual a 0,55.
123
UNIDADE 4
 As associações (X e Y) de grau intermediário (r entre 0 e |1|) apresentam-se como nuvens inclinadas, 
de forma elíptica, como podemos observar na Figura 5.
Figura 5 - Correlação quando r = 0,65 / Fonte: o autor.
O que significa, então, esses valores de r? Observe a Figura 6 a seguir, que traz uma correlação igual a r = 0,56.
Figura 6 - Correlação quando r = 0,55 / Fonte: o autor.
Descrição da Imagem: a figura apresenta uma reta que tem nove barras (na vertical), iniciando o traço em -1, -8, -0,5, 
-,02, 0, 0,2, 0,5 0,8 e +1. 
124
UNICESUMAR
O que significa, então, o valor 0,55 encontrado? Assim, o coeficiente de correlação nunca será maior 
que 1 nem menor que –1. Dessa maneira, os valores de r iguais a zero evidenciam que não há asso-
ciação entre as variáveis X e Y. Enquanto valores próximos a zero (sejam eles negativos ou positivos) 
indicam uma correlação muito fraca entre as variáveis, os valores de r próximos a –1 ou a 1 indicam 
associações fortes entre X e Y. Portanto, o valor r = 0,588 indica uma correlação fraca ou forte? Apesar 
de uma boa resposta a esta pergunta subjetiva, para nos embasar, temos autores, livros, textos, artigos 
científicos para nos ajudar a interpretar a magnitude de um coeficiente de correlação.
Segundo Zou et al. (2003) a proposta para interpretação do coeficiente de correlação linear (r) 
pode ser observada no Quadro 1.
Quadro 1 - Interpretação do coeficiente de correlação linear
Valor do coeficiente de correlação linear (r) Direção e força da associação
-1,0 Perfeita e negativa
-0,8 Forte e negativa
-0,5 Moderada e negativa
-0,2 Fraca e negativa
0 Ausência de associativa
0,2 Fraca e positiva
0,5 Moderada e positiva
0,8 Forte e positiva
1,0 Perfeita e positiva
Fonte: adaptado de Zou et al. (2003).
Zou et al. (2003) interpretam o sinal do coeficiente de correlação como a direção da associação. Os 
coeficientes de correlação linear que são maiores do que zero apresentam correlações positivas (quanto 
maior X, maior Y), e coeficientes menores que zero indicam correlações negativas (quanto maior X, 
menor Y). Já a correlação igual a zero indica que não existe uma correlação linear.
É importante salientar que a interpretaçãode r pode variar de acordo com a experiência de au-
tores, principalmente as intermediárias (-0,8, 0,5, -0,2, -0,3 e outros), o que não muda é que +1 e -1 
são correlações perfeitas e zero não há correlação linear. Para facilitar nosso entendimento, analise na 
Figura 7 que quanto mais próximo aos extremos (-1 e +1) mais forte é a correlação, e, à medida que se 
aproxima de zero, a correlação vai ficando mais fraca. 
Figura 7 - Correlação quando r = 0,55 / Fonte: o autor.
125
UNIDADE 4
Então, podemos concluir que uma correlação igual a -0,90 é mais forte do que uma 
correlação igual a 0,40? Sim, porque -0,90 está mais próximo de -1, e 0,40 está mais 
próximo de zero. Mas como encontramos o coeficiente de correlação de Pearson? 
É representada pela letra “r” e determinado pela seguinte equação: 
r
x y
x y
n
x
x
n
y
y
n
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
���
�� ��
.
( ).( )
( )
.
( )2
2
2
2
Em que:
r = Coeficiente de correlação de Pearson (a ser encontrado)
∑x = valores da somatória da variável x 
∑y = valores da somatória da variável y 
∑x.y = valores da somatória da variável x multiplicado pela variável y
∑x2 = valores da somatória da variável x ao quadrado 
∑y2 = valores da somatória da variável y ao quadrado
Agora que temos a equação que determina o coeficiente de Pearson, vimos que se 
trata de uma equação bem complexa, mas fique tranquilo(a), querido(a) aluno(a), 
resolveremos juntos o passo a passo. Vejamos um exemplo: um professor de ciências 
biológicas deseja saber se existe correlação entre o tempo dedicado ao estudo e o 
desempenho dos alunos na disciplina de Bioestatística. Assim, ele selecionou oito 
alunos, assim, podemos observar o número de horas (X) e a nota obtida na prova 
de Bioestatística (Y) para cada aluno. 
A existência de uma correlação baixa, entretanto, não deve conduzir ao 
descarte das variáveis de estudo. Um coeficiente de correlação linear bai-
xo indica apenas que não há uma grande semelhança de comportamento 
linear entre as variáveis do estudo. Assim, devem-se estudar outros tipos 
de relações entre elas.
 (E. Z. Martinez)
126
UNICESUMAR
Tabela 2 - Relação entre as horas de estudo e nota na disciplina de Bioestatística
Acadêmico Horas de Estudo (x) Nota em Bioestatística (y)
A 8 10
B 8 8
C 6 4
D 5 8
E 4 6
F 7 9
G 5 7
H 1 2
Fonte: o autor.
Para facilitar nosso cálculo, você deve ter percebido que vamos precisar elevar todos os valores de X 
ao quadrado, todos os valores de Y ao quadrado e somar tudo isso, então, vamos reescrever a tabela, 
com essas colunas. Observe a seguir (Tabela 3):
Tabela 3 - Relação entre as horas de estudo e nota na disciplina de Bioestatística
Acadêmico Horas de Estudo (x) Nota em Bioestatística (y) x2 y2 x.y
A 8 10 64 100 80
B 8 8 64 64 64
C 6 4 36 16 24
D 5 8 25 64 40
E 4 6 16 36 24
F 7 9 49 81 63
G 5 7 25 49 35
H 1 2 1 4 2
TOTAL 44 54 280 414 332
Fonte: o autor.
Agora que temos o total e já determinamos os valores que precisamos, faremos a substituição na equa-
ção para determinar o coeficiente de Pearson.
r
x y
x y
n
x
x
n
y
y
n
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
���
�� ��
.
( ).( )
( )
.
( )2
2
2
2
Substituindo os valores na equação, temos:
127
UNIDADE 4
r
r
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�332 44 548
280 44
8
414 54
8
332
2 2
( . )
( )
.
( )
(( . )
.
.
.
2 376
8
280 1 936
8
414 2 916
8
332 297
280 24
�
��
��
�
��
��
��
�
��
�
�
�
r
22 414 364 5
35
38 49 5
35
1 881
35
43 37
0 81
� � �� �
�
� � � �
�
�
�
. ,
. ,
.
,
,
r
r
r
r
Portanto, existe uma correlação linear e forte entre as horas de estudo (x) e a nota na prova de B0ioes-
tatística (y) uma vez que o valor encontrado de r é igual a 0,81.
Você achou complicado utilizar esta equação? Ajudaremos com uma maneira simples, em que 
você consegue tirar a prova real utilizando o Microsoft Excel®, mas lembre-se, agora você está 
em processo de aprendizagem e, ao fazer cálculos passo a passo da forma algébrica, você estará 
exercitando seu raciocínio lógico, isso ajudará você na tomada de decisões. 
Utilizando o Microsoft Excel®, basta reescrever a tabela na planilha, vá em inserir função – 
Estatística – Correl, onde abrirá para você a função = correl, em seguida, no item matriz um, 
selecione todas as notas da variável X (sem cabeçalho e total), clique em matriz 2 e selecione 
todas as notas da variável Y (sem cabeçalho e total). 
Descrição da Imagem: a figura apresenta um gráfico de dispersão em que o eixo (X) está na horizontal representando 
as horas de estudo dos alunos; no eixo Y, que está na vertical, temos as notas distribuídas dos oitos alunos. 
128
UNICESUMAR
Quando falamos em relações lineares entre as variáveis X e Y, significa que, ao utilizarmos o coeficien-
te de correlação de Pearson, estamos nos referindo a uma situação em que uma variável é, direta ou 
inversamente, proporcional a outra (CRESPO, 2009). Vimos em nosso exemplo, que quanto às horas 
dedicadas a estudos tem uma relação forte com a nota da disciplina de Bioestatística. Portanto, é de 
fundamental importância construir um gráfico de dispersão entre as variáveis antes de calcularmos 
o coeficiente de correlação (que já fizemos anteriormente, na Figura 7), e, então, observarmos se é 
realmente adequado utilizarmos essa medida de associação. 
Figura 8 - Gráfico de dispersão sobre a relação entre horas de estudo (X) e nota na disciplina de Bioestatística (Y) / Fonte: o autor.
Se a dispersão que é apresentada no gráfico permite visualizar uma reta imaginária passando pelos 
pontos, entendemos que há a sugestão de uma relação linear (ainda que essa reta tenha uma inclina-
ção pequena).
Um erro comum entre as pessoas que estão aprendendo bioestatística é pensar que o coeficiente 
de correlação serve para testar se há uma relação linear entre as variáveis X e Y. Quando usamos o 
coeficiente de correlação, já partimos do princípio de que a possível relação entre as variáveis se dá de 
forma linear, por isso, a importância do gráfico de dispersão, assim, o coeficiente de Pearson serve para 
medir o tamanho dessa associação linear, e não para verificar se há linearidade na relação entre X e Y.
129
UNIDADE 4
Depois que calculamos a correlação linear, podemos ter o interesse em determinar a Regressão Linear. 
A análise de regressão explicita em uma equação matemática a forma da relação entre uma variável 
chamada dependente e uma ou mais variáveis chamadas independentes, ou seja, quando temos o 
interesse, estudo da regressão aplica-se àquelas situações em que há razões para supor uma relação de 
causa-efeito entre duas variáveis quantitativas e se deseja expressar, matematicamente, essa relação.
 “
O termo regressão deve-se a Francis Galton, que publicou, em 1886, um artigo no qual 
tentou explicar por que pais de alta estatura tinham filhos com estatura em média mais 
baixa do que a deles e pais de baixa estatura tinham filhos em média mais altos. Esse 
fenômeno foi chamado de regressão à média, termo que, apesar de inadequado para 
expressar a dependência entre duas variáveis quantitativas, acabou sendo incorporado 
pelo uso à linguagem estatística (MARTINEZ, 2015, p. 103).
Para entender melhor, em nosso estudo, o professor de Enfermagem quis saber se há relação entre o 
tempo de estudo e nota na prova da disciplina Bioestatística. A variável dependente é a nota da prova, 
pois, supostamente, recebe o efeito do tempo dedicado aos estudos. Por sua vez, o tempo de estudo (X) 
é a variável independente, dado que, supostamente, ela exerce algum efeito sobre a variável dependente.
Sendo assim, os objetivos da regressão linear são, segundo Martinez (2015):
1. Avaliar uma possível dependência de y em relação a x. 
2. Expressar matematicamente está relação por meio de uma equação.
Também podemos ter situações em que temos valores atípicos, ou seja, em que podemos 
chamar de fora da linearidade. O que fazemos com esses valores? Podemos excluir, ajustar? 
A resposta aesta pergunta não é simples. Em nenhuma situação podemos eliminar observa-
ções de nosso banco de dados com o propósito de deixar os resultados mais interessantes 
ou de destacar possíveis associações entre as variáveis que valorizariam nosso estudo, prin-
cipalmente nas áreas biológica e da saúde, que podem trazer dados que podem orientar o 
direcionamento de uma pesquisa, além de não ser uma conduta ética por parte do pesquisador. 
Para isso, é importante que você vá novamente aos dados coletados, faça comparação com os 
dados da pesquisa de campo, verifique os questionários, os prontuários, a fonte original dos 
dados para, então, verificar a possibilidade de erros de digitação ou anotação. Ainda que não 
fosse esse o erro encontrado, não é correto eliminá-lo, arbitrariamente. É de suma importância 
buscar outras informações sobre aquele dado para possa entender se realmente ele pertence 
àquela população de interesse do estudo. 
130
UNICESUMAR
Vamos considerar que a variável independente Y de interesse é quantitativa contínua. O modelo de regressão 
simples envolve uma única variável independente X. A equação para determinar a regressão linear é dada por:
y a b x� � .
Em que:
ŷ = valor predito da variável resposta
a = constante de regressão que representa o intercepto entre a linha de regressão e o eixo y
b = coeficiente linear de regressão da variável resposta y em função da variável explicativa x incli-
nação da reta; taxa de mudança na variável y por unidade de mudança na variável x
x = valor da variável explicativa (variável independente)
O coeficiente de regressão “b” fornece uma estimativa da variação esperada de y a partir da variação de 
uma unidade em x (BARBETTA et al., 2014). A partir desta equação, é possível encontrar os valores 
preditos para y e a reta de regressão. Vimos, anteriormente, que a relação entre x e y pode ser mostrada 
por um diagrama de dispersão.
Para calcular a regressão linear, vamos determinar “a” e “b”. Assim, utilizaremos as equações:
b
x y
x y
n
x
x
n
�
�
�
�
�
�
�
�
�
�
�
���
��
.
( ).( )
( )2
2
Em que:
∑x = valores da somatória da variável x 
∑y = valores da somatória da variável y 
∑x.y = valores da somatória da variável x multiplicado pela variável y
Para determinar “a”, utilizaremos a equação a seguir:
a Y b X� � .
Em que:
Y = média de Y 
X = média de X 
b = valor que é determinado por equação e encontrado valor de “b”.
Para encontrarmos as médias de Y e X , basta:
Y
y
n
� �
131
UNIDADE 4
Em que:
y = somatória de todos os valores de y
n = número total de elementos
X
x
n
� �
Em que:
x = somatória de todos os valores de x
n = número total de elementos
Agora que já sabemos como determinar a correlação linear, relembraremos nosso exemplo: um professor 
de Enfermagem deseja saber se existe correlação entre o tempo dedicado ao estudo e o desempenho 
dos alunos na disciplina Bioestatística. Assim, ele selecionou oito alunos, assim, podemos observar o 
número de horas (X) e a nota obtida na prova de Bioestatística (Y) para cada aluno (apresentaremos 
a tabela a seguir, com as colunas necessárias para calcular a regressão linear). 
Tabela 4 - Relação entre as horas de estudo e nota na disciplina de Bioestatística
Acadêmico Horas de Estudo (x) Nota em Bioestatística (y) x2 x.y
A 8 10 64 80
B 8 8 64 64
C 6 4 36 24
D 5 8 25 40
E 4 6 16 24
F 7 9 49 63
G 5 7 25 35
H 1 2 1 2
TOTAL 44 54 280 332
Fonte: o autor.
Com os resultados, podemos calcular o valor de “b”, utilizando a equação:
b
x y
x y
n
x
x
n
�
�
�
�
�
�
�
�
�
�
�
���
��
.
( ).( )
( )2
2
Substituindo os valores na equação:
132
UNICESUMAR
b
b
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
�
332 44 54
8
280 44
8
332 2 376
8
280 1 936
8
2
( ).( )
( )
.
.��
��
�
��
�
�
�� �
�
�
b
b
b
332 297
280 242
35
38
0 92,
Agora, determinaremos “a”, utilizando a equação a seguir:
a Y b X� � .
Primeiro, teremos que encontrar a média de X e Y:
Y
y
n
� �
Y
Y
=
=
54
8
6 75,
X
x
n
� �
X
X
=
=
44
8
5 5,
Agora que temos o valor de b = 0,92; Y = 6 75, e X = 5 5, , determinaremos “a”:
a Y b X� � .
a
a
a
� �
� �
�
6 75 0 92 5 5
6 75 5 06
1 69
, , . ,
, ,
,
Descrição da Imagem: a figura apresenta um gráfico de dispersão em que o eixo (X) está na horizontal representando 
as horas de estudo dos alunos; no eixo Y, que está na vertical; temos as notas distribuídas dos oitos alunos, na qual 
temos a reta em sentido crescente representando a regressão linear.
133
UNIDADE 4
Agora, com todos os valores necessários, determinaremos a equação de regressão linear:
Substituindo, temos:
y x� �1 69 0 92, , .
Com a equação da reta, podemos substituir dois pontos quaisquer por X para traçar a reta. A Figura 
9 apresenta-nos o gráfico de dispersão com a reta de regressão linear.
Figura 9 - Gráfico de dispersão e reta de regressão linear sobre a relação entre horas de estudo (x) e nota na disciplina de 
bioestatística / Fonte: o autor.
Podemos observar como o valor de r encontrado, anteriormente, foi igual a 0,80, e o valor de “bx” é 
positivo, nossa reta ajustada tem sentido crescente. Caso nosso valor de r fosse negativo, nossa reta 
ajustada teria o sentido decrescente. Outro ponto importante em uma análise utilizando ferramentas 
estatísticas é a inferência. Imagine que um profissional da saúde trabalha em um laboratório e está 
conduzindo um estudo cujo objetivo é analisar se um novo medicamento pode ser capaz de trazer 
bons resultados ao tratamento de determinada doença. Para realizar essa pesquisa, este profissional 
selecionou uma amostra de 80 pessoas portadoras da doença, e estas foram divididas em dois grupos 
com 40 pessoas cada. As pessoas do grupo A foram submetidas ao medicamento que está sendo avaliado, 
as pessoas do grupo B, receberam um placebo. Os resultados estão apresentados na Tabela a seguir:
Descrição da Imagem: a figura apresenta um círculo grande com bolinhas dentro dele e com a letra N (maiúscula) 
representando a população. Dentro desse círculo grande, temos um círculo menor, que representa a parte que será 
analisada (amostra), seguida de uma seta, e essa bolinha menor é evidenciada com a letra n (minúscula). 
134
UNICESUMAR
Tabela 5 - Resultados do estudo
Grupo Tamanho amostral Responderam ao tratamento
A 40 20 40 50�� � � %
B 40 10 40 25�� � � %
Fonte: o autor.
Podemos observar que: 20 40 50�� � � % das pessoas que estão no grupo A, responderam ao trata-
mento que está sendo avaliado, já 10 40 25�� � � % das pessoas alocadas no grupo B responderam ao 
tratamento com o medicamento sem o princípio ativo (placebo). Dessa maneira, a razão entre essas 
porcentagens é 50 25 2%( ) / %( )grupoA grupoB = , isto é, podemos concluir que entre as 80 pessoas 
que tem a doença e estão participando do estudo, se utilizarem o medicamento (da pesquisa) tem o 
dobro de chances de responder à doença quando comparados ao grupo B. 
Agora, temos a contribuição da Bioestatística neste estudo: este resultado encontrado é válido para 
portadoras da doença ou somente para as 80 pessoas que participaram do estudo?
Inicialmente, o resultado obtido descreve apenas as 80 pessoas que compuseram esta amostra. No entanto 
nosso intuito é que os nossos resultados tragam valor para todas as pessoas que fazem parte da população 
e que tenham essa doença, não importando se foram selecionados, ou não, para compor a amostra da 
pesquisa. Para obtermos isso, fazemos uso da inferência estatística, ferramenta usada para extrapolar os 
achados de nossa amostra para todos os indivíduos que fazem parte da população (MARTINEZ, 2015). 
 A Figura 10 apresenta-nos o processo pelo qual obtemos conclusões sobre uma população (N) a 
partir de dados obtidos, por meio de uma amostra (n). 
Figura 10 - Representação de uma inferência estatística / Fonte: o autor.
135
UNIDADE 4
Para estudarmos a inferência estatística, relembraremos alguns conceitos já estudados anteriormente 
(CRESPO, 2009):
a) População (N): conjunto de elementos que tem,pelo menos, uma característica em comum.
b) Amostra (n): subconjunto da população, parte da população. 
c) Amostragem aleatória: é representativa da população, sendo válidos os resultados obtidos, por 
meio do uso da inferência estatística.
Outro conceito importante que precisamos estudar aqui na inferência estatística é o Parâmetro, essen-
cial para entendermos a inferência estatística. Trata-se de valor calculado a partir de uma população, 
ou seja, usando todos os elementos (MARTINEZ, 2015). Por exemplo: um professor de Farmácia 
quer estudar a altura (em cm) das crianças que estão cursando a 1ª série em determinado município. 
A população inclui todas as crianças deste município. A média da altura encontrada (em cm), que é 
calculada a partir da análise do peso de todas as crianças da população é um parâmetro. 
Pedimos que tome cuidado para não confundir Parâmetro com Variável. O parâmetro, como já 
vimos, é uma característica numérica de uma população, já uma variável é uma característica dos in-
divíduos que estamos pesquisamos. Segundo Parenti, Silva e Silveira (2017), o parâmetro é um número 
fixo, já os valores de uma variável são passíveis de variação de um indivíduo a outro. Por exemplo: 
entre os alunos estudados, a idade e o prato preferido são variáveis, já a média da altura de todos os 
alunos de determinada cidade é um parâmetro. 
Nem sempre, na prática, conseguiremos trabalhar com parâmetros, trabalharemos com amostra. 
Assim, a média amostral, que é resultante de uma amostra de tamanho n, é uma estimativa da média 
populacional. Dessa maneira, as estimativas são quantidades calculadas da amostra com a finalidade 
de representar um parâmetro de interesse (MARTINEZ, 2015).
A diferença entre uma média populacional (parâmetro) da média amostral (estimativa) é denotada por:
a) média populacional: representado pela letra grega µ.
b) média amostral: representado por “xis barra” X .
 “
Quando conduzimos uma pesquisa com base em uma amostra de n indivíduos, po-
demos calcular o valor de x com base nas observações amostrais. Mas, obviamente, 
não podemos calcular o valor de n, dado que não temos à nossa disposição todos os 
elementos da população. Assim, entendemos que o parâmetro é um número fixo, mas 
geralmente não conhecemos seu valor (MARTINEZ, 2015, p. 166).
Assim, as principais ferramentas da inferência estatística são os intervalos de confiança e os testes de 
hipóteses. Podemos utilizar da seguinte forma: 
a) Intervalos de confiança: utilizamos quando o objetivo do estudo é voltado à estimação de um 
parâmetro. 
b) Testes de hipóteses: utilizados quando o objetivo do estudo envolve hipóteses sobre um parâ-
metro de interesse.
136
UNICESUMAR
O intervalo de confiança para a média (µ) de uma população é construído em torno da estimativa 
pontual X . 
Para construir este intervalo, fixamos uma probabilidade “ 1 – α” de que o intervalo construído 
contenha o parâmetro populacional. Desta forma α será a probabilidade de que o intervalo obtido 
não contenha o valor do parâmetro, isto é, α será a probabilidade de erro. Sabendo-se que a média da 
amostra apresenta uma distribuição normal (média µ e desvio padrão σ/ ) se a população de onde 
for extraída a amostra for normal (ou se a amostra for superior a 30 e retirada de qualquer população) 
de média µ e de desvio padrão σ, podemos então utilizar a curva normal para estabelecer os limites 
para o intervalo de confiança (BARBETTA, 2014).
Para entendermos melhor o intervalo de confiança, temos que entender que a margem de erro é 
a sua peça chave, ou seja, no meio do intervalo de confiança é que fica a média amostral. Observe na 
equação a seguir:
Limite inferior do intervalo de con�anç
X ME
 X 
Limite superior do intervalo de con�anç
X ME
A distância que temos entre a média e o limite do intervalo de confiança é exatamente igual à 
margem de erro. É importante salientar que o nível de confiança deve ser selecionado, previamente, 
pelo pesquisador, e que a média populacional fica dentro do intervalo de confiança. 
Para calcular o limite superior XLS e inferior XLI do intervalo de confiança para nível de confiança 
igual a (1 – α) usa-se a seguinte expressão oriunda da discussão sobre as áreas embaixo da curva normal 
e a distribuição normal padronizada:
X X ME X Zc S
n
X X ME X Z S
n
LS
LI c
� � � �
� � � �
Em que:
X = média
Zc= Z crítico - valor a ser encontrado na Tabela de Curva Normal (Tabela Z)
S = desvio padrão 
n = número de elementos da amostra
α = intervalo de confiança (ex.: 90%, 95%, 98%).
Você verá que é bem simples este cálculo, e temos duas situações:
1º caso: para σ conhecido ou amostra grande (n ≥ 30): para determinar, utilizaremos a equação a seguir:
X Zc
n
± . s
Descrição da Imagem: a figura apresenta, em forma de sino, na qual essa curva não toca o eixo, sendo dividida em 
sua metade com pontilhados que indicam a média cuja área destacada é 0,4750.
137
UNIDADE 4
Em que:
X = média
Zc = “Z” crítico (encontrado na Tabela Z)
σ = desvio padrão
n = número de elementos da amostra.
Vejamos um exemplo: um professor fez uma pesquisa com 100 alunos, e a média de idade deste grupo 
de alunos é de 24 anos. Sabendo-se que o desvio padrão é igual a quatro anos, determine o intervalo 
de 95% de confiança para a média. Para a resolução, devemos entender que o que calcularemos nessa 
equação é apenas: Zc
n
. s , pois a média que já é dada, nós somaremos e diminuiremos pelo intervalo 
encontrado. 
1º passo: encontrar o Zcrítico: com a tabela de distribuição normal reduzida (vista no nosso capítulo 
4) é que encontraremos Zcrítico. 
Temos 95% para encontrar o valor na curva, vamos:
( ) ,95 100 0 95� �
Só que esta tabela é reduzida, então, não encontraremos o valor de 0,95, para isso, vamos:
0 95 2 0 475, ,� �
Vamos construir o intervalo na curva:
Figura 11 - Curva de Gauss / Fonte: o autor.
2º passo: agora, vamos até a Tabela Z para encontrar o valor referente a 0,4750, mas, desta vez, nós 
procuraremos os valores e acharemos Z. Veja a seguir:
138
UNICESUMAR
Tabela 6 - Tabela de distribuição Normal Reduzida
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4454 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4764 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
Fonte: Crespo (2009, p. 218). 
Encontramos o valor de 1,96. Você poderá encontrar qualquer valor utilizando somente a tabela Z. 
Uma dica muito importante, valores de Zcrítico para o grau de confiança:
a. 90% = 1,645;
b. 95% = 1,96;
c. 99% = 2,575.
Esses valores já foram retirados da Tabela Z, e sãoos mais utilizados. 
Fica a dica!
Agora que temos o Zcrítico, desvio padrão (dado no exercício) e número de elementos (também dado 
no exercício), vamos resolver. 
3º passo: resolver a equação (margem de erro):
139
UNIDADE 4
Zc
n
. s
1 96 4
100
1 96 4
10
1 96 0 4 0 784
, .
, .
, . , ,=
4º passo: agora que temos a margem de erro, determinamos o intervalo de confiança, somaremos com 
a média o valor da margem de erro e diminuiremos a média pela margem de erro, utilizando:
X Zc
n
�
� �
� �
.
, ,
, ,
s
24 0 784 24 784
24 0 784 23 216
ou
24 0 784± ,
Também pode ser escrito desta maneira: 23,218≤ µ ≤ 24,784.
2º caso: Intervalo de confiança para a média (σ desconhecido): quando desejamos estimar a média 
de uma população normal com variância desconhecida, temos duas situações:
a) Se n >30: utilizamos a distribuição normal com estimador s2 de σ2 (visto anteriormente).
b) Se n ≤ 30: utilizamos a distribuição t de Student.
Vejamos um exemplo: uma amostra de dez pessoas com as idades: 9, 8, 12, 7, 9, 6, 11, 6, 10 e 9, tem, em 
média, 8,7, um desvio padrão 2 e foi extraída de uma população Normal. Construa um intervalo de 
confiança para média ao nível de 95%.
Utilizando a equação do intervalo de confiança para t de Student, temos:
IC X tc s
n
� � .
Em que:
X = média
tcritíco= valor a ser encontrado na Tabela t de Student
S = desvio padrão 
n = número de elementos da amostra
Descrição da Imagem: a figura apresenta uma curva em formato de sino, dividida em duas partes iguais, e as pontas 
do eixo estão pintadas destacando-se pela cor cinza, com duas setas destacando esses eixos. 
Descrição da Imagem: a figura apresenta uma curva em formato de sino, divididas em duas partes iguais, e as pontas 
do eixo estão pintadas destacando-se pela cor cinza, com duas setas destacando esses eixos, representando 2,5% em 
cada eixo. O eixo do meio é igual a 95%.
140
UNICESUMAR
Utilizaremos a Tabela t de Student em um teste bicaudal que podemos observar na Figura 12.
Figura 12 - Representação do teste bicaudal para Tabela t student / Fonte: o autor.
Para resolver nosso exercício, temos que encontrar nosso tcrítico, assim, temos:
• 95% é nosso intervalo de confiança.
• Como nossa área interessada para trabalhar com essa tabela são as caudas, devemos encontrar 
esse valor. 
• Se a área é 95%, para termos os 100%, faltam 5%, certo. São esses 5% que são divididos nas caudas. 
Veja a Figura 13.
 
Figura 13 - Representação do teste bicaudal para Tabela t student / Fonte: o autor.
Como você pode perceber, os 95% é o que temos em nosso exercício, e os 5% foram divididos nas duas 
áreas do gráfico, representando 2,5% em cada cauda. Mas, para utilizar a tabela t Student, consideraremos 
que 5% teste são bicaudal, e procuraremos esse valor na tabela. Apenas mais um detalhe, antes de ir à tabela, 
é importante que você entenda que o grau de liberdade é igual a n – 1, portanto, temos 10 elementos, para 
o grau de liberdade teremos: 10-1 = 9. Assim, buscaremos “9” quanto ao grau de liberdade. 
Vamos procurar a linha 9 e a coluna 5% em nossa tabela T Student apresentada a seguir: 
141
UNIDADE 4
Ta
be
la
 7
 -
 T
ab
el
a 
t 
de
 S
tu
de
nt
 -
 P
ro
ba
bi
lid
ad
e 
pa
ra
 u
m
 te
st
e 
bi
ca
ud
al
G
. 
lib
er
-
da
de
0,
95
0,
90
0,
80
0,
70
0,
60
0,
50
0,
40
0,
30
0,
20
0,
10
0,
05
0,
02
0,
01
0,
00
1
1
0,
07
87
0,
15
84
0,
32
49
0,
50
95
0,
72
65
1,
00
00
1,
37
64
1,
96
26
3,
07
77
6,
31
38
12
,7
06
2
31
,8
20
5
63
,6
57
63
6,
61
9
2
0,
07
08
0,
14
21
0,
28
87
0,
44
47
0,
61
72
0,
81
65
1,
06
07
1,
38
62
1,
88
56
2,
92
00
4,
30
27
6,
96
46
9,
92
48
31
,5
99
1
3
0,
06
81
0,
13
66
0,
27
67
0,
42
42
0,
58
44
0,
76
49
0,
97
85
1,
24
98
1,
63
77
2,
35
34
3,
18
24
4,
54
07
5,
84
09
12
,9
24
0
4
0,
06
67
0,
13
38
0,
27
07
0,
41
42
0,
56
86
0,
74
07
0,
94
10
1,
18
96
1,
53
32
2,
13
18
2,
77
64
3,
74
69
4,
60
41
8,
61
03
5
0,
06
59
0,
13
22
0,
26
72
0,
40
82
0,
55
94
0,
72
67
0,
91
95
1,
15
58
1,
47
59
2,
01
50
2,
57
06
3,
36
49
4,
03
21
6,
86
88
6
0,
06
54
0,
13
11
0,
26
48
0,
40
43
0,
55
34
0,
71
76
0,
90
57
1,
13
42
1,
43
98
1,
94
32
2,
44
69
3,
14
27
3,
70
74
5,
95
88
7
0,
06
50
0,
13
03
0,
26
32
0,
40
15
0,
54
91
0,
71
11
0,
89
60
1,
11
92
1,
41
49
1,
89
46
2,
36
46
2,
99
80
3,
49
95
5,
40
79
8
0,
06
47
0,
12
97
0,
26
19
0,
39
95
0,
54
59
0,
70
64
0,
88
89
1,
10
81
1,
39
68
1,
85
95
2,
30
60
2,
89
65
3,
35
54
5,
04
13
9
0,
06
45
0,
12
93
0,
26
10
0,
39
79
0,
54
35
0,
70
27
0,
88
34
1,
09
97
1,
38
30
1,
83
31
2,
26
22
2,
82
14
3,
24
98
4,
78
09
10
0,
06
43
0,
12
89
0,
26
02
0,
39
66
0,
54
15
0,
69
98
0,
87
91
1,
09
31
1,
37
22
1,
81
25
2,
22
81
2,
76
38
3,
16
93
4,
58
69
11
0,
06
42
0,
12
86
0,
25
96
0,
39
56
0,
53
99
0,
69
74
0,
87
55
1,
08
77
1,
36
34
1,
79
59
2,
20
10
2,
71
81
3,
10
58
4,
43
70
12
0,
06
40
0,
12
83
0,
25
90
0,
39
47
0,
53
86
0,
69
55
0,
87
26
1,
08
32
1,
35
62
1,
78
23
2,
17
88
2,
68
10
3,
05
45
4,
31
78
13
0,
06
39
0,
12
81
0,
25
86
0,
39
40
0,
53
75
0,
69
38
0,
87
02
1,
07
95
1,
35
02
1,
77
09
2,
16
04
2,
65
03
3,
01
23
4,
22
08
14
0,
06
38
0,
12
80
0,
25
82
0,
39
33
0,
53
66
0,
69
24
0,
86
81
1,
07
63
1,
34
50
1,
76
13
2,
14
48
2,
62
45
2,
97
68
4,
14
05
15
0,
06
38
0,
12
78
0,
25
79
0,
39
28
0,
53
57
0,
69
12
0,
86
62
1,
07
35
1,
34
06
1,
75
31
2,
13
14
2,
60
25
2,
94
67
4,
07
28
16
0,
06
37
0,
12
77
0,
25
76
0,
39
23
0,
53
50
0,
69
01
0,
86
47
1,
07
11
1,
33
68
1,
74
59
2,
11
99
2,
58
35
2,
92
08
4,
01
50
17
0,
06
36
0,
12
76
0,
25
73
0,
39
19
0,
53
44
0,
68
92
0,
86
33
1,
06
90
1,
33
34
1,
73
96
2,
10
98
2,
56
69
2,
89
82
3,
96
51
18
0,
06
36
0,
12
74
0,
25
71
0,
39
15
0,
53
38
0,
68
84
0,
86
20
1,
06
72
1,
33
04
1,
73
41
2,
10
09
2,
55
24
2,
87
84
3,
92
16
19
0,
06
35
0,
12
74
0,
25
69
0,
39
12
0,
53
33
0,
68
76
0,
86
10
1,
06
55
1,
32
77
1,
72
91
2,
09
30
2,
53
95
2,
86
09
3,
88
34
20
0,
06
35
0,
12
73
0,
25
67
0,
39
09
0,
53
29
0,
68
70
0,
86
00
1,
06
40
1,
32
53
1,
72
47
2,
08
60
2,
52
80
2,
84
53
3,
84
95
21
0,
06
35
0,
12
72
0,
25
66
0,
39
06
0,
53
25
0,
68
64
0,
85
91
1,
06
27
1,
32
32
1,
72
07
2,
07
96
2,
51
76
2,
83
14
3,
81
93
22
0,
06
34
0,
12
71
0,
25
64
0,
39
04
0,
53
21
0,
68
58
0,
85
83
1,
06
14
1,
32
12
1,
71
71
2,
07
39
2,
50
83
2,
81
88
3,
79
21
23
0,
06
34
0,
12
71
0,
25
63
0,
39
02
0,
53
17
0,
68
53
0,
85
75
1,
06
03
1,
31
95
1,
71
39
2,
06
87
2,
49
99
2,
80
73
3,
76
76
142
UNICESUMAR
G
. 
lib
er
-
da
de
0,
95
0,
90
0,
80
0,
70
0,
60
0,
50
0,
40
0,
30
0,
20
0,
10
0,
05
0,
02
0,
01
0,
00
1
24
0,
06
34
0,
12
70
0,
25
62
0,
39
00
0,
53
14
0,
68
48
0,
85
69
1,
05
93
1,
31
78
1,
71
09
2,
06
39
2,
49
22
2,
79
69
3,
74
54
25
0,
06
33
0,
12
69
0,
25
61
0,
38
98
0,
53
12
0,
68
44
0,
85
62
1,
05
84
1,
31
63
1,
70
81
2,
05
95
2,
48
51
2,
78
74
3,
72
51
26
0,
06
33
0,
12
69
0,
25
60
0,
38
96
0,
53
09
0,
68
40
0,
85
57
1,
05
75
1,
31
50
1,
70
56
2,
05
55
2,
47
86
2,
77
87
3,
70
66
27
0,
06
33
0,
12
68
0,
25
59
0,
38
94
0,
53
06
0,
68
37
0,
85
51
1,
05
67
1,
31
37
1,
70
33
2,
05
18
2,
47
27
2,
77
07
3,
68
96
28
0,
06
33
0,
12
68
0,
25
58
0,
38
93
0,
53
04
0,
68
34
0,
85
46
1,
05
60
1,
31
25
1,
70
11
2,
04
84
2,
46
71
2,
76
33
3,
67
39
29
0,
06
33
0,
12
68
0,
25
57
0,
38
92
0,
53
02
0,
68
30
0,
85
42
1,
05
53
1,
31
14
1,
69
91
2,
04
52
2,
46
20
2,
75
64
3,
65
94
30
0,
06
32
0,
12
67
0,
25
56
0,
38
90
0,
53
00
0,
68
28
0,
85
38
1,
05
47
1,
31
04
1,
69
73
2,
04
23
2,
45
732,
75
00
3,
64
60
60
0,
06
30
0,
12
62
0,
25
45
0,
38
72
0,
52
72
0,
67
86
0,
84
77
1,
04
55
1,
29
58
1,
67
06
2,
00
03
2,
39
01
2,
66
03
3,
46
02
90
0,
06
29
0,
12
60
0,
25
41
0,
38
66
0,
52
63
0,
67
72
0,
84
56
1,
04
24
1,
29
10
1,
66
20
1,
98
67
2,
36
85
2,
63
16
3,
40
19
12
0
0,
06
28
0,
12
59
0,
25
39
0,
38
62
0,
52
58
0,
67
65
0,
84
46
1,
04
09
1,
28
86
1,
65
77
1,
97
99
2,
35
78
2,
61
74
3,
37
35
15
0
0,
06
28
0,
12
59
0,
25
38
0,
38
61
0,
52
55
0,
67
61
0,
84
40
1,
04
00
1,
28
72
1,
65
51
1,
97
59
2,
35
15
2,
60
90
3,
35
66
18
0
0,
06
28
0,
12
58
0,
25
37
0,
38
59
0,
52
53
0,
67
59
0,
84
36
1,
03
94
1,
28
63
1,
65
34
1,
97
32
2,
34
72
2,
60
34
3,
34
54
21
0
0,
06
28
0,
12
58
0,
25
37
0,
38
58
0,
52
52
0,
67
57
0,
84
33
1,
03
90
1,
28
56
1,
65
21
1,
97
13
2,
34
42
2,
59
94
3,
33
75
24
0
0,
06
28
0,
12
58
0,
25
36
0,
38
58
0,
52
51
0,
67
55
0,
84
31
1,
03
87
1,
28
51
1,
65
12
1,
96
99
2,
34
20
2,
59
65
3,
33
15
27
0
0,
06
28
0,
12
58
0,
25
36
0,
38
57
0,
52
50
0,
67
54
0,
84
30
1,
03
84
1,
28
47
1,
65
05
1,
96
88
2,
34
02
2,
59
42
3,
32
69
30
0
0,
06
28
0,
12
58
0,
25
36
0,
38
57
0,
52
50
0,
67
53
0,
84
28
1,
03
82
1,
28
44
1,
64
99
1,
96
79
2,
33
88
2,
59
23
3,
32
33
40
0
0,
06
27
0,
12
57
0,
25
35
0,
38
56
0,
52
48
0,
67
51
0,
84
25
1,
03
78
1,
28
37
1,
64
87
1,
96
59
2,
33
57
2,
58
82
3,
31
50
50
0
0,
06
27
0,
12
57
0,
25
35
0,
38
55
0,
52
47
0,
67
50
0,
84
23
1,
03
75
1,
28
32
1,
64
79
1,
96
47
2,
33
38
2,
58
57
3,
31
01
80
0
0,
06
27
0,
12
57
0,
25
34
0,
38
55
0,
52
46
0,
67
48
0,
84
21
1,
03
71
1,
28
26
1,
64
68
1,
96
29
2,
33
10
2,
58
20
3,
30
27
10
00
0,
06
27
0,
12
57
0,
25
34
0,
38
54
0,
52
46
0,
67
47
0,
84
20
1,
03
70
1,
28
24
1,
64
64
1,
96
23
2,
33
01
2,
58
08
3,
30
03
 
Fo
nt
e:
 B
ar
be
ta
 e
t 
al
. (
20
14
, p
. 3
0
0)
.
O
bs
.: 
D
is
tr
ib
ui
çã
o 
de
 t-
St
ud
en
t 
se
gu
nd
o 
os
 g
ra
us
 d
e 
lib
er
da
de
 e
 u
m
a 
da
da
 
pr
ob
ab
ili
da
de
 e
m
 u
m
 t
es
te
 b
ic
au
da
l (
pr
im
ei
ra
 li
nh
a)
. P
ar
a 
um
 t
es
te
 m
on
oc
au
da
l, 
co
ns
id
er
e 
m
e-
ta
de
 d
o 
va
lo
r 
de
 p
ro
ba
bi
lid
ad
e 
ap
on
ta
do
.
143
UNIDADE 4
Assim o valor encontrado é igual a 2,2622, agora, resolveremos nosso exercício. 
Resolvendo nosso exercício, voltando a equação, temos:
IC X tc s
n
� � .
IC
IC
IC
IC
� �
� �
� �
�
8 7 2 2622 2
10
8 7 2 2622 2
3 16
8 7 2 2622 0 63
8
, , .
, , .
,
, , . ,
,, ,
, , ,
, , ,
7 1 43
8 7 1 43 10 13
8 7 1 43 7 27
�
� � �
� � �
IC
IC
Portanto: IC = [7,27; 10,13]. 
Assim, a probabilidade de este intervalo 7,27 a 10,13 conter a média populacional (verdadeira 
idade) das pessoas é igual a 95%. 
Também temos um método para fazer inferências sobre as populações: os testes de hipóteses. Ao 
admitirmos um valor hipotético para um parâmetro populacional e, baseados nas informações cole-
tadas em uma amostra, podemos realizar o teste de hipóteses, na qual nossa decisão poderá: aceitar 
ou rejeitar a hipótese. É importante frisar que esta decisão está sujeita a erros, baseado em resultados 
de uma amostra, muitas vezes, não é possível tomar decisões que estejam totalmente corretas. No 
entanto, podemos dimensionar a chance, a probabilidade, o risco em aceitar ou rejeitar uma hipótese 
(MARTINEZ, 2015). 
 Uma hipótese estatística refere-se à suposição do parâmetro populacional, como: 
a) A altura média da população brasileira é de 1,65 m, isto é: H: μ = 1,65 m.
b) A variância populacional dos salários vale R$1.000,00, isto é: H: σ2 = 1.000,00.
c) A proporção de paulistas com a doença X é de 40%, ou seja: H: p = 0,40.
d) A distribuição de probabilidades dos pesos dos alunos de uma instituição de ensino é normal.
e) A chegada de navios ao porto de Santos é descrita por uma distribuição de Poisson.
Isso significa que as hipóteses estatísticas são estabelecidas pelos critérios do pesquisador, baseado 
no que ele está buscando, ou seja, com informações teóricas, muitas vezes. Já o teste de hipótese em 
si, trata-se de uma regra de decisão para aceitar ou rejeitar uma hipótese estatística com base nos ele-
mentos amostrais. São dois os tipos de hipóteses: designa-se H0, denominada hipótese nula, a hipótese 
estatística a ser testada, e H1, a hipótese alternativa. A hipótese nula expressa uma igualdade, enquanto 
a hipótese alternativa é dada por uma desigualdade.
144
UNICESUMAR
São exemplos de hipóteses para um teste estatístico:
a)
H0: μ = 1,65 m
H1: μ ≠ 1,65 m
ou
H0: μ = 1,65 m
H1: μ > 1,65 m
ou
H0: μ = 1,65 m
H1: μ < 1,65 m
b)
H0: σ2 = 1.000,00
H1: σ2 ≠ 1.000,00
ou
H0: σ2 = 1.000,00
H1: σ2 > 1.000,00
ou
H0: σ2 = 1.000,00
H1: σ2 < 1.000,00
c)
H0: p = 0,40
H1: p ≠ 0,40
ou
H0: p = 0,40
H1: p > 0,40
ou
H0: p = 0,40
H1: p < 0,40
Existem dois tipos possíveis de erros quando fazemos um teste estatístico para acei-
tar ou rejeitar H0. Nós podemos rejeitar a hipótese H0, quando ela é verdadeira, ou 
aceitar H0, quando ela é falsa (MARTINEZ, 2015). O erro de rejeitar H0, sendo H0 ver-
dadeira, é denominado Erro tipo I, e a probabilidade de se cometer o Erro tipo I é 
designada α. Por outro lado, o erro de aceitar H0, sendo H0 falsa, é denominado Erro 
tipo II, e a probabilidade de cometer o Erro tipo II é designada β.
Os possíveis erros e acertos de uma decisão com base em um teste de hipótese 
estatístico estão apresentados a seguir:
• Erro do tipo 1: trata-se do erro que se comete ao rejeitar a hipótese H0 quando 
ela é verdadeira. O nível de significância do teste é designado por α, que é a 
probabilidade de se cometer o erro do tipo 1. 
• Erro do Tipo 2: é o erro que se comete ao aceitar a hipótese H0 quando ela 
é falsa. Rejeitar H0 implica a aceitação de H1 e vice-versa. A probabilidade de 
cometer um erro do tipo 2 é dada por 1 – α.
Dentro do teste de hipóteses, temos as regiões de aceitação e rejeição, a saber:
• Região de Aceitação (R. A.): é a região na qual se aceita a hipótese nula (H0).
• Região de Rejeição (R. R.): é a região de rejeição da hipótese nula (H0), sendo 
complementar à região de aceitação. É também chamada de Região Crítica 
(R. C.). 
Como tipos de testes de hipóteses temos: Bilateral, Unilateral à Esquerda, Unilateral à 
Direita, sendo a região crítica (ou região de rejeição) que corresponde aos valores da 
estatística de teste que nos levam a rejeitar a hipótese nula. Dependendo da afirmativa 
em teste, a região crítica poderia estar nas duas caudas extremas, poderia estar na 
cauda esquerda, ou poderia estar na cauda direita.
145
UNIDADE 4
Teste bilateral
A região crítica está nas duas regiões extremas (caudas) sob a curva (Figura 14).
Figura 14 - Teste bilateral / Fonte: o autor.
Teste unilateral à direita
A região crítica está na região extrema (cauda) direita sob a curva (Figura 15).
Figura 15 - Teste unilateral à direita / Fonte: o autor.
Descrição da Imagem: a figura apresenta uma 
curva em formato de sino (Gauss), divididas em 
duas partes iguais, sendo a R. A. (Região de Acei-
tação), e, nas pontas do eixo, temos duas extremi-
dades como R. R. (Região de Rejeição). 
Descrição da Imagem: a figura apresenta uma 
curva em formato de sino (Gauss), divididas em 
duas partes iguais, sendo a R. A. (Região de Acei-
tação) na região direita, dividida com um traço e, 
na sua extremidade direita, temos a R. R. (Região 
de Rejeição). 
146
UNICESUMAR
Teste unilateral à esquerda
A região crítica está na região extrema (cauda) esquerda sob a curva (Figura 16).
Figura 16 - Teste unilateral à esquerda / Fonte: o autor.
Depois de apresentarmos os conceitos fundamentais dentro de um teste de hipótese, você verá que não 
é um teste complicado. A seguir, apresentaremos o roteiro para realização de um teste de hipóteses.
1º passo:estabelecer a hipótese nula H0. 
2º passo: estabelecer a hipótese alternativa H1. 
3º passo: fixar o nível de significância α: em que definimos o nível de confiança para um intervalo 
de confiança, como a probabilidade 1 – α. Escolhas comuns para α são 0,05; 0,01 e 0,10, com 0,05 
sendo a mais comum.
Os valores críticos de z relativos aos níveis de significância usados com maior frequência podem 
ser observados a seguir (valores já retirados da Tabela Z de distribuição normal reduzida):
Nível de significância α 0,10 0,05 0,01
Valores críticos de z para testes unilaterais ± 1,28 ± 1,64 ±2,33
Valores críticos de z para testes bilaterais ± 1,64 ± 1,96 ± 2,58
4º passo: determinar a região de rejeição da hipótese nula. 
5º passo: extrair a amostra e calcular o valor da estatística correspondente. 
6º passo: rejeitar ou aceitar H0, conforme o valor da estatística amostral cair em R. R. ou R. A. 
Para entendermos este passo a passo, vejamos um exemplo: supondo que um professor de ciências 
biológicas deseja testar H0: μ = 20 contra H1: μ > 20, sabendo que o desvio padrão da população é igual 
a 4 e a amostra testada foi de 16 elementos: 
Descrição da Imagem: a figura apresenta uma 
curva em formato de sino (Gauss), dividida em 
duas partes iguais, sendo a R. A. (Região de Acei-
tação) na região direita, dividida com um traço 
e, em sua extremidade esquerda, temos a R. R. 
(Região de Rejeição). 
147
UNIDADE 4
1º passo: estabelecer a hipótese nula H0: 
H0: μ = 20
2º passo: estabelecer a hipótese alternativa H1:
H1: μ > 20
3º passo: fixar o nível de significância α: Para esse exercício vamos admitir que α = 0,05 = 5%.
4º passo: determinar a região de rejeição da hipótese nula: Como H1: μ > 20, vamos utilizar o teste 
unilateral à direita, que podemos observar na Figura 17.
Figura 17 - Teste unilateral à direita / Fonte: o autor.
5º passo: extrair a amostra e calcular o valor da estatística correspondente: temos a amostra de 16 
elementos, desvio padrão igual a 4, e determinar o Zcalculado. Obs.: não temos a média amostral para este 
exercício. Como estabelecemos 0,05 como nível de significância, o z será igual a 1,64.
zcalculado X
n
µ
�
� 0
s
Em que: 
Zcalculado = valores da tabela Z
X = média da amostra
µ0 = é a média da população (hipótese a ser testada)
σ = desvio padrão da população
n = número de elementos da amostra
Substituindo os valores na equação, temos:
Descrição da Imagem: a figura apresenta uma 
curva em formato de sino (Gauss), dividida em 
duas partes iguais, sendo a R.A. (Região de Acei-
tação) na região direita, dividida com um traço 
e, na sua extremidade direita, temos a R. R. (Re-
gião de Rejeição). 
148
UNICESUMAR
zcalculado X
n
µ
�
� 0
s
1 64 4
16
1 64 4
4
1 64
1
1 64 20
21 64
20
20
20
,
,
,
,
,
�
�
�
�
�
�
� �
�
X
X
X
X
X
6º passo: rejeitar ou aceitar H0, conforme o valor da estatística amostral cair em R. R. ou R. A.
Nesse exercício, temos:
Rejeitar H0 quando > 21,64
Não Rejeitar H0 quando ≤ 21,64
Vamos a outro exemplo para sua melhor compreensão?
Um professor de Biomedicina fez uma pesquisa com um componente que será utilizado em labo-
ratório, tem uma vida média de 50 meses e um desvio padrão de 50 meses. Ao retirar uma amostra 
de 36 componentes, que foram obtidas a partir desta população, percebeu que o componente tem em 
média 48 meses de vida. Assim, utilizando o teste de hipóteses, podemos afirmar que a média desta 
população é diferente de 50? Considere o nível de 5% para resolução. 
Nesse caso, queremos obter o teste de hipóteses com uma média diferente de 50, certo? Então, 
utilizaremos o teste bilateral. Resolvendo o exercício passo a passo, temos:
1º passo: estabelecer a hipótese nula H0:
H0: µ = 50 (µ0)
2º passo: estabelecer a hipótese alternativa H1: 
H1: µ ≠ 50 (µ0)
3º passo: fixar o nível de significância α: 0,05.
149
UNIDADE 4
4º passo: determinar a região de rejeição da hipótese nula: como H1: μ > 20, utilizaremos o teste 
unilateral à direita, que podemos observar na Figura 18.
Figura 18 - Teste bilateral / Fonte: o autor.
5º passo: extrair a amostra e calcular o valor da estatística correspondente: temos a amostra de 36 
componentes, com uma população de 50 componentes, o tempo de vida médio amostral é de 48 me-
ses. Como estabelecemos 0,05 como nível de significância (para teste bilateral), o z será igual a 1,96.
zcalculado X
n
µ
�
� 0
s
zcalculado
zcalculado
zcalculado
zcalcu
�
�
�
�
�
�
48
4
36
2
4
6
2
0 666
50
,
llado � �3
6º passo: rejeitar ou aceitar H0, conforme o valor da estatística amostral cair em R. R. ou R. A.. Nesse 
exercício, temos:
Rejeita-se H0 pois, o resultado amostral afirma que a média é diferente de 50 meses, ao nível de 
95% de confiança.
Descrição da Imagem: a figura apresenta uma 
curva em formato de sino (Gauss), dividida em 
duas partes iguais, sendo a R. A. (Região de 
Aceitação), e, nas pontas do eixo, temos duas 
extremidades como R. R. (Região de Rejeição). 
150
UNICESUMAR
Você percebeu, caro(a) estudante, que a correlação e a regressão linear poderão ajudá-lo(a) como 
professor(a). Você pode ter uma turma, analisar duas disciplinas e fazer projeções sobre as possíveis 
notas de seus alunos, desde que tenham uma correlação linear forte. Você, também, identificou como 
as técnicas estudadas em Bioestatística sobre a inferência poderão, por meio de testes, construir um 
modelo de aceitação ou rejeição de uma hipótese. 
Você sabia que o ajuste de retas em uma análise de regressão é im-
portante para a área de ciências biológicas e da saúde? Muitos fenô-
menos biológicos podem ser expressos por equações matemáticas, 
que podem facilitar o entendimento das relações entre grandezas 
conhecidas e aquelas que queremos estimar, como o ajustamento de 
curvas, que é um instrumento imprescindível quando sabemos que a 
medida cefálica de um animal arisco (ave, morcego, peixe etc.) apre-
senta uma afinada relação com outras medidas, entre outras aplica-
ções. Nossa roda de conversa abordará um pouco desta aplicação. 
Você sabia que um professor pode, também, analisar (utilizando 
técnicas estatísticas) a compreensão dos seus alunos quanto aos 
conteúdos trabalhados? Para isso, recomendamos a leitura do artigo a 
seguir, em que foi avaliada a compreensão em testes de hipóteses de 
alunos que cursaram a disciplina Bioestatística em uma Universidade 
pública no estado de Minas Gerais. Para tal, 23 alunos responderam a um teste sobre o tema, 
do qual foram analisadas neste texto duas questões que versam sobre o estabelecimento/
formulação de hipóteses. Para acessar, use seu leitor de QR Code.
https://apigame.unicesumar.edu.br/qrcode/8513
151
A
G
O
R
A
 É
 C
O
M
 V
O
C
Ê
1. Um professor de Ciências Biológicas fez uma análise com 20 alunos, com o objetivo 
de saber se existe relação entre as disciplinas Anatomia Humana e Fisiologia Humana. 
Com isso, calculou a regressão linear, e o valor encontrado foi igual a r = 0,85. Assim, 
o professor pode concluir que:
a) Existe uma correlação linear forte e positiva entre as disciplinas de Anatomia Humana 
e Fisiologia Humana.
b) Existe uma correlação linear forte e negativa entre as disciplinas de Anatomia Humana 
e Fisiologia Humana.
c) Existe uma correlação linear fraca e positiva entre as disciplinas de Anatomia Humana 
e Fisiologia Humana.
d) Existe uma correlação linear fraca e negativa entre as disciplinas de Anatomia Humana 
e Fisiologia Humana.
e) Não existe uma correlação linear fraca e positiva entre as disciplinas de Anatomia 
Humana e Fisiologia Humana.
2. Um professor de Biomedicina fez a correlação de uma de suas turmas entre as disci-
plinas de Ecologia (x) e Educação Ambiental (y), obteve um r = 0,83 e uma equação de 
regressão linear igual a: y = 0,74x + 2,38. Se a nota de um aluno na disciplina Ecologia 
for 6,0, a nota estimada da disciplina de Educação Ambiental será igual a:
a) 5,0.
b) 6,0.
c) 6,4.
d) 6,8.
e) 7,2.
152
A
G
O
R
A
 É
 C
O
M
 V
O
C
Ê
3. O diagramade dispersão pode ajudar na interpretação e, também, a verificar se existe 
alguma correlação entre as variáveis X e Y. Diante disso, analise o gráfico (Figura 19) 
de dispersão a seguir:
Fonte: o autor.
Descrição da Imagem: a figura apresenta um gráfico de dispersão, no qual temos pontos x, y apre-
sentados na ordem a seguir (sempre lendo primeiro eixo x seguida de vírgula eixo y, para separar o 
próximo ponto separamos por traço) 10,11- 12,11- 13,2 - 14,1- 15,1- 10,1- 9,1 - 8,1.
Ao analisar o gráfico de dispersão, podemos dizer que:
a) Existe uma correlação linear forte.
b) Existe uma correlação linear positiva.
c) Existe uma correlação linear negativa.
d) Existe uma correlação linear fraca.
e) Não existe uma correlação linear.
153
C
O
N
FI
R
A
 S
U
A
S 
R
ES
P
O
ST
A
S
4. Um professor fez um experimento com uma amostra de 100 peças, com um tempo 
médio de vida de 501,2 minutos e desvio padrão igual a 4. O intervalo de confiança 
para média populacional com 95% de confiança é igual a:
a) IC � �501 2 0 998, ,
b) IC � �501 2 1 775, ,
c) IC � �501 2 3 75, ,
d) IC � �501 2 4 99, ,
e) IC � �501 2 0 784, ,
5. Sabemos que um intervalo de confiança é um parâmetro de interesse em uma popu-
lação, na qual podemos determinar a partir de amostras conhecidas. Se temos uma 
amostra igual a 12, determinaremos o intervalo de confiança utilizando:
a) Distribuição Normal.
b) Distribuição Binomial. 
c) Distribuição t de Student.
d) Correlação Linear.
e) Regressão Linear. 
154
M
EU
 E
SP
A
Ç
O
5
Iniciaremos uma visão geral da Epidemiologia e compreender os 
seus conceitos, elementos fundamentais e temas básicos. Vamos 
abordar a perspectiva histórica da Epidemiologia, destacando a 
evolução, utilização atual até a Epidemiologia moderna. Apresen-
taremos as principais aplicações da Epidemiologia; além de com-
preender a história natural da doença integrando os conceitos de 
saúde e doença. Entender a Etiologia nas fases pré-patológicas e 
patológicas. E por fim compreender a correlação entre preditor e 
desfecho para explicar o processo de saúde-doença e classificar a 
prevenção em saúde.
Epidemiologia: 
Definição, Objetivos 
e Perspectivas 
Históricas
Dra. Izabel Galhardo Demarchi
156
UNICESUMAR
Aluno (a), você compreenderá que a Epidemiologia é uma discipli-
na básica e fundamental para os cursos da área de saúde, uma vez 
que a aplicação de seus conceitos e métodos permitem estabelecer 
ou hipotetizar a situação de saúde de uma população, assim como 
define os preditores (fatores de risco ou de proteção) associados 
aos mais diversos desfechos encontrados em saúde. 
Nesta unidade, serão apresentados os principais conceitos, 
objetivos e perspectivas históricas da Epidemiologia, fornecen-
do informações conceituais essenciais para a compreensão das 
próximas unidades. Aqui, conceituamos a Epidemiologia e outras 
terminologias, e descrevemos os seus objetivos e aplicações para a 
saúde. Em perspectivas históricas, contamos a base do surgimento 
desta disciplina até a Epidemiologia Moderna, destacando a sua 
importância para a descoberta dos agentes causadores de doen-
ças, óbitos ou outras consequências. A Epidemiologia não só está 
relacionada às doenças ou outros desfechos desfavoráveis, mas 
também com a descoberta de vacinas ou medidas preventivas 
que promovem a saúde do indivíduo ou do coletivo, assim como 
explora a pesquisa de medicamentos, novos métodos de diagnós-
tico e de recuperação da saúde.
Considerando que a Epidemiologia estuda a distribuição das 
doenças e outros desfechos em saúde em uma população, é impor-
tante que todo o processo em que o indivíduo saudável se torna 
um doente seja compreendido desde a raiz. Portanto, aqui nesta 
unidade o aluno poderá compreender o processo saúde-doença, 
também descrito como História Natural das Doenças.
A base das doenças ou outros desfechos, como o óbito, sequelas 
ou até a cura, está na investigação dos fatores etiológicos (preditores 
de risco ou de proteção) e na causalidade, que são definidos e in-
terpretados na Unidade I. Aqui, você também poderá compreender 
como se dá a aplicação das medidas preventivas para a promoção, 
proteção e recuperação à saúde. Tenha uma boa leitura e um bom 
aproveitamento da nossa disciplina.
157
UNIDADE 5
CONCEITOS EPIDEMIOLÓGICOS
Bem-vindo (a) ao primeiro tópico de Epidemiologia! Caro (a) aluno (a), neste tópico você aprenderá 
alguns conceitos teóricos da nossa disciplina para podermos dar continuidade aos próximos conteúdos. 
Nesta Unidade, nós estudaremos a definição de Epidemiologia e outros temas importantes para padro-
nizarmos a nossa linguagem. Espero que você adquira a base teórica da Epidemiologia para avançarmos 
para os conteúdos mais complexos.
O que é Epidemiologia?
Primeiramente, você deve estar se perguntando, mas o que é Epidemiologia? Atualmente, Epidemio-
logia é a principal ciência da informação em saúde, base da medicina, da saúde coletiva e das outras 
formações profissionais de saúde (ALMEIDA FILHO; BARRETO, 2011). Pode ser considerada o 
eixo da saúde pública e uma disciplina essencial para todas as disciplinas clínicas (ROUQUAYROL; 
ALMEIDA FILHO, 1999).
Em termos etimológicos (origem da palavra), “Epidemiologia” significa o estudo do que afeta 
a população ou estudo sobre populações (epi=sobre; demo=população; logos=estudo) Atualmen-
te, considerando que a Epidemiologia tem uma complexidade crescente e que sua abrangência 
partiu do individual para um conceito de coletividade, existem muitas definições para este termo 
(PEREIRA, 2002). 
158
UNICESUMAR
O conceito original se restringia ao estudo de epidemias de doenças transmis-
síveis, o que prevaleceu por um longo período (PEREIRA, 2002). No dicionário 
Oxford (English Dictionary), Epidemiologia se trata de um ramo da ciência médica 
que trata das epidemias. E o que é epidemia? A epidemia ocorre quando o número 
de casos de uma doença ou óbito (ou ainda outro desfecho) excede o número de 
casos esperados para aquele período e localidade (GORDIS, 2009). No entanto, esse 
conceito é muito básico e atualmente não contempla a magnitude dessa disciplina, 
de modo que o conceito evoluiu para abranger todos os eventos relacionados com a 
saúde das populações (PEREIRA, 2002).
A Epidemiologia tem sido definida tradicionalmente como a ciência que estuda a 
distribuição das doenças e suas causas em populações humanas (ALMEIDA FILHO; 
BARRETO, 2011). Leon Gordis (2009) define Epidemiologia como a ciência que 
estuda a distribuição das doenças nas populações e os fatores que determinam ou 
influenciam esta distribuição. A Associação Internacional de Epidemiologia (IEA, 
International Epidemiological Association), em 1973, definiu essa disciplina em 
seu Guia de Métodos de Ensino como o estudo dos fatores determinantes para a 
frequência (número e porcentagem) e a distribuição das doenças nas coletividades 
humanas . A ciência clínica tem como foco o estudo da enfermidade no indivíduo, 
observando caso a caso, enquanto que a Epidemiologia estuda os problemas de saúde 
de um grupo de pessoas (ROUQUAYROL; ALMEIDA FILHO, 1999).
O conceito mais completo de Epidemiologia pode ser encontrado na referência 
de Almeida Filho e Rouquayrol (2006, p. 15), na qual ela é conceituada como: 
 “
ciência que estuda o processo saúde-enfermidade na sociedade, ana-
lisando a distribuição populacional e fatores determinantes do risco 
de doenças, agravos e eventos associados à saúde, propondo medidas 
específicas de prevenção, controle ou erradicação de enfermidades, 
danos ou problemas de saúde e de proteção, promoção ou recuperação 
da saúde individual ou coletiva, produzindo informação e conheci-
mento para apoiar a tomada de decisão no planejamento, adminis-
tração e avaliação de sistemas, programas, serviços e ações de saúde.
A Epidemiologia questiona Qual, Onde, Quando e Porquê alguma doença ou outro 
evento em saúde acomete um indivíduo ou uma população? Portanto, a doença, a 
moléstia, o agravo, oóbito e ausência de saúde não são distribuídas ao acaso em uma 
população (GORDIS, 2009). 
Atualmente, sabe-se que a Epidemiologia não estuda somente as epidemias e que 
as áreas temáticas se concentram no estudo de doenças infecciosas (por exemplo: 
sarampo, malária, infecção pelo vírus da imunodeficiência adquirida/HIV, entre 
159
UNIDADE 5
outras), doenças não infecciosas (diabetes, hipertensão arterial, depressão e outras), e 
agravos à integridade física (acidentes, homicídios, suicídios, óbito) (ROUQUAYROL; 
ALMEIDA FILHO, 1999). Pode ainda ser definida como a ciência que estuda os 
fatores etiológicos na gênese das enfermidades (JÉNICEK, 1995), que quantifica os 
fenômenos de saúde e doença, usando cálculos matemáticos e técnicas estatísticas 
(GORDIS, 2009). Podemos inferir que a Epidemiologia é uma ciência aplicada e diri-
gida para a solução de problemas de saúde, e se trata de uma ferramenta poderosa e de 
grande utilidade para a área da saúde. Atualmente, ela ocupa cada vez mais um lugar 
privilegiado como fonte de desenvolvimento metodológico para todas as ciências 
da saúde e subsidiando as práticas de saúde (ALMEIDA FILHO; BARRETO, 2011).
Resumindo, a Epidemiologia é a disciplina que analisa a situação de saúde das 
populações a partir do levantamento da frequência e distribuição dos fenômenos 
associados à saúde humana, animal e ambiental; identifica os fatores determinantes 
(preditores) das doenças, agravos ou óbito; e auxilia no planejamento e gestão em 
saúde a partir de seus resultados e interpretações. Agora que você já entendeu o 
conceito da Epidemiologia, vamos compreender melhor os seus objetivos para a 
saúde coletiva e individual.
Objetivos da Epidemiologia
Como pudemos ver anteriormente, o alvo da Epidemiologia, no passado, era voltado 
para a detecção de epidemias, como as de cólera, pestes, varíola e febre amarela, 
que afetam a população. Com o passar do tempo, observou-se que a epidemia 
era apenas uma fase aguda de uma fase do processo de morbidade (doença). Os 
estudiosos passaram a observar continuamente a ocorrência e a distribuição das 
doenças agudas e a buscar agentes etiológicos específicos para as doenças. A par-
tir disso, o estudo de doenças infecciosas crônicas também se tornaram alvo das 
pesquisas (PEREIRA, 2002).
Ao longo dos anos, os pesquisadores e epidemiologistas observaram que houve 
uma redução do número de óbitos e doentes por doenças infecciosas, enquanto 
aumentaram os casos de doenças crônicas (como o câncer, diabetes e hipertensão 
arterial). O estudo de doenças crônicas dirigiu as pesquisas para investigações de 
condições etiológicas pré-existentes (presentes antes do aparecimento das alterações 
clínicas ou anatomopatológicas), como os fatores de risco e os estados fisiológicos. 
Assim, a Epidemiologia passou a estudar qualquer evento relacionado a saúde das 
populações, não só a doença, mas também os fatores de risco e de proteção aos quais 
os indivíduos se expõem, e outros fatores que afetam os índices de morbidade e 
mortalidade (PEREIRA, 2002).
160
UNICESUMAR
A partir da assistência aos doentes e da prática de medidas preventivas, destacou-se 
o papel dos serviços de saúde para a detecção da distribuição e ocorrência das doenças, 
e esses serviços passaram a ser utilizados como referência para obtenção de dados e 
informações para a Epidemiologia, assim como a disciplina Epidemiologia passou a ser 
utilizada pelos serviços como um método de avaliação dos serviços prestados, como 
por exemplo, a auxiliar as instituições de saúde a verificar a cobertura populacional dos 
serviços, a qualidade do atendimento e outros (PEREIRA, 2002).
Os objetivos básicos da Epidemiologia são: 
• descrever as condições de saúde da população, como a distribuição e a magnitude 
dos eventos, de forma a determinar a extensão da doença na comunidade;
• investigar os fatores determinantes (preditores) da situação de saúde, ou seja, iden-
tificar os fatores etiológicos na gênese das enfermidades em um contexto coletivo.;
• estudar a história natural e o prognóstico da doença, a fim de desenvolver novos 
modelos de intervenção a partir de tratamentos ou medidas preventivas e, assim, 
comparar com os modelos de referência para verificar se foram efetivos;
• reduzir ou eliminar a exposição aos fatores de risco a partir do desenvolvimento 
de uma base para programas preventivos;
• reduzir os problemas de saúde a partir do conhecimento de sua distribuição e das 
medidas de intervenção;
• proporcionar dados essenciais para o planejamento, execução e avaliação das ações 
de prevenção, controle e tratamento das doenças, assim como estabelecer prioridades; 
• proporcionar bases para desenvolver as políticas públicas de saúde relacionadas 
aos problemas genéticos, ambientais ou de outra natureza;
• avaliar o impacto das ações dos serviços de saúde, assim como, tecnologias e pro-
cessos no campo da saúde. (ROUQUAYROL; ALMEIDA FILHO, 1999; PEREIRA, 
2002; GORDIS, 2009; ALMEIDA FILHO; BARRETO, 2011)
Hoje, a Epidemiologia é fundamental e a base para todas as ciências básicas, clínicas e 
sociais da saúde (ALMEIDA FILHO; BARRETO, 2011). Mas qual é a sua história? Como 
surgiu tão importante disciplina? Quais são os princípios éticos, políticos e filosóficos 
que tornam inegável a Epidemiologia para nossas vidas? Todas essas respostas você 
encontrará no próximo tópico.
PERSPECTIVA HISTÓRICA
Neste tópico, você entenderá o surgimento da Epidemiologia como disciplina e base 
para as demais áreas da saúde, e compreenderá o seu desenvolvimento até a Epide-
miologia Moderna.
161
UNIDADE 5
Raízes Históricas da Epidemiologia
As raízes da Epidemiologia estão dentro da História da Medicina e da evolução das causas das doenças, 
e podemos traçá-las desde a antiguidade clássica (PEREIRA, 2002). Segundo Almeida Filho e Barreto 
(2011), a Epidemiologia é uma ciência que busca respostas para questões transcendentes sobre a vida, 
a saúde, o sofrimento e a morte, e que se modifica sem cessar. No campo científico, a Epidemiologia 
emergiu no final do século XIX e se consolidou como ciência em meados do século XX. Inicialmente, 
abordaremos os principais elementos da Epidemiologia, com base na cultura ocidental moderna, e 
as circunstâncias que que fizeram emergir os três pilares fundamentais da Epidemiologia: a clínica, a 
medicina social e a estatística (ALMEIDA FILHO; BARRETO, 2011).
Hipócrates de Cós - Grécia antiga (400 anos a.C.)
Os primeiros relatos associados à Epidemiologia são encontrados na História Antiga, em que exis-
tia uma tensão entre a medicina curativa e preventiva, e entre a medicina individual e coletiva. Esse 
pensamento ocidental era encontrado na Grécia antiga em 420 a.C. Na mitologia grega, cultuava-se 
o deus da saúde, Asclépios (também chamado de Esculápio), concomitantemente conhecido como 
deus da medicina (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; BUSATO, 2016; ROU-
QUAYROL; ALMEIDA FILHO, 1999).
162
UNICESUMAR
Esse antagonismo entre a medicina curativa e a medicina preventiva é encontrado na figura das 
filhas e herdeiras de Asclépios, Panacéia e Higéia. Este paradoxo entre a medicina individual/curativa 
e coletiva/preventiva é ainda um pensamento predominante até os dias de hoje. Panacéia era conside-
rada a “padroeira” da medicina individual curativa, a qual representava a prática terapêutica baseada 
em intervenções por manobras físicas, encantamentos, preces e uso de medicamentos (pharmakon= 
fármacos) em indivíduos doentes (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; BUSATO, 
2016). A irmã, Higéia (que deu origem ao termo higiene), era venerada por aqueles que consideravam 
a saúde resultante da harmonia entre os homens e o ambiente. Os chamados higeus buscavam promo-
ver a saúde e evitar as doenças por meio de ações preventivas, a partir da manutenção do equilíbrio 
entre os elementos fundamentais: terra, fogo, ar e água. A sobrevivência dessas crenças e práticas levou 
à derivação da palavra higiene e aoseu conceito no sentido de promoção da saúde, principalmente 
em âmbito coletivo (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; ROUQUAYROL; 
ALMEIDA FILHO, 1999).
O precursor da Epidemiologia, também con-
siderado por muitos o pai da Epidemiologia, foi 
Hipócrates de Cós. O raciocínio epidemiológico 
foi antecipado por Hipócrates a partir de seus es-
tudos sobre as epidemias (termo criado por ele) e 
a distribuição das enfermidades nos ambientes. No 
seu escrito Corpus Hippocraticus, fica clara a visão 
racional da medicina, afastando as teorias sobrena-
turais, bem diferente da concepção mágico-religio-
sa predominante na antiguidade (PEREIRA, 2002; 
ALMEIDA FILHO; BARRETO, 2011).
Hipócrates definiu que a saúde do homem de-
penderia da harmonia entre os fluidos (bile amarela 
e negra, fleugma ou linfa, e sangue) e do equilíbrio 
destes elementos naturais, ou seja, as doenças eram 
produto da relação complexa entre a constituição 
do indivíduo e do ambiente que o cerca. Em seu 
texto, ele orientava ao médico sempre considerar 
os fatores ambientais como o clima, a maneira de 
viver, os hábitos de comer e de beber, durante a 
avaliação clínica do indivíduo. Ele também defen-
dia o exame clínico minucioso e sistemático do 
pacientes, que consiste em base para o diagnóstico e descrição da História Natural das Doenças. 
Além de ser considerado o pai da medicina, muitos o consideram o pai da Epidemiologia, ou ainda 
o primeiro epidemiologista (PEREIRA, 2002). 
Figura 1 - Hipócrates de Cós, o iniciador da Epidemiologia, 
que estudou as causas das doenças seguindo um raciocínio 
lógico e não miasmático.
163
UNIDADE 5
Um dos seus trabalhos clássicos, denominado como Ares, águas, lugares, buscou apresentar ex-
plicações no racional, e não no sobrenatural, a respeito das doenças nas populações, ligando-as aos 
fatores ambientais, defendendo o conceito ecológico da saúde-enfermidade, utilizado até os dias de 
hoje. Suas observações não se limitavam apenas ao paciente em si, mas sim à coletividade. A partir 
daí, surgiu a ideia do miasma (emanação), em que a doença era originada de situações insalubres, 
como a má qualidade do ar. Essas emanações insalubres seriam capazes de causar doenças como 
malária, que vem do latim maus ares (junção de mal e ar), que se relaciona com a crença sobre o 
modo de transmissão da doença. As emanações passariam do doente para os indivíduos suscetíveis, 
o que explicava a origem das epidemias de doenças contagiosas da época (PEREIRA, 2002; ALMEI-
DA FILHO; BARRETO, 2011).
A preservação dos ensinamentos de Hipócrates foi mantida principalmente por Galeno (138-201 
a.C) na Roma antiga, por árabes na Idade Média e retomada por clínicos na Europa Ocidental, no 
período da Renascença e, posteriormente, por toda parte. Um dos médicos mais famosos naquele 
período, foi Claudius Galeno, natural de Bergama (Turquia). Galeno sustentou a teoria humoral de 
Hipócrates e a ampliou (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; BUSATO, 2016; 
ROUQUAYROL; ALMEIDA FILHO, 1999).
Além de Galeno, a era romana nos deixou mais um legado para a Epidemiologia, pelas mãos do im-
perador Marco Aurélio, que solicitava a realização de censos periódicos e de um registro compulsório de 
nascimentos e óbitos, o que mais tarde seria conhecido como “estatísticas vitais”. O império romano tinha 
o que podemos chamar de infraestrutura sanitária, formada por aquedutos que levavam água de melhor 
qualidade para Roma, e de esgotos, que até hoje são preservados (ALMEIDA FILHO; BARRETO, 2011; 
BUSATO, 2016; ROUQUAYROL; ALMEIDA FILHO, 1999).
Idade Média até o Século XIX
No início da idade média, no Ocidente, predominaram o cristianismo e as práticas de caráter mági-
co-religioso, com o propósito da salvação da alma. A prática clínica para os pobres era exercida por 
religiosos, principalmente como caridade, ou por leigos, barbeiros, boticários e outros. Nesse contexto, 
não havia espaço para as ações de cunho coletivo, alastrando-se as epidemias e as pragas, e nestas 
situações de maior risco, tornava-se a se tomar as medidas coletivas (ALMEIDA FILHO; BARRETO, 
2011; ROUQUAYROL; ALMEIDA FILHO, 1999). 
Enquanto no mundo ocidental priorizavam-se as medidas de cunho individual e práticas baseadas 
em magia, no mundo árabe destacavam-se o avanço tecnológico e o caráter coletivo da medicina. O 
apogeu desta era deu-se no século X, nos califados de Bagdá e Córdoba. Os médicos muçulmanos, 
ainda preservando os princípios hipocráticos, realizavam a prática da higiene, precursora da saúde 
pública, pois foram estabelecidos os registros de informações demográficas e sanitárias e até sistemas 
de vigilância epidemiológica. 
164
UNICESUMAR
Neste período, destacamos o médico persa Avicena (989-1037), autor da obra Cânon da 
Medicina, que trata dos princípios gerais da medicina, adotando os termos Etiologia, sintomas, 
diagnose, prognose e terapêutica. Nessa obra, foi preconizado o uso sistemático do registro 
da ocorrência de doenças, antecipando a Epidemiologia (ALMEIDA FILHO; BARRETO, 
2011; MEDRONHO, 2009; BUSATO, 2016; ROUQUAYROL; ALMEIDA FILHO, 1999).
O avanço no campo cultural, filosófico e social, articulado à emergência de um novo 
modo de produção, resultou na constituição das ciências modernas. O novo entendimento 
do mundo superou a metafísica religiosa medieval e, entre os séculos XVI e XVIII, houve 
um enorme e complexo esforço para a produção de dados, informações e conhecimento 
em todos os níveis do saber e localidades em que se expandia a civilização ocidental 
(ALMEIDA FILHO; BARRETO, 2011). No século XVI, o médico espanhol Angelério 
descreveu um estudo sobre as pestes, denominado Epidemiologia, tendo então criado 
o termo. No final do século XVIII e início do século XIX, iniciando com a Revolução 
Francesa, as epidemias como cólera, febre tifóide e febre amarela eram graves problemas 
de saúde nas cidades, aumentando as preocupações com higiene, o aprimoramento da 
legislação sanitária e a criação de estruturas administrativas para controle e prevenção 
das doenças (PEREIRA, 2002).
Todos esses avanços e o impacto dos movimentos renascentistas na formação da 
Epidemiologia permitem dizer que ela surgiu da consolidação de um tripé de elementos 
conceituais (saberes sobre a doença), metodológicos (diretrizes quantitativas) e ideoló-
gicos (práticas de transformação da sociedade): Clínica, estatística e Medicina Social, 
respectivamente (ALMEIDA FILHO; BARRETO, 2011; BUSATO, 2016).
A seguir, você aprenderá sobre as raízes epidemiológicas em cada um dos três eixos.
Epidemiologia na Clínica
O fundador da clínica médica foi Thomas Sydenham (1624-1689), segundo os anglo-sa-
xões. Sydenham era um médico de Londres e um precursor da ciência epidemiológica 
que estabeleceu uma teoria sobre epidemias e elaborou o conceito “História Natural 
das Enfermidades” (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011; ROU-
QUAYROL; ALMEIDA FILHO, 1999).
Para os franceses, o precursor da medicina científica moderna foi Michel Focault (1926-
1984). Foucault conta que a Sociedade de Medicina de Paris fundou a clínica moderna no 
século XVIII, e organizou-se a partir da Ordem Real para que os médicos investigassem uma 
epizootia que dizimou rebanhos e que gerou grandes perdas para a indústria têxtil francesa. 
Nessa investigação estava incluída a contagem do número de casos, mesmo que não humanos, 
o que contribuiu grandemente para a Epidemiologia metodológica (ALMEIDA FILHO E 
BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999; MEDRONHO, 2009).
165
UNIDADE 5
Com a teoria microbiana e a fisiopatologia, a medicina científica passou a desem-
penhar um papel importante na institucionalização da prática médica contemporânea. 
No século XVII, o microscópio já era conhecido nos Países Baixos e, inicialmente, 
não era utilizado por médicos ou outro profissional das ciências biológicas, mas sim 
por comerciantes para examinar a qualidade dos tecidos que compravam e vendiam. 
A curiosidade do homem foi além, e passou avisualizar tudo que estivesse à sua 
volta (ALMEIDA FILHO; BARRETO, 2011). Com os aperfeiçoamentos técnicos e a 
vidraria, foi possível a confecção de instrumentos óticos de razoável potência, por-
tanto foi possível reconhecer os microrganismos e relacionar o seu papel na gênese 
das doenças (PEREIRA, 2002; ALMEIDA FILHO; BARRETO, 2011).
A partir daí, um dos clínicos mais conhecidos por explorar problemas de maior 
relevância clínica e de saúde pública na época foi Ignaz Semmelweis (1818-1865). 
Semmelweis comandava a maternidade do hospital geral de Viena (Áustria), que na 
época tinha duas clínicas obstétricas. A clínica, constituída por médicos e estudantes 
de medicina, registrou 16% de taxa de óbito de parturientes, quase dez vezes maior 
que no setor das parteiras (7%). Após um aluno de Semmelweis ferir-se acidental-
mente durante uma necropsia e morrer de infecção maciça, detectaram lesões e pus 
que se assemelhavam aos encontrados nas parturientes mortas por febre puerperal. 
Observou-se que os médicos e estudantes, que todos 
os dias realizam as necropsias nas pacientes falecidas e 
depois iam fazer os partos, poderiam transmitir as tais 
partículas a partir das mãos. A partir disso, Semmel-
weis determinou que antes dos partos os profissionais 
deveriam lavar as mãos com uma solução de soro e 
escovar as unhas após as autópsias e antes de entrar 
em contato com qualquer paciente. No ano seguinte, 
a mortalidade da clínica médica foi semelhante a das 
parteiras, reduzindo de 12,2% para 2,4% (GORDIS, 
2009; ALMEIDA FILHO E BARRETO, 2011). 
Outras contribuições foram surgindo a partir da 
emergência da fisiologia moderna e da microbiolo-
gia, principalmente com Louis Pasteur (1822-1895). A 
pedido da indústrias de vinho, Pasteur, químico e não 
médico ou biólogo, estudou a fermentação alcoólica 
evidenciando a presença de leveduras como causa do 
processo. Ele também iniciou a teoria da pasteuriza-
ção, na qual alguns microrganismos eram destruídos 
pelo aquecimento (GORDIS, 2009; ALMEIDA FILHO; 
BARRETO, 2011; PEREIRA, 2002).
Figura 2 - Louis Pasteur, famoso pelos estudos de fer-
mentação alcoólica e pasteurização.
Fonte: Wikimedia (2016, on-line)¹.
166
UNICESUMAR
Um outro exemplo importante da clínica médica é Robert Koch (1843-1910), que em 1882 descobriu 
o agente causador da tuberculose e escreveu os postulados da teoria microbiana da doença (“teoria do 
germe”). Koch postulou que o microrganismo deveria ser isolado em cultura de cada caso da doença. 
Uma vez isolado, deveria ser inoculado em um animal para reproduzir a doença experimentalmente. 
Aplicando-se os métodos de Koch, em 1880 e 1989 foram descobertos os agentes da febre tifóide, 
hanseníase, malária, cólera, erisipela, difteria, brucelose, pneumonia e outros (ALMEIDA FILHO, 
BARRETO, 2011).
Como podemos ver, na segunda metade do sé-
culo XIX e na primeira do século XX ocorreu uma 
reorientação do pensamento médico e uma altera-
ção dos conceitos de doença e contágio. A partir da 
comprovação de seres microscópicos e seu papel 
na gênese da enfermidades, a clínica e a patologia 
tornaram-se subordinadas aos laboratórios, que 
também ditavam as normas de higiene e legislação 
sanitária. As escolas de saúde pública passaram as 
formas aos sanitaristas, e os ensinos passaram a 
se concentrar em laboratórios. Foram fundados 
diversos institutos de pesquisas aplicadas à prática 
clínica, como o Instituto Pasteur e, consequente-
mente, aumentou-se o número de produções cien-
tíficas com progresso da ciência e tecnologia. Não 
somente os avanços da bacteriologia; houve uma 
significativa consolidação dos métodos de preven-
ção de doenças, como as imunizações e a promoção 
da saúde ambiental (PEREIRA, 2002). 
Em relação às imunizações, destaca-se Edward Jenner (1749), que teve um grande interesse na 
varíola, considerada um problema de saúde universal para a época. Sabia-se que os sobreviventes à 
doença estariam imunes, e tornou-se uma prática comum infectar indivíduos saudáveis administrando 
um material retirado de pacientes com varíola. Esse procedimento ficou conhecido como variolização, 
e tornou-se um método preventivo muito comum na prática médica. No entanto, muitos indivíduos 
foram a óbito, ou alguns desenvolveram a doença ou ainda outras infecções (GORDIS, 2009). Com 
o objetivo de encontrar uma prática mais segura para prevenir a varíola, Jenner passou a estudar a 
varíola bovina, e observou que as mulheres ordenhadoras de vacas desenvolviam a varíola mais bran-
da e que após surtos da doença essas mulheres não desenvolviam a infecção. Então, Jenner decidiu 
testar a hipótese de que a varíola bovina poderia prevenir a doença nos homens. Somente em 1967 a 
Organização Mundial da Saúde (OMS) realizou uma intensa campanha internacional para erradicar 
a varíola, usando vacinas contendo o vírus da varíola bovina. Em 1980, a OMS emitiu um certificado 
de erradicação da doença (GORDIS, 2009).
Figura 3 - Robert Koch, o descobridor do agente etiológico da 
tuberculose. / Fonte: Wikimedia (2016, on-line)². 
167
UNIDADE 5
Na saúde ambiental, destacou-
-se o meio ambiente como propa-
gador de doenças, relacionando o 
seu papel na transmissão das en-
fermidades, como a presença de 
vetores e reservatórios de agentes. 
Com a saúde ambiental, foi pos-
sível estabelecer ciclo de vida de 
parasitos e o papel de mosquitos 
na transmissão de doenças in-
fecciosas. A partir destes conhe-
cimentos de transmissibilidade, 
abandonou-se a teoria centrada 
nos germes e passaram a aplicar 
a teoria da multicausalidade para 
a ocorrência de doenças, ou seja, 
as doenças são resultantes da in-
teração entre o agente, o homem 
e o meio ambiente. A doença re-
sultaria em qualquer perturbação 
dessa complexa interação de múl-
tiplos fatores, e não só de um fator 
unificado (PEREIRA, 2002).
A partir de todos os resultados 
clínicos, a quantificação da doença passou a ser um elemento metodológico importante para avaliar a 
distribuição das doenças e a efetividade das medidas preventivas. A quantificação das enfermidades passou 
a ser uma nova ciência da saúde, surgindo a estatística (PEREIRA, 2002; ALMEIDA FILHO; BARRETO, 
2011, MEDRONHO, 2009). Desta maneira, a clínica contribui para a descrição das doenças, diagnóstico 
e tratamento de doenças, agravos e outros eventos de saúde que acometem pessoas ou populações, sendo 
importante para o avanço das pesquisas e desenvolvimento da tecnologia médica (BUSATO, 2016).
Epidemiologia na Estatística
Segundo Busato (2016, p. 24), “a articulação entre a clínica, medicina social e a estatística, resulta na 
evolução da Epidemiologia, ressaltando a sua vocação de ciência aplicada no diagnóstico e na solução 
de problemas de saúde”. A estatística é um método capaz de analisar os riscos, os fatores de risco e os 
desfechos em saúde, promovendo maior confiabilidade nos resultados obtidos pelas pesquisas. Além 
disso, com a computadorização, a avaliação de causa e efeito tiveram maior precisão na análise estatística. 
Figura 4 - Edward Jenner (1749-1823), pioneiro da vacinação. Nesta figura, está o 
menino James Phipps de 8 anos de idade sendo imunizado contra varíola, 1796. 
168
UNICESUMAR
Os métodos numéricos já eram utilizados para o estudo da situação 
de saúde já no século XVII. As pesquisas e os registros populacionais 
de John Graunt (1620-1674) são mencionados como precursores da 
demografia, da estatística e da Epidemiologia. Graunt foi um membro 
da Royal Society (Londres) que realizou os primeiros estudos analíticos 
de estatística vital utilizando dados de obituários (mortalidade por sexo 
e região). Graunt foi o pioneiro em utilizar os coeficientes (óbito em 
relação à população) e é considerado o pai das estatísticas vitais ou o pai 
da demografia (ALMEIDA FILHO; BARRETO, 2011, MEDRONHO, 
2009; PEREIRA, 2002; ROUQUAYROL; ALMEIDA FILHO, 1999).
Em 1747, James Lind (1716-1794), um médico escocês e pioneiro da 
higiene naval, realizou o primeiro estudo de ensaio clínico (experimen-tação em seres humanos). Lind observou que marinheiros possuíam 
sintomas como dentes soltos, sangramento de gengivas e hemorragias. 
Assim, ele selecionou 12 homens do navio que sofriam de escorbuto e 
dividiu os dois grupos, com seis indivíduos cada. Os grupos receberam 
adições diferentes à sua dieta básica: alguns receberam sidra (fermen-
tado alcoólico de suco de maçã), e outros água do mar, uma mistura de 
alho, mostarda e rabanete. O outro grupo recebeu vinagre, laranjas e 
limões. Os indivíduos alimentados com cítricos tiveram uma recupera-
ção notável. Lind estabeleceu definitivamente a superioridade das frutas 
cítricas sobre todos os outros tratamentos (BBC, 2017; PEREIRA, 2002).
O estudo de Pierre-Charles Alexandre Louis (1787-1872) inaugurou a 
Epidemiologia. Louis foi um médico e matemático precursor da avaliação 
da eficácia de tratamentos clínicos utilizando métodos estatísticos, que 
realizou estudos para investigar a mortalidade por diversas doenças. Um 
desses estudos avaliou a letalidade da pneumonia após o tratamento com 
a sangria, e revelou também seu poder prejudicial para o tratamento da 
doença (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; 
PEREIRA, 2002; ROUQUAYROL; ALMEIDA FILHO, 1999).
William Farr (1807-1883) criou o registro anual de mortalidade e 
morbidade para a Inglaterra e o País de Gales. Essa criação foi o marco 
da institucionalização dos sistemas de informação em saúde. Farr foi 
influenciado pelo enfoque social, e analisou os dados de mortalidade 
com dados específicos (ocupações, sexo, estação e outros fatores). Jun-
tamente dos dados disponibilizados pelo escritório, foi possível o acesso 
a um manancial de informações sobre saúde, até então não disponível 
(MEDRONHO, 2009, ALMEIDA FILHO; BARRETO, 2011; PEREIRA, 
2002; ROUQUAYROL; ALMEIDA FILHO, 1999).
169
UNIDADE 5
O método de aritmética médica de Louis e a estatística de Farr 
permitiram a integração entre a clínica e a estatística, faltando ape-
nas o campo político para o surgimento de uma nova ciência da 
saúde de caráter coletivo. Para isso, também foi preciso atribuir a 
saúde aos aspectos sociais e políticos e aliar este princípio à preo-
cupação e ao compromisso com o processo de transformação da 
situação de saúde na sociedade . No final do século XVIII, com a 
burguesia já consolidada, ocorreram muitas intervenções do Estado 
na saúde das populações (MEDRONHO, 2009; ALMEIDA FILHO; 
BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). 
Na França, esse processo ficou conhecido como Medicina urbana, 
com o objetivo de sanear as cidades e os seus espaços, ventilar as ruas e 
as construções e isolar áreas consideradas miasmáticas. Na Inglaterra 
e na Alemanha também houve intervenção do Estado para o controle 
e vigilância das enfermidades, e havia o movimento hospitalário e o 
assistencialismo. Com a urbanização e a formação de um proletaria-
do, abriu-se um processo de luta política por uma medicina coletiva, 
ou medicina social, dando início a um movimento de politização da 
saúde (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011; 
ROUQUAYROL; ALMEIDA FILHO, 1999).
Medicina Social
Também conhecida como medicina urbana ou ainda medicina 
social (termo cunhado por Jules Guérin em 1838). A medicina 
social designa modos de abordar a questão da saúde de modo co-
letivo (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011). 
Muitos relatórios de discípulos de Louis Pasteur, tanto na França 
como na Inglaterra, demonstraram que as condições inadequadas 
de vida da classe trabalhadora resultaram na deterioração dos níveis 
de saúde. Em 1842, na Alemanha, Edwin Chadwick (1800-1890) 
escreveu o relatório As condições sanitárias da população traba-
lhadora da Grã-Bretanha, voltado para a medicina dos pobres. 
Essa publicação impressionou o Parlamento, que ficou encarregado 
de propor medidas de saúde pública e de recrutamento de médi-
cos sanitaristas para solucionar os principais problemas de saúde 
coletiva (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; 
ALMEIDA FILHO, 1999).
170
UNICESUMAR
Em meados do século XIX, o médico sanitarista Rudolf Ludwing Karl Virchow (1821-1902) destacou-se 
como um dos principais personagens da medicina social. O legislativo de Berlim enviou Virchow para a 
Alta Silésia, onde vivia uma população de origem polonesa (da mesma origem da família de Virchow), 
para estudar um surto de tifo. O seu relatório constatou que as pessoas viviam em condições deploráveis 
e denunciou o capitalismo, pois descreveu que a prevenção das epidemias não dependia somente de 
remédios ou medidas de higiene, mas dependia de uma ampla reforma das condições sócio-econômicas 
(MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). 
Em 1850, os jovens idealistas médico-sociais, oficiais de saúde pública e membros da Royal Me-
dical Society organizaram na Inglaterra a London Epidemiological Society. Dentre os membros mais 
importantes destacou-se John Snow (1813-1858), considerado o fundador (pai) da Epidemiologia. 
Snow desenvolveu numerosos estudos para esclarecer a origem das epidemias de cólera ocorridas em 
Londres (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011; GORDIS, 2009; PEREIRA, 2002; 
BUSATO, 2016; ROUQUAYROL; ALMEIDA FILHO, 1999).
Naquele período, Londres era uma megalópole de 2,5 milhões de habitantes, e que tinha uma 
precária condição de higiene e de saneamento. 
Os dejetos eram acumulados por toda parte da 
cidade e jogados no rio Tâmisa, cuja água era uti-
lizada para abastecimento por duas companhias 
de distribuição. Para Snow, a teoria do miasma 
não explicava a transmissão de cólera. Em 1849, 
no segundo ano da epidemia, Snow publicou o 
panfleto intitulado ‘Sobre a Maneira de Trans-
missão da Cólera’ (On the Mode of Communi-
cation of Cholera), defendendo a ideia de que a 
doença era transmitida pela água (contaminação 
hídrica) (ALMEIDA FILHO; BARRETO, 2011; 
BUSATO, 2016). 
Snow observou que os casos mais frequentes 
estavam entre as pessoas que usavam água forne-
cida por empresas que a recolhiam de um poço na 
Broad Street. A captação da água era realizada em 
pontos muito poluídos do rio pelas companhias 
Lambeth Company e Southwark and Vauxhall 
Company. Naquela época, por motivos técnicos 
e não de saúde, a companhia Lambeth transferiu 
o lugar de captação da água para um local menos 
poluído do rio Tâmisa, mas a outra companhia não 
moveu o local de captação da água. Snow racio-
cinou que a transferência do lugar de captação da água deveria reduzir a taxa de mortalidade por cólera 
Figura 5 - John Snow, o pai da Epidemiologia, realizou estudos 
sobre o cólera em Londres durante o período de 1849-1856. 
Fonte: Wikimedia (2015, on-line)³. 
171
UNIDADE 5
naqueles que recebiam água pela companhia Lambeth em relação aos que recebiam água pela outra 
empresa. Snow encontrou uma taxa de mortalidade de 315 casas por 10.000 casas quando a água era 
distribuída pela Southwark and Vauxhall Company. Naquelas abastecidas pela Lambeth Company, a taxa 
era de apenas 38 casos de óbito a cada 10.000 casas (GORDIS, 2009; PEREIRA, 2002; BUSATO, 2016).
O número de casos de cólera era quase 14 vezes maior na área que recebia água da companhia 
Southwark and Vauxhall em relação à região abastecida pela Lambeth Company. Então, ele propôs 
ao conselho administrativo que fosse removida a bomba do poço de Broad Street, e os casos de cólera 
começaram a diminuir. A partir disso, ele publicou a segunda edição de On the Mode of Communi-
cation of cholera, acrescentando esses resultados. Em 1884, Robert Kock isolou e cultivou a bactéria 
(ALMEIDA FILHO; BARRETO, 2011).
Na Inglaterra, na França e na Alemanha, surgiu o movimento conhecido como sanitarismo, no qual 
a maioria dos funcionários era de agências oficiais que realizavam o controle de doenças. Os sanitaristas 
faziam discursos e praticavam as questões de saúde baseados na aplicação de tecnologia e em atividades 
profiláticas, como a imunização, o saneamento e o controle de vetores. As ações eram destinadasprin-
cipalmente aos pobres e a setores excluídos da sociedade. Além do sanitarismo, a estatística, a patologia 
e as pesquisas microbianas aplicadas no campo social da saúde (Saúde Pública) contextualizaram a 
constituição da Epidemiologia como campo científico (ALMEIDA FILHO; BARRETO, 2011).
Epidemiologia Atual
Dando continuidade abordaremos a consolidação da Epidemiologia como disciplina, as atualidades 
e o seu desenvolvimento no Brasil.
No Mundo 
Em 1918, a escola pioneira de saúde pública foi inaugurada em Baltimore (EUA), Johns Hopkins School 
of Hygiene and Public Health, a qual serviu de modelo de “escola de saúde pública” e foi difundida pelo 
mundo todo, com o apoio da Fundação Rockefeller. Wade Hampton Frost (1880-1938), sanitarista do 
National Public Health Service, assumiu a nova cátedra de Epidemiologia na escola John Hopkins 
e foi o primeiro professor da disciplina no mundo. Frost utilizou novas técnicas estatísticas para es-
tudar a prevalência e a incidência de doenças transmissíveis (ALMEIDA FILHO; BARRETO, 2011; 
MEDRONHO, 2009; ROUQUAYROL; ALMEIDA FILHO, 1999).
Em 1928, a fusão da antiga Escola da Medicina Tropical com o Departamento de Higiene da 
University College formou a London School of Hygiene and Tropical Medicine. O primeiro pro-
fessor de Epidemiologia e Estatística Vital foi Major Greenwood (1880-1949), conhecido também 
como o fundador da estatística moderna. Ele foi o principal responsável em introduzir a estatística 
na pesquisa epidemiológica (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; ROU-
QUAYROL; ALMEIDA FILHO, 1999).
172
UNICESUMAR
Em 1929, com a crise econômica mundial e social, o avanço tecnológico e a especialização da prática 
médica levaram à elevação dos custos e da elitização da assistência à saúde, reduzindo o seu alcance social. 
Nesse período, o caráter social das doenças foi resgatado a partir da Epidemiologia. Em 1936, o clínico 
britânico John Ryle (1889-1950), o primeiro diretor do Instituto de Medicina Social da Universidade de 
Oxford, propôs a sistematização do modelo de História Natural das Doenças, essencial para a crescente 
medicina preventiva. Nesse modelo, a saúde poderia ser alcançada pelas ações intervencionistas reali-
zadas antes do aparecimento da doença. Posteriormente, a noção de prevenção se estendeu em muitos 
países que internacionalizaram o movimento ideológico da Medicina Preventiva como prática médica 
(ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009; ROUQUAYROL; ALMEIDA FILHO, 1999). 
Nas décadas de 1930 e 40, muitos países passaram a incorporar os aspectos de prevenção nos con-
teúdos de formação de profissionais de saúde. Foram criados departamentos de medicina preventiva 
que abordavam os conteúdos de Epidemiologia, administração em saúde e ciências da conduta, que 
eram ministrados pelas escolas de saúde pública somente. O conceito de prevenção foi ampliado para 
prevenção primária, secundária e terciária (descritos ainda nesta unidade), incorporando toda a prática 
médica (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009).
Com a Segunda Guerra Mundial, houve uma necessidade de desenvolver métodos eficientes para 
medir a saúde física e mental dos exércitos, abrindo a possibilidade de aplicação dos métodos epi-
demiológicos à população civil. No período pós-guerra, grandes inquéritos epidemiológicos foram 
realizados, principalmente de doenças não-infecciosas, como pretendia a nova ciência (MEDRONHO, 
2009; ROUQUAYROL; ALMEIDA FILHO, 1999). 
Em 1954, a institucionalização da disciplina levou à fundação da International Epidemiological 
Association (IEA), à transformação do tradicional American Journal of Hygiene em American 
Journal of Epidemiology em 1964. Na década de 1950, novos desenhos de investigação começaram 
a ser desenvolvidos por programas de investigação e departamentos de Epidemiologia (ALMEIDA 
FILHO; BARRETO, 2011; MEDRONHO, 2009; PEREIRA, 2002; ROTHMAN; GREENLAND; 
LASH, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999).
Na teoria, foram definidos os indicadores básicos da saúde, prevalência e incidência, e formalizado 
o conceito de risco. Também foi introduzida a Bioestatística como ferramenta de análise dos estudos 
para a identificação das causas das enfermidades. Neste campo, destacou-se Jerome Cornfield (1912-
1979), que desenvolveu os estimadores do risco relativo (risco de desenvolver uma determinada doença 
quando exposto a um fator de risco) e introduziu as técnicas de regressão logística (análise estatística) 
na Epidemiologia (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009).
Na década de 1960, houve um grande avanço tecnológico e científico com o desenvolvimento e 
difusão da computação eletrônica. Isso levou à matematização cada vez maior da disciplina. Com a 
computação, foi possível criar e utilizar os bancos de dados, que aliados às ferramentas e softwares 
(programas) de estatística, expandiram a investigação epidemiológica. Na década de 1970, a matemática 
passou a validar as investigações científicas dos riscos, fatores e efeitos, ou seja, ela passou a ser indis-
pensável para a confrontação da experiência clínica ou da demonstração experimental (ALMEIDA 
FILHO; BARRETO, 2011; MEDRONHO, 2009; ROUQUAYROL; ALMEIDA FILHO, 1999). 
173
UNIDADE 5
Na década de 80, foi consolidada a Epidemiologia clínica, aquela fora do contexto coletivo, com 
ênfase em procedimentos de identificação de caso e na avaliação da eficácia terapêutica, conforme 
o que recentemente é conhecido como medicina baseada em evidência. Nos anos de 1990, houve 
uma ampliação do objetivo de conhecimento da disciplina, surgindo novos horizontes de pesquisa, 
destacando-se a Epidemiologia Molecular, a Epidemiologia Genética, a Farmacoepidemiologia e a 
Epidemiologia de Serviços de Saúde (ALMEIDA FILHO; BARRETO, 2011; MEDRONHO, 2009).
No Brasil
No Brasil, o início da Epidemio-
logia deu-se com a Medicina 
Tropical e os naturalistas, que des-
creveram a ocorrência de muitas 
doenças infecciosas, seus agentes 
e vetores. Em 1903, o médico Os-
waldo Cruz (1872-1917), egres-
so do Instituto Pasteur de Paris, 
ocupou o cargo de diretor Geral 
de Saúde Pública. Oswaldo Cruz 
tinha como tarefa, sanear a capital 
(Rio de Janeiro, naquela época), e 
combater as principais endemias 
da cidade, como a febre amarela, 
varíola e peste bubônica. Oswaldo Cruz impôs a notificação compulsória e medidas rigorosas para 
controle das doenças, como a aplicação de multas e vacinação nos moldes militares. Em 1904, a capital 
sofreu uma grave epidemia de varíola, e obrigou a vacinação contra a doença a partir de um projeto de 
lei do Congresso, a qual previa sanções para quem a desobedecesse. O autoritarismo da vacina levou à 
insatisfação popular que deu origem à Revolta das Vacinas. No início do século XX, em Manguinhos, 
no Rio de Janeiro, Oswaldo Cruz fundou um Instituto de pesquisa, que hoje leva o seu nome e se tornou 
um dos laboratórios mais importantes do país (PEREIRA, 2002; ALMEIDA FILHO; BARRETO, 2011; 
MEDRONHO, 2009).
Após Oswaldo Cruz, destacou-se Carlos Chagas (1879-1934), médico sanitarista e campanhista. Em 
1909, em Lassance (Minas Gerais), enquanto combatia o surto de malária, Chagas descobriu o agente 
da tripanossomíase americana (mundialmente conhecida como Doença de Chagas), o protozoário 
Trypanosoma cruzi, nome dado em homenagem ao Oswaldo Cruz (MEDRONHO, 2009; PEREIRA, 
2002; ALMEIDA FILHO; BARRETO, 2011). Do Instituto Manguinhos, também merece destaque o 
protozoologista Adolfo Lutz (1855-1940), que trabalhou com febre amarela e outras endemias. Lutz 
ocupou o cargo de diretor do Instituto Bacteriológico em São Paulo, e descobriu a relação do vetor Aedes 
aegypti como transmissor da febre amarela (PEREIRA, 2002; ALMEIDA FILHO; BARRETO, 2011).
Figura 7: Revolta das Vacinas, ocorrida em 1904 no Rio de Janeiro, contra o autori-
tarismo da vacinação comandado por Oswaldo Cruz e seu exército 
Fonte: Wikimedia (2017, on-line)4. 
174
UNICESUMAR
Em meados de 1950, foram criados os departamentos de Medicina Preventiva(ou Social) em fa-
culdades de Medicina, e a disciplina de Epidemiologia foi inserida nos cursos de medicina. Em 1960, 
foram realizadas campanhas de vacinação para a erradicação da varíola, e em 1970, contra a poliomielite. 
Juntamente com a epidemia de doença meningocócica, as campanhas e a epidemia contribuíram para a 
consolidação do Sistema Nacional de Vigilância Epidemiológica do Brasil. Ainda em 1970, foram criados 
núcleos de saúde coletiva, e em 1979 criou-se a Associação Brasileira de Pós-graduação em Saúde Co-
letiva (ABRASCO), atuando também nos serviços de saúde (MEDRONHO, 2009; ALMEIDA FILHO; 
BARRETO, 2011).
O ápice do movimento de reforma sanitária deu-se na VIII Conferência Nacional de Saúde, 
considerada o marco da criação do Sistema Único de Saúde (SUS). Em 1898, durante o Seminário 
Estratégias para o Desenvolvimento da Epidemiologia no Brasil, foi elaborado o I Plano Diretor, 
que abordava questões sobre o desenvolvimento da disciplina no Brasil para a graduação, pós-gra-
duação, pesquisas e serviços de saúde (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011). 
Em 1990, foi realizado o I Congresso Brasileiro de Epidemiologia (Campinas, SP) e criado o Centro 
Nacional de Epidemiologia, órgão vinculado ao Ministério da Saúde (criado em 1953). Esse órgão 
era responsável por promover e disseminar o uso de Epidemiologia para todos os níveis de atenção 
na saúde do SUS. Posteriormente, foram realizados outros congressos de Epidemiologia, com cada 
vez mais trabalhos científico apresentados e maior número de participantes, e também atualizado 
o Plano Diretor (MEDRONHO, 2009; ALMEIDA FILHO; BARRETO, 2011).
Desde 2005, a Comissão de Epidemiologia da ABRASCO lançou o IV Plano Diretor de Desenvol-
vimento da Epidemiologia no Brasil, que afirma o uso da Epidemiologia na saúde pública, refletindo 
um grande aumento das pesquisas epidemiológicas com impacto social e as relações com os diversos 
determinantes de saúde (social, econômico, político e cultural) (MEDRONHO, 2009; ALMEIDA 
FILHO E BARRETO, 2011).
APLICAÇÕES DA EPIDEMIOLOGIA
Tradicionalmente, a Epidemiologia é utilizada como método de verificação da situação de saúde de uma 
população, estudando a distribuição das doenças e outros problemas de saúde e as razões para que esta 
distribuição ocorra. Além disso, com essa base racional, a Epidemiologia pode ser utilizada para a deci-
são das intervenções em saúde e empregada para avaliar o sucesso das tomadas de decisão para o bem 
individual e da coletividade (PEREIRA, 2002; FRANCO; PASSOS, 2011). Bem como a Epidemiologia é 
um campo de ação tecnológica que pode ser utilizada no planejamento e gestão em saúde, também é um 
campo de prática social que promove a saúde (ALMEIDA FILHO; BARRETO, 2011). A seguir, as aplicações 
da Epidemiologia serão melhor descritas complementando o tópico I desta unidade.
175
UNIDADE 5
Diagnóstico da situação de saúde
O diagnóstico da situação de saúde 
de uma população é baseada na iden-
tificação dos problemas de saúde que 
afetam um ou mais indivíduos, e é uma 
das principais aplicações da disciplina, se-
não a mais importante. Essa investigação 
gera dados quantitativos que são obtidos 
diariamente, como em laboratórios de 
análises clínicas (diagnóstico e notifica-
ção de casos de dengue, por exemplo), 
ou em situações especiais, como em in-
quéritos realizados por graduandos ou 
pós-graduandos. Todos os dados coleta-
dos podem ser analisados em conjunto 
e fornecer um diagnóstico da população 
(ROTHMAN et al., 2011; PEREIRA, 
2002; GORDIS, 2009).
Os dados coletados podem ser a ocorrência de uma condição única, como um agravo à saúde (uma 
doença, uma sequela pós-traumática, um efeito adverso e outros); um fator de risco (por exemplo, 
exposição ao fumo ou álcool); uma característica populacional, como raça e condições econômicas, 
ou outro evento de interesse; grupo de condições, como doenças infecciosas ou cardiovasculares, por 
exemplo (PEREIRA, 2002).
Com a geração de informações em saúde, é possível:
f) direcionar as ações em saúde; por exemplo, focar as ações saneantes para áreas com maior 
taxa de infecções gastrointestinais. A distribuição de casos apontará as camadas da população 
em que o dano é dano mais frequente ou onde é raramente encontrado. Com esses dados é 
possível acompanhar as intervenções e observar se os processos de desigualdade persistem ou 
foram sanados. 
Desta forma, uma das ações da Epidemiologia, além de identificar os problemas de saúde, é de propor 
medidas preventivas dos riscos e os danos a fim de evitar a ocorrência das doenças, agravos, ou compli-
cações, como a vacinação do exemplo acima (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; 
ALMEIDA FILHO, 1999; GORDIS, 2009).
g) formular explicações ou gerar hipóteses do porque esses eventos são mais frequentes em de-
terminados grupos.
176
UNICESUMAR
A distribuição de eventos em uma população nos leva a questionar: quais são os fatores que influen-
ciaram ou que causaram essa distribuição? Uma variável de exposição constitui um fator de risco ou 
não para uma determinada patologia? A resposta para esta questão se torna muito importante do 
ponto de vista da saúde coletiva, para que se possa tomar decisões para a resolução de problemas de 
saúde (ALMEIDA FILHO; BARRETO, 2011; PEREIRA, 2002; ROUQUAYROL; ALMEIDA FILHO, 
1999; GORDIS, 2009). No entanto, o maior desafio da Epidemiologia consiste na correta produção de 
hipóteses e no processo de validação destas para a busca de soluções para os problemas identificados 
(ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999; GORDIS, 2009; 
ROTHMAN et al. 2011).
Você já pensou como a Epidemiologia está relacionada com a sua rotina e suas relações indi-
viduais e coletivas? Avalie a importância da Epidemiologia no seu cotidiano.
Identificação etiológica dos problemas de saúde
A identificação etiológica significa identificar a causa de uma doença, de um agravo ou de qualquer 
outro problema de saúde, o que constitui um grande desafio científico. Como podemos ver na história 
da Epidemiologia, a investigação das causas das doenças tiveram início no sobrenatural. Posteriormente, 
atribuiu-se aos fatores físicos e miasmas, depois aos germes ou contágio e, então, à múltipla causalidade 
(multifatorial, a teoria utilizada até os dias de hoje). Nesta fase da causalidade múltipla, os eventos de 
saúde dependem da interação dos fatores físicos, biológicos, sociais e outros na coletividade (PEREIRA, 
2002; ROUQUAYROL; ALMEIDA FILHO, 1999; GORDIS, 2009; ROTHMAN et al., 2011).
No caso das investigações epidemiológicas, podemos ter abordagens unicausais ou multicausais 
(PEREIRA, 2002):
• unicausal: relaciona-se uma causa a um efeito. Por exemplo, a incidência e mortalidade por 
câncer de pulmão é reduzida significativamente com a diminuição do hábito de fumar. Porém, 
esse princípio da unicausalidade não se aplica a muitas doenças, como as crônico-degenerativas 
(diabetes, por exemplo);
177
UNIDADE 5
• ulticausal: múltiplas 
causas estão envolvidas 
com um evento ou uma 
única causa está envol-
vida com muitos danos 
à saúde. Exemplo: as 
doenças coronarianas 
estão associadas a múl-
tiplos fatores, como a 
obesidade, nível sérico 
(sanguíneo) de coleste-
rol aumentado (acima 
do considerado nor-
mal), ao sedentarismo, 
tabagismo, estresse e 
outros. Múltiplos fato-
res também requerem 
múltiplos esforços para 
controle e prevenção 
do evento.
Pulmão Saudável Pulmão de Fumante
EFEITOS DO TABACO SOBRE A SAÚDE
Figura 8. O hábito de fumar pode levar ao câncer de pulmão. Consequentemente, 
reduzir o consumo de cigarros diários ou adotar a medida de parar de fumar pode 
reduzir o risco de se ter câncer de pulmão.
Para se confirmar um caso (uma doença, ou qualquer outro evento em saúde) é necessário evidenciar 
os fatos, como um diagnóstico clínico e laboratorial que confirmem o caso. Até uma nova intervenção 
deve ter seu efeito comprovado. Esse tipo de ciência é denominada medicina baseada em evidência.Essas evidências podem ser obtidas de diferentes fontes, como as experiências em animais, observações 
clínicas adquiridas com os anos, achados laboratoriais, análises comparativas de estatísticas e inquéritos 
populacionais (PEREIRA, 2002; FRANCO; PASSOS, 2011; BENSEÑOR; LOTUFO, 2005). 
Caso as evidências apontem uma relação causal, gera-se uma hipótese, e procura-se confirmar essa 
causa ou descartá-la por uma simples coincidência (PEREIRA, 2002; ROUQUAYROL; ALMEIDA 
FILHO, 1999; GORDIS, 2009). Não são todos os métodos epidemiológicos que permitem diferen-
ciar uma coincidência de uma verdadeira relação causal, e os estudos mais adequados que inferem 
causalidade são os ensaios clínicos randomizados e controlados (PEREIRA, 2002; GORDIS, 2009; 
BENSEÑOR; LOTUFO, 2005). 
178
UNICESUMAR
Aprimoramento de um diagnóstico e prognóstico
A Epidemiologia, ao descrever a distribuição da doença na população, contribui para o diagnóstico clínico 
realizado pelos médicos. A descrição de quadro clínico inicia-se a partir da observação de um caso, ou de 
poucos casos. O clínico reconhece os principais aspectos daquela afecção (PEREIRA, 2002), acompanhado 
das evidências laboratoriais, e é confirmado baseado na literatura especializada e pelos estudiosos da matéria 
(PEREIRA, 2002; FRANCO; PASSOS, 2011). Além disso, a Epidemiologia contribui para a identificação de 
síndromes e a classificação de doenças ao reunir pessoas com os mesmos sinais e sintomas, reconhecendo-se 
padrões clínicos em grupos que tenham as mesmas características (PEREIRA, 2002; FRANCO; PASSOS, 
2011), como ocorre na Classificação Internacional de Doenças (CID) (PEREIRA, 2002).
Os valores de referência de exames laboratoriais também estão subordinados aos estudos epidemioló-
gicos, uma vez que a precisão do valor está associada à soma dos valores individuais que geram resultados 
coletivos (PEREIRA, 2002). Para isso, podem ser calculados os valores de sensibilidade e especificidade, 
abordadas nos livros de análises clínicas. Além disso, pode-se selecionar o melhor teste de diagnóstico para 
uma região com alta ou baixa prevalência a partir dos cálculos e da interpretação do valor preditivo positivo 
e negativo (GORDIS, 2009; BENSEÑOR; LOTUFO, 2005).
Ao mesmo tempo em que a Epidemiologia contribui para a avaliação do curso clínico da doença, des-
crevendo melhor suas características, ela fornece elementos para quantificar o prognóstico. Este, por sua 
vez, representa se o indivíduo afetado pela enfermidade terá maior probabilidade ou não de apresentar uma 
complicação ou um menor tempo de sobrevida. Os desfechos resultantes da patologia como o tempo de 
sobrevida, surgimento de complicações, sequelas, óbito, e até a cura ou melhora clínica são considerados 
fatores de prognóstico (PEREIRA, 2002; MEDRONHO, 2009; GORDIS, 2009; BENSEÑOR; LOTUFO, 
2005). Alguns coeficientes podem ser utilizados para se calcular o prognóstico , como a taxa de letalidade, 
as taxa de mortalidade e de sobrevivência e a mediana do tempo de sobrevivência (GORDIS, 2009).
Planejamento e organização de serviços de saúde
Uma vez que a Epidemiologia dispõe de instrumentos adequados para determinar o impacto das 
medidas e intervenções em saúde, as informações epidemiológicas deveriam ser utilizadas para as 
tomadas de decisão na fase de planejamento e de organização dos serviços de saúde (MEDRO-
NHO, 2009). Algumas informações epidemiológicas podem ser utilizadas para subsidiar as decisões 
relativas à prioridade e ao melhor destino dos recursos. Dentre essas informações, encontram-se a 
magnitude e a distribuição dos problemas de saúde, que são os fatores de risco e os agravos à saúde, e 
das características da população; as relações causais entre as características populacionais e os recursos 
humanos, financeiros e materiais (PEREIRA, 2002).
Para a adequação da oferta de serviços, da orientação e da reorganização, é preciso analisar a necessidade 
de saúde, a demanda, a oferta, o acesso, o uso e a equidade. O conceito de necessidade de saúde pode ser 
visto do aspecto clínico (necessidade individual, clínica, voltada para a opinião médica) e a necessidade 
179
UNIDADE 5
percebida pelo indivíduo. Não basta o problema ser identificado como necessidade, para a saúde coletiva é 
importante que esse problema também tenha demanda. As informações de morbidade e mortalidade são os 
indicadores que mais refletem a necessidade populacional. Ainda, a Epidemiologia pode colaborar para a 
elaboração de novos indicadores e parâmetros de avaliação da qualidade dos serviços (MEDRONHO, 2009)
Os serviços devem estar disponíveis (acessíveis) em quantidade e qualidade suficientes para atender 
todos aqueles que dele necessitem. No entanto, é comum observarmos discrepâncias na oferta de serviços 
de acordo com a região ou localidade, muitas vezes uma prioridade da lei do mercado e não da necessida-
de de atenção à saúde. A organização e a distribuição dos serviços dependem da forma de financiamento 
(público, privado) e da demanda de necessidade tecnológica (MEDRONHO, 2009).
A oferta do serviço é medida pelas quantidades de recursos físicos (número de consultórios e leitos), 
humanos (médicos, dentistas, enfermeiros e etc.), de equipamentos ou ainda de horas semanais de dispo-
nibilidade e o volume de produção que se é capaz de oferecer. O acesso aos serviços depende, em todos os 
níveis de atenção à saúde, não só da disponibilidade dos recursos, mas também da distância, das barreiras 
geográficas, culturais, econômicas, e até funcionais. Também depende do tempo, do transporte, e até mesmo 
das filas, salas de espera, horários e outras condições que viabilizam o uso do serviço por diferentes grupos 
populacionais (MEDRONHO, 2009). Assim, a Epidemiologia faz o levantamento desses dados, quantifi-
cando a frequência e a distribuição da demanda, da oferta e do acesso, facilitando ao gestor e à população 
decidirem onde os recursos devem ser mais bem aplicados.
Avaliação de serviços e programas assim como políticas públicas 
de saúde
A preocupação em avaliar a assistência à saúde é mais antiga quanto a medicina, mas somente no início 
deste século a avaliação de qualidade na área da saúde como um conjunto de conhecimentos organi-
zados passou a ser praticada. O conceito de qualidade deve abranger os aspectos de acesso, adequação, 
efetividade, equidade, custos e a satisfação do paciente. Inclui também o desempenho do profissional de 
saúde, a qualidade e a utilização de insumos (vacinas, diagnósticos, medicamentos e outros), e o adequado 
abastecimento e desenvolvimento dos sistemas de informação (MEDRONHO, 2009).
Os mesmos princípios utilizados para a identificação etiológica também podem ser aplicados para 
a avaliação epidemiológica dos serviços e programas (PEREIRA, 2002; FRANCO; PASSOS, 2011). 
Observa-se se um recurso (material, humano ou financeiro) ou um processo foi bem empregado na 
saúde (PEREIRA, 2002). Os resultados observados geralmente são os indicadores de saúde (veja a Uni-
dade II). Por exemplo: observa-se se os índices de morbimortalidade de uma população melhoraram 
após o investimento financeiro destinado ao treinamento de pessoal (PEREIRA, 2002). A partir da 
obtenção dos resultados dos indicadores, deve-se comparar aos padrões, os quais são especificações 
numéricas precisas consideradas como grau aceitável de qualidade. Essas especificações podem ser 
obtidas em revisões de literatura, opinião de especialistas, consensos e resultados de ensaios clínicos, 
principalmente os randomizados (MEDRONHO, 2009). 
180
UNICESUMAR
Os hospitais têm utilizado crescentemente os indicadores e padrões para suas bases administrati-
vas, principalmente o indicador de mortalidade, o tempo de permanência e a taxa de readmissão. Em 
relação à taxa de mortalidade, a identificação das mortes evitáveis deve ser um objetivo fundamental, 
pois pode representar o uso inadequado de tecnologias, falhas nas supervisões, altas inapropriadas, 
infecção hospitalar, erroscirúrgicos e procedimentos invasivos (MEDRONHO, 2009; GORDIS, 2009).
Nesse sentido, podem ser avaliados os parâmetros de eficácia, efetividade e eficiência. A eficácia 
investiga o impacto das tecnologias em condições ideais de observação (em ambiente laboratorial), 
como uma experiência epidemiológica ou uma avaliação de produtos (vacinas, medicamentos, pro-
dutos de diagnóstico e outros) e procedimentos (cirurgias, técnicas de educação em saúde, etc.). A 
efetividade é utilizada para avaliar o impacto que os serviços e programas geram em condições normais 
(reais), como efeitos vacinais, a implantação de programas (como de farmacovigilância), a avaliação 
da toxicidade de um produto recém-lançado no mercado. A eficiência leva em consideração não só 
o impacto, mas também os recursos empregados em um programa e serviço. Assim, a eficiência pode 
comparar o resultado de diversas tecnologias para avaliar qual confere maior benefício e menor custo 
(MEDRONHO, 2009; PEREIRA, 2002; GORDIS, 2009).
A Epidemiologia também é utilizada para verificar os benefícios de políticas de rastreamento de 
doenças, como o rastreamento para detecção precoce de câncer (mama, colo do útero, próstata e ou-
tros). Por exemplo: podemos utilizar estudos em seres humanos para verificar se o rastreamento de 
câncer de mama tem reduzido os índices de mortalidade (GORDIS, 2009). 
Avaliação de qualidade no Brasil
A avaliação da qualidade dos serviços de saúde praticados no Brasil ainda é muito limitada, restrin-
gindo-se à análise da estrutura física e aos aspectos quantitativos da produção de serviços. Visuali-
za-se uma avaliação precária do indicador de morbimortalidade ou o uso de padrões, parâmetros e 
indicadores inadequados ou obsoletos. É indiscutível a necessidade de avaliar o sistema e os serviços 
de saúde utilizando indicadores e outras ferramentas com alta qualidade e precisão, para que que se 
tomem medidas e intervenções confiáveis e seguras, assim como a utilização desses resultados para o 
planejamento e organização dos serviços (MEDRONHO, 2009).
A produção hospitalar dos serviços financiados pelo sistema público de saúde é coberta por uma 
base de dados nacional. Atualmente, esse sistema é uma fonte de informação que pode ser utilizada para 
avaliar a assistência hospitalar. O sistema de informação mais importante para os hospitais é o Sistema 
de Informações Hospitalares (SIH) pertencente ao Sistema Único de Saúde (SUS). O SIH é um banco de 
dados administrativo que fornece informações sobre morbidade, consumo de recursos, uso de procedi-
mentos de diagnóstico, perfil sociodemográfico e geográfico e outros. Desta maneira, o SIH é um valioso 
instrumento para o planejamento e a avaliação da qualidade dos serviços prestados (MEDRONHO, 2009).
181
UNIDADE 5
Qual é o papel dos hospitais públicos e particulares para a compreensão da distribuição e 
frequência das doenças em uma população?
O papel dos gestores na Epidemiologia
O bom gestor (planejador) é aquele que considera as informações epidemiológicas para o 
planejamento, a execução e a avaliação das ações de saúde. Ele deve considerar os indicadores 
de saúde, como a mortalidade, a morbidade, os fatores de risco, as características da população 
e outros fatores que se tornam necessários ou são demandados por aquela comunidade. Aplicar 
corretamente o conhecimento epidemiológico de acordo com a situação de saúde detectada é um 
grande desafio para o gestor nos tempos atuais. Tudo isso porque o gestor é aquele que decide ou 
sugere em que aplicar os recursos. Portanto, a Epidemiologia fornece dados e interpretações que 
dão suporte para as decisões a serem tomadas sobre a alocação de recursos e a organização dos 
serviços. As decisões a serem tomadas podem ser baseadas nas prioridades levantadas pelos estu-
dos epidemiológicos, adequando-se às necessidades e aos recursos disponíveis (PEREIRA, 2002).
Um outro objetivo da Epidemiologia é a busca de evidências em saúde na literatura científica 
disponível em bancos de dados online. As evidências a partir de bases online podem auxiliar o 
médico a tomar decisões clínicas que não puderam ser baseadas em sua intuição ou experiên-
cia. A base de dados mais utilizada é o MEDLINE ou PubMed, pertencente à Biblioteca Nacional 
de Medicina (National Library of Medicine) dos Estados Unidos da América (disponível no link 
https://www.ncbi.nlm.nih.gov/pubmed/). Os artigos científicos mais encorajados para a tomada 
de decisão são os de revisão sistemática e metanálise. Os estudos podem ser selecionados 
por palavras (em inglês) citadas no título, no corpo do texto, no nome de autores e revistas, no 
ano de publicação, no tipo de estudo e outros filtros.
(BENSEÑOR; LOTUFO, 2005)
182
UNICESUMAR
HISTÓRIA NATURAL DA DOENÇA
Seguimos estudando o processo saúde-doença ou História Natural das Doenças, como também abor-
daremos os conceitos de causalidade e fatores etiológicos.
A História Natural das Doenças (HND) compreende o conjunto de processos que interagem 
levando a algum dano na saúde do indivíduo. Esses processos interativos compreendem as relações 
entre o agente, o suscetível e o meio ambiente. A HND vai desde os primeiros estímulos patológicos 
até os efeitos de doença, como a invalidez, as sequelas, a recuperação ou a morte (LEAVELL; CLARK 
apud ROUQUAYROL; ALMEIDA FILHO, 1999).
A utilidade da HND é descrever as múltiplas causas e as diferentes enfermidades que acometem 
o indivíduo, servindo de base para a compreensão de condições reais e específicas e, principalmente, 
apontando as diversas medidas de prevenção e controle (ROUQUAYROL; ALMEIDA FILHO, 1999). 
A HND pode ser dividida em dois estágios ou fases (ROUQUAYROL; ALMEIDA FILHO, 1999; PE-
REIRA, 2002; FRANCO; PASSOS, 2011):
• Período pré-patogênico: aquele em que o suscetível (focaremos aqui o homem) é exposto 
aos fatores biopsicossociais. Refere-se ao período anterior à doença, à interação preliminar dos 
fatores potencialmente causadores da doença;
• Período patogênico: seria aquele em que ocorre a manifestação da doença propriamente dita. É o 
período em que o indivíduo acometido pela doença manifesta sinais e sintomas. O indivíduo iniciou 
a interação estímulo-hospedeiro e possui alterações fisiopatológicas. Nesse período, a enfermidade 
pode progredir para a cura, a recuperação, a cronicidade, as sequelas, a invalidez e até a morte.
Para compreendermos melhor esses processos, faremos uma breve revisão dos conceitos de saúde e doença.
Conceitos de saúde e doença
O termo saúde, no mais simples que se possa descrever, seria a ausência de doença, e por isso esse 
183
UNIDADE 5
conceito não é mais usado. “A saúde já foi considerada uma espécie de silêncio orgânico”, na qual existe 
um estado de harmonia e equilíbrio funcional em que os diferentes sistemas e aparelhos não sinalizam 
irregularidades (FRANCO; PASSOS, 2011, p. 2). Rotineiramente, na prática clínica, os indivíduos são 
rotulados como sadios ou doentes a partir de exames clínicos e laboratoriais que indicam a presença 
ou ausência de anormalidades (PEREIRA, 2002), e é claro que não podemos considerar como uma 
pessoa saudável aquela que contém uma infecção ou qualquer outra doença (FRANCO; PASSOS, 2011).
Em 1948, em sua constituição, a OMS adotou a definição de que “saúde é um completo estado de 
bem-estar físico, mental e social, e não meramente a ausência de doença”. O Brasil incorporou o direito 
à saúde na Constituição Federal do Brasil de 1988, e ampliou o seu conceito na Lei Orgânica da Saúde 
8.080 (de 19 de setembro de 1990) e na Lei 12.864 de 24 de setembro de 2013 (BRASIL, 1990; 2013): 
“é direito de todos e dever do estado, garantido mediante políticas sociais e econômicas que visem à 
redução do risco de doença e de outros agravos e ao acesso universal e igualitário às ações e serviços, 
para sua promoção, proteção e recuperação” (Art. 196 da Constituição Federal do Brasil) (BRASIL, 1988).
A partir das leis mencionadas acima, definiram-se os determinantese condicionantes de saúde: 
alimentação, moradia, o saneamento básico, meio ambiente, transporte, trabalho, renda, educação, 
atividade físicas, lazer e acesso aos bens e serviços essenciais (BUSATO, 2016).
Em contrapartida, a doença seria a falta ou perturbação da saúde (PEREIRA, 2002), ou ainda um 
“desajustamento ou uma falha nos mecanismos de adaptação do organismo ou uma ausência de rea-
ção aos estímulos, cuja ação está exposto” (JENICEK; CLÉROUX, apud HERZLICH, 2004). Ainda, a 
portaria n° 204 de 17 de fevereiro de 2016 (BUSATO, 2016, p. 27) descreve o agravo como: 
 “
“qualquer dano à integridade física ou mental do indivíduo, provocado por circuns-
tâncias nocivas, tais como acidentes, intoxicações por substâncias químicas, abuso 
de drogas ou lesões decorrentes de violências interpessoais […]”; e a doença como: 
“enfermidade ou estado clínico, independente de origem ou fonte, que represente ou 
possa representar um dano significativo para os seres humanos; [...]”.
O processo saúde-doença implica múltiplas e complexas interações. O processo é definido por Jenicek 
e Cleroux (apud HERZLICH, 2004) como uma perturbação da estrutura, função de um órgão, sistema 
ou de todo um organismo, podendo, ainda, alterar suas funções vitais. De um modo geral, o processo 
saúde-doença na coletividade humana é o processo biológico de desgaste e reprodução, resultando 
em um funcionamento biológico diferente com consequência para o desenvolvimento regular das 
atividades do cotidiano. Seria o surgimento da doença (ROUQUAYROL; ALMEIDA FILHO, 1999).
A divisão do processo saúde-doença é útil para identificação dos riscos e dos danos à saúde, mas 
também para pontuar as ações preventivas e curativas nos diversos momentos, também preocupando-se 
com o momento em que a doença afeta o indivíduo ou o coletivo (PEREIRA, 2002). A Epidemiologia 
não se preocupa, portanto, somente com o conhecimento dos problemas de saúde, incapacidade, doença 
ou morte, mas também com a melhoria dos indicadores de saúde e de elevação da qualidade de vida das 
populações (FONSECA; CORBO, 2007; BUSATO, 2016).
184
UNICESUMAR
A História Natural das Doenças é dividida em período pré-patogênico e patogênico. Para cada 
período, há medidas de prevenção específicas e gerais para promover o controle ou a intervenção do 
processo saúde-doença, conforme apresentado no Quadro 1.
Período pré-patogênico
Essa fase inicial ou de suscetibilidade é aquela em que o indivíduo ainda não manifesta a doença, mas 
existem condições para o seu aparecimento. As condições de vida, características pessoais (como sexo, 
idade e outros) e os hábitos podem facilitar ou dificultar os danos à saúde e são considerados fatores 
de risco ou de proteção (PEREIRA, 2002; GORDIS, 2009). 
Quando o indivíduo é exposto aos fatores de risco, tem maior probabilidade de desenvolver uma 
determinada enfermidade. Por exemplo: a exposição ao fumo predispõe ao câncer de pulmão. Ao passo 
que os fatores de proteção indicam que quando o indivíduo é exposto ao fator, ele tem uma menor chance 
de desenvolver aquele problema de saúde. Por 
exemplo, pessoas que praticam atividade físi-
ca regularmente estão mais protegidas contra 
doenças coronarianas (PEREIRA, 2002).
A partir da multicausalidade, constrói-se o 
modelo sistêmico, que é constituído de várias 
causas que podem estar em diferentes níveis 
de organização (veja a figura abaixo). O círculo 
externo representa a sociedade, que engloba 
os demais, como as famílias, que compreen-
dem o indivíduo, que é composto por órgãos 
e células. Poderíamos ir mais adiante, com as 
moléculas e os átomos. A partir deste círculo, 
podemos procurar uma explicação ao dano à 
saúde. Essa explicação incorpora o aspecto so-
cial à visão biomédica individualista, levando 
a uma visão social e holística e, assim, cons-
truindo a Epidemiologia Social. As soluções 
para o problema se darão de acordo com o nível afetado, variando desde uma intervenção individual 
a uma coletiva (PEREIRA, 2002; FRANCO; PASSOS, 2011).
Na lógica multicausal, a tríade ecológica é a mais utilizada em Epidemiologia para identificar fatores 
de risco, e é representada por três aspectos: o hospedeiro, o agente e o meio ambiente (Pereira, 2002; 
Busato, 2016; Gordis, 2009; Rouquayrol e Almeida Filho, 1999; Almeida Filho e Barreto, 2011; Franco 
e Passos, 2011).
Figura 8: Modelo sistêmico da pesquisa epidemiológica 
Fonte: a autora, adaptado de Pereira (2002).
185
UNIDADE 5
Figura 9 - Tríade ecológica como modelo multicausal no processo saúde-doença.
Fonte: a autora, adaptado de Fonseca e Corbo (2007).
Este modelo representa a multicausalidade dos problemas de saúde e mostra a igual importância de 
cada elemento que compõe a tríade. Sendo assim, todas as características devem ter a mesma relevân-
cia para o estudo de qualquer agravo à saúde. A partir da identificação das características da tríade 
é possível analisar o processo saúde-doença e localizar racionalmente as intervenções (PEREIRA, 
2002; BUSATO, 2016; GORDIS, 2009; ROUQUAYROL; ALMEIDA FILHO, 1999; ALMEIDA FILHO; 
BARRETO, 2011; FRANCO; PASSOS, 2011). 
Nos fatores do hospedeiro, devemos levar em consideração a herança genética, a anatomia, a fi-
siologia do organismo e os hábitos e costumes, por exemplo. Nos fatores ambientais, temos o ambiente 
físico, químico, biológico e social (PEREIRA, 2002; BUSATO, 2016; FRANCO; PASSOS, 2011; ROU-
QUAYROL; ALMEIDA FILHO, 1999). A pesquisa genética tem se fortalecido nas últimas décadas, 
uma vez que muitos genes têm sido atribuídos à diferentes patologias. A essa investigação podemos 
dar o nome de Epidemiologia Genética (PEREIRA, 2002; FRANCO; PASSOS, 2011).
Em relação à anatomia e à fisiologia do hospedeiro, é claro e evidente que, por exemplo, o sexo influen-
cia nas patologias encontradas, como é o caso de câncer colo do útero em mulheres e do de próstata nos 
homens. Assim, temos as características como idade, raça, sexo (FRANCO; PASSOS, 2011) e os aspectos 
imunológicos do hospedeiro, incluindo as imunizações naturais e artificiais (vacinação) (GORDIS, 2009).
Em relação ao estilo de vida, os hábitos e as condutas podem favorecer ou prevenir a ocorrência de danos 
à saúde. Muitas doenças estão relacionadas com os hábitos diários; por exemplo: as doenças coronarianas 
estão relacionadas ao sedentarismo, ao tabagismo, à obesidade, ao consumo elevado de gorduras e outros. 
Assim como, nas doenças infecciosas, o hábito da prática sexual sem uso de preservativos pode predispor 
às infecções sexualmente transmissíveis (PEREIRA, 2002; BUSATO, 2016).
Em relação aos fatores ambientais, que são designados como intrínsecos e extrínsecos ao hos-
pedeiro, podemos classificá-los como físico, biológico e social. No ambiente físico, temos os aspectos 
do ar, água e lugares, assim como a constituição da flora e da fauna de um dado local. Por exemplo: as 
altitudes, a umidade relativa do ar, a geografia, o clima, os recursos hídricos e a temperatura podem 
influenciar a multiplicação de vetores e a sobrevivência de parasitas. Ainda temos os terremotos, as 
inundações, a poluição e outras características que podem afetar a saúde ou a vida do indivíduo e da 
sociedade (PEREIRA, 2002; ROUQUAYROL; ALMEIDA FILHO, 1999).
186
UNICESUMAR
No ambiente biológico, encontramos os seres vivos: agentes, vetores e reservatórios das doenças. As 
condições ecológicas determinam a concentração de doentes em uma dada região, assim como, a distribuição 
dos agentes biológicos, vetores, reservatórios e seres humanos infectados e os suscetíveis (PEREIRA, 2002). 
O ambiente social está relacionado com os aspectos sociais, econômicos, políticos e culturais. É a 
parte humana do meio ambiente organizada em sociedade. Aqui temos exemplos de fatores que afetam 
a saúde do indivíduo: renda, nível de escolaridade, ocupação, transporte, emprego e outros. A partir da 
quantificação dos aspectos sociais, podemos encontrar desigualdades, por exemplo, de cobertura dos 
sistemas de saneamento e deserviços de saúde. Essas identificações das desigualdades determinam os 
tipos e as intensidades das medidas preventivas e curativas utilizadas na intervenção do processo de 
doença (PEREIRA, 2002; BUSATO, 2016; ROUQUAYROL; ALMEIDA FILHO, 1999). 
Podemos concluir que o estado de saúde-doença depende da interação e do equilíbrio desses fatores 
ecológicos da tríade. A saúde reflete o resultado homeostase e a doença é resultante do desequilíbrio 
desses fatores (FRANCO; PASSOS, 2011). O período pré-patológico pode evoluir ou não para a fase 
patológica, e isso depende das ações e medidas tomadas neste período de exposição aos fatores de 
risco. A prevenção da exposição aos fatores de risco e aos de proteção conduzirá a uma promoção da 
saúde do indivíduo, evitando que este seja afetado por problemas de saúde.
Período patogênico
Na fase patológica ocorrem os processos de exteriorização da afecção. É o período em que ocorrem 
os processos no interior do corpo humano e se sucedem as respostas orgânicas (PEREIRA, 2002). O 
período de patogênese é caracterizado pelas primeiras ações do agente patogênico, com perturbações 
bioquímicas em nível celular, nas formas e nas funções do organismo, evoluindo para efeitos perma-
nentes, cronicidade, morte ou cura (ROUQUAYROL; ALMEIDA FILHO, 1999).
O conhecimento desses mecanismos permite a adoção de critérios de diagnóstico e tratamentos vol-
tados para detectar e interromper o processo já instalado no organismo. Por exemplo, a manifestação de 
dores articulares pode indicar a artrite reumatoide, que é confirmada por exames laboratoriais e clínicos. 
A partir dessa identificação, pode-se prescrever o uso de antiinflamatórios para o tratamento da doença. 
As medidas intervencionistas podem ou não regredir ou solucionar o problema (PEREIRA, 2002). 
O período patológico compreende as fases pré-clínica, clínica e residual. A fase pré-clínica, em que 
a doença ainda não é clinicamente aparente, pode evoluir para a fase clínica ou não. Essa fase seria o 
que chamamos da base de um iceberg, ou seja, a ponta do iceberg, aquela que emerge, é a fase clínica, a 
aparente, a que se vê pelas manifestações clínicas e pode ser observada facilmente; a base do iceberg é 
aquilo que não se vê, mas se sabe que existe. Na fase pré-clínica, as medidas de rastreamento e triagem, 
também chamadas de screening, são as ferramentas mais importantes para o diagnóstico deste perío-
do. Essas técnicas são utilizadas para a procura de indivíduos suspeitos de estarem enfermos o sob o 
risco de adoecer. Isto pode ser realizado a partir de exames laboratoriais aplicados à população geral, 
por exemplo (PEREIRA, 2002; GORDIS, 2009; FRANCO; PASSOS, 2011). O período pré-clínico é a 
187
UNIDADE 5
interação entre o estímulo e o suscetível (ROUQUAYROL; ALMEIDA FILHO, 1999).
Na fase clínica, observa-se a doença propriamente dita, é a manifestação do problema de saúde. A 
percepção do limiar clínico é a ponta do iceberg da doença, acima do mar, é a doença exteriorizada. 
Geralmente, apenas os casos aparentes são notificados e utilizados para verificar a distribuição de 
uma doença na comunidade, ficando de fora os casos subclínicos (PEREIRA, 2002; GORDIS, 2009; 
FRANCO; PASSOS, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). 
Portanto, neste período, as medidas protetoras são as curativas, as quais irão levar à proteção do 
indivíduo e evitar sequelas ou o óbito. Como exemplo temos o infarto agudo do miocárdio, que pode 
requerer procedimento cirúrgico, ou que para evitar de ocorrer novamente irá requerer uma dieta, 
abstenção de fumo, controle da pressão arterial e outras medidas (PEREIRA, 2002; GORDIS, 2009; 
FRANCO E PASSOS, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999).
Proporção de casos
clinicamente
discerníveis
Proporção de casos
não discerníveis
clinicamente
Infecção inaparente
Óbitos
Manifestações clínicas
Casos graves
Linha do horizonte clínico
Figura 10: Horizonte clínico da doença representado pelo ‘iceberg’ / Fonte: autoria própria, adaptado de Saúde & Cidadania (2017).
O iceberg representa o horizonte clínico, em que acima do mar encontram-se os casos clinicamente 
aparentes, e abaixo, os inaparentes. No nível clínico, podemos ter vários desfechos, como o óbito, a 
cronicidade do caso, que pode evoluir ou não para o óbito, a gravidade e a agudização, invalidez, os 
casos fatais, as sequelas ou ainda a cura (GORDIS, 2009; FRANCO; PASSOS, 2011; ROUQUAYROL; 
ALMEIDA FILHO, 1999).
A fase residual é aquela em que doença não progrediu para o óbito ou não houve cura completa, 
observando-se alterações anatômicas e funcionais que se estabilizam. Podemos até dizer que é a pro-
gressão para a cronicidade. Esta estabilização é alcançada por tratamentos ou pelo próprio curso natural 
da doença, que muitas vezes deixa sequelas. Neste caso, tomam-se medidas de recuperação à saúde 
com o objetivo de reabilitar o indivíduo diante o aspecto físico, psicológico ou social. Por exemplo: a 
reabilitação de indivíduos que sofreram acidentes a partir da fisioterapia (Pereira, 2002; Franco; Passos, 
2011; Rouquayrol; Almeida Filho, 1999).
188
UNICESUMAR
Quadro 1 - Modelo de História Natural das Doenças: do horizonte clínico às medidas de prevenção. 
Susceptibilidade Fase clínica
Fase pré clínica Doença
precoce
discernível
Doença avançada
(complicações)
Morte
Invalidez
Pré patogênese
Diagnóstico
precoce
Limitação
do ano
Prevenção secundária
Cura Convalescença
Reabilitação
Prevenção terciária
Horizonte
clínico
Recuperação
Patogênese
precoce
Patogênese
Fase de incapacidade
residual
Atenção primária
Promoção
Da saúde
Proteção
Especí�ca
Fonte: Wikimedia (2011, on-line)5. 
MEDIDAS PREVENTIVAS
Com todo conhecimento que você já adquiriu, podemos con-
cluir que o conhecimento dos fatores de risco e de proteção e 
a identificação dos grupos de risco e do processo saúde-doen-
ça são fundamentais para a escolha das tomadas de decisão, 
como as ações intervencionistas e de prevenção. Portanto, nós 
abordaremos os níveis de prevenção na atenção à saúde como 
ferramenta para a saúde individual e coletiva.
As medidas preventivas são todas as ações direcionadas para 
evitar as doenças ou suas consequências. Essas medidas podem 
ser periódicas (esporádicas) ou aplicadas e de forma endêmica 
ou epidêmica. A saúde pública constantemente promove ações 
destinadas a evitar o início de doenças. Por exemplo, nas doenças 
infecciosas e parasitárias é tradição a cloração da água de abas-
tecimento público, o controle de vetores, a imunização e outras 
medidas. Têm-se também medidas específicas (restritas), como 
no caso do uso de antiretrovirais para a infecção pelo HIV, e as 
inespecíficas (gerais), como o saneamento básico, que promove 
a melhora da qualidade de vida da população (PEREIRA, 2002). 
189
UNIDADE 5
O objetivo principal da saúde pública é evitar as doenças, prolongar a vida e desenvolver a saúde 
física e mental na sociedade. Esses objetivos se sobrepõe aos da Epidemiologia, a qual tem sido um 
instrumento fundamental para a orientação das ações de saúde pública. As práticas de saúde podem 
se basear no conhecimento epidemiológico para o planejamento, a execução e a avaliação de medidas 
preventivas (ROUQUAYROL; ALMEIDA FILHO, 1999). Atualmente, a prevenção de danos à saúde é 
classificada em (PEREIRA, 2002; ROUQUAYROL; ALMEIDA FILHO, 1999):
• prevenção primária: medidas aplicadas na fase anterior do início da doença, ou seja, no período 
pré-patogênico;
• prevenção secundária: ações que interferem no curso da doença, no período patogênico;
• prevenção terciária: aplicada no estágio mais avançado da doença, com o objetivo de prevenir 
a piora do quadro clínico, também aplicada no período patogênico.
A medidas de prevenção não são apenas responsabilidade dos profissionais de saúde, mas também 
dos gestores e, principalmente, da sociedade.
Prevenção primária
As ações de prevenção primária são dirigidas para a manutenção da saúde, evitando a ocorrência da 
fase patológica e denovos casos de agravos à saúde. É o que refere à promoção da saúde, não focando 
apenas o individual, mas sim a melhoria da qualidade de vida da coletividade humana. Por exemplo: 
práticas de educação para a saúde e saneamento ambiental, prática de esportes (PEREIRA, 2002; 
FRANCO; PASSOS, 2011). A prevenção primária também engloba as ações de proteção específica, 
como a imunização, a saúde ocupacional, a higiene pessoal e do lar; a proteção contra acidentes; o 
aconselhamento genético; e o controle de vetores (ROUQUAYROL; ALMEIDA FILHO, 1999)
Na prevenção primária, a resposta às ações depende dos custos envolvidos, da magnitude da evi-
dência (unicausal; multicausal), da facilidade em reduzir ou eliminar a exposição ao fator específico 
(GORDIS, 2009).
Prevenção secundária
As medidas de prevenção secundária são voltadas para o período patológico, seja em fase subclínica 
ou clínica. Essas ações previnem a evolução do processo patológico no organismo, no sentido de fazê-lo 
regredir ou cessar, como no caso do uso de antibióticos para doenças bacterianas. Nesse caso, há o 
uso da medida preventiva com o intuito de prevenir um agravo maior, e não com função curativa. Por 
exemplo: a utilização de aspirina por indivíduos que já tiveram infarto do miocárdio pode prevenir um 
segundo infarto. Portanto, as ações secundárias visam a prevenir reincidências, complicações, sequelas 
e óbitos (PEREIRA, 2002; FRANCO E PASSOS, 2011).
190
UNICESUMAR
A prevenção secundária também aborda o diagnóstico precoce a partir de inquéritos para a des-
coberta de casos na comunidade, os exames periódicos individuais, o isolamento do indivíduo para 
evitar propagação das doenças e o tratamento da doença (ROUQUAYROL; ALMEIDA FILHO, 1999).
Na prevenção secundária, devemos considerar a gravidade da doença, se há possibilidade de de-
tecção precoce por métodos de diagnóstico, o quão onerosa e invasiva será a detecção, se o indivíduo 
terá benefícios (como o tratamento, ausência ou mínimos efeitos colaterais) (GORDIS, 2009).
Prevenção terciária
Neste caso, as medidas preventivas se destinam à fase residual da doença, visando a desenvolver a 
capacidade funcional do indivíduo, que foi reduzida pela doença. Exemplo: recuperar o indivíduo 
que sofreu de poliomielite na infância; reabilitar aquele que sofreu um acidente (PEREIRA, 2002; 
FRANCO; PASSOS, 2011). Nesses casos, englobam-se as medidas de reabilitação, a fisioterapia, a 
terapia ocupacional e o emprego ao reabilitado (ROUQUAYROL; ALMEIDA FILHO, 1999).
Níveis de atenção em saúde
Na saúde pública do Brasil, desdobram-se três níveis de atenção à saúde (PEREIRA, 2002; FRANCO; 
PASSOS, 2011; GORDIS, 2009):
1. Atenção primária: aquela voltada para a promoção da saúde, ou seja, aquela em que as medidas 
são destinadas à manutenção do bem-estar coletivo, sem uma doença específica. Por exemplo: 
aquela que promove uma boa qualidade nutricional, de moradia, de emprego e até da imuni-
zação. As atividades são comumente realizadas pelas Unidades Básicas de Saúde (UBS);
2. Atenção secundária: engloba medidas que impedem o aparecimento de um determinado dano 
à saúde, voltadas para a proteção da saúde. Inclui também a identificação e o tratamento de 
processos patológicos, e a limitação do dano. As medidas são geralmente realizadas nas clínicas, 
laboratórios e hospitais;
3. Atenção terciária: envolve medidas que desenvolvem o potencial funcional do organismo afe-
tado. Seria a reabilitação promovida, geralmente, por uma equipe multiprofissional que fornece 
ações integradas para dar suporte físico, mental e social. Geralmente, as ações são realizadas 
nas clínicas e hospitais.
191
UNIDADE 5
No Brasil, os três níveis de atenção à saúde são articulados a partir das Redes de Atenção em Saú-
de (RAS), garantindo a integralidade do cuidado. As diretrizes para a organização das RAS no 
âmbito do Sistema Único de Saúde foi oficializado por meio da Portaria GM/MS nº 4.279, publi-
cada no Diário Oficial de 31/12/2010. As RAS possuem como eixo norteador e porta de entra-
da a atenção primária, que se articula e integra com a secundária e terciária. (MENDES, 2011). 
Chegamos ao final de mais uma Unidade; agora você conheceu os conceitos básicos e a história da 
nossa disciplina, que apesar de muito antiga, é atualizada e aplicada em todos os ciclos da vida. Agora 
você já possui a base conceitual da Epidemiologia e podemos prosseguir para os próximos conteúdos 
e aprofundar as práticas e os conceitos epidemiológicos. 
CONSIDERAÇÕES FINAIS
Nesta unidade, estudamos os conceitos de Epidemiologia, saúde, doença, processo saúde-doença, fa-
tores etiológicos e prevenção. Todos esses conceitos são base para que você compreenda as próximas 
unidades. Observamos que a saúde é o bem-estar físico, mental e psicossocial, e que deve ser estudada 
pela Epidemiologia para identificar os desequilíbrios que acarretam os problemas de saúde. Concluí-
mos que a Epidemiologia é fundamental para o planejamento e orientação dos serviços de saúde, 
uma vez que as necessidades da população são evidenciadas a partir dos estudos epidemiológicos. A 
identificação das prioridades coletivas permite que sejam propostas medidas para os problemas de 
saúde encontrados, como as medidas preventivas.
Concluímos que o estudo epidemiológico deve ser realizado rotineiramente a partir da coleta de da-
dos em clínicas, laboratórios, universidades, hospitais e outras instituições (como as de pesquisa), ou até 
mesmo pelo indivíduo da comunidade. Esses dados devem ser interpretados quali e quantitativamente 
para que se possa inferir a verdadeira situação de saúde da população. Uma das maneiras de transformar 
os dados em informações é aplicando os cálculos dos indicadores de saúde e as medidas de ocorrência.
Vimos que são muitas as aplicações da Epidemiologia e que, desde a Grécia Antiga, os seus conceitos 
e práticas vêm sendo aplicados nos níveis individual e coletivo, com o objetivo de compreender o pro-
cesso saúde-doença, identificar causas dos problemas de saúde e propor medidas de prevenção, a fim 
de melhorar a qualidade e a expectativa de vida humana e ambiental. Muitas experiências de grandes 
estudiosos, como John Snow, foram descritas aqui nesta unidade para que possamos compreender 
que os estudos epidemiológicos não cessam; ao contrário, eles estão em constante transformação e 
alcançam cada vez mais credibilidade na área científica. Os estudos mais importantes são aqueles com 
cunho social e que podem modificar toda a história de uma sociedade.
192
A
G
O
R
A
 É
 C
O
M
 V
O
C
Ê
1. Conceitue a ciência Epidemiologia.
2. O objetivo principal da Epidemiologia é:
I) Identificar fatores etiológicos dos problemas de saúde.
II) Estudar a distribuição das doenças e outros danos à saúde.
III) Propor medidas de prevenção em saúde e até de planejamento.
IV) Reformar as políticas públicas de saúde e interferir nas ações dos gestores.
Assinale a alternativa correta.
a) Apenas I e II estão corretas.
b) Apenas II e III estão corretas.
c) Apenas I está correta.
d) Apenas I, II e III estão corretas.
e) Nenhuma das alternativas está correta.
3. Assinale a alternativa CORRETA quanto à história e os personagens da Epidemiologia.
a) John Snow, médico inglês, dedicou seus estudos para a medicina social, destacando-se 
pelo estudo do cólera e a transmissão hídrica.
b) John Snow foi um médico inglês que voltou seus estudos para a medicina clínica, dei-
xando de fora o cunho social das doenças.
c) James Lind realizou o primeiro ensaio clínico, e descobriu que o escorbuto era causado 
pela deficiência de vitamina D.
d) Roberto Kock é considerado o Pai das Estatísticas Vitais e identificou causas de mor-
talidade, como prematuridade e raquitismo.
e) Oswaldo Cruz foi um médico sanitarista que descobriu o agente etiológico da Doença 
de Chagas, o Trypanosoma cruzi.
193
A
G
O
R
A
 É
 C
O
M
 V
O
C
Ê
4. Assinale Verdadeiro (V) ou Falso (F) quanto à História Natural das Doenças (HND).) ( A HND é dividida em período pré-patogênico e patogênico. O primeiro refere-se à fase 
que antecede a doença, e o segundo, à doença propriamente dita.
 ) ( A HND estuda a tríade ecológica que envolve apenas os aspectos do hospedeiro, do 
agente e do ambiente, e não o social.
 ) ( Na fase patológica, além da doença, tem-se a preocupação com as suas sequelas, 
com a incapacidade e até com o óbito.
Assinale a alternativa correta:
a) V; V; F.
b) F; F; V.
c) V; F; V.
d) F; F; F.
e) V; V; V.
5. Assinale Verdadeiro (V) ou Falso (F) para as alternativas referentes às medidas preven-
tivas utilizadas na Epidemiologia.
 ) ( A prevenção primária é voltada para ações que previnem o aparecimento da doença; 
são medidas que antecedem o período patogênico. Por exemplo: saneamento básico 
e imunizações.
 ) ( A prevenção secundária inclui medidas de proteção à saúde que interferem na fase 
patológica. Por exemplo: diagnóstico e tratamento de uma doença específica. 
 ) ( A prevenção terciária engloba ações de reabilitação durante a fase patogênica, como 
a fisioterapia utilizada em casos de acidentes.
Assinale a alternativa correta.
a) V; V; F.
b) F; F; V.
c) V; F; V.
d) F; F; F.
e) V; V; V.
194
A
G
O
R
A
 É
 C
O
M
 V
O
C
Ê
Leia o texto sobre a imunização contra a varíola (variolização) e veja a importância 
do conhecimento da História Natural das Doenças, a aplicação da estatística e da 
medicina social para se obter a eficácia de medidas preventivas (como a vacinação), 
quando aplicadas sobre as reais necessidades da população (como a varíola):
“A tentativa de imunização contra a varíola configura-se como uma prática milenar, an-
terior à constituição e divulgação do método experimental em biomedicina, que marcou 
o final do século XIX, e à elaboração das teorias e conceitos que envolvem a elucidação 
do processo imunitário, e à fabricação de vacinas em escala industrial, que só ocorreram 
no século XX. Mesmo antes de se reconhecer a similaridade entre o cowpox (doença que 
acometia os bovinos) e a varíola e de ter sido criada a vacinação, já se tinha observado que 
a varíola podia ser evitada a partir do contato do homem sadio com o doente. Esta cons-
tatação impulsionou a disseminação de práticas, inicialmente orientais, que alcançaram 
a Europa no início do século XVIII, conhecidas como ‘variolização’, ‘inoculação’ [...]. Apesar 
de se estabelecerem como diferenciadas tecnicamente entre si, consistiam em implantar 
no homem sadio o vírus variólico contido na secreção retirada das pústulas de pessoas 
doentes, na tentativa de provocar a instalação da varíola na sua forma mais branda com 
manifestação local, tentando evitar a doença na expressão mais grave. 
[...] A difusão da vacina antivariólica nos países europeus, a partir de fins do século XVIII, 
veio aumentar o questionamento acerca da prática da inoculação do vírus variólico, incor-
porando-o a um processo de discussão que extrapolava a própria técnica, abrangendo as 
ações de saúde e higiene que já começavam a se estruturar em vários países, tomando 
a varíola um espaço importante, dada sua expressão epidemiológica e social de relevo. 
Destacavam-se questões referentes à varíola e à sua imunização na tentativa de se ex-
plicar as diversas variáveis da doença e a imunidade específica a partir, principalmente, 
a constatação da perda da defesa contra a doença em pessoas vacinadas, detectada 
na primeira década após o início da disseminação da vacina no mundo. Como uma das 
soluções, na tentativa de não descartar o uso da vacinação como uma medida para o 
controle da varíola, propôs-se a revacinação, que também gerou discussões, angariando 
adeptos e críticos à sua indicação. 
A precária base científica da microbiologia e da fisiopatologia, além do desconhecimento 
do processo imunitário, naquele século, levou à realização, ao longo do período, de várias 
experiências empíricas, com base na medicina clínica e na estatística, envolvendo no de-
bate corrente, além da vacinação e da revacinação, preocupações com a disseminação da 
doença e o uso da técnica da inoculação (aplicação do vírus variólico).
LE
IT
U
R
A
 C
O
M
P
LE
M
EN
TA
R
195
A
G
O
R
A
 É
 C
O
M
 V
O
C
Ê
LE
IT
U
R
A
 C
O
M
P
LE
M
EN
TA
R
[...] A Gazeta Médica da Bahia, por exemplo, divulgou um artigo, assinado pelo médico 
Pacífico Pereira, onde esse apoiava e elogiava a atuação de outro médico, Lucien Papillaud, 
que desde 1847, no Sul do Brasil, se dedicava à prática da inoculação do vírus variólico, 
tanto em indivíduos não vacinados como em alguns anteriormente vacinados. Baseado 
em experiências formuladas por ele, Papillaud defendia a inoculação pós-vacinal através 
da aplicação do vírus variólico, apontando-o como preservativo da varíola epidêmica, 
indicando o vírus vacinal para o controle da varíola esporádica (endêmica). A estatística 
elaborada por ele, em uma de suas experiências, mostra que entre 84 pessoas inoculadas 
com o vírus extraído de variolosos (vírus variólico), 63 apresentaram erupção, sendo que, 
entre estes, nove caracterizavam-se, segundo ele, como erupções variólicas. Dessa forma, 
nesta experiência, o risco de contrair a varíola através deste tipo de aplicação era de mais 
de 10%. [...]. Aparecem na prática deste médico três questões associadas: além do tipo de 
agente a ser inoculado (vacinal ou variólico) sugere, também, diferenciação do estado de 
distribuição da varíola epidêmica ou endêmica para escolha da aplicação a ser formulada, 
distinguindo a revacinação da prática que denominou de inoculação pós-vacinal.
[...] Com a introdução da vacina animal e a incorporação, no Brasil, principalmente a partir 
da década de 1920, de novas técnicas de produção em escala industrial, gerou-se um novo 
perfil da questão, que, em termos do controle da doença, culminou com sua erradicação 
mundial, na década de 1970. Novas questões vêm surgindo, no início do presente século, 
em relação à varíola, voltando a transformá-la em problema mundial, diante da perspectiva 
do vírus ser utilizado como arma biológica.
[...] Apesar de a vacinação se constituir como uma prática estatal, esta não respondia às 
expectativas de controle da doença, devido às extensas dimensões territoriais e à falta de 
serviços locais e nacionais articulados e adequados às necessidades e possibilidades das 
práticas sanitárias. 
A discussão em torno da vacinação envolvia também a capacidade profissional, a situação 
empregatícia dos vacinadores, principalmente nas províncias e nas localidades distantes 
da Corte, a qualidade da vacina empregada e da vacinação executada, assim como a 
liberdade de opção pelo uso ou não da vacina por parte da população.” 
Fonte: FERNANDES, T. M. Imunização antivariólica no século XIX no Brasil: inoculação, va-
riolização, vacina e revacinação. História, Ciências, Saúde. Manguinhos, v. 10 (suplemento 
2), p. 461-74, 2003.
196
A
G
O
R
A
 É
 C
O
M
 V
O
C
Ê
M
A
TE
R
IA
L 
C
O
M
P
LE
M
EN
TA
R
A História e Suas Epidemias - A Convivência do Homem com os 
Microorganismos
Stefan Cunha Ujvari 
Editora: SENAC Rio
Sinopse: este livro faz o resgate abrangente e minucioso da luta travada 
pela humanidade contra os germes ao longo dos séculos - desde a tenta-
tiva de compreensão das primeiras epidemias da História, passando pela 
descoberta dos microorganismos como causadores de infecção e também 
dos antibióticos e vacinas que levaram ao controle ou extinção de alguns deles. Descreve com 
riqueza de detalhes a disputa aparentemente sem fim entre homens e micróbios; estes, a cada 
avanço científico para destruí-los, contra-atacam com mutações e tipos mais resistentes.
Erin Brockovich
Ano: 2000
Sinopse: Julia Roberts é a atriz principal e interpreta Erin, uma mulher 
divorciada, com três filhos e sem um tostão no bolso que, depois de so-
frer um acidente, implora ao seu advogado para trabalhar com ele. Ela 
descobre uma história de cair o queixo e começa a investigar a ocultação 
de um incidenteenvolvendo casos de água contaminada que causava 
graves doenças nos moradores das redondezas. A história é baseada em 
fato verídico. O acordo a que os advogados chegaram foi a maior indenização já paga num litígio 
direto na história dos Estados Unidos, cerca de US$ 333 milhões’.
No artigo Papel da Epidemiologia no desenvolvimento do Sistema 
Único de Saúde no Brasil: histórico, fundamentos e perspectivas, 
você aprenderá sobre o papel da Epidemiologia e seus praticantes 
no desenvolvimento do Sistema Único de Saúde (SUS). 
Para acessar, use seu leitor de QR Code.
http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1415-790X2002000400003
197
M
EU
 E
SP
A
Ç
O
198
M
EU
 E
SP
A
Ç
O
6
Olá aluno (a) nesta unidade vamos conceituar os métodos da ciência epi-
demiológica, ressaltando a questão das variáveis e indicadores de saúde, 
problematizando instrumentos e técnicas de medida de doença e saúde na 
pesquisa populacional e descrever o processo de coleta de dados para a 
geração de informações epidemiológicas para a caracterização dos eventos 
de saúde que ocorrem nas populações, nos grupos de indivíduos e na cole-
tividade humana. Vamos também apresentar as formas de expressão dos 
resultados dos indicadores de saúde, conceituando a frequência absoluta 
e relativa; os indicadores de saúde, ressaltando a importância do indicador 
para a avaliação da situação de saúde das populações. E por fim, descre-
ver a estrutura e as funções do sistema de vigilância epidemiológica para 
doenças transmissíveis e não transmissíveis. Identificar as fontes de dados 
em saúde e conhecer os sistemas de informação em saúde.
Indicadores de 
Saúde e a Vigilância 
Epidemiológica
Dra. Izabel Galhardo Demarchi
200
UNICESUMAR
Olá, caro(a) aluno(a). Nesta unidade, você compreenderá como 
podemos aplicar algumas ferramentas epidemiológicas, como 
os indicadores de saúde e a vigilância epidemiológica nas ati-
vidades rotineiras, assim como para o planejamento e 
a avaliação das políticas de saúde.
Inicialmente, são abordados os métodos 
epidemiológicos, ou seja, referenciamos 
as estratégias, técnicas e procedimentos 
de pesquisa no campo da Epidemiolo-
gia. Você terá subsídios conceituais para 
reconhecer e aplicar as variáveis epidemio-
lógicas e os indicadores de saúde. Também abordaremos as 
técnicas para medir a doença e a saúde nas populações para, 
em seguida, apresentarmos as estratégias metodológicas para 
modificar os determinantes e os mecanismos do processo saú-
de-doença.
Na unidade anterior, você aprendeu sobre as aplicações da 
Epidemiologia, e a maioria delas, senão todas, depende de in-
formações em saúde para qualquer tomada de decisão. Aborda-
remos desde a coleta de dados à transformação em informação. 
A informação epidemiológica é produzida a partir de dados, 
que são a base para se formular os objetivos, as hipóteses e a 
metodologia dos estudos epidemiológicos.
Você aprenderá como expressar os resultados epidemioló-
gicos em frequências, absoluta e relativa. Serão abordados os 
principais indicadores de saúde, seus cálculos e interpretações. 
Os indicadores são utilizados para o planejamento de ações e 
serviços em saúde pelos gestores, e para a avaliação de progra-
mas e serviços de saúde.
Por fim, faremos uma breve síntese de como atua a vigilância 
epidemiológica, desde a sua estrutura e dos objetivos até as suas 
ações em saúde. Ainda nesse tópico, você será capaz de encon-
trar as fontes de dados mais importantes em saúde e conhecer 
os principais sistemas de informação, que podem ser utilizados 
para o conhecimento da situação de saúde de uma população.
201
UNIDADE 6
MÉTODOS EPIDEMIOLÓGICOS: CONCEITOS
Caro (a) aluno (a), você aprenderá a utilizar algumas das ferramentas epidemio-
lógicas usadas para quantificar a situação de saúde de uma população, assim 
como compreenderá o papel da Vigilância Epidemiológica para a coleta de dados 
e a geração de informações em saúde que podem ser utilizadas pelos gestores, 
sanitaristas e pesquisadores para as tomadas de decisões e o planejamento das 
ações e dos serviços de saúde.
Nesta Unidade, primeiramente, definiremos a noção de metodologia, desde o 
descobrimento do problema e da obtenção de soluções até a geração e a correção 
de hipóteses. Também abordaremos como as variáveis e indicadores epidemio-
lógicos são utilizados no campo epidemiológico. 
Quando analisamos a situação de saúde de populações, nós nos deparamos 
com diversos problemas de saúde, que precisam ter a ocorrência confirmada e 
mecanismos para sua identificação e resolução e para a geração de novas ideias. 
Para se ter fatos reais relevantes, que mereçam prioridade e maior atenção pelos 
gestores e comunidade, a pesquisa do problema deve ser sistematizada e genera-
lizada, ou seja, de ponta (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; 
ALMEIDA FILHO, 1999).
Portanto, inicialmente, precisamos descobrir qual é o problema, a ‘’lacuna” 
em um conjunto de conhecimento. O problema pode estar evidente e claro, ou 
podemos sugerir um problema a partir de métodos quantitativos, ou ainda re-
colocar um velho problema à luz dos novos conhecimentos (ALMEIDA FILHO; 
BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999). Por exemplo, pode-
mos verificar que a AIDS tem sido um problema evidente no mundo; observa-se 
que as mortes por acidente de trânsito têm aumentado significativamente nos 
últimos anos; e que casos de sarampo voltaram a ser notificados em algumas 
regiões do país.
Após a colocação do problema, devemos procurar conhecimentos e instrumen-
tos para a solução deste problema. Por exemplo: encontrar técnicas que detectem 
precocemente indivíduos infectados pelo HIV para se evitar o desenvolvimento 
da AIDS propriamente dita, como a detecção precoce da infecção por métodos 
laboratoriais. Em seguida, deve-se solucionar o problema, o que é uma das etapas 
mais difíceis, pois podemos utilizar meios empíricos e teóricos já existentes ou 
identificados, ou ainda inventar novas ideias (hipóteses, teorias e técnicas) (AL-
MEIDA FILHO; BARRETO, 2011; FRANCO; PASSOS, 2011; ROUQUAYROL; 
ALMEIDA FILHO, 1999). Por exemplo, investigar novos medicamentos para o 
tratamento do HIV, ou métodos de cura.
202
UNICESUMAR
Ao obter uma solução, as suas consequências deverão ser investigadas. Utilizando o 
exemplo acima, pode-se investigar o prognóstico de um paciente infectado pelo HIV 
tratado com um novo medicamento. Devemos provar que a solução para o problema 
é pertinente, se o resultado é satisfatório e, se sim, dar a pesquisa como concluída. Caso 
contrário, devemos corrigir as hipóteses, procedimentos, teorias ou dados empregados 
na obtenção da solução incorreta. Seria o recomeço da investigação, um novo ciclo da 
pesquisa (ALMEIDA FILHO; BARRETO, 2011; FRANCO; PASSOS, 2011).
Atualmente, com a modernização dos sistemas de saúde, nós temos uma crescente 
variedade e complexidade dos serviços prestados pelos profissionais de saúde à disposição 
da população, assim como muitos gastos. Diariamente, são muitos e complexos os dados 
registrados pelos sistemas de saúde, os quais podem ser transformados em informações 
que refletem, além da situação de saúde, a eficácia e o sucesso das ações prestadas e de 
programas de saúde pública, bem como constituir a base para a formulação de hipóte-
ses e metodologias de estudo (PEREIRA, 2002; ALMEIDA FILHO; BARRETO, 2011; 
ROUQUAYROL; ALMEIDA FILHO, 1999).
Os dados coletados podem ser a ocorrência de uma condição única, como um agravo 
à saúde (uma doença, uma sequela pós-traumática, um efeito adverso e outros); um fator 
de risco (por exemplo, exposição ao fumo ou álcool); uma característica populacional, 
como raça e condições econômicas, ou outro evento de interesse; um grupo de condições, 
como doenças infecciosas ou cardiovasculares, por exemplo (PEREIRA, 2002).
A coleta de informações é sistemática sobre eventos relacionados à saúde de uma po-
pulação definida e na quantificação desses eventos (MEDRONHO, 2009). Um problemaepidemiológico pode ser muito evidente, podemos dizer que salta aos olhos, como uma 
grave epidemia. Outras vezes, o problema é latente e o tempo de aparecimento do pro-
blema é longo. Esses fatos mais “escondidos” emergem quando se utilizam estratégias de 
investigação mais elaboradas e que requerem uma sensibilidade e percepção do investiga-
dor (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999).
Um outro aspecto relevante para o diagnóstico de saúde é a abrangência populacional 
que esses dados representam, que é importante para a utilização de técnicas de amostra-
gem populacional aleatória, para que toda a diversidade possa ser selecionada sem vieses 
do pesquisador (PEREIRA, 2002). Outro aspecto que deve ser minuciosamente observado 
é a seleção dos indicadores de saúde (Tópico 4 desta unidade), que devem ser selecionados 
adequadamente e retratar muito bem a população. Os principais indicadores utilizados 
no mundo são o de morbidade (coeficiente de pessoas doentes em uma população por 
uma determinada doença) e o de mortalidade (taxa de óbito em uma população, geral 
ou específica) (PEREIRA, 2002). 
203
UNIDADE 6
Processo de seleção de amostras de elementos da população alvo para realizar um levantamento epidemiológico.
A ferramenta epidemiológica utilizada para descrever o estado de saúde popu-
lacional é o estudo epidemiológico descritivo, que organiza os dados e evidencia 
as frequências dos eventos de saúde em diversos grupos da população, permitindo 
comparar os resultados entre esses grupos. Neste tipo de estudo, o evento de saúde 
é descrito de acordo com características pessoais, do lugar e tempo (ALMEIDA 
FILHO; BARRETO, 2011; PEREIRA, 2002; ROUQUAYROL; ALMEIDA FI-
LHO, 1999). Por exemplo: pode-se estudar o número de casos de AIDS segundo 
o gênero, município e ano de notificação. A Epidemiologia também auxilia na 
identificação de grupos de pessoas mais vulneráveis a uma doença (FRANCO; 
PASSOS, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999), por exemplo, os 
profissionais manicure e pedicure são mais vulneráveis à infecção por hepatite 
B e C (SÃO PAULO, 2017).
A metodologia epidemiológica parte da pesquisa e da validação de uma 
hipótese epidemiológica, que surge a partir de enunciado que propõe uma ex-
plicação para um fenômeno relacionado à distribuição ou à frequência de um 
desfecho em populações, utilizando para isso os fatores de risco e as medidas de 
risco. Ao ser formulada, a hipótese deve levar em consideração os dados da doença 
na população e das variações ambientais, associados à exposição aos fatores de 
risco (ALMEIDA FILHO; BARRETO, 2011).
204
UNICESUMAR
DADOS EPIDEMIOLÓGICOS: DA COLETA À INFORMAÇÃO
Todo esse processo de geração de conhecimento científico-técnico é iniciado pela observação, tomada 
como matéria-prima. As observações são transformadas em dados que podem produzir informa-
ções no final do processo produtivo, emergindo como conhecimento científico e tecnológico. Na 
observação temos a identificação, a seleção, a coleta e o registro sistemático de características, pro-
priedades ou atributos relevantes de objetos naturais, culturais, pessoais e sociais. Podem ser objetos 
de observação: o homem, o ambiente, as condições sócio-econômicas, uma célula, a massa corpórea, 
uma doença, etc. (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999).
Os dados podem ser expressos como indicadores, no sentido de que indicam parâmetros (valor 
ideal de uma dada dimensão) ou propriedades (quantificáveis) do objeto em observação. Os dados não 
refletem nenhuma informação quando analisados isoladamente, é necessário que haja um aglomerado 
de dados para que tenham algum valor científico ou para que sejam utilizados para tomadas de decisão. 
A transformação do dado em informação requer uma ferramenta analítica a partir da qual o dado é 
organizado, classificado, condensado e interpretado. Por exemplo: o peso de um feto em particular é 
um dado, compará-lo com um parâmetro estabelecido gera a informação de desnutrição ou de um bom 
estado nutricional (ALMEIDA FILHO; BARRETO, 2011; ROUQUAYROL; ALMEIDA FILHO, 1999).
OBSERVADO
*Observação
DADO
Codi�cação
INFORMAÇÃO
Análise
CONHECIMENTO
Interpretação
Figura 1: O ciclo da produção de conhecimento./ Fonte: autoria própria, adaptado de Almeida Filho e Barreto (2011).
205
UNIDADE 6
A estrutura dos dados
Quando transformamos os dados em informações, estas podem ser chamadas de 
variáveis, que quanto à sua natureza podem ser qualitativas (como sexo feminino e 
masculino, renda, ocupação, procedência, situação conjugal, presença ou ausência de 
uma enfermidade etc.) e quantitativas (número de casos, estatura, pressão arterial, 
temperatura corporal, níveis de colesterol e outros) (ALMEIDA FILHO; BARRETO, 
2011; ROUQUAYROL; ALMEIDA FILHO, 1999).
As variáveis qualitativas podem ser numeradas para facilitar a digitação em ban-
cos de dados, ou seja, podemos codificá-las; por exemplo: se a doença for ausente, 
podemos atribuir a ela o número zero (0), enquanto para aqueles que possuem a 
doença, podemos a atribuir o número um (1). Ainda para as variáveis categorizadas, 
demos como exemplo o estado civil: solteiro=0, casado=1, divorciado=2, viúvo=3. 
As variáveis quantitativas podem ser contínuas ou descontínuas (discretas), classi-
ficadas de acordo com os limites de variação. Estas referem dois valores consecutivos 
expressos por números inteiros, não sendo possível fracioná-los (exemplo, número 
de casos de uma doença, 10 casos de dengue). Já as contínuas são aquelas que admi-
tem valores fracionados, independente do valor consecutivo (exemplo: temperatura 
corporal, 36,5°C) (ROUQUAYROL; ALMEIDA FILHO, 1999; ALMEIDA FILHO; 
BARRETO, 2011; FRANCO; PASSOS, 2011). 
As variáveis ainda podem ser classificadas como dependentes e independentes, em 
termos matemáticos. As variáveis independentes são aquelas representadas no eixo x 
das abscissas; e as ordenadas do eixo y são as dependentes. A variável independente 
será o fator causal, sendo o efeito final a variável dependente, aquela que depende 
do fator de risco para ser desencadeada. A independente antecipa a dependente 
(ROUQUAYROL; ALMEIDA FILHO, 1999; ALMEIDA FILHO; BARRETO, 2011).
Em alguns manuais de Epidemiologia, a variável dependente também é deno-
minada de “variável resposta” (em inglês: outcome), e seus valores dependem das 
variáveis independentes, denominados de ‘“variáveis preditoras”. Em uma perspectiva 
geral, as variáveis epidemiológicas são expressas como dados a partir de indicadores 
(ALMEIDA FILHO; BARRETO, 2011). 
Os indicadores epidemiológicos sintetizam a relação entre os doentes ou outros 
desfechos (óbito, doença, sujeitos portadores de uma doença e outros resultados) e o 
conjunto de membros de uma população. Os indicadores equivalem à probabilidade 
de adoecer, e constituem uma expressão geral e simplificada do que chamamos de 
risco. Ora, os indicadores podem ser calculados por taxas, razão ou proporção, e como 
coeficientes. Como já citamos anteriormente, os principais indicadores utilizados 
para avaliar o estado de saúde das comunidades são os de mortalidade e morbidade 
(ALMEIDA FILHO; BARRETO, 2011).
206
UNICESUMAR
Fontes dos dados
As fontes dos dados podem ser primárias ou secundárias, e ainda cole-
tadas de forma contínua ou periódica. As fontes primárias são aquelas em 
que os dados são obtidos diretamente dos indivíduos participantes das 
pesquisas, a partir de exames ou entrevistas, como nos estudos observacio-
nais utilizados em Epidemiologia. Os registros diários e sistemáticos das 
atividades profissionais de saúde nos serviços, suas ações e intervenções, 
constituem fontes especiais dos dados secundários, que alimentam os 
sistemas de informação. São incluídos também como fontes especiais os 
registros em cartório, os prontuários clínicos, os arquivos de laboratórios, 
entre outros. Os dados mais coletados são a Declaração de Óbito, a Decla-
ração de Nascido Vivo e a Ficha de Notificaçãode casos de doenças e agra-
vos à saúde (ALMEIDA FILHO; BARRETO, 2011; FRANCO; PASSOS, 
2011; ROUQUAYROL; ALMEIDA FILHO, 1999; MEDRONHO, 2009).
Os dados secundários são muitas vezes obtidos por meio eletrônico 
a partir dos sistemas nacionais de informação e de inquéritos popula-
cionais, que cobrem um amplo interesse sobre os perfis de morbimor-
talidade, os fatores de exposição e os determinantes das condições de 
saúde. As fontes mais importantes para obtenção de dados de interesse 
em saúde no Brasil são pertencentes ao Ministério da Saúde (MS) e à 
Organização Pan-Americana (OPAS). Uma das fontes mais utilizadas é 
a Rede Interagencial de Informações para a Saúde (RIPSA), que viabiliza 
um conjunto de dados e informações com a publicação Indicadores e 
Dados Básicos para a Saúde no Brasil (ALMEIDA FILHO; BARRETO, 
2011; ROUQUAYROL; ALMEIDA FILHO, 1999; MEDRONHO, 2009).
Em relação ao tempo de coleta dos dados, pode-se obtê-los de forma 
contínua ou episódica, ou ainda com periodicidade não definida. Os dados 
contínuos podem ser obtidos a partir do registro civil, de notificações e de 
registros de óbitos, doenças e agravos, como aqueles obtidos também pelo 
Instituto Brasileiro de Geografia e Estatística (IBGE). Também são contí-
nuos os dados obtidos e que alimentam o Sistema Nacional da Vigilância 
Epidemiológica, o Sistema Nacional de Agravos de Notificação (SINAM), o 
Sistema de Informação de Mortalidade (SIM) e o Sistema de Nascido Vivos 
(SINASC), dentre muitos outros pertencentes ao MS (tópico 5 desta Unida-
de). Nesses sistemas, podem ser coletados diversos dados, como os relativos a 
óbito, doença, sexo, idade, estatura, peso, raça, ocupação, estado civil, tipo de 
parto e outros (ALMEIDA FILHO; BARRETO, 2011; FRANCO; PASSOS, 
2011; ROUQUAYROL; ALMEIDA FILHO, 1999; MEDRONHO, 2009).
207
UNIDADE 6
Os dados periódicos geralmente são aqueles obtidos por inquéritos 
epidemiológicos realizados nos estudos observacionais, como os 
transversais, que analisam a situação de saúde de uma população em 
um período limitado, ou ainda, são obtidos por estudos longitudinais 
que acompanham um grupo de populacional para verificar fatores de 
risco e determinantes de doenças e agravos em saúde. Como exemplo 
de fonte de dados periódicos, temos o inquérito de maior abrangência 
geográfica e periódico, a Pesquisa Nacional por Amostra de Domicí-
lios (PNAD). Uma outra base importante é o Instituto Nacional do 
Câncer (INCA). Destaca-se também o VIGITEL, do MS, que realiza 
inquéritos domiciliares a partir de entrevistas por telefone em todos 
os municípios das capitais. Neste inquérito, podemos obter dados 
como as características sócio-demográficas, de alimentação, de ati-
vidade física, de tabagismo, de consumo de álcool e drogas, de saúde 
bucal, de violência e outros (ALMEIDA FILHO; BARRETO, 2011; 
ROUQUAYROL; ALMEIDA FILHO, 1999).
É muito importante a transparência das ações e das aplicações 
de recursos em saúde para uma boa gestão, seja ela pública 
ou particular. É a partir da transparência que nós, cidadãos e 
profissionais de saúde, sabemos onde e como nossos recursos 
estão sendo aplicados A Lei n° 12.527 regulamenta o direito 
constitucional de acesso dos cidadãos às informações públi-
cas. Assim nasceu o portal da transparência do Ministério da 
Saúde (MS), que pode ser acessado em <http:saude.gov.br>. 
O MS também conta com Sala de Apoio à Gestão Estratégica 
(SAGE), que disponibiliza as informações e análises de forma 
gráfica e em tabelas, de modo executivo e gerencial, para sub-
sidiar as tomadas de decisões, a gestão, a prática profissional e 
a geração de conhecimento, e demonstrar a ação da gestão na 
saúde no âmbito do SUS. Embora seja público, a SAGE é uma 
ótima referência para as instituições de saúde demonstrarem 
seus indicadores de saúde de modo representativo. Para ver 
mais, acesse: <http:sage.saude.gov.br>.
Fonte: a autora.
208
UNICESUMAR
Os instrumentos de coleta devem ser tão simples quanto possível e fáceis de serem organizados 
e analisados posteriormente. Deve-se assegurar o correto preenchimento dos dados que tenham va-
riáveis suficientes para a produção de informação, pois a insuficiência de dados poderá prejudicar a 
interpretação do estudo, assim como a coleta excessiva e complexa, que pode levar a erros e falhas de 
preenchimento. Torna-se, também, muito importante a capacitação e o treinamento dos pesquisadores 
ou dos indivíduos que alimentam os sistemas. Os instrumentos mais utilizados são os formulários, 
protocolos, questionários e roteiros, que podem ser aplicados diretamente e pessoalmente para o 
participante ou via internet, correspondência e outros (ALMEIDA FILHO; BARRETO, 2011; ROU-
QUAYROL; ALMEIDA FILHO, 1999).
RESULTADOS EPIDEMIOLÓGICOS
A maioria dos resultados ou informações em saúde são expressos como indicadores, e a preparação 
destes envolve a contagem de unidades, como o número de doentes, de óbitos, etc. A forma mais sim-
ples de representar um resultado é a partir do número absoluto, denominando de frequência absoluta. 
Essa forma de expressão de um resultado é a mais utilizada pela imprensa leiga rotineiramente. Por 
exemplo: foram detectados dez casos de dengue na semana. Esses resultados podem ser utilizados para 
comparar a situação de saúde entre regiões e em tempos diferentes (veja a Tabela 1) (PEREIRA, 2002; 
GORDIS, 2009; FRANCO; PASSOS, 2011).
Outra forma de expressão é a frequência relativa, mais utilizada para facilitar a comparação e inter-
pretação e na qual os valores absolutos são expressos em relação a outros valores absolutos, calculan-
do-se a porcentagem (%) (veja Tabela 1) (PEREIRA, 2002; GORDIS, 2009; FRANCO; PASSOS, 2011).
209
UNIDADE 6
Para você entender melhor a frequência absoluta e relativa, vamos dar como exemplo os resultados 
de Pierre Louis (mencionado na Unidade I), que realizou estudos para investigar a mortalidade por 
pneumonia após tratamento com a sangria (Tabela 1). O estudo revelou, a partir da frequência absoluta 
e relativa do número de óbitos, que a sangria realizada logo no início dos sintomas era extremamente 
prejudicial para o tratamento da doença (PEREIRA, 2002).
Tabela 1 – Letalidade da pneumonia em franceses submetidos à sangria, Paris, 1835.
Início do tratamento/
sangria (dias)
Número de 
pacientes
Frequência absoluta 
(número de óbitos)
Frequência relativa 
(letalidade) (%)
1-3a 24 12 50
4-6b 34 12 35
7-9c 19 3 16
Total 77 27 35
a A sangria foi iniciada entre o primeiro e terceiro dia da doença; b a sangria foi iniciada a partir do quarto dia da doença; c a 
sangria foi iniciada a partir do sétimo dia da doença. / Fonte: Pereira (2002).
Os resultados relativos também 
podem ser expressos a partir do 
cálculos de coeficientes ou taxas, 
nos quais o número de casos é 
relacionado com o tamanho da 
população da qual eles procedem. 
O numerador é definido pelo nú-
mero de casos detectados e o de-
nominador é o número total da 
população sob o risco de adoe-
cer. O numerador é o número de 
pessoas acometidas pela doença 
ou exposta ao fator de risco, e o 
denominador é o número total 
de pessoas sob o risco (PEREIRA, 
2002; FRANCO; PASSOS, 2011). 
Veja como podemos estruturar um coeficiente: (número de casos/população sob risco no período 
do estudo) x constante. A constante pode ser qualquer múltiplo de 10 (10, 100, 1.000, 10.000 e etc.). 
Multiplica-se pela constante para facilitar a comunicação dos resultados e a comparação entre popu-
lações com tamanhos diferentes de amostragem (PEREIRA, 2002; FRANCO; PASSOS, 2011). Demos 
como exemplo dados hipotéticos, na cidade X ocorreram 10 casos de dengue a cada 10.000 habitantes 
por semana epidemiológica, enquanto que na cidade Y foram apenas 3 casos a cada 10.000 habitantes. 
Quando utilizamos a constante 100, fazemos a relação de porcentagem, muito utilizada nos estudos 
observacionais e retrospectivos.
Figura 3 – Tratamento com sanguessugas. Os estudos de Pierre Louis mostraram 
que a sangria utilizando sanguessugassobre a pele era prejudicial para o tratamento 
da pneumonia e não benéfico, como se acreditava naquela época.
210
UNICESUMAR
Figura 4 – A utilização de computadores para digitação e armazenamento de bancos de dados também permite a construção 
de gráficos e tabelas, e a análise estatísticas dos dados. 
Os indicadores de saúde são parâmetros utilizados internacionalmente ou nacionalmente para 
verificar a situação de saúde de populações, sob o ponto de vista sanitário, permitindo a comparação 
com parâmetros estabelecidos, ou entre regiões e períodos, assim como com o intuito de mudar uma 
situação presente julgada insatisfatória. Também podem ser utilizados para subsidiar uma tomada 
de decisão de forma racional e bem fundamentada ou ainda como faceta diagnóstica, uma vez que 
tem caráter de prognóstico, pois podem presumir o que provavelmente ocorrerá no futuro tendo 
como base os indicadores do passado e do presente (PEREIRA, 2002; ROUQUAYROL; ALMEIDA 
FILHO, 1999; MEDRONHO, 2009).
A escolha de um indicador de saúde para a interpretação de uma situação de saúde requer muitos 
aspectos metodológicos, éticos e operacionais. Um indicador deve medir e representar o fenômeno 
considerado, ou seja, ele deve quantificar o fenômeno e ser capaz de discriminar corretamente o even-
to dos outros. Além deste aspecto, o indicador deve ter alta confiabilidade, também conhecida como 
reprodutibilidade, o que significa que deve permitir a obtenção de resultados semelhantes quando a 
mensuração é repetida (PEREIRA, 2002; FRANCO; PASSOS, 2011; MEDRONHO, 2009).
PRINCIPAIS INDICADORES DE SAÚDE
211
UNIDADE 6
A representatividade se refere à cobertura populacional que esse indicador alcança. Geralmente, para 
que o indicador tenha esse alcance, utiliza-se a técnica de amostragem para se obter um processo adequado 
de seleção das unidades componentes da amostra. Deve-se considerar os aspectos éticos, uma vez que os 
indicadores devem manter o sigilo e não podem acarretar malefícios ou prejuízos às pessoas investigadas. 
Do ângulo técnico-administrativo, o indicador deve ser de fácil cálculo, interpretação e obtenção, baixo 
custo operacional, e ainda o cálculo deve ser simples e flexível (PEREIRA, 2002; FRANCO; PASSOS, 2011; 
MEDRONHO, 2009).
Atualmente, a forma mais confiável para se obter informações válidas e de fácil transformação de dados 
é a utilização de computadores para a digitação de bancos de dados informatizados. Os dados são arma-
zenados em computadores e, assim, são mais fáceis de serem manipulados, atualizados e comparados no 
tempo e espaço (PEREIRA, 2002). A escolha do coeficiente é determinada pelos dados disponíveis e pelo 
propósito da análise dos dados, e deve ser realizada de forma adequada para evitar vieses nas interpretações 
da situação de saúde (GORDIS, 2009; FRANCO; PASSOS, 2011; MEDRONHO, 2009).
Morbidade
Os indicadores de morbidade permitem inferir os riscos de o indivíduo adoecer, indicam os determinantes 
das doenças e a escolha das ações saneadoras adequadas. Em comparação com a mortalidade, a morbi-
dade é mais sensível para expressar mudanças a curto prazo. Os registro de doença ou outros agravos são 
coletados rotineiramente pelos serviços de saúde e, devido à sua facilidade operacional de registro, este é 
o caminho mais simples para se verificar o estado de saúde das populações (PEREIRA, 2002; FRANCO; 
PASSOS, 2011; MEDRONHO, 2009). 
Os dados de doença podem ser obtidos por diagnósticos de altas hospitalares, atendimentos de consultas, 
arquivos como prontuários e laudos laboratoriais, atestados e notificações compulsórias. Os dados ainda 
podem ser obtidos por inquéritos epidemiológicos, uma vez que não existe um sistema rotineiro adequado 
para registro, ou usualmente isto não é requerido (PEREIRA, 2002; FRANCO; PASSOS, 2011; GORDIS, 
2009; MEDRONHO, 2009). 
O cálculo de morbidade é dado pela fórmula=
número de indivíduos acometidos pela doença, período, ano X constante
número de pessoas na população
Limitações: as pessoas muitas vezes não percebem as anormalidades ou ainda tardam a procurar os serviços 
de saúde, o que pode alterar as estatísticas e a variabilidade dos registros de morbidade (PEREIRA, 2002).
212
UNICESUMAR
Mortalidade
Historicamente, é o primeiro indicador utilizado em saúde coletiva. 
Até hoje, é o mais empregado. Isso se deve à sua facilidade operacio-
nal, à objetividade do termo óbito e à obrigatoriedade da notificação 
do óbito e de sua causa. O seu registro compulsório permite que 
a base de dados seja mantida e atualizada constantemente pelos 
técnicos do governo e divulgada periodicamente (PEREIRA, 2002; 
FRANCO; PASSOS, 2011; GORDIS, 2009; MEDRONHO, 2009).
Os indicadores de mortalidade ainda podem ser específicos, como:
• Coeficiente de mortalidade por causas específicas= (número 
de óbitos por uma causa específica/número total de indiví-
duos sob o risco) x múltiplo de 10, geralmente 100.000;
• Coeficiente de mortalidade materna= (número de óbitos 
por causas ligadas à gestação, parto e puerpério, área, ano/
nascidos vivos no mesmo período) x múltiplo de 10;
• Coeficiente de mortalidade infantil = (número de óbitos 
em menores de um ano, na área, ano/número de nascidos 
vivos, na área, ano) x 1000. Este indicador é sempre multipli-
cado por mil nascidos vivos, é um parâmetro universal. Veja 
abaixo a ilustração da distribuição da taxa de mortalidade 
infantil no mundo (2008);
• Coeficiente de mortalidade neonatal infantil precoce = (nú-
mero de óbitos em recém-nascido do dia zero a 6 dias de 
nascimento, área, durante o ano/total de nascidos vivos, área, 
durante o ano) x 1000. Geralmente, as mortes são relacionadas 
com anormalidades congênitas e infecções intrauterinas;
• Coeficiente de mortalidade neonatal, tardia = (número de 
óbitos em recém-nascidos com sete a 27 dias de nascimento, 
área, durante o ano/total de nascidos vivos, área, durante o 
ano) x 1000. Geralmente, o óbito está relacionado a gastroen-
terites, infecções respiratórias e má nutrição;
• Coeficiente de mortalidade neonatal, pós-neonatal = (nú-
mero de óbitos em recém-nascido com 28 a 364 dias de 
nascimento, área, durante o ano/total de nascidos vivos, área, 
durante o ano) x 1000. Estes óbitos estão relacionados com 
infecções respiratórias, má nutrição, acidentes e outros.
213
UNIDADE 6
TAXAS MUNDIAIS DE MORTALIDADE INFANTIL
Mortes/1000
nascidos vivos
175
100
50
25
10
1
Figura 5 – Taxa (ou coeficiente) de mortalidade infantil no mundo, ano de 2008. As áreas mais vermelhas são as com maior taxa de mortalidade 
em menores de um ano de idade. Legenda: óbitos/mil nascidos vivos; taxa de mortalidade infantil no mundo. / Fonte: Wikimedia (2014, on-line)¹.
Um dos maiores desafios da mortalidade é a alta taxa de mortalidade 
por causas evitáveis, ou seja, óbitos que poderiam ser evitados quando 
tomada alguma medida preventiva. Essas mortes evitáveis geralmente 
estão relacionadas com os baixos níveis sanitários e sociais da popu-
lação. Por exemplo: a mortalidade materna é quase cinco vezes maior 
em países do Terceiro Mundo, e é considerada como morte evitável. 
Os óbitos por acidente de trânsito e outros também são considerados 
evitáveis (PEREIRA, 2002). 
Apesar de ser o indicador mais utilizado, apresenta algumas 
limitações importantes que merecem destaque, pois podem dimi-
nuir a sua qualidade. Um dos maiores problemas é a subcontagem 
do numerador, o que pode acontecer devido a mortes não infor-
madas, registros de óbito inexistentes, cemitérios clandestinos e 
outras causas. Também ocorre a sobre-contagem do numerador 
por certidões duplicadas, por exemplo. O denominador exige uma 
estimativa correta da população. Ainda se perde qualidade quando 
o número de médico é baixo para cada mil habitantes, e quando 
se tem causas de óbito mal definidas (PEREIRA, 2002; GORDIS, 
2009; MEDRONHO, 2009).
214
UNICESUMAR
Outros indicadores
Abaixo, citamos um dos indicadores utilizados para avaliar a situação 
de saúde, diagnósticoe prognóstico de populações (GORDIS, 2009): 
• Taxa de letalidade: número de pessoas que morrem por uma 
doença dividido pelo número de pessoas com a doença no ano;
• Taxa de mortalidade: número de óbitos por uma doença 
dividido pelo número de pessoas naquela população (doen-
tes e não doentes) por ano;
• Taxa de sobrevivência em cinco anos: percentual de pes-
soas vivas em cinco anos após o início do tratamento ou 
cinco anos após o diagnóstico da doença. Esse coeficiente é 
muito utilizado para avaliação de tratamentos para câncer;
• Sobrevivência observada: sobrevivência observada ao lon-
go do tempo, na qual se observa o número de indivíduos 
vivos a cada ano após o início do tratamento ou da doença;
• Mediana do tempo de sobrevivência: extensão do tempo 
em que a metade da população estudada sobrevive;
• Taxa relativa de sobrevivência: é a sobrevivência esperada 
em pessoas com a doença dividido pela sobrevivência espe-
rada em pessoas sem a doença;
• Índice de morbimortalidade: este índice é chamado de 
multidimensional, e incorpora tanto o impacto das doenças 
quanto o dos óbitos que incidem em uma população.
Além desses indicadores, outros podem ser selecionados para ava-
liar programas e serviços de saúde, como a taxa (%) de cobertura 
populacional, a taxa de imunização em menores de um ano, o 
acesso a água potável, o acesso a esgoto, o acesso aos serviços de 
saúde, entre outros (PEREIRA, 2002).
Você conhece os indicadores de saúde do seu município e 
como eles têm sido aplicados para as tomadas de decisão?
215
UNIDADE 6
VIGILÂNCIA EPIDEMIOLÓGICA
Explicar a ocorrência de doenças e a 
distribuição dos indicadores auxi-
lia na identificação de causas e 
de seus determinantes (ME-
DRONHO, 2009; GORDIS, 
2009). Essas explicações 
fornecem subsídios para 
a investigação etiológica e 
para as tomadas de deci-
sões (ALMEIDA FILHO; 
BARRETO, 2011; PEREI-
RA, 2002; ROUQUAYROL; 
ALMEIDA FILHO, 1999). 
Assim nascem os núcleos de 
vigilância, uma vez que o seu ob-
jetivo é monitorar a ocorrência de 
problemas de saúde e a documentação 
dos seus efeitos em uma população definida, 
e caracterizar as pessoas afetadas e com maior risco. Os 
dados da vigilância podem ser utilizados para informar e avaliar programas de saúde pública 
e identificar tendências futuras, auxiliando os planejadores de saúde (ROTHMAN et al., 2011)
O termo vigilância significa o ato de vigiar, atenção, cuidado. A Vigilância em Saúde é o ato de 
observar e analisar permanentemente a situação de saúde da população, desenvolvendo um conjunto 
de ações destinadas a controlar determinantes, riscos e danos à saúde de populações que vivem em de-
terminados territórios. Os componentes da vigilância são: vigilância e controle das doenças transmissíveis; 
vigilância das doenças e agravos não transmissíveis; vigilância da situação de saúde; vigilância da saúde do 
trabalhador; vigilância ambiental em saúde e vigilância sanitária. Todos com o objetivo de diminuir coe-
ficientes de morbimortalidade; aumentar a qualidade de vida e garantir acesso da população aos serviços 
de saúde (MINISTÉRIO DA SAÚDE, 2009).
No Brasil, o marco da institucionalização das ações de vigilância ocorreu em 1966-1973, com a Campa-
nha de Erradicação da Varíola (CEV). Em 1969, o modelo da CEV inspirou a Fundação Serviços de Saúde 
Pública (FSESP) a organizar um sistema de notificação semanal de doenças selecionadas e a disseminar 
informações pertinentes em um boletim epidemiológico de circulação quinzenal. Em 1975, ocorreu a 5ª 
Conferência Nacional de Saúde, na qual foi instituído o Sistema Nacional de Vigilância Epidemiológica 
(SNVE), sob a Lei n° 6.259/75 e o Decreto n° 78.231/76. A partir desta lei, tornou-se obrigatória a notifica-
ção de doenças transmissíveis. Em 1988, o SUS incorporou o SNVE e definiu a Vigilância Epidemiológica 
(VE), a partir da Lei Orgânica da Saúde 8.080 (MINISTÉRIO DA SAÚDE, 2009, on-line)²:
216
UNICESUMAR
 “
conjunto de ações que proporciona o conhecimento, a detecção ou prevenção de qual-
quer mudança nos fatores determinantes e condicionantes de saúde individual ou 
coletiva, com a finalidade de recomendar e adotar as medidas de prevenção e controle 
das doenças ou agravos. 
Consequentemente, a vigilância deixou de ser um setor acessório e passou a integrar o nível decisório 
da gestão. As atividades principais da VE são a coleta e o processamento dos dados coletados; a aná-
lise e a interpretação dos dados processados; a recomendação das medidas de controle apropriadas; a 
promoção das ações de controle indicadas; a avaliação da eficácia e efetividade das medidas adotadas; 
e a divulgação de informações pertinentes (MINISTÉRIO DA SAÚDE, 2009).
A VE tem muitos desafios, como a profunda mudança no perfil epidemiológico das populações (mu-
danças sociais e demográficas); o declínio das taxas de mortalidade por doenças infecciosas e parasitárias 
e do crescente aumento das mortes por causas externas e doenças crônicas degenerativas, o que implicou 
na incorporação de doenças e agravos não transmissíveis ao escopo de atividades da VE. Ainda, a VE tem 
o propósito de fornecer orientação técnica permanente para os profissionais de saúde, que têm a respon-
sabilidade de decidir sobre a execução de ações de controle de doenças e agravos, tornando disponíveis, 
para esse fim, informações atualizadas sobre a ocorrência desses casos, bem como dos fatores que a con-
dicionam, numa área geográfica ou população definida (MINISTÉRIO DA SAÚDE, 2009).
Os dados coletados geralmente são os dados demográficos, socioeconômicos, ambientais, de mor-
bidade e mortalidade e as notificações de surtos e epidemias. Esses dados são coletados a partir da 
observação de pessoas e de doenças e agravos em saúde. A partir da observação de pessoas, podem ser 
investigados os fatores de risco, os prognósticos para a doença, a eficácia de dada vacina/medicamento 
(MINISTÉRIO DA SAÚDE, 2009). 
A observação de doenças e 
agravos permite detectar as varia-
ções de tendências e a frequência 
dos problemas de saúde, identifi-
cando as doenças e agravos com 
valores altos e baixos. Também 
possibilita traçar o perfil das 
doenças, priorizar problemas e 
agir em função do diagnóstico 
da situação. Faz parte da VE o 
Centro de Controle de Zoonoses, 
que realiza atividades dirigidas 
aos vetores (Aedes sp., fleboto-
míneos e outros), reservatórios e 
hospedeiros (MINISTÉRIO DA 
SAÚDE, 2009).
Figura 6 – Centro de Controle de Zoonoses, pertencente à Vigilância Epidemiológica 
do município de Guaratinguetá (SP). Essa instituição tem a função de controle de 
vetores, e suas atividades são voltadas para os reservatórios e hospedeiros de 
doenças que acometem os animais / Fonte: (Wikimedia, 2015, on-line)³.
217
UNIDADE 6
Outro desafio da VE são as doenças emergentes e reemergentes. As doenças 
emergentes são aquelas cujos agentes, até então, são desconhecidos, ou as que se 
expandem ou ameaçam expandir-se para áreas consideradas indenes. A infecção 
pelo HIV é um exemplo. As doenças reemergentes são aquelas doenças bastante 
conhecidas, que estavam controladas, ou eliminadas de uma determinada região, 
e que vieram a ser reintroduzidas, como a cólera e a dengue (MINISTÉRIO DA 
SAÚDE, 2009).
A VE alimenta muitos sistemas de informação do SUS. O mais impor-
tante deles é o Sistema Nacional de Informação de Agravos de Notificação, o 
SINAN, que é uma base de dados que contém valiosas fontes de informação 
sobre a ocorrência de doenças e agravos sob vigilância epidemiológica, e que 
se utiliza do registro rotineiro de dados sobre saúde, derivado da produção de 
serviços ou de sistemas de informação específicos. As principais fontes são os 
laboratórios e hospitais que emitem resultados de exames laboratoriais e, na 
rotina da VE, complementam o diagnóstico de confirmação da investigação 
epidemiológica (MINISTÉRIO DA SAÚDE, 2009).
Com a utilização das ferramentas epidemiológicas para a determinação da 
situação de saúde, podemos observar muitasconquistas ao longo dos anos: 
o Brasil interrompeu transmissão da doença de Chagas pelo vetor Triatoma 
infestans; o índice de tétano neonatal caiu abaixo do limite estabelecido; a 
síndrome da rubéola congênita tornou-se um evento raro no país; os casos 
de óbitos por coqueluche diminuíram (Corynebacterium diphtheriae); o 
número de internações de casos por complicações de influenza decresceu 
após a vacinação, dentre outras (MINISTÉRIO DA SAÚDE, 2009).
O fortalecimento da VE se dá pela realização de cursos de longa duração, 
como o Programa de Capacitação e Formação de Recursos Humanos, os 
mestrados e as especializações profissionalizantes; o Programa de Atualização 
em Epidemiologia Aplicada à Gestão; os cursos de curta duração ministrados 
pela Funasa, pela OMS, pela Fiocruz, pela Universidade Federal do Rio de 
Janeiro e outros; por Cooperação internacional e pela faculdade de Saúde 
Pública da Universidade de São Paulo (MINISTÉRIO DA SAÚDE, 2009).
Prezado aluno(a), chegamos ao final de mais uma unidade, em que abor-
damos os indicadores de saúde e o papel da Vigilância Epidemiológica para o 
planejamento e a gestão em saúde. Podemos, a partir de agora, compreender 
melhor a situação das populações e como acompanhar o seu desenvolvimento 
a partir da saúde. Espero que você utilize os conhecimentos adquiridos nesta 
unidade para cumprir seu papel no controle social, monitorando a qualidade 
de saúde da sua população, e também cobrando dos órgãos responsáveis 
melhorias nos padrões de vida. Até a próxima Unidade!
218
UNICESUMAR
CONSIDERAÇÕES FINAIS
Caro(a) aluno(a), você aprendeu a aplicação de algumas ferramentas epidemiológicas, como os indicadores 
de saúde e a Vigilância Epidemiológica (VE). Pode entender que a construção dos indicadores e as ações 
de VE ocorrem diariamente ou de forma periódica.
Conhecemos as estratégias metodológicas para realizar os estudos epidemiológicos, desde o sur-
gimento da pergunta científica, passando pela detecção do problema e pela formulação de hipóteses 
até a solução do problema e a validação da hipótese. 
Descrevemos o conceito de dados, como realizar a coleta de dados e a importância da transformação 
dos dados em informação. Nós caracterizamos as variáveis epidemiológicas (qualitativas e quantitativas; 
contínuas e discretas; dependentes e independentes; resposta e preditora) e citamos as fontes para coleta 
dos dados (IBGE, SINAN, SIM e outras bases). Você também pode compreender o papel das informações 
para determinar a situação de saúde, planejamento e gestão em saúde.
Descrevemos também como expressar os resultados epidemiológicos em frequências, absolu-
ta e relativa (porcentagem, coeficientes e taxas). Abordamos o conceito de indicador de saúde e 
apresentamos os principais indicadores, morbidade e mortalidade, seus cálculos, interpretações 
e limitações. A partir disso, você pode compreender a importância desses parâmetros para o pla-
nejamento de ações e serviços em saúde pelos gestores e para a avaliação de programas e serviços 
de saúde.
Finalmente, fizemos uma síntese de como atua a Vigilância Epidemiológica e vimos que a observação 
das pessoas e das doenças e agravos em saúde, rotineiramente ou de forma periódica, é fundamental 
para se estabelecer a situação de saúde de uma população, identificar fatores determinantes e condi-
cionantes de saúde, avaliar ações e programas e subsidiar as tomadas de decisão.
Assim chegamos ao fim de mais uma unidade.. Espero que você tenha compreendido as funções e 
como utilizar a metodologia epidemiológica e os indicadores de saúde para o estudo da situação de 
saúde das populações, assim como que tenha entendido a importância da Vigilância Epidemiológica 
nas atividades diárias dos serviços de saúde e gestão.
219
A
G
O
R
A
 É
 C
O
M
 V
O
C
Ê
1. Para que servem os indicadores de saúde?
2. Em relação à fase que vai da coleta de dados até a geração de informação em saúde, 
selecione a alternativa correta.
a) Os dados epidemiológicos podem ser utilizados de forma bruta para se gerar conhe-
cimento sobre a situação de saúde de uma população.
b) Os dados podem ser coletados rotineiramente nas atividades e serviços de saúde, 
mas nunca ocasionalmente.
c) A coleta de dados periódica, realizada por inquéritos epidemiológicos, não pode ser 
utilizada para a interpretação da situação de saúde, uma vez que não possui credibi-
lidade científica.
d) As variáveis qualitativas não possuem a mesma relevância epidemiológica que as 
variáveis quantitativas.
e) Os dados devem ser trabalhados, matemática e estatisticamente, para gerar uma 
informação utilizável para interpretar a situação de saúde de uma população.
3. Os critérios empregados para a avaliar um indicador de saúde são:
I) O seu cálculo deve ser simples, e os dados, acessíveis.
II) Deve ter uma ampla cobertura populacional e deve ser reprodutível.
III) Não precisa manter o sigilo das informações.
IV) Deve ter baixo custo operacional.
Assinale a alternativa correta.
a) Apenas I e II estão corretas.
b) Apenas I, II e IV estão corretas. 
c) Apenas I está correta.
d) Apenas II e III estão corretas.
e) Todas as alternativas estão corretas.
220
A
G
O
R
A
 É
 C
O
M
 V
O
C
Ê
4. Em relação aos indicadores de saúde, assinale verdadeiro (V) ou falso (F).
 ) ( Os indicadores de saúde são utilizados para subsidiar a tomada de decisão de forma 
racional e bem fundamentada.
 ) ( Os indicadores podem ser expressos por frequência absoluta (a mais utilizada), relativa 
(porcentagem) e, em menor caso, por coeficientes ou taxas.
 ) ( O indicador de morbidade é calculado pelo número de pessoas doentes dividido pelo 
de número de pessoas na população.
 ) ( A morbidade pode ser obtida em base de dados de notificação compulsória e em 
inquéritos epidemiológicos, enquanto que na mortalidade os dados são retirados 
apenas de declaração de óbito.
 ) ( O indicador de mortalidade tem muitas limitações, como a subcontagem ou sobre-
contagem do numerador e o preenchimento de declaração de óbito com causas mal 
definidas.
5. Em relação ao papel da Vigilância Epidemiológica (VE), assinale verdadeiro (V) ou falso (F).
 ) ( A VE é responsável pela vigilância das condições sanitárias de portos, restaurantes, 
escolas e outros estabelecimentos.
 ) ( A VE deve proporcionar o conhecimento, a detecção ou a prevenção de qualquer 
mudança nos fatores determinantes e condicionantes de saúde individual ou coletiva.
 ) ( Outra finalidade da VE é recomendar e adotar as medidas de prevenção e controle 
das doenças ou agravos.
 ) ( Os dados utilizados pela VE são os demográficos, sociais e econômicos, ambientais, 
de morbidade e mortalidade, e qualquer outro que se fizer necessário.
 ) ( Os Centros de Controle de Zoonoses e os laboratórios de análises clínicas não per-
tencem à VE. 
221
A
G
O
R
A
 É
 C
O
M
 V
O
C
Ê
Neste texto, você poderá construir uma visão crítica sobre os dados utilizados para os 
resultados dos indicadores de saúde de mortalidade e morbidade. Aqui são expostos os 
principais problemas enfrentados para a confiabilidade dos indicadores. 
“Ao avaliar a exatidão dos dados de mortalidade, muitos autores consideram “padrão ouro” 
os diagnósticos obtidos nas necropsias. Ainda que estes se constituam em excelente fonte 
de informação para o preenchimento de causas nas declarações de óbito, sabe-se que não 
é bem assim. De fato, mesmo que 100% das mortes fossem submetidas à necropsia, não 
se teria 100% de exatidão nas mesmas, visto que nem todos os patologistas preenchem 
adequadamente os atestados de óbito.
[...] quando a evolução para o óbito é muito rápida, a proporção de erros de diagnóstico é 
grande, como o verificado com a hemorragia cerebral e a oclusão coronária.
[...] Entre nós, há poucos estudos comparando as informações do atestado de óbito com 
dados de autópsia.
[...] Por outro lado, apenas os dados da necropsia não são, muitas vezes, suficientes para 
elaboração de umasequência causal lógica e adequado preenchimento da declaração de 
óbito. Pensa-se, nesse caso, haver necessidade também de informações clínicas, razão pela 
qual acredita-se que a melhor forma de preencher a declaração de óbito é a originada da 
união das informações de uma necropsia e um prontuário, ambos bem elaborados.
[...] O que foi aqui descrito quanto à fidedignidade dos dados de mortalidade diz respeito 
apenas à declaração da causa básica, a qual nem sempre é feita de maneira correta pelos 
médicos. Por outro lado, as estatísticas podem apresentar falhas, mesmo quando a causa 
da morte é declarada corretamente, porque existe a possibilidade de erros na codificação 
da causa, por conta de codificadores mal preparados. No Brasil, após a municipalização 
das ações de saúde, a codificação das causas de morte passou a ser feita nas secretarias 
municipais de saúde, o que fez com que a quantidade de codificadores crescesse assusta-
doramente, sendo que o Brasil é, hoje, talvez, o país com maior número de codificadores 
de causas de morte. Esse fato fez com que se tornasse difícil o seu treinamento e, parti-
cularmente, o acompanhamento e a supervisão necessários para o bom andamento dos 
trabalhos. Assim, corre-se o risco de ver deterioradas as estatísticas de mortalidade, caso 
não seja feita boa formação dos codificadores e supervisão, em nível municipal. A tentati-
va de sanar essa questão e uniformizar o trabalho desenvolvido foi feita por meio de um 
programa para seleção eletrônica da causa básica da morte, o qual vem sendo utilizado 
regularmente através do programa Seletor da Causa Básica – SCB, desenvolvido pelo Centro 
Brasileiro de Classificação de Doenças em conjunto com o Datasus/Ministério da Saúde. 
Este, embora ainda com algumas falhas, representa a esperança de uma boa codificação LE
IT
U
R
A
 C
O
M
P
LE
M
EN
TA
R
222
A
G
O
R
A
 É
 C
O
M
 V
O
C
Ê
LE
IT
U
R
A
 C
O
M
P
LE
M
EN
TA
R
da causa da morte, além de assegurar a comparabilidade dos seus dados, em todo o País. 
Outro fator que pode afetar as estatísticas de mortalidade por causas, somente para es-
tudos de tendências, é a introdução de novas revisões da Classificação Internacional de 
Doenças. Com o objetivo de sanar esse viés, a OMS e a Rede de Centros Colaboradores 
da OMS para a Classificação de Doenças publicam uma equivalência dos códigos entre as 
revisões, a qual deve ser usada nesses estudos, sempre que o período estudado englobar 
mais do que uma revisão. Um cuidado também a ser tomado para evitar distorção dos 
dados, na análise epidemiológica, refere-se à necessidade de selecioná-los segundo local de 
residência do falecido ou, em caso específico, segundo local de ocorrência. Além de todos 
esses aspectos, é preciso introduzir no currículo das escolas médicas (nos últimos anos e 
mesmo na residência médica) temas relacionados às estatísticas de mortalidade, seus usos 
e a importância do preenchimento do atestado de óbito e a maneira correta de fazê-lo.
A excessiva multiplicação dos cursos de medicina é bastante preocupante, visto que pode levar 
a uma situação em que, se os alunos estão correndo o risco de serem mal preparados nas artes 
de diagnosticar e tratar, certamente, não serão melhores quanto a declarar do que morreram 
seus pacientes.”
Fonte: LAURENTI, R.; JORGE, M. H. P. de M.; GOTLIEB, S. L. A confiabilidade dos dados de 
mortalidade e morbidade por doenças crônicas não-transmissíveis. Ciência & Saúde Co-
letiva, v. 9, n.4, p. 909-920, 2004.
223
A
G
O
R
A
 É
 C
O
M
 V
O
C
Ê
M
A
TE
R
IA
L 
C
O
M
P
LE
M
EN
TA
R
Epidemiologia. Indicadores de Saúde e Análises de Dados
Tatiana Gabriela Brassea Galleguillos 
Editora: Saraiva
Sinopse: o livro apresenta os conceitos de Epidemiologia e estatística, bem 
como sua utilização no decorrer do tempo. Discute as diferentes teorias 
que explicam o processo saúde-doença, inclusive a que contempla os 
Determinantes Sociais em Saúde. Mostra os indicadores mais utilizados 
para medir morbidade e mortalidade, associando-os às metas mundiais 
e nacionais, como os Objetivos do Milênio. Aponta as características de doenças transmissíveis 
e não transmissíveis e os impactos que causam nas diferentes regiões do país. Por fim, explica 
a transição epidemiológica ocorrida no Brasil e o planejamento em saúde, a partir do uso de 
indicadores epidemiológicos, como ferramenta de gestão do SUS. O conteúdo pode ser aplicado 
para os cursos técnicos em Agente Comunitário de Saúde, Enfermagem, Gerência em Saúde, 
Registros e Informações em Saúde, Vigilância em Saúde, entre outros.
A Organização Pan-Americana de Saúde subsidia a Rede Interagencial 
de Informações em Saúde (RIPSA), que traz as bases de dados para 
os Indicadores e Dados Básicos para a Saúde no Brasil. Acesse o link 
abaixo e veja mais. 
Para acessar, use seu leitor de QR Code.
http://www.ripsa.org.br/vhl/indicadores-e-dados-basicos-para-a-saude-no-brasil-idb/
224
M
EU
 E
SP
A
Ç
O
7
Para começarmos nossa disciplina aluno (a) você irá conhecer e 
introduzir os conceitos e aplicações de prevalência e incidência, 
e abordar a relação prevalência e incidência ,descrever os tipos 
de prevalência e sua interpretação, os tipos de incidência e sua 
interpretação. E por fim, conceituar e interpretar as medidas de 
associação utilizadas para identificação de fatores de risco ou de 
proteção dos estudos retrospectivos, além das medidas de associa-
ção utilizadas para identificação de fatores de risco ou de proteção 
dos estudos prospectivos.
Medidas de 
Frequência e de 
Associação
Dra. Izabel Galhardo Demarchi
226
UNICESUMAR
Caro(a) aluno(a), nesta unidade você aprenderá o que são e como 
utilizar as medidas de ocorrência dos fenômenos epidemiológicos, 
como a prevalência e a incidência. Nós também abordaremos como 
calcular e interpretar as medidas de associação (Odds ratio, ou razão 
das proporções, e risco relativo), as quais possibilitam identificar fatores 
de risco associados aos desfechos em saúde e calcular a probabilidade 
da ocorrência dos problemas de saúde quando um indivíduo é exposto 
a esses fatores.
Faremos uma breve introdução dos conceitos básicos das medidas de 
ocorrência mais utilizadas em epidemiologia, também chamadas de me-
didas de frequência. Também mostraremos para você como representar 
a ocorrência das doenças nas populações utilizando tabelas, mapas e 
gráficos. Descreveremos as medidas de prevalência e de incidência, seus 
cálculos e interpretações. Nesses dois tópicos, utilizaremos exemplos 
hipotéticos ou originais para que você compreenda a aplicação dessas 
medidas, para verificar a situação de saúde das populações e determinar 
quais são as doenças ou causas das enfermidades que nelas ocorrem 
com maior frequência. 
E conceituaremos as medidas de associação e suas aplicações para 
a identificação de fatores de risco, causas ou ainda fatores de proteção, 
que levam à ocorrência de doenças, óbitos ou outros desfechos em 
saúde. Para facilitar a compreensão das medidas de associação, destaca-
remos as medidas de odds ratio (proporção dos pares) e risco relativo, 
utilizadas quando se realizam estudos retrospectivos e prospectivos, 
respectivamente. Por isso, para que você compreenda esse tema, tam-
bém abordaremos brevemente esses tipos de estudos, os quais você 
aprenderá melhor na próxima unidade deste livro.
227
UNIDADE 7
MEDIDAS DE FREQUÊNCIA (OCORRÊNCIA)
Figura 1 – Gráfico de ocorrência do vírus HIV / Fonte: Wikimedia (2014, on-line)¹.
Nesta unidade, conceituaremos as medidas de frequência, também chamadas de ocorrência, e as 
medidas de associação. Você será capaz de compreender e até de calcular e interpretar as medidas de 
frequência e de associação a partir da obtenção dos conhecimentos teóricos e da prática de exercícios 
contidos nesta unidade.
Primeiramente vamos conceituar as medidas de frequência das doenças. Para isso, precisamos 
voltar ao conceito de epidemiologia contido anteriormente, na qual o melhor conceito

Mais conteúdos dessa disciplina