Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

1 
EPIDEMIOLOGIA 
INTRODUÇÃO 
Décadas atrás a epidemiologia era conhecida como o estudo das 
doenças transmissíveis. Hoje, no entanto, sabemos que ela é muito mais 
abrangente, uma vez que trata de qualquer evento relacionado à saúde das 
populações. A epidemiologia estuda o processo saúde-doença de grupos 
de pessoas, objetivando uma melhoria na saúde das populações, 
principalmente das menos favorecidas. 
Uma das características fundamentais da prática epidemiológica é a 
medida de saúde e de doença. Neste contexto, diversas são as medidas 
que auxiliam na caracterização da saúde das populações. Por muitos anos 
a teoria da unicausalidade era norteadora para o entendimento das 
doenças. Hoje, porém. A teoria da Multicausalidade tem seu papel 
reconhecido na epidemiologia. 
 
 
2 
Estes são alguns conceitos que vamos trabalhar. É importante 
lembrar que dominar bem os conceitos explorados neste capítulo servirão 
de subsídio para sua preparação acadêmica e profissional. 
 
Epidemiologia: conceitos 
e história 
O que é epidemiologia? 
A epidemiologia já foi entendida de diferentes maneiras. As 
definições, geralmente, estão vinculadas com a visão de mundo da época 
em que foi escrita. Em 1927, Frost definiu epidemiologia como o “estudo 
da história natural das doenças”. Sartwell, em 1973, entendia que a 
epidemiologia era o “uso de todos os métodos pertinentes que estão 
disponíveis para estudar a distribuição e dinâmica das doenças nas 
populações humanas”. Recentemente, em 2000, Pereira passou a 
entender a epidemiologia como o estudo do comportamento coletivo da 
saúde e da doença. 
Estes são alguns exemplos de definições de epidemiologia ao longo 
do tempo. Com o intuito de nortear este livro, adotaremos a definição que 
caracteriza epidemiologia como um conjunto de conceitos, teorias e 
métodos que permitem estudar, conhecer e transformar o processo saúde-
 
 
3 
doença na dimensão coletiva. Ao utilizar essa definição, entendemos que 
a epidemiologia é uma ciência que estuda as doenças em grupos 
populacionais, enquanto a clínica estuda a enfermidade no indivíduo. 
Estas definições de epidemiologia, assim como tantas outras que 
existem na literatura, possuem em comum o estudo da doença na 
população. Sendo assim, todas elas se preocupam em descobrir como as 
doenças se distribuem e quais são as causas, visando identificar os fatores 
determinantes/causais no processo saúde-doença. 
É importante destacar que a epidemiologia faz uso de métodos 
matemáticos e de técnicas de estatística para quantificar os fenômenos 
saúde-doença. Isto fez com que ela se tornasse a principal fonte de 
informação em saúde, se destacando na produção de metodologias para 
todas as áreas da saúde. 
Um pouco da história da 
epidemiologia 
Alguns autores contam que a epidemiologia surgiu ainda na 
Antiguidade, com Hipócrates, uma vez que ele descrevia as epidemias e o 
ambiente, sugerindo certo raciocínio epidemiológico. No entanto, os 
sucessores de Hipócrates não mantiveram o entendimento de coletividade, 
concebendo a cura individual como referência na prática médica. 
 
 
 
4 
A dominação da Igreja 
católica, na Idade 
Média, e as invasões 
dos bárbaros 
estimularam a adoção 
de práticas de saúde 
baseadas em crenças 
religiosas. 
Os tratamentos mágico-religiosos propunham que, mesmo que o 
corpo fosse perdido, a alma poderia ser salva. Este movimento fez com 
que a “medicina” fosse realizada pelos religiosos, por caridade, ou pelos 
leigos, por profissão. Nesta época não era oferecido nenhuma prática para 
tratamento coletivo, a menos que surgisse alguma praga ou epidemia. 
Com a ascensão da burguesia, países como a França, Estados 
Unidos e Inglaterra começaram a exigir que o Estado interferisse na saúde 
da população. Sendo assim, no século XVIII, movimentos assistencialistas 
começaram a promover a medicina para os pobres. A Revolução Industrial 
e sua economia política deram origem à uma classe proletária, que tinha a 
força do trabalho como único meio de sobrevivência. 
No século XIX, com a prevalência de doenças infectocontagiosas, o 
avanço da bacteriologia, da patologia e da fisiologia fez com que a medicina 
colocasse o foco na assistência nos aspectos curativos das pessoas. A 
medicina estava, novamente, vinculada com aspectos individuais da 
doença. 
Fonte: https://ichef.bbci.co.uk/news/660/cpsprodpb/AFBF/production/_102519944_sificolores.jpg 
 
 
5 
No Brasil, no final da década de 1920, as condições precárias de 
trabalho associadas às condições de moradia dos trabalhadores, assim 
como a falta de saneamento nas cidades, foram os principais fatores que 
causaram diversas doenças e mortes (MEDRONHO et al., 2008). 
Na mesma época, problemas com a economia mundial anteciparam 
uma crise na medicina científica. O desenvolvimento da tecnologia e a 
especialização da área médica reduziu ainda mais o alcance social. Esta 
crise elevou os custos com cuidados médicos, dificultando o acesso da 
população mais carente à assistência à saúde. 
O enfoque em aspectos sociais relacionados à saúde retornou 
somente por meio da epidemiologia, mas de forma menos politizada que a 
medicina social. Nesta época a epidemiologia preocupava-se em manter o 
caráter médico-social com enfoque na coletividade e não apenas em um 
grupo de indivíduos. 
Na década de 1960, com o surgimento da computação, foi possível 
desenvolver a epidemiologia por meio da matemática. As novas técnicas 
de análise de dados tornaram-se mais efetivas, específicas e precisas. 
Atualmente, um dos principais problemas metodológicos da 
epidemiologia é a falta de modelos que possam explicar de que forma 
ocorre a relação entre condições de saúde de uma população e seus 
fatores de risco. Não existem modelos que possibilitam explicar claramente 
a associação entre um fator de risco e a ocorrência de uma doença. 
Resumindo, falta uma teoria que trate a saúde como um fato social. 
 
 
6 
Planejar e organizar os serviços de saúde definindo prioridades, subsidiando o
planejamento de ações para a melhoria da atenção à saúde, alterando as condições
de saúde da população.
Avaliar programas e serviços disponíveis com o objetivo de identificar aqueles
que apresentam os melhores resultados e tenham o maior impacto nas
condições de saúde da população.
Diagnosticar a saúde da população conhecendo o perfil epidemiológico e
suas necessidades com o objetivo de desenvolver práticas de saúde
adequadas para cada contexto, região ou realidade.
Analisar criticamente os trabalhos científicos possibilitando selecionar produções de
melhor qualidade.
Aplicabilidades da epidemiologia 
Destacaremos a aplicabilidade da epidemiologia de forma breve e 
objetiva, mesmo sabendo que sua utilidade é bastante abrangente. Sendo 
assim, sintetizamos algumas de suas aplicabilidades: 
 
 
 
 
 
 
 
 
 
 
 
São profissões que utilizam a epidemiologia: sanitarista, planejador, 
gestor, epidemiologista, professor, clínico, etc. 
 
 
7 
Causalidade e processo saúde-
doença 
A saúde e a doença são conceitos que foram interpretados de 
maneiras distintas ao longo do tempo. A saúde já foi definida como um 
estado em que os diversos sistemas do organismo estavam em silêncio e 
equilíbrio. Sendo assim, essa concepção não torna possível caracterizar 
como doença qualquer problema que estivesse relacionado com algum 
aspecto mental ou social. 
Considerar um indivíduo saudável quando suas funções orgânicas, 
físicas e mentais encontram-se em situação normal também pode gerar 
uma série de dúvidas, como sabemos o que é“normal” e “anormal”? Ficaria 
a critério de cada indivíduo determinar o que é uma pessoa saudável? 
Sendo assim, em 1948, a Organização Mundial da Saúde (OMS) 
sugeriu como definição de saúde o “completo estado de bem-estar físico, 
mental e social e não apenas a ausência de doenças”. Mas, novamente, 
esbarramos em conceitos difíceis de serem avaliados. O que é o “completo 
estado de bem-estar”? 
O que sabemos é que a doença sempre faz parte da vida humana. 
Existem indícios de doenças desde a Antiguidade. Os registros mais 
antigos são encontrados em fósseis e pinturas rupestres. No entanto, como 
são entendidas as causas dessas doenças? 
 
 
8 
Uma doença, uma única causa 
No final do século XVII a causalidade social das doenças aparece 
com força. Todas as diferentes teorias de causalidade fortalecem a ideia 
de que as definições de saúde e doença são determinadas pelos fatos 
históricos e aspectos sociais. 
Com o desenvolvimento da bacteriologia, no século XVIII, as teorias 
começaram a apresentar causas mais palpáveis, uma vez que agora era 
possível identificar vírus e bactérias. Ficou evidente que as doenças tinham 
uma causa específica e poderia ser combatida com agentes químicos ou 
vacinas. Tratava-se do início da concepção unicausal. 
Até o início do século XX essa concepção foi bem aplicada para 
doenças infecciosas, mas logo se percebeu que essa teoria possui 
limitações, uma vez que não explicava todos os tipos de doenças. Algumas 
enfermidades não conseguiam ser explicadas por apenas uma causa. Isso 
fez com que essa ideia fosse substituída por outras mais abrangentes. 
Uma doença, uma cadeia de causas 
Rothman, em 1986, propôs um modelo de causalidade. Este modelo 
dizia que certo fenômeno não seria explicado por um único fator, mas sim 
por uma cadeia de fatores (causas componentes). Essas causas, juntas, 
agiriam para a produção de determinado efeito. O autor chama de “causa 
suficiente” a cadeia mínima de causas componentes que, inevitavelmente, 
produzirá a doença. Este modelo parece o mais coerente para 
 
 
9 
correlacionar causa e efeito. Por considerar a multicausalidade, em que 
cada mecanismo causal envolve a ação conjunta de várias causas 
componentes. 
MacMahon entende que a epidemiologia tem como objetivo construir 
uma rede de eventos causas que podem determinar a ocorrência de uma 
doença em uma população. Ao construir essa rede de associações, é 
possível identificar e dar prioridade para as relações causais que podem 
promover a saúde da população, evitar enfermidades ou outras 
complicações. 
Medidas em saúde 
Na área da saúde existem diversas formas de medir o nível de vida 
e de saúde de uma população. Essas medidas são efetuadas utilizando 
coeficientes e índices. Para isso, é necessário seguirmos alguns critérios, 
por exemplo, é preciso que os dados de toda a população de uma 
determinada área estejam disponíveis, utilizar as mesmas definições e 
mesmos métodos para todos os países, com o objetivo de comparação. 
Incidência 
A incidência da doença é definida como o número de casos novos 
em um período de tempo, em uma população exposta ao risco de ficar 
doente. Devemos ficar atentos pois, o número de casos deve ser medido 
em relação à população e não em números absolutos. 
 
 
10 
É possível verificar a incidência de uma doença por meio de um 
coeficiente que pode ser calculado da seguinte forma 
 
É importante destacarmos que podemos escolher a base da equação 
de acordo com a frequência de casos. Em uma frequência alta podemos 
utilizar base 100 ou 1000. Já quando a frequência é baixa é mais comum 
utilizar 10 mil ou 100 mil. 
A medida de incidência permite verificar a ocorrência de casos novos 
em dada população exposta. Por isso, não podemos incluir no numerador 
do cálculo aquelas pessoas que já estavam doentes em um momento 
anterior ao determinado. 
Prevalência 
O coeficiente de prevalência é o número de casos de uma doença 
que existe em uma população em um período de tempo específico dividido 
pelo número total de pessoas nessa população no mesmo período. 
 
A prevalência nos informa quantos casos existem naquela 
determinada população. Somam-se os casos novos e os já existentes, sem 
diferenciá-los. Existem dois tipos de prevalência. A prevalência no ponto 
ou instantânea é quando escolhemos um determinado momento para fazer 
 
 
11 
o cálculo, como uma fotografia daquele momento. Já a prevalência no 
período é quando realizamos o cálculo utilizando um intervalo de tempo 
mais amplo, como uma série de fotografias sequenciais. 
Mortalidade 
Mortalidade refere-se ao conjunto de indivíduos que morreram em 
um dado intervalo de tempo. É a relação entre a frequência absoluta de 
óbitos e o número de expostos ao risco de morrer. 
Um exemplo disso é o cálculo de mortalidade infantil. Mortalidade 
infantil é o termo que é utilizado quando nos referimos ao óbito de crianças 
menores de 1 ano, ocorridos em uma determinada área, em um dado 
período de tempo. A taxa de mortalidade infantil (TMI) é dada pela seguinte 
equação 
 
Mortalidade infantil – óbitos de crianças menores de 1 ano, 
ocorridos em determinada área, em dado período de tempo. 
Mortalidade neonatal – óbitos de menores de 28 dias de idade, 
também chamada de mortalidade infantil precoce. 
Mortalidade pós-neonatal – óbitos ocorridos no período que vai do 
28º dia de vida até o 12º mês, antes de a criança completar 1 ano de idade, 
também chamada de mortalidade tardia. 
 
 
 
12 
Vale salientar que a taxa de mortalidade infantil também pode ser 
separada em neonatal e pós-neonatal. Por fim, é comum observarmos que, 
à medida que ocorre o desenvolvimento social e econômico, a taxa de 
mortalidade infantil diminui. 
 
 
Letalidade 
A letalidade é entendida como o maior ou menor poder que uma doença 
tem de provocar a morte. Pode ser calculada pela relação entre os óbitos 
causados por um evento e o número de pessoas que foram acometidos 
pela doença. 
 
 
 
 
13 
Surto 
Surto é a ocorrência de dois ou mais casos epidemiologicamente 
relacionados. Alguns autores entendem o surto como a ocorrência de um 
fenômeno restrito a um espaço extremamente delimitado, como quartel, 
creche, festa. 
Epidemia 
Epidemia é a ocorrência, em uma comunidade ou região, de casos 
de natureza semelhante, claramente excessiva em relação ao esperado. O 
conceito usado na epidemiologia diz que a epidemia é uma alteração, 
espacial e cronologicamente delimitada, do estado de saúde-doença de 
uma população, caracterizada pela elevação inesperada e descontrolada 
dos coeficientes de incidência de uma determinada doença. 
Pandemia 
A pandemia é caracterizada como uma epidemia de larga 
distribuição geográfica, atingindo mais de um país ou continente. 
Endemia 
Uma doença é considerada endêmica quando acontece com muita 
frequência em um mesmo local. Tem duração contínua e restrita a uma 
determinada área. 
 
 
14 
EXEMPLOS DE APLICAÇÕES 
 
Questão 1. Numa determinada comunidade, a letalidade do sarampo foi de 10% no ano de 2014. 
Durante esse ano, ocorreram 50 óbitos da doença. A partir destas informações, qual o número 
de casos de sarampo nessa comunidade no ano de 2014? 
 
(a) 5 (b) 25 (c) 50 (d) 250 (e) 500 
 
Questão 2. Em um determinado município com uma população de 1.200.000 de habitantes, 
foram notificados 600 casos de meningite, dos quais 120 mortes foram confirmadas, causadas 
pela doença. Qual foi o percentual de letalidade da doença neste caso? 
 
(a) 20% (b) 0,5% (c) 2% (d) 0,02% (e)5% 
 
Questão 3. Em um estado brasileiro, dois municípios vizinhos apresentam os seguintes dados 
populacionais: cidade A com 30.000 habitantes e a cidade B com 100.000habitantes. Em ambas 
as cidades foram registrados 252 casos de hepatite A, no mês de março. Ao avaliar esta 
situação, o coeficiente de morbidade dessas cidades em relação a hepatite A é: 
 
(a) Maior na cidade B (b) Igual nas duas cidades (c) Menor na cidade A 
(b) (d) Menor na cidade B (e) Não é possível determinar 
 
Questão 4. No município X, no ano de 2014, foram diagnosticados 30 casos novos de 
tuberculose. Além destes, 10 casos de tuberculose diagnosticados em 2013 ainda se 
encontravam em tratamento em 2014. Ao final de 2014, constatou-se que entre estes 40 casos 
de tuberculose ocorreram 2 óbitos. A população do município X em 2014 era de 100.000 
habitantes. Qual foi a incidência de tuberculose no município X em 2014? 
 
(a) 4 por 10.000 hab. (b) 2 por 10.000 hab. (c) 1 por 10.000 hab. (d) 3 por 10.000 hab. 
 
 
15 
Qual foi a prevalência de tuberculose no município X em 2014? 
(a) 4 por 10.000 hab. (b) 2 por 10.000 hab. (c) 1 por 10.000 hab. (d) 3 por 10.000 hab. 
 
Qual foi o coeficiente de letalidade da tuberculose no município X em 2014? 
(a) 2. (b) 5% (c) 0,2 por 10.000 habitantes. (d) 6,7% 
 
RECAPITULANDO 
Neste capítulo tratamos sobre os principais conceitos e definições de 
epidemiologia, apontando para a definição aceita nos dias de hoje. 
Concebemos epidemiologia como uma ciência que estuda as doenças em 
grupos populacionais. 
Logo após contamos um pouco da história da epidemiologia, com o 
objetivo de entender como ocorreu a construção da definição que é aceita 
atualmente. Apontamos, também, para sua aplicabilidade. 
Destacamos o conceito de causalidade. Hoje, entendemos que as 
doenças e enfermidades possuem modelos multicausais, onde existe uma 
cadeia de causas que devem ser estudadas e entendidas para promover a 
saúde. 
Por fim, apresentamos as principais medidas em saúde, destacando 
a incidência e a prevalência, mortalidade e letalidade. Finalizamos o 
capítulo definindo surto, epidemia e pandemia. 
 
 
 
16 
REFERÊNCIAS 
 
BUSATO, I. M. S.; Epidemiologia e processo saúde-doença. Curitiba: 
InterSaberes, 2016. 
FRANCO, L. J.; PASSOS, A. D. C.; Fundamentos de Epidemiologia. 
Barueri: Manole, 2011. 
MEDRONHO, R.A.; BLOCH, K.V.; LUIZ, R.R.; WERNECK, G. L. 
Epidemiologia. São Paulo: Atheneu, 2008. 
TIETZMANN, D. Epidemiologia. São Paulo: Pearson Education do 
Brasil, 2014. 
 
 
 
 
 
 
 
 
 
 
 
17 
 
INTRODUÇÃO 
Neste nosso segundo capítulo, abordaremos os principais tipos de 
Estudos Epidemiológicos destacando as características de cada um, sua 
aplicabilidade e exemplos na área da saúde. 
 
Por que é importante para o profissional da área da saúde 
ter conhecimento a respeito dos estudos epidemiológicos? 
A evolução tecnológica, o avanço da ciência e as novas descobertas 
que diariamente ocorrem na área da saúde fazem com que seja 
indispensável ao profissional o domínio da linguagem relacionada às 
pesquisas da área. Um profissional atualizado necessita estar em contato 
com publicações específicas a sua atuação através da leitura de artigos, 
livros, laudos, relatórios de pesquisas, etc. Também destaca-se aqui o 
profissional que deseja realizar pesquisas em seu campo de atuação, neste 
 
 
18 
caso, a determinação da metodologia a ser utilizada deve estar alinhada 
aos objetivos do seu estudo. Neste contexto, uma das competências 
necessárias é o conhecimento dos tipos de estudos epidemiológicos mais 
importantes e suas características. 
Então convido a todos a conhecer um pouco mais sobre os ESTUDOS 
EPIDEMIOLÓGICOS! 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
19 
 
ESTUDOS EPIDEMIOLÓGICOS 
 
 O delineamento de um estudo é fundamental para o alcance dos 
objetivos a que este se propõe, por esta razão é muito importante que toda 
a pesquisa seja desenvolvida sob a luz de um projeto. 
 Neste projeto o pesquisador deve traçar sua metodologia e 
considerar todos os aspectos teóricos importantes para a condução de um 
estudo científico e com validade acadêmica. Neste contexto, o tipo de 
estudo a ser conduzido deve ser criteriosamente selecionado de acordo 
com as hipóteses e/ou proposições que se deseja verificar, observando-se 
que todos os tipos possuem vantagens e desvantagens em sua escolha. 
Os principais estudos epidemiológicos podem ser classificados em 
dois grandes grupos: Observacionais e Experimentais. 
ESTUDOS OBSERVACIONAIS 
Os estudos observacionais caracterizam-se pela NÃO intervenção do 
pesquisador, é muito comum utilizar este tipo de estudo para descrever 
temas de pesquisa ainda pouco conhecidos, sem hipóteses de pesquisa 
pré-definidas e sem a presença de associações entre variáveis. 
 Podem ser: descritivos, transversais, de coorte ou estudos de caso 
- DESCRITIVOS: como o nome já sugere, descrevem a ocorrência 
de uma doença/patologia específica em uma população de interesse. 
 
 
20 
Os estudos descritivos são indicados em situações em que se 
conhece muito pouco sobre a frequência, história natural ou 
determinantes de uma doença, podem utilizar dados secundários de 
grandes bases de pesquisa, dados rotineiros como prontuários, 
fichas de observação clínica, ou ainda dados coletados através de 
questionários. 
EXEMPLO 
- TRANSVERSAIS: também conhecidos por Estudos de Prevalência, 
uma vez que medem a prevalência de uma determinada doença de 
interesse, são importantes pois fornecem indicadores úteis para o 
entendimento de surtos epidêmicos. Neste tipo de pesquisa cada 
indivíduo é estudado em relação a ocorrência de uma determinada 
 
 
21 
doença em um determinado período de tempo pré-estabelecido. São 
estudos amplamente utilizados na área da saúde pois são de fácil 
condução e baixo custo. 
EXEMPLO 
 
- COORTE: Permite verificar a associação entre o fator de exposição 
e o desfecho, seguindo uma sequencia lógica temporal, sendo 
caracterizado por ser um estudo longitudinal. O estudo de coorte é 
um estudo de incidência, com isso, os indivíduos investigados não 
apresentam o desfecho de interesse no momento em que a 
investigação começa. 
 
 
22 
O estudo de coorte pode ser considerado o delineamento mais 
adequado para avaliar o risco de ocorrência de uma doença em função da 
exposição a um determinado fator. Estes tipos de 
estudo devem ser utilizados para 
casos em que se deseja: 
 
 
Os estudos de coorte podem ser de dois tipos: 
a) Coorte Prospectivo: neste estudo o investigador monta 
os grupos de estudo no tempo presente, coleta os dados 
iniciais de um período base deles e continua a coletar os dados 
com o passar do tempo. Suas características são: 
Identificar a incidência de determinada doença de interesse
Verificar fatores relacionados à ocorrência desta doença
Observar fatores que possuem associação em relação à 
evolução desta doença 
Acompanhar a sobrevida associada à doença
 
 
23 
 
EXEMPLO: 
 
A investigação deve iniciar ANTES da 
ocorrência da doença
Deve-se certificar que a exposição 
ocorre ANTES do efeito (desfexo)
Configura-se como um estudo de longa 
duração, com isso pode ser oneroso e ter 
perdas de casos 
 
 
24 
b) Coorte Retrospectivo: neste estudo o investigador volta 
para trás na história para definir um grupo de risco (ex. aqueles 
que foram expostos à bomba atômica de Hiroshima, em agosto 
de 1945) e segue os membros do grupoaté o presente para 
ver o desfecho ocorrido. Suas características são: 
 
EXEMPLO: 
A investigação deve iniciar APÓS da 
ocorrência da doença
É necessário o acesso a registros e 
informações sobre o indivíduo investigado 
(fichas, prontuários)
Determina-se um grupo de interesse formado 
no passado com continuidade até o presente
 
 
25 
- ESTUDOS CASO–CONTROLE: neste tipo de estudo os grupos de 
participantes são selecionados a partir de casos observados de uma 
doença de interesse e os controles são estabelecidos a partir de 
determinados critérios (são oriundos do mesmo universo 
estabelecido para o grupo de casos, porém não possuem/ não 
desenvolveram a doença/patologia de interesse). Os grupos são 
comparados quanto a frequência da exposição entre os casos 
(doentes) e controles (não doentes). 
 
“O aspecto central desse tipo de desenho é a comparação entre 
dois grupos com base na frequência da exposição ao(s) fator(es) 
de risco de interesse. A principal vantagem é a possibilidade de se 
investigar doenças mais raras, com longo período de indução ou 
de latência, sem a necessidade de acompanhamento de uma 
grande população, por um longo período para verificar a ocorrência 
da doença. Para algumas doenças que ocorrem mais raramente, 
seria inviável acompanhar os indivíduos por vários anos ou 
décadas, até que a doença ocorra.” (Rêgo, 2010) 
 
Por exemplo, uma determinada pesquisa verificou que o risco de 
desenvolver câncer de pulmão é duas vezes maior em indivíduos 
fumantes do que em não fumantes. Neste exemplo poderíamos 
determinar em uma pesquisa com fumantes que o Grupo caso são 
indivíduos com câncer de pulmão e o Grupo controle indivíduos que 
não desenvolveram câncer de pulmão. Aqui é importante que os 
grupos caso e controle sejam pareados de acordo com algumas 
variáveis como idade, sexo, raça e histórico familiar de câncer. 
 
 
26 
 
 
 
 
 
 
 
Genericamente poderíamos representar desta forma: 
 
 
 
 
 
 
 
 
 
 
Indivíduos 
investigados
Grupo Caso:
Com câncer de 
Pulmão
Fumantes 
Não fumantes
Grupo Controle:
Sem câncer de 
pulmão
Fumantes
Não fumantes
Indivíduos 
investigados
Grupo Caso:
Doentes
Expostos 
Não expostos
Grupo Controle:
Sadios
Expostos
Não expostos
 
 
27 
Estudos de Caso-controle viabilizam ao pesquisador a análise 
simultânea de vários fatores de exposição que possivelmente 
estariam associados a doença investigada, são indicados no estudo 
de doenças raras e considerados mais ágeis e menos onerosos do 
que estudos de Coorte. 
 
EXEMPLO: 
 
 
28 
 
ESTUDOS EXPERIMENTAIS 
 
Os estudos experimentais também são conhecidos por estudos de 
intervenção, uma vez que o pesquisador tem participação ativa na 
determinação de estratégias de ação com vistas a interferir no estudo 
de forma sistemática e controlada. Neste tipo de estudo epidemiológico é 
possível testar hipóteses pré-determinadas, isolar efeitos de interesse, 
exercer controle em relação a fatores externos e comparar a eficácia entre 
tratamentos, medicações, métodos em uma doença de interesse. 
Os resultados obtidos com estudos experimentais podem conduzir a 
conclusões como o estabelecimento de um novo tratamento para uma 
lesão na coluna, a diminuição do tempo de internação através de um novo 
protocolo de atendimento, a redução dos casos de violência doméstica 
através do estabelecimento de ações comunitárias de conscientização, etc. 
 Questões éticas são de extrema importância na condução de 
pesquisas experimentais, uma vez que pacientes/indivíduos serão 
submetidos a algum tipo de intervenção, com isso, o consentimento 
informado por parte dos participantes é de suma importância. 
 
 
 
 
29 
Poderíamos apresentar um delineamento experimental através do 
seguinte esquema: 
 
 
 
Os estudos experimentais podem ser de dois tipos: Ensaio Clínico 
randomizado ou Ensaio Clínico não randomizado. 
- ENSAIO CLÍNICO RANDOMIZADO (ECR): Os participantes 
devem ter a mesma oportunidade de receber, ou não, a intervenção 
proposta e esses grupos devem ser os mais parecidos possíveis, de 
forma que a única diferença entre eles seja a intervenção em si, 
podendo-se, assim, avaliar o impacto na ocorrência do desfecho em 
um grupo sobre o outro. A seleção dos indivíduos participantes, bem 
como a divisão dos grupos Controle e Experimental deve ser feita 
de forma aleatória. É o padrão de excelência em estudos 
 
 
Pacientes/Indivíduos 
selecionados 
Método Convencional
Placebo
Evento ocorre
Evento não ocorre
Método Experimental
Evento ocorre
Evento não ocorre
 
 
30 
EXEMPLO: 
 -ENSAIO CLÍNICO NÃO RANDOMIZADO (ECNR): Neste tipo de 
estudo há um grupo experimental e um grupo controle, mas a designação 
dos participantes para cada grupo não se dá de forma aleatória, como no 
Ensaio Clínico não randomizado, mas conveniência do pesquisador. 
 
 
 
 
 
 
31 
 
OUTROS ESTUDOS: ECOLÓGICOS 
A unidade de análise é uma população ou um grupo de pessoas que 
geralmente pertencem a uma área geográfica definida (cidade, Estado, 
Região, etc.). São utilizados com o objetivo de avaliar como o contexto 
social e ambiental podem afetar a saúde em grupos populacionais, 
avaliando a ocorrência de uma determinada doença e a efetividade de 
intervenções, por exemplo, de políticas públicas de saúde na população de 
estudo. 
Possuem um baixo custo de execução, os resultados obtidos 
permitem uma análise macro, é inviável aqui termos resultados a nível 
individual de pacientes. 
EXEMPLO: 
 
 
32 
 
REFERÊNCIAS BIBLIOGRÁFICAS 
Ayres J.R.D.C.M. Sobre o risco: paara compreender a epidemiologia. São 
Paulo: HUCITEC - Humanismo, Ciência e Tecnologia; 1997. 
ROBERTO, A. M.. Medronho, RA et al. (eds). Epidemiologia. São Paulo: 
Atheneu, 2002 
RÊGO, MAV. Estudos caso estudos caso-controle: uma breve revisão. Gaz 
Méd Bahia 2010. 
Rocha, H. A. L., Carvalho, E. R., & Correia, L. L. ([s.d.]). Conceitos Básicos 
em Epidemiologia e Bioestatística. Fortaleza: Faculdade de Medicina - 
Universidade Federal do Ceará. Consultado em 20 de janeiro de 2019 
http://www.epidemio.ufc.br/files/ConceitosBasicosemEpidemiologiae 
Bioestatistica.pdf 
 
 
33 
NESTE CAPÍTULO VOCÊ IRÁ 
APRENDER: 
● Pesquisar, conhecer, compreender, analisar e avaliar a realidade 
social, nos diferentes cenários do mundo do trabalho e em todos os 
níveis de atenção à saúde. 
• Conhecer, desenvolver e aplicar métodos e técnicas de investigação 
e elaboração de trabalhos acadêmicos e científicos que permitam a 
busca de novos conhecimentos e tecnologias, com o propósito de 
contínua atualização para o exercício profissional de excelência. 
 
 
 
 
 
 
 
 
 
 
 
34 
 
INTRODUÇÃO 
Existe um consenso por parte dos estudiosos de várias áreas que há uma 
grande demanda na sociedade atual por um cidadão que compreenda 
estatística, que seja capaz de consumir e pensar criticamente sobre as 
informações diárias que recebe, exercendo boas decisões baseadas 
nestas informações. 
Há uma concordância geral na concepção de que o estudo de 
estatística merece um extenso estudo devido à relevância para a sociedade 
contemporânea de atividades de coletar, representar e processar dados, 
este fato pode ser considerado como uma consequência do crescimento 
do uso de métodos estatísticos na realização de predições. 
A Estatística hoje se configura como uma das ciências que mais vem 
crescendo em termos de utilização e importância. Diariamente somos“soterrados” por informações estatísticas: são estatísticas da saúde, 
estatísticas da segurança, estatísticas da educação, etc., não há como 
qualquer cidadão fugir de tanta informação. A quantidade enorme de dados 
é o que caracteriza o mundo atual, cada vez mais necessitamos de 
informações, saber como obtê-las e como entendê-las é fundamental para 
qualquer indivíduo, pois este deve ser capaz de fazer uma análise crítica 
dos dados possibilitando uma tomada de decisões mais consciente. 
A relevância e as justificativas para o estudo da estatística são 
inúmeras, o que agora, neste momento, entra em debate são as questões 
referentes as quais habilidades e competências estatísticas que devem ser 
 
 
35 
trabalhadas com os alunos. Esta competência estatística se refere ao 
conhecimento básico do raciocínio e do propósito da estatística. Um 
cidadão "estatisticamente competente" seria aquele que possui a 
habilidade para interagir como uma pessoa "educada" na atual era da 
informação. Esta competência estatística pode também ser definida 
como a habilidade para compreender e avaliar criticamente resultados 
estatísticos que permeiam nossas vidas diárias – junto à habilidade 
para reconhecer a contribuição que o pensamento estatístico pode 
trazer para as decisões públicas e privadas, profissionais e pessoais. 
 
 
 
 
 
 
 
36 
Conceitos Básicos de Estatística 
Sempre que falamos em Estatística estamos inseridos no contexto de uma 
pesquisa. As pesquisas podem ser classificadas em duas grandes 
abordagens: qualitativa e quantitativa. 
Uma pesquisa é composta por quatro etapas distintas. Destas etapas nas 
três últimas (planejamento, execução e comunicação dos resultados) a 
estatística surge como uma importante ferramenta de suporte para o 
pesquisador. 
Na etapa Planejamento da pesquisa, a estatística tem importante 
participação na determinação do tamanho da amostra a ser estudada, na 
escolha do procedimento/processo de amostragem que deve ser utilizado 
para a coleta de dados, bem como na elaboração do instrumento de coleta 
e no estabelecimento do tipo de variáveis a serem pesquisadas. 
 No momento da Execução da pesquisa, a estatística é 
imprescindível, pois fornece as ferramentas necessárias para a análise dos 
dados e para a obtenção de conclusões sobre o objeto de estudo. 
 Na Comunicação dos resultados, a estatística auxilia a construção 
de tabelas e gráficos facilitando a apresentação dos principais resultados 
obtidos. 
Todas estas etapas são importantes de serem realizadas e fazem 
parte da elaboração de uma pesquisa científica que procure ser o mais 
fidedigna possível. O conhecimento destas etapas também é importante 
para o julgamento da adequação de pesquisas realizadas por terceiros, ou 
 
 
37 
seja, quando nos é apresentado oralmente ou através de artigos resultados 
de uma pesquisa precisamos ter um conhecimento mínimo do processo 
científico para que sejamos capazes de criticar e entender os resultados 
obtidos. 
O que é estatística? 
A palavra estatística surge da expressão em Latim statisticum collegium 
palestra sobre os assuntos do Estado, de onde surgiu a palavra em língua 
italiana statista, que significa "homem de estado", ou político, e a palavra 
alemã Statistik, designando a análise de dados sobre o Estado. A palavra 
adquiriu um significado de coleta e classificação de dados, no início do 
século 19. 
Atualmente a estatística é entendida como uma ciência que estuda e 
pesquisa sobre: o levantamento de dados com a máxima quantidade de 
informação possível para um dado custo; o processamento de dados para 
a quantificação de incertezas; tomada de decisões sob condições incertas, 
utilizando o menor risco possível. A estatística tem sido utilizada para a 
pesquisa científica, para otimização de recursos econômicos, para a 
melhoria na qualidade e na produtividade, para a otimização de tomada e 
análise de decisões, em questões judiciais e para previsões. 
Estatística Descritiva e Inferencial 
A Estatística, pode ser dividida em duas áreas: Descritiva e Inferencial. A 
área descritiva é mais simples, contemplando ferramentas de organização 
 
 
38 
de dados e síntese de informação. A área Inferencial, por sua vez, permite 
ao pesquisador projetar resultados amostrais para populações, bem como 
testar hipóteses concernentes a parâmetros populacionais. Inferência 
estatística é o processo pelo qual estatísticos tiram conclusões acerca da 
população usando informação de uma amostra. A Estatística Inferencial 
está baseada em dois pilares fundamentais: a Amostragem e a 
Probabilidade. 
População e Amostra 
Uma população é o conjunto de elementos de interesse em um 
determinado estudo, que podem ser pessoas ou resultados experimentais, 
com uma ou mais características comuns. 
Uma amostra é um subconjunto da população, usada para obter 
informação acerca do todo. Obtemos uma amostra para fazer inferências 
de uma população. No entanto, as inferências só são válidas quando a 
amostra representa a população. 
A Variável 
Uma variável é uma característica de uma população que difere de um 
indivíduo para o outro e do qual temos interesse em estudar. Cada unidade 
(membro) da população que é escolhido como parte de uma amostra 
fornece uma medida de uma ou mais variáveis, chamadas observações. 
As variáveis podem ser classificadas como quantitativas e qualitativas. 
 
 
39 
Variáveis Quantitativas 
São aquelas que podem ser medidas em uma escala quantitativa, ou seja, 
apresentam valores numéricos/quantidades. Podem ser contínuas ou 
discretas. 
 
Variáveis Qualitativas 
São aquelas que não possuem valores quantitativos, mas, ao contrário, são 
definidas por várias categorias, ou seja, representam uma classificação dos 
indivíduos. Podem ser nominais ou ordinais. 
 
 
 
 
40 
Estatística Descritiva 
Tabelas de Frequência 
Tabelas de frequência e gráficos estatísticos são encontrados em jornais, 
relatórios técnicos, monografias, dissertações, teses e revistas científicas. 
As tabelas de frequência simples apresentam de forma concisa o número 
de ocorrências (absoluta e relativa) dos valores de uma variável. 
A tabela de frequência é uma forma de representação de frequência de 
cada valor distinto da variável. Elas resumem a informação contida na 
amostra, ordenando os seus valores e agrupando-os em classes de valores 
repetidos ou valores distribuídos por intervalos. 
Exemplo: 
Tabela 1. Distribuição de frequências das raças de gatos atendidos na clínica em 
setembro/2018 
Raça Frequência % 
Abissínio 15 18,3 
Persa 25 30,5 
Himalaio 10 12,2 
Siamês 32 39,0 
Total 82 100 
 
 
 
 
 
41 
Elementos que compõe a tabela: 
1. Título – deve apresentar a informação contida na tabela 
Tabela 1. Distribuição de frequências das raças de gatos atendidos na clínica em 
setembro/2018 
2. Cabeçalho – indica o que cada coluna da tabela representa 
Raça Frequência % 
3. A tabela de frequência possui três colunas: 
A primeira corresponde à variável de pesquisa 
Raça 
Abissínio 
Persa 
Himalaio 
Siamês 
Total 
A segunda corresponde ao número de vezes que cada valor ou 
categoria da variável se repetiu 
Frequência 
15 
25 
10 
32 
82 
A terceira é o valor relativo da frequência, ou seja, o percentual 
% 
18,3 
30,5 
12,2 
39,0 
100 
 
 
42 
Para calcular o percentual podemos utilizar o seguinte procedimento 
% =
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑔𝑎𝑡𝑜𝑠 𝑑𝑎 𝑟𝑎ç𝑎 𝑒𝑠𝑝𝑒𝑐í𝑓𝑖𝑐𝑎 (𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎)
𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑔𝑎𝑡𝑜𝑠 𝑖𝑛𝑣𝑒𝑠𝑡𝑖𝑔𝑎𝑑𝑜𝑠 (𝑎𝑚𝑜𝑠𝑡𝑟𝑎)
∗ 100Exemplo: Vamos calcular o percentual de gatos da raça Siamês 
%𝑆𝑖𝑎𝑚ê𝑠 =
32
82
∗ 100 
Portanto 
%𝑆𝑖𝑎𝑚ê𝑠 = 0,39 ∗ 100 
Logo, 
%𝑆𝑖𝑎𝑚ê𝑠 = 39,0% 
Medidas Estatísticas 
A análise descritiva dos dados tem por objetivo a descrição dos resultados 
de uma pesquisa através de tabelas, gráficos e cálculos de algumas 
medidas estatísticas. 
Medidas de Tendência Central 
São indicadores que permitem que se tenha uma primeira ideia, um 
resumo, de como se distribuem os dados de um determinado experimento. 
Estas medidas são consideradas formas úteis de descrever um grupo como 
 
 
43 
um todo encontrando um único número que represente o conjunto de 
dados. As medidas de tendência central são: média, mediana e moda. 
Média 
A média aritmética é representada por �̅� na amostra ou por 𝜇 na população. 
É uma medida de localização do centro da amostra, e obtém-se a partir da 
soma de um conjunto de valores, dividida pelo número de valores 
considerados conforme a seguinte expressão: 
�̅� =
∑ 𝑥
𝑛
 
Exemplo: 
Assim como com os seres humanos, os animais precisam de toda uma 
preparação durante a gravidez. É necessário saber quanto tempo dura, 
como agir durante o processo e o que vai acontecer depois do nascimento. 
Neste contexto, uma pesquisa foi realizada com uma amostra de 10 gatos 
da raça Ragdoll com o objetivo de verificar o tempo de gestação (em dias). 
Os dados observados foram: 
60 60 65 65 65 65 70 70 65 62 
Amostra: 10 gatos da raça Ragdoll 
Variável: tempo de gestação (em dias) 
Média: 
�̅� =
60 + 60 + 65 + 65 + 65 + 65 + 70 + 70 + 65 + 62
10
 
 
 
44 
�̅� =
647
10
 
�̅� = 64,7 
O tempo médio de gestação foi de 64,7 dias 
Mediana (Md) 
Ordenados os elementos da amostra, a mediana é o valor que a divide ao 
meio, isto é, metade dos elementos da amostra são menores ou iguais a 
mediana e a outra metade é maior ou igual a mediana. 
Exemplo 1: Quando o tamanho da amostra é par 
Considere a quantidade de sódio (mg) em 9 marcas distintas de 1 litro de 
leite integral: 
90 92 95 90 95 94 90 90 91 
1º passo: Ordenar os dados em ordem crescente 
90 90 90 90 91 92 94 95 95 
2º passo: Encontrar a posição da mediana 
Como o tamanho da amostra é ímpar, o valor central estará na posição 
𝑛+1
2
, 
portanto, a posição da mediana será 
9+1
2
= 5ª posição 
3º passo: localizar a mediana 
90 90 90 90 91 92 94 95 95 
 
 
45 
Interpretação: metade das marcas de 1 litro de leite integral possuem 
menos que 91mg de sódio e metade, mas que 91mg de sódio. 
Exemplo 2: Quando o tamanho da amostra é par 
Considere a quantidade de sódio (mg) em 10 marcas distintas de 1 litro de 
leite integral: 
90 92 95 90 95 94 90 90 91 93 
1º Passo: Ordenar os dados em ordem crescente 
90 90 90 90 91 92 93 94 95 95 
2º Passo: Encontrar a posição da mediana 
Como o tamanho da amostra é par, o valor central está na posição 
𝑛
2
, 
portanto a posição da mediana será 
10
2
= 5ª posição 
3º Passo: Localizar a mediana: como “n” é par devemos localizar os dois 
valores centrais, ou seja, a 5ª e a 6ª posição: 
90 90 90 90 91 92 93 94 95 95 
Sendo assim, a mediana será 
𝑀𝑑 =
91 + 92
2
 
𝑀𝑑 = 91,5 𝑚𝑔 
 
 
46 
Moda 
A moda é o valor que ocorre com maior frequência num conjunto de dados, 
ou seja, o valor mais comum. 
Exemplo: Considere as notas finais em Estatística de 10 alunos: 
8 7 6 8 7 2 5 7 7 7 
Interpretação: a nota em Estatística que ocorreu com maior frequência foi 
de 7 pontos. 
Medidas de Variabilidade ou Dispersão 
São medidas da variação de um conjunto de dados em torno da média, ou 
seja, da maior ou menor variabilidade dos resultados obtidos. Elas 
permitem se identificar até que ponto os resultados se concentram ou não 
ao redor da tendência central de um conjunto de observações. 
A média é extremamente útil como uma medida que objetiva 
representar/resumir um conjunto de dados, mas também é imprescindível 
ao pesquisador ter conhecimento da variação que ocorre em torno desta 
média. Para isso o cálculo das medidas de variabilidade contribui para uma 
melhor interpretação do comportamento de uma variável quantitativa (sua 
média e sua variação). 
 
 
47 
Variância 
A variância é representada na população pelo símbolo 𝜎2 e na amostra 
pelo símbolo 𝑠2. Quanto maior for a variação dos valores do conjunto de 
dados, maior será a variância. A variância de uma amostra é a média dos 
quadrados dos desvios dos valores em relação à média. 
𝑠2 =
∑(𝑥 − �̅�)2
𝑛 − 1
 
No cálculo da variância pode-se observar que a unidade da variável 
estudada é levada ao quadrado, dificultando assim, a interpretação de seu 
resultado final. A solução para este problema é extrair a raiz quadrada da 
variância, permitindo assim que se volte à unidade original da variável. 
Essa nova medida (a raiz quadrada da variância) é chamada de desvio-
padrão 
Desvio-padrão 
O desvio-padrão é a raiz quadrada da variância. Esta medida expressa a 
variação média do conjunto de dados em torno da média, para mais ou 
para menos. 
𝑠 = √
∑(𝑥 − �̅�)2
𝑛 − 1
 
Exemplo: os dados abaixo se referem à quantidade de pessoas que 
apresentaram uma determinada virose e foram diagnosticados em uma 
amostra de 5 dias em um hospital 
 
 
48 
8 10 5 8 8 
Amostra: 5 dias 
Variável: quantidade de pessoas que apresentaram uma determinada 
virose 
Média: �̅� =
8+10+5+8+8
5
= 7,8 𝑝𝑒𝑠𝑠𝑜𝑎𝑠 
Interpretação: em média são diagnosticados ao dia 7,8 pessoas com essa 
virose 
Desvio-padrão: 𝑠 = √
(8−7,8)2+(10−7,8)2+(5−7,8)2+(8−7,8)2+(8−7,8)2
5−1
 
sendo assim, 
𝑠 = √
(0,2)2 + (2,2)2 + (−2,8)2 + (0,2)2 + (0,2)2
4
 
portanto, 
𝑠 = √
0,04 + 4,84 + 7,84 + 0,04 + 0,04
4
 
logo, 
𝑠 = √
12,8
4
= √3,2 = 1,8 𝑝𝑒𝑠𝑠𝑜𝑎𝑠 
Interpretação: existe uma variação em torno da média de 1,8 pessoas 
 
 
49 
Coeficiente de Variação (CV) 
O CV é a razão entre o desvio-padrão e a média de um conjunto de dados. 
Ele expressa a variação relativa (%) presente no conjunto de dados em 
relação à média. 
𝐶𝑉 =
𝑠
�̅�
∗ 100 
Quanto maior o CV, mais heterogêneos são os dados. 
Exemplo: 𝐶𝑉 =
1,8
7,8
∗ 100 = 23,1% 
 
RECAPITULANDO 
Neste capítulo aprendemos sobre os conceitos básicos de estatística, 
diferenciando a parte descritiva da inferencial. Apontamos, também, as 
diferenças entre variáveis quantitativas e qualitativas. 
Aprendemos a organizar os dados em tabelas de frequência, com o 
objetivo de proporcionar uma apresentação mais adequada dos mesmos. 
Estudamos as medidas de tendência central (média, mediana e moda) e 
as medidas de variabilidade (variância, desvio-padrão e coeficiente de 
variação). 
 
 
 
 
50 
REFERÊNCIAS 
 
CASSENOTE, A.J.F. Principais temas em Epidemiologia para 
residência médica. São Paulo: Medcel, 2012. 
FRANCO, L. J.; PASSOS, A. D. C.; Fundamentos de Epidemiologia. 
Barueri: Manole, 2011. 
MEDRONHO, R.A.; BLOCH, K.V.; LUIZ, R.R.; WERNECK, G. L. 
Epidemiologia. São Paulo: Atheneu, 2008. 
 
 
 
 
 
 
 
 
 
 
 
 
51 
NESTE CAPÍTULO 
VOCÊ IRÁ 
APRENDER: 
 
● Conhecer os principais métodos de Amostragem. 
• Realizar Estimativas intervalares para uma proporção e para uma 
média. 
 
 
 
 
 
 
 
 
 
 
 
52 
 
INTRODUÇÃO 
 Frequentemente precisamos obter conclusões para um conjunto de 
elementos (população) observando apenas uma parcela deste conjunto 
(amostra). Este processo é chamado de inferência estatística. É importante 
termos a consciênciade que a possibilidade de erro é inerente ao processo 
de inferência. 
A preocupação fundamental para minimizar o risco de errar ao tomar uma 
decisão é com a forma de seleção da amostra. O critério a ser utilizado na 
seleção de elementos deve ser muito cuidadoso, para que possamos tomar 
nossas decisões com níveis de segurança aceitáveis. 
Amostragem 
A seguir, algumas das principais técnicas de amostragem. 
Amostragem Probabilística 
É a designação dada a todos os métodos de amostragem que envolvem 
seleção aleatória dos elementos, atribuindo a cada elemento da população 
uma probabilidade de pertencer à amostra. Podemos destacar as 
seguintes técnicas de amostragem probabilística: 
 
 
53 
Amostra Aleatória Simples 
Equivale ao sorteio lotérico, em que todos os elementos da população têm 
iguais probabilidades de pertencer à amostra e todas as possíveis 
amostras têm iguais probabilidades de ocorrer. 
Amostra Aleatória Sistemática 
Consiste numa variação da amostra aleatória simples, que tem por objetivo 
facilitar a obtenção da amostra. Ela é feita, selecionando-se elementos em 
intervalos regulares (a cada dez ou vinte, por exemplo), partindo de um 
cadastro previamente organizado de acordo com um critério que não tenha 
relação com a variável de interesse. 
Amostra Aleatória Estratificada 
É indicada nos casos em que a população é muito heterogênea, ou seja, 
os elementos possuem características muito distintas entre si, e isto 
interfere no fenômeno que desejamos investigar. Consiste em dividir a 
população em grupos (estratos) de tal forma que, dentro de cada estrato, 
os elementos sejam semelhantes e as diferenças ocorram entre os grupos. 
Em cada um desses grupos, é selecionada uma amostra (aleatória simples 
ou sistemática). Através deste processo, garantimos que as diferentes 
características da população serão representadas na amostra. 
 
 
54 
Amostra Aleatória por Conglomerados 
Este tipo de amostragem também trabalha com grupos, mas, ao contrário 
da estratificada, aqui os grupos já estão naturalmente formados, não por 
afinidade, mas por proximidade física. Dentro de cada grupo 
(conglomerado), podemos encontrar as mesmas diferenças que 
encontraríamos na população como um todo. A técnica consiste em sortear 
alguns grupos e, dentro deles, sortear alguns elementos para participar da 
pesquisa ou até mesmo investigar todos os elementos do grupo. 
A amostra aleatória por Conglomerados é bastante comum em pesquisas 
domiciliares, quando o fenômeno a ser investigado não está relacionado 
com a classe social. Os conglomerados corresponderiam aos diferentes 
quarteirões de um município. Aí são sorteados alguns quarteirões e, dentro 
deles, é feito o estudo. O objetivo desta técnica é minimizar o custo e o 
tempo despendido na coleta de dados. 
 Amostragem Não Probabilística 
É o termo utilizado para designar todas as técnicas de seleção amostral 
que não envolvem mecanismos aleatórios, ou sorteios. Estas amostragens 
são extremamente comuns em pesquisas de opinião. Podemos citar 
algumas técnicas não probabilísticas. 
 
 
 
 
55 
Amostra por Conveniência ou Acidental 
O pesquisador escolhe, de acordo com a sua conveniência, os elementos 
que serão investigados. Normalmente, a decisão do pesquisador 
fundamenta-se em um conhecimento profundo que ele tenha da 
população, de tal forma que ele possa definir quais elementos representam 
melhor esta população. 
Amostra por Cotas 
Tem como objetivo obter uma amostra que tenha características similares 
às da população. Para fazer isto, o pesquisador deve ter um bom 
conhecimento sobre a distribuição da população com relação a algumas 
características que podem interferir no seu estudo, por exemplo, qual o 
percentual da população com determinada faixa etária ou de determinada 
classe social. Então, ele vai selecionando elementos para compor sua 
amostra, até atingir aquele percentual. Este é o método não probabilístico 
que se aproxima da técnica probabilística de amostragem estratificada, 
tendo como diferença a inexistência de um sorteio prévio dos elementos a 
serem pesquisados. 
Amostra de Voluntários 
Os elementos da população são informados sobre a realização da 
pesquisa e decidem fazer parte ou não do estudo. Na área da saúde este 
tipo de amostragem é muito utilizado, principalmente para testes de 
 
 
56 
medicações ou de vacinas. Também vemos este tipo de amostragem nas 
pesquisas interativas, muito comuns em programas de debate, nos quais 
somos convidados a expressar nossa opinião sobre determinado assunto. 
As técnicas de Inferência Estatística que iremos estudar partem do 
pressuposto de que a amostra foi selecionada de forma aleatória 
simples. Se tiver sido utilizada alguma outra técnica de amostragem 
probabilística, não há problemas com relação a este pressuposto, pois as 
técnicas de amostragem sistemática ou por conglomerados produzem, sob 
condições gerais, resultados equivalentes a uma aleatória simples, 
enquanto que a amostragem estratificada produz melhores resultados. 
O problema ocorre quando a amostra for não probabilística, o que é 
bastante comum, na prática. Quando isto ocorre, teoricamente falando, não 
poderíamos aplicar técnicas de inferência estatística. Este procedimento 
acabaria inviabilizando o uso da Estatística em muitas áreas do 
conhecimento, pois muitas vezes é inviável ou mesmo impossível aplicar 
alguma técnica probabilística. Nestas situações, o que se recomenda é 
um extremo cuidado ao fazer generalizações, respeitando sempre as 
limitações do estudo, extrapolando os resultados apenas para elementos 
que tenham características semelhantes àqueles que foram estudados. 
 
 
 
 
 
 
57 
Estimação 
Primeiro precisamos entender dois conceitos: 
PARÂMETRO: Medida que caracteriza uma população (ex: média, desvio-
padrão, proporção de elementos com uma característica, ...). 
 
ESTATÍSTICA OU ESTIMADOR: Medida que caracteriza uma amostra 
(ex: média, desvio-padrão, proporção de elementos com uma 
característica, ...). 
A partir destes conceitos, percebe-se que um parâmetro é uma constante, 
ou seja, possui um valor fixo (mesmo que ele seja desconhecido), enquanto 
que uma estatística é uma variável, pois depende de qual será a amostra 
selecionada. 
Estimar é fazer uma previsão ou uma projeção. É fornecer um valor para 
um parâmetro desconhecido. A estimação pode ser: 
 
Por ponto
• Fornece um único valor como estimativa para o parâmetro
Por intervalo
• Fornece um intervalo de valores no qual se acredita que esteja 
contido o parâmetro.
 
 
58 
Intervalo de Confiança 
Consiste em construir um intervalo em torno da estimativa por ponto, 
usando uma margem de erro. 
Conceitos Associados 
Nível de Confiança (1-α) 
É a probabilidade de que o intervalo realmente contenha o valor do 
parâmetro. Deve ser fixado pelo pesquisador. Os valores que são usados 
com maior frequência são 90%, 95% e 99%. 
Nível de Significância (α) 
É o complementar do nível de confiança, correspondendo a probabilidade 
de erro ao se fazer uma estimação. 
Erro Absoluto de Estimação (ε) 
É a margem de erro do intervalo. Corresponde à distância máxima que se 
admite, a um dado nível de confiança, entre o valor do parâmetro 
(desconhecido) e a estimativa obtida a partir da amostra. O erro de 
estimação pode ser fixado pelo pesquisador. Para tanto, ele deverá 
planejar cuidadosamente o seu estudo, determinando o tamanho de 
 
 
59 
amostra que será necessário para obter esta margem de erro. Quando isto 
não é feito, ele pode ser calculado a partir da amostra coletadae seu valor 
dependerá: do tamanho da amostra, do nível de confiança desejado e da 
variabilidade da população. 
Intervalo de Confiança para 
Proporção 
Para que este intervalo seja construído é necessário trabalharmos com 
uma amostra relativamente grande (n>30). 
O intervalo deve ser construído da forma: [𝑝 ± 𝜀] 
Onde: 
𝜀 = 𝑧. √
𝑝. (1 − 𝑝)
𝑛
 
Os valores de 𝑧 (normal padrão) mais utilizados são: 
Z 0,05 = 1,645 (para 90% de confiança) 
Z 0,025 = 1,96 (para 95% de confiança) 
Z 0,005 = 2,576 (para 99% de confiança 
Exemplo: 
 
 
60 
Uma pesquisa foi realizada com uma amostra de 400 crianças 
residentes em uma determinada região do município de Porto 
Alegre, destas 48 já tiveram catapora. Construa um Intervalo 
de Confiança 95% para o verdadeiro percentual de crianças 
com catapora. 
População: é formada por todas as crianças de uma 
determinada região de Porto Alegre. 
Amostra: é composta pelas 400 crianças que foram pesquisadas. 
Variável: presença ou ausência de catapora, que é uma variável qualitativa 
Parâmetro a ser estimado: incidência de catapora na população, ou seja, 
o percentual de crianças da população que tiveram catapora. 
Calculando a respectiva incidência na amostra, obtemos 𝑝 =
48
400
= 0,12 =
12%. Portanto, estimamos que 12% das crianças desta região já tiveram 
catapora. Esta é a estimativa por ponto. 
𝜀 = 1,96. √
0,12(1 − 0,12)
400
 
Logo, 
𝜀 = 1,96. √
0,1056
400
 
Portanto, 
 
 
61 
𝜀 = 1,96. √0,0003 
Sendo assim, 
𝜀 = 1,96.0,0162 = 0,032 
Ou seja, 
𝜀 = 3,2% 
Esta é a margem de erro desta pesquisa. Agora sabemos que está próximo 
de 12%, no máximo 3,2% de distância desse valor. 
Desta forma temos 
[12 − 3,2 𝑎𝑡é 12 + 3,2] logo, [8,8% 𝑎𝑡é 15,2%] 
Interpretação: podemos afirmar, com 95% de confiança, que entre 8,8% e 
15,2% das crianças desta região (população) já tiveram catapora. 
Neste exemplo, imaginamos que a pesquisa já havia sido realizada e 
estávamos apenas calculando a margem de erro resultante. O mais correto 
é fazer um planejamento prévio do estudo, determinando quantas pessoas 
deveriam ser pesquisadas, para que tivéssemos, a um determinado nível 
de confiança, uma margem de erro estabelecida. 
Nesta situação, precisamos calcular um tamanho de amostra que atenda a 
estas condições. Para fazer isto, necessitamos fixar um nível de confiança 
e uma margem de erro, além de ter uma estimativa da variabilidade 
populacional (por exemplo, através da proporção de uma amostra). 
 
 
62 
Vamos fazer isto no exemplo: Usaremos 99% de confiança, com uma 
margem de erro de 3,2 pontos percentuais, que foi aquela que encontramos 
quando trabalhamos com 95% de confiança. Imagine que já tenha sido feito 
um estudo inicial (estudo piloto), revelando que 12% das crianças 
pesquisados tiveram catapora. Para determinar o tamanho de amostra (n), 
trabalhamos algebricamente com as fórmulas da margem de erro, e 
chegamos à seguinte fórmula: 
𝑛 =
𝑧2. 𝑝. (1 − 𝑝)
𝜀2
 
Portanto, 
𝑛 =
2,582. 0,12. (1 − 0,12)
0,0322
 
Sendo assim, 
𝑛 = 686,44 
Isso significa que deveríamos pesquisar 687 crianças da comunidade. 
Intervalo de Confiança para uma 
Média 
Nos exemplos citados anteriormente estávamos trabalhando com variáveis 
qualitativas. Nestes casos, só podemos trabalhar com percentuais. Quando 
trabalhamos com variáveis quantitativas, no entanto, podemos fazer 
estimação de médias. 
 
 
63 
O intervalo de confiança para uma média populacional tem a forma: [�̅� ± 𝜀] 
Neste intervalo �̅� é a média amostral e ε a margem de erro da média 
amostral. 
Para calcularmos este erro é necessária a utilização da seguinte fórmula 
𝜀 = 𝑡.
𝑠
√𝑛
 
Onde 𝑡 é o valor obtido em uma tabela de distribuição 𝑡, com 𝑛 − 1 graus 
de liberdade, associado ao nível de confiança desejado. 
 
Exemplo: 
Considere uma amostra de 25 
pacientes com enxaqueca que 
foram tratados com determinado 
tipo de analgésico, observou-se que 
o tempo médio que o analgésico levou para começar a fazer efeito foi de 
18 minutos, com desvio-padrão de 3,5 minutos. 
População: é formada por todas as pessoas que são tratadas com este 
analgésico. 
Amostra: é composta pelos 25 pacientes com enxaqueca que foram 
pesquisados. 
 
 
64 
Variável: tempo que o analgésico levou para começar a fazer efeito, que é 
uma variável quantitativa. 
Parâmetro a ser estimado: tempo médio que o analgésico leva para 
começar a fazer efeito, para todos os pacientes que recebem este 
tratamento. 
Estimativa: uma estimativa por ponto para o parâmetro consiste em dizer 
que o tempo médio deverá ser de 18 minutos (�̅�), aproximadamente. 
Para iniciarmos os cálculos devemos obter o valor de 𝑡 na tabela. Para isso, 
devemos considerar que estamos trabalhando com 95% de confiança e 
que 𝑛 = 25. Sendo assim, na tabela 𝑡 − 𝑠𝑡𝑢𝑑𝑒𝑛𝑡 
 
 
 
 
65 
 
Logo, 
 
 
66 
𝜀 = 2,064 . 
3,5
√25
 
Sendo assim, 
𝜀 = 2,064 . 0,7 
Portanto, a margem de erro é de 
𝜀 = 1,44 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 
Com este valor é possível construir o intervalo de confiança para a média 
populacional 
[18 − 1,44 ; 18 + 1,44] 
Ou seja 
[16,56 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝑎𝑡é 19,44 𝑚𝑖𝑛𝑢𝑡𝑜𝑠] 
Interpretação: Podemos afirmar, com 95% de segurança, que o tempo 
médio que este analgésico leva para começar a fazer efeito nos pacientes 
a ele submetidos (população) deve estar entre 16,56 minutos e 19,44 
minutos 
 
Exercícios 
Os exercícios a seguir são relacionados com os temas discutidos no 
capítulo 
 
 
67 
1- Uma amostra de famílias de uma comunidade foi investigada quanto 
ao número de filhos, resultando os dados a seguir: 
Número de filhos Número de famílias 
0 6 
1 12 
2 23 
3 10 
4 8 
5 2 
a) Qual a variável apresentada nessa tabela? Como ela se classifica? 
b) Qual o percentual de famílias que possui menos de 3 filhos? 
c) Construa um intervalo, com 95% de confiança, para o percentual de 
famílias dessa comunidade que possuem menos de 3 filhos. 
 
 
2- Amostras de trabalhadores dos gêneros masculino e feminino foram 
investigadas com relação ao salário bruto mensal, resultando os dados a 
seguir, em salários mínimos: 
Masculino: 6 7 5 8 3 4 5 6 
Feminino: 4 3 5 7 5 2 5 7 
a) Para cada um dos dois gêneros, determine as medidas de tendência 
central. 
b) Para cada um dos dois gêneros, determine o desvio-padrão. 
c) Determine o intervalo de confiança de 95% para a média de salário 
bruto mensal de cada gênero. 
 
 
 
68 
3- Uma amostra de 40 usuários de determinado serviço assistencial foi 
investigada quanto à idade, resultando uma média de 42,5 anos, com 
desvio-padrão de 7,6 anos. 
a) Estime, com 95% de confiança, a média populacional. 
b) Estime, com 98% de confiança, a média populacional 
 
4- Foi feita uma pesquisa com 800 adultos de uma região metropolitana, 
verificando-se que 6% deles estão desempregados. 
a) Estime, com 95% de confiança, a verdadeira proporção de adultos 
desempregados nessa região. 
 
 
REFERÊNCIAS 
 
FRANCO, L. J.; PASSOS, A. D. C.; Fundamentos de Epidemiologia. 
Barueri: Manole, 2011. 
MEDRONHO, R.A.; BLOCH, K.V.; LUIZ, R.R.; WERNECK, G. L. 
Epidemiologia. São Paulo: Atheneu, 2008. 
 
 
 
 
 
69 
NESTE CAPÍTULO 
VOCÊ IRÁ 
APRENDER: 
 
 
- Realizar a tomada de decisão através de um teste de hipóteses; 
- Compreender a interpretação e aplicabilidade de cada tipo de teste de 
hipóteses 
 
 
 
 
70 
INTRODUÇÃO 
 
Em muitos casos de pesquisas há um interesse em realizarcomparações entre grupo de investigação. Estas comparações 
inicialmente são feitas de forma descritiva, por exemplo, através do cálculo 
de médias. Mas quando desejamos inferir um resultado obtido em uma 
amostra para toda a população de interesse é necessária a realização de 
uma análise inferencial através de um teste de hipóteses. 
[...] um teste de hipóteses é um processo que usa 
estatísticas amostrais para testar a afirmação sobre o 
valor de um parâmetro populacional. Pesquisas na área 
da saúde e negócios confiam nos testes de hipóteses para 
a tomada de decisões fundamentais sobre novos 
medicamentos e estratégias de mercado. (FARBER, 
2010) 
 
Em que situações na área da saúde observamos a utilização 
desta ferramenta Estatística? 
- Boni et all (2005) utilizaram testes de hipóteses para 
a comparação dos comportamentos de risco para 
infecção por HIV entre amostras de usuários de 
cocaína injetável do Rio de Janeiro e de Porto Alegre. (veja aqui o 
artigo na íntegra) 
 
 
71 
- Silva et all (2009) analisaram através de um 
teste de hipóteses os efeitos da infecção 
causada pelo Toxoplasma gondii sobre a 
parede do duodeno de gatos. Os autores 
compararam gatos com cerca de três meses de vida, distribuídos 
aleatoriamente em um Grupo controle com gatos do Grupo infectado. 
(veja aqui o artigo na íntegra) 
 
- Bergman et all (2005) verificaram as alterações, após o período de 
um ano, no crescimento e na aptidão física 
relacionada à saúde de escolares dos sexos 
feminino e masculino. Para a comparação 
dos resultados entre meninos e meninas 
utilizaram o teste de hipóteses. (veja aqui o artigo na íntegra) 
 
- Aurichio et all (2010) comparou através de um teste de hipóteses o 
índice de massa corporal (IMC) de idosos entre duas 
faixas de idade: 60 a 74 anos e 75 anos ou mais. ( veja 
aqui o artigo na íntegra) 
 
Neste capítulo, abordaremos os testes de Hipóteses para 
comparação entre duas médias t-student, uma das ferramentas 
Estatísticas mais utilizadas na área da saúde. 
 
 
72 
TESTES DE HIPÓTESES PARA 
MÉDIAS – TESTE T-STUDENT 
 
lgumas vezes existe um particular interesse em decidir sobre a 
verdade ou não de uma hipótese específica (se dois grupos têm a 
mesma média ou não, ou se o parâmetro populacional tem um valor em 
particular ou não). O Teste de hipóteses fornece-nos a estrutura para que 
façamos isto, ele é útil quando desejamos verificar a alegação (afirmação) 
feita sobre uma média, configura-se numa importante ferramenta na toma 
de decisão porque é um método científico capaz de validar ou não uma 
afirmação sobre uma população de estudo. 
 
 Neste capítulo veremos dois dos principais testes de Hipóteses: teste 
t-student para uma média e teste t-student para comparação entre duas 
médias. A utilização destes testes permite a análise e posterior tomada de 
decisão em situações onde são formuladas hipóteses a respeito de uma 
média. 
Exemplos: 
- O QI médio dos funcionários é de 110 pontos; 
- A taxa de colesterol média de mulheres é superior à dos homens; 
A 
 
 
73 
- O tempo de tratamento com o medicamento A é inferior ao tempo 
do medicamento B. 
COMPONENTES DE UM TESTE DE HIPÓTESES 
 
Um teste de hipóteses poderia ser descrito através de uma estratégia 
de análise com o seguinte raciocínio: 
1º) Descreva o efeito em que está interessado em comprovar em termos 
de um parâmetro populacional como, por exemplo, uma média (  ) ou 
uma proporção ( ); 
2º) A Hipótese Nula (H0) é a afirmação de que tal efeito não está 
presente na população; 
3º) Com base nos dados obtidos na amostra verifique se os valores 
obtidos estão muito distantes do valor do parâmetro pela hipótese nula; 
caso afirmativo, os dados evidenciam que a hipótese nula é falsa e que 
o efeito que está procurando está realmente presente; 
4º) O valor de “p” (p-value) representa o nível de significância de um 
teste e indica a probabilidade de se observar um valor igual ou mais 
extremo do que o observado, se a hipótese nula é verdadeira. 
 
 
Em geral, estipula-se um nível de 5%. O valor da probabilidade de 
se obter o efeito observado, dado que a hipótese nula é verdadeira, é 
chamado de p-valor. Se o valor do p-valor for menor que o nível de 
Podemos interpretar o valor de prova ou valor-p ou p-value como 
a medida do grau de concordância entre os dados e H0 Assim 
Quanto menor for o p-value, menor é a consistência entre os 
dados e a hipótese nula. 
 
 
74 
significância estipulado, assume-se o erro tipo I e rejeita-se a hipótese nula. 
Ao contrário, se o p-valor for maior, não é assumido o erro tipo I e se aceita 
a hipótese nula. Os testes podem rejeitar ou aceitar a hipótese nula. Há 
dois possíveis tipos de erros quando realizamos um teste estatístico para 
aceitar ou rejeitar H0 : 
Erro do tipo I : é o erro ao rejeitar H0 quando, na realidade, H0 é 
verdadeira. A probabilidade de cometer este erro do tipo I é 
designada por α (nível de significância). O erro do tipo I equivale 
a concluir que o tratamento é eficaz quando na verdade ele não é. 
Erro do tipo II : é o erro ao aceitar H0 quando, na realidade, H0 é 
falsa. A probabilidade de cometer este erro do tipo II é designada 
por β . 
Em um teste de hipóteses é obviamente desejável que se reduza ao 
mínimo as probabilidades α e β dos dois tipos de erros. Porém, a 
diminuição de se ter um erro implica no aumento de ter um outro erro. Em 
geral, escolhe-se pela diminuição do erro tipo I. A redução simultânea 
dos erros poderá ser alcançada pelo aumento do tamanho da amostra. 
 
 
 
 
 
 
 
 
75 
 
HIPÓTESES DE PESQUISA 
 
O primeiro passo consiste em formular hipóteses sobre a afirmação 
de estudo. As hipóteses estatísticas sempre comparam dois ou mais 
parâmetros e podem ser classificadas em dois tipos: 
 
• Hipótese Nula (H0) estabelece a ausência de diferença entre os 
parâmetros. É sempre representada por uma igualdade. 
• Hipótese Alternativa (H1) é a hipótese contrária à H0 geralmente é 
a hipótese que o pesquisador quer ver confirmada. É normalmente 
representada por uma desigualdade. 
 
ESTATÍSTICA DO TESTE 
A estatística do teste é um valor calculado com as informações 
provenientes da amostra e utilizado para se tomar a decisão sobre a 
aceitação ou rejeição da hipótese nula (H0). 
 
REGRA DE DECISÃO 
Se o valor da estatística do teste cai dentro da região crítica, 
rejeitamos a hipótese (nula) H0, pois existe uma forte evidência amostral 
 
 
76 
de sua falsidade. Ao contrário, se aceitamos H0, não existe evidência 
amostral significativa para sua rejeição. 
 
CONCLUSÃO EXPERIMENTAL 
 
Após a regra de decisão o teste deve ter uma conclusão experimental 
onde o pesquisador de acordo com o contexto do problema finalizará a 
sua análise. 
 
Figura 1. Etapas de um teste de Hipóteses 
 
 
TESTE DE HIPÓTESES PARA UMA MÉDIA 
 
Formulação das hipóteses de 
pesquisa H0 e H1
Calculo da Estatística do Teste
Determinação da Regra de Decisão
Conclusão
 
 
77 
Utiliza-se este teste para comparar os valores obtidos em uma 
amostra com uma média estabelecida como referência. 
 
HIPÓTESES 
 
 Obs.: Em nossa disciplina vamos trabalhar com os testes bilaterais. 
ESTATÍSTICA DO TESTE 
t = 
x̅ − μ
s
√n
 
REGRA DE DECISÃO 
 
 
 
 
EXEMPLO 1 
 Em um debate sobre as estruturas 
familiares, um psicólogo afirma que há alguns 
anos atrás a idade média em que os filhos 
saem da casa de seus pais para irem morar 
sozinhos ou constituírem suas própriasfamílias é de 25 anos. Suspeitando 




=
)(:1H
)(:Ho
o
o
referência
referência


 
 
x
 = média da amostra 
  = valor de referência 
 s = desvio-padrão da amostra 
 n = tamanho da amostra 
 
 
 
78 
que esta realidade tenha nos últimos anos se alterado um pesquisador 
resolveu verificar a hipótese de que nos dias de hoje os filhos permanecem 
mais tempo na casa dos pais. Para isso ele fez uma pesquisa com 400 
indivíduos questionando-os a Idade em que haviam saído da casa de seus 
pais e como resultado foi verificada uma idade média de 32 anos com 
um desvio-padrão de 5 anos. Analise os dados e conclua a um nível de 
significância de 5%. 
 
Passo 1. Dados do Problema 
x = Idade em que os filhos haviam saído da casa de seus pais (variável) 
µ = 25 anos (valor de referência) 
n = 400 indivíduos (tamanho da amostra) 
x̅ = 32 anos (média da amostra) 
s = 5 anos (desvio-padrão da amostra) 
p = 5% ou 0,05 (nível de significância) 
Passo 2. Formulação das Hipóteses 
{
H0: μ = 25 anos
H1: μ ≠ 25 anos
 
Passo 3. Cálculo da Estatística do teste 
t = 
x̅ − μ
s
√n
= 
32 − 25
5
√400
= 
7
0,25
= 28 
 
Passo 4. Regra de Decisão 
 
 
 
79 
1º) Obter o valor de t tabelado, ou seja, o valor da tabela t-student que se encontra no final 
deste capítulo. Para esse exemplo as hipóteses caracterizam um teste bilateral (pois H1: 
μ ≠ 25 anos), então de acordo com a tabela para α = 0,05 (nível de significância do teste: 
p=5% então devemos observar a coluna t0,05). A linha da tabela (gl – graus de liberdade) é 
sempre para este teste: n-1. Então teremos: 400 -1 = 399 – devemos observar o valor na 
linha infinito (sempre que ultrapassar 200 olhamos a linha infinito) - O valor tabelado é t 
tabelado = 1,96. 
 
 
 
 
2º) O valor tabelado será o valor que estabelecerá os limites de aceitação e rejeição na regra 
de decisão: 
 
 
 
 
 
 
3º) O valor calculado da estatística do teste caiu FORA da Região de aceitação então a 
decisão será REJEITA H0!!! 
Ao REJEITAR H0, estamos REJEITANDO a hipótese de que µ = 25 anos – logo concluímos 
que µ ≠ 25 anos. 
 
Passo 5. Conclusão 
Região de Aceitação 
Aceita H0 
 
Região crítica 
Rejeita H0 
-1,96 
0 
1,96 
Região crítica 
Rejeita H0 
28 
 
 
80 
Rejeita-se H0, logo a idade média em que os filhos saem da casa de seus 
pais difere significativamente de 25 anos. Pelos dados observados na 
amostra (média amostral foi de 32 anos) observa-se que esta idade é 
superior a 25 anos, com isso os filhos estão saindo mais tarde da casa dos 
pais. 
 
 
 
 
EXEMPLO 2 
De acordo com a OMS (Organização Mundial de 
Saúde) um bebê que acaba de nascer possui, em 
média, um tamanho de 50 cm. Uma amostra de 20 
bebês recém-nascidos filhos de mães usuárias de 
crack foi investigada e uma das variáveis analisadas foi 
o tamanho do bebê ao nascer. Verificou-se neste estudo que os bebês 
nasceram, em média, com 48,3 cm com um desvio-padrão de 5 cm. 
Analise estes dados e conclua se podemos afirmar ao nível de significância 
de 5% que bebês filhos de usuárias de crack possuem o tamanho 
significativamente inferior ao estabelecido pela Organização mundial de 
saúde. 
Passo 1. Dados do Problema 
x = Tamanho de bebês recém-nascidos (variável) 
µ = 50 cm (valor de referência) 
 
 
81 
n = 20 bebês (tamanho da amostra) 
x̅ = 48,3 cm (média da amostra) 
s = 5 cm (desvio-padrão da amostra) 
p = 5% ou 0,05 (nível de significância) 
Passo 2. Formulação das Hipóteses 
{
H0: μ = 50 cm
H1: μ ≠ 50 cm
 
 
 
Passo 3. Cálculo da Estatística do teste 
t = 
x̅ − μ
s
√n
= 
48,3 − 50
5
√20
= 
−1,7
1,11
= −1,53 
 
Passo 4. Regra de Decisão 
 
1º) Obter o valor de t tabelado, ou seja, o valor da tabela t-student que se encontra no final 
deste capítulo. Para esse exemplo as hipóteses caracterizam um teste bilateral (pois H1: 
μ ≠ 50 cm), então de acordo com a tabela para α = 0,05 (nível de significância do teste: 
p=5% então devemos observar a coluna t0,05). A linha da tabela (gl – graus de liberdade) é 
sempre para este teste: n-1. Então teremos: 20 -1 = 19 – devemos observar o valor na linha 
19 - O valor tabelado é t tabelado = 2,093. 
 
 
 
 
 
82 
2º) O valor tabelado será o valor que estabelecerá os limites de aceitação e rejeição na regra 
de decisão: 
 
 
 
 
 
 
3º) O valor calculado da estatística do teste caiu DENTRO da Região de aceitação então a 
decisão será ACEITA H0!!! 
Ao ACEITAR H0, estamos ACEITANDO a hipótese de que µ = 50 cm 
Passo 5. Conclusão 
Aceita-se H0, logo o tamanho médio de bebês recém-nascidos, filhos de 
usuárias de Crack NÃO difere significativamente de 50 cm. Com isso, 
não podemos afirmar que os bebês de usuárias de crack nascem menores 
do que os bebês normais. 
 
TESTE DE HIPÓTESES PARA COMPARAÇÃO 
ENTRE DUAS MÉDIAS 
 
 Este teste tem por objetivo comparar as médias provenientes de 
duas amostras independentes. 
Região de Aceitação 
Aceita H0 
 
Região crítica 
Rejeita H0 
-2,093 
0 
2,093 
Região crítica 
Rejeita H0 
-1,53 
 
 
83 
Grupo 1 





1
1
1
s
x
n
 Grupo 2 





2
2
2
s
x
n
 
HIPÓTESES: 
Obs.: Em nossa disciplina vamos trabalhar com os testes bilaterais. 
ESTATÍSTICA DO TESTE: 
𝑡 = 
�̅�1 − �̅�2
√𝑠1
2
𝑛1
+
𝑠2
2
𝑛2
 
REGRA DE DECISÃO 
 
 
 
 
EXEMPLO 1 
Os dados abaixo representam os escores do grau de 
Qualidade de vida (mensurado através do instrumento SF 
36 que corresponde a uma escala de 0 a 100 pontos, 
quanto maior o escore maior é a Qualidade de vida) de dois grupos de 




=
21
21
:1H
:Ho


 
x
1 = média do grupo 1 
x
2 = média do grupo 2 
s12 = desvio-padrão ao quadrado do grupo 1 
s22 = desvio-padrão ao quadrado do grupo 2 
n1 = tamanho da amostra do grupo 1 
n2 = tamanho da amostra do grupo 2 
 
 
 
84 
Idosos: Grupo 1: Idosos residentes em casas de repouso e Grupo 2: 
Idosos residentes com a família 
 
Idosos residentes n Escore Médio Desvio-padrão 
Grupo 1 - Casas de repouso 27 68 7 
Grupo 2 - Com a família 39 75 10 
 
Verifique se existe diferença significativa para o escore médio de qualidade 
de vida entre os grupos e conclua ao nível de significância de 5%. 
Passo 1. Dados do Problema 
x = Grau de Qualidade de vida (variável) 
n1 = 27 idosos 
n2 = 39 idosos 
x1̅ = 68 pontos 
x2̅̅ ̅ = 75 pontos 
s12 = 7 pontos 
s22 = 10 pontos 
p = 5% ou 0,05 (nível de significância) 
Passo 2. Formulação das Hipóteses 
Passo 3. Cálculo da Estatística do teste 
𝑡 = 
�̅�1 − �̅�2
√
𝑠1
2
𝑛1
+
𝑠2
2
𝑛2
= 
68 − 75
√7
2
27 +
102
39
=
−7
√1,81 + 2,56
=
−7
2,09
= −3,3 
 
Passo 4. Regra de Decisão 
 
1º) Obter o valor de t tabelado, ou seja, o valor da tabela t-student que se encontra no final 
deste 




=
21
21
:1H
:Ho


 
 
85 
capítulo. Para esse exemplo as hipóteses caracterizam um teste bilateral (pois H1:µ1 ≠ µ2), 
então de acordo com a tabela para α = 0,05 (nível de significância do teste: p=5% então 
devemos observar a coluna t0,05). A linha da tabela (gl – graus de liberdade) é sempre para 
este teste: n1+n2 -2. Então teremos: 27+39 -2 = 64 – como não temos linha 64 na tabela, 
devemos observaro valor na linha mais próxima que é alinha 60 - O valor tabelado é t tabelado 
= 2,000. 
 
 
 
2º) O valor tabelado será o valor que estabelecerá os limites de aceitação e rejeição na regra 
de decisão: 
 
 
 
 
3º) O valor calculado da estatística do teste caiu FORA da Região de aceitação então a 
decisão será REJEITA H0!!! 
Ao REJEITAR H0, estamos REJEITANDO a hipótese de que H0:µ1 = µ2 
 
Passo 5. Conclusão 
Rejeita-se H0, logo o escore médio de qualidade de vida difere 
significativamente entre os grupos investigados. Observa-se, ao verificar 
as médias de cada grupo que o escore médio de qualidade de vida é 
significativamente superior para o grupo de idosos que reside com a 
família. 
Idosos residentes Escore Médio 
Região de Aceitação 
Aceita H0 
 
Região crítica 
Rejeita H0 
-2,000 
0 
2,000 
Região crítica 
Rejeita H0 
-3,3 




=
21
21
:1H
:Ho


 
 
86 
Grupo 1 - Casas de repouso 68 pontos 
Grupo 2 - Com a família 75 pontos 
 
EXEMPLO 2 
O magnésio é um íon predominantemente intra-celular, que 
participa como co-fator de mais de 300 reações enzimáticas, 
dentre elas na atividade da tirosino-cinase. Sua deficiência 
pode aumentar a resistência periférica à insulina, 
especialmente em pacientes com síndrome metabólica e diabetes mellitus 
tipo 2 (DM2). Este trabalho avaliou 18 indivíduos divididos em dois grupos 
distintos: Grupo 1: Portadores de diabetes mellitus tipo 2 e Grupo 2: 
Controle (indivíduos sadios) 
Comparação dos níveis de magnésio (Mg) no plasma (mEq/l) entre os grupos de estudo 
Grupo n Nível médio de Mg Desvio-padrão 
Grupo Diabetes Mellitus tipo 2 10 1,2 0,5 
Grupo Controle 8 1,6 0,7 
 
Passo 1. Dados do Problema 
x = Nível de magnésio (variável) 
n1 = 10 pacientes 
n2 = 8 pacientes 
x1̅ = 1,2 mg 
x2̅̅ ̅ = 1,6 mg 
s12 = 0,5 mg 
s22 = 0,7 mg 
p = 5% ou 0,05 (nível de significância) 
Passo 2. Formulação das Hipóteses 
 
 
87 
Passo 3. Cálculo da Estatística do teste 
𝑡 = 
�̅�1 − �̅�2
√
𝑠1
2
𝑛1
+
𝑠2
2
𝑛2
= 
1,2 − 1,6
√0,5
2
10 +
0,72
8
=
−0,40
√0,025 + 0,061
=
−0,40
0,29
= −1,4 
 
Passo 4. Regra de Decisão 
 
1º) Obter o valor de t tabelado, ou seja, o valor da tabela t-student que se encontra no final 
deste capítulo. Para esse exemplo as hipóteses caracterizam um teste bilateral (pois H1:µ1 
≠ µ2), então de acordo com a tabela para α = 0,05 (nível de significância do teste: p=5% 
então devemos observar a coluna t0,05). A linha da tabela (gl – graus de liberdade) é sempre 
para este teste: n1+n2 -2. Então teremos: 10+8 -2 = 16 – O valor tabelado é t tabelado = 2,120. 
 
 
 
2º) O valor tabelado será o valor que estabelecerá os limites de aceitação e rejeição na regra 
de decisão: 
 
 
 
 
3º) O valor calculado da estatística do teste caiu DENTRO da Região de aceitação então a 
decisão será ACEITA H0!!! 




=
21
21
:1H
:Ho


Região de Aceitação 
Aceita H0 
 
Região crítica 
Rejeita H0 
-2,120 
0 
2,120 
Região crítica 
Rejeita H0 
-1,4 




=
21
21
:1H
:Ho


 
 
88 
Ao ACEITAR H0, estamos ACEITANDO a hipótese de que H0:µ1 = µ2 
 
Passo 5. Conclusão 
Aceita-se H0, logo o nível médio de magnésio NÃO difere 
significativamente entre os grupos investigados. 
 
 
 
 
 
 
 
 
 
EXERCÍCIOS 
 
1) Em uma investigação de hipertensão induzida por gravidez, 
um grupo de mulheres com essa disfunção foi tratado com baixa 
dose de aspirina e um segundo grupo foi tratado com placebo. 
Uma amostra de 23 mulheres que receberam aspirina tem pressão 
sanguínea arterial média de 109 mm Hg e desvio-padrão de 8 mm Hg; uma 
 
 
89 
amostra de 24 mulheres para quem foi dado o placebo, tem pressão 
sanguínea de 111 mm Hg, com desvio-padrão de 8 mm Hg. Ao nível de 5% 
de significância o que podemos concluir? 
2) Diversos estudos sugerem uma estreita relação entre pesadelos e o 
transtorno depressivo. Para verificar esta hipótese os pesquisadores Sarah 
Chellappa e John Araújo realizaram uma pesquisa com o 
objetivo de detectar a prevalência de pesadelos em 
pacientes com transtorno depressivo e observar sua relação 
com idade, sexo, tempo de doença, gravidade do quadro 
depressivo e ideação suicida. Os resultados foram 
publicados no artigo “Relevância clínica de pesadelos em 
pacientes com transtorno depressivo”. Um destes resultados está 
apresentado na tabela abaixo que compara o tempo de doença 
(transtorno depressivo) entre os pacientes com e sem pesadelos: 
 
 
Comparação do tempo de doença entre pacientes com e sem pesadelos 
Grupo n Tempo Médio de doença Desvio-padrão 
Pacientes com pesadelos 36 6,17 anos 1,80 anos 
Pacientes sem pesadelos 24 4,57 anos 1,62 anos 
 
Analise os dados e conclua ao nível de significância de 5%. 
3) Um pesquisador acredita que o índice de massa 
corpórea de homens diabéticos é diferente do índice 
para mulheres diabéticas. Para fazer a comparação, 
investigou 207 homens diabéticos, obtendo média 
igual a 26,4 kg/m2, com desvio-padrão de 3,3 kg/m2. Para 
127 mulheres diabéticas, a média foi de 25, 4 kg/m2, com desvio-padrão de 
 
 
90 
5,2 kg/m2. Usando 5% de significância, verifique se existe diferença 
significativa entre homens e mulheres para o índice de massa corpórea. 
 
4) A lactação é um estágio importante do ciclo produtivo das fêmeas suínas 
e deve promover um elevado número leitões desmamados, saudáveis e 
com bom peso ao desmame. O leite é a única fonte de alimento do leitão 
nos primeiros dias de vida. Com o aumento no número de leitões nascidos 
por leitegada ocorrido nos últimos anos tem-se observado também 
aumento na produção diária de leite das fêmeas. 
De acordo com a literatura, as porcas 
amamentam seus leitões em torno de 22 vezes 
por dia, ou seja, de hora em hora. Com o objetivo 
de verificar tal alegação, uma amostra de 32 
porcas foi investigada, observando-se o número 
de vezes em que estas amamentam seus leitões, 
como resultados foi observado um número médio 
de 24 vezes por dia com uma variação de 3 vezes ao dia. Analise estes 
dados comparando o valor encontrado com o valor referido pela literatura 
e conclua a um nível de significância de 5%. 
5) Foram estudadas as características fisicoquímicas e 
citológicas do líquido sinovial da articulação 
temporomandibular de dez eqüinos hígidos. Dentre as 
características foi verificada a taxa de glicose que 
apresentou uma média de 108,3 mg/dLl com uma variação de 35,4 mg/dL. 
Considerando que a concentração de glicose considerada normal para 
eqüinos hígidos é em média 95 mg/dL verifique a hipóteses de que esses 
 
 
91 
animais possuem a taxa de glicose significativamente superior à taxa 
normal. Use 5% de significância. 
6) Um pesquisador afirma que, quando uma criança de 2 meses começa a 
tomar exclusivamente leite do tipo A, o seu peso sofre um aumento, em 
médio, de 500 gramas. Para verificar esta afirmação, foram selecionadas, 
ao acaso 50 crianças de 2 meses a quem se deu o leite 
referido verificando-se que o seu peso aumentou em 
média 475 gramas com um desvio-padrão de 48 
gramas. Averigúe, ao nível de significância 5% se o 
aumento de peso difere significativamente ao afirmado 
pelo pesquisador. 
 
REFERÊNCIAS 
FARBER, L. Estatística Aplicada. São Paulo: Pearson Prentice Hall, 
2010. 
MANN, P.S. Introdução à Estatística. Rio de Janeiro: LTC, 2015. 
 
 
92 
 
 
93 
NESTE 
CAPÍTULO VOCÊ 
IRÁAPRENDER: 
 
 
- Realizar a tomada de decisão através de um teste de associação; 
- Compreender a interpretação e aplicabilidade das medidas de associação 
mais importantes na área da saúde. 
 
 
 
 
94 
INTRODUÇÃO 
 
Na área da saúde é muito comum observarmos fatores de risco que 
estão associados a uma série de doenças ou ocorrência de determinados 
fatos de interesse: 
 
 
 
 
 
 
 
Profissionais da área da saúde diariamente deparam-se com 
diagnósticos sobre patologias, ocorrências de desfechos como o óbito, 
internação hospitalar, ocorrência de abuso sexual, sintomas associados, 
etc. As pesquisas auxiliam estes profissionais fornecendo insumos 
importantes para a tomada de decisão frente ao volume de variáveis que 
podem estar envolvidas no processo de cura, ou ainda na melhoria das 
condições de vida de um indivíduo. 
 
 
95 
Uma das importantes ferramentas que podemos dispor deste 
contexto é o teste de associação Qui-quadrado que pode ser utilizado 
quando temos duas variáveis qualitativas (categorias que podem ser 
dicotômicas, ordinais ou nominais) dos quais suspeita-se que há uma 
relação de dependência entre elas, ou ainda, que estas estejam 
relacionadas. 
 [...] o teste Qui-quadrado é um teste não paramétrico 
usado para responder perguntas de pesquisa que 
envolvem taxas, proporções ou frequencias. 
(RODRIGUES, LIMA & BARBOSA, 2017) 
 
Em que situações na área da saúde observamos a 
utilização desta ferramenta Estatística? 
- Kronbauer e Meneghel (2005) utilizaram o teste Qui-
quadrado para associar a ocorrência de violência de 
gênero a outras variáveis como idade da mulher, 
escolaridade da mulher, escolaridade do marido, 
classe social e anos de união. (Veja artigo na íntegra aqui) 
- Souza et all. (2008) no artigo “Acidentes de 
trabalho envolvendo mãos: casos atendidos em um 
serviço de reabilitação” investigaram a relação entre 
a ocupação profissional do paciente e o agente 
 
 
96 
causador da lesão através do teste de associação Qui-quadrado. 
(Veja artigo na íntegra aqui) 
- Payad et all. (2015) em seu trabalho de 
pesquisa “Associação entre o consumo de 
junk food e a pressão arterial alta e obesidade 
em crianças e adolescentes iranianos: o 
Estudo Caspian-IV” fizeram uso do teste Qui-
quadrado com o objetivo de avaliar a 
existência de uma associação significativa o consumo de junk food e 
a hipertensão e obesidade em uma amostra nacional de crianças e 
adolescentes iranianos. (Veja artigo na íntegra aqui) 
 
TESTE DE ASSOCIAÇÃO QUI-
QUADRADO 
O teste Qui-quadrado também é um teste de hipóteses utilizado para 
comparar a distribuição de diversos acontecimentos em diferentes 
amostras, a fim de avaliar se as proporções observadas destes eventos 
mostram ou não diferenças significativas ou se as amostras diferem 
significativamente quanto às proporções desses acontecimentos, ou ainda, 
pode-se dizer que seu objetivo é verificar se existe associação significativa 
entre duas variáveis qualitativas. 
 
 
97 
O método usado é o da comparação, ou seja, comparar um grupo 
observado com um grupo esperado de frequências. 
Para iniciarmos o teste primeiramente é necessário estabelecermos 
quais as variáveis que desejamos verificar se estão associadas (x e y). 
Após serem definidas, estas deverão ser organizadas em uma tabela 
cruzada (tabela de contingência), conforme estrutura apresentada abaixo: 
 
Figura 1. Apresentação geral de uma tabela cruzada 2x2 
 
Variável linha (x) 
Variável coluna (y) 
Total Categoria 1 Categoria 2 
Categoria 1 fo11 fo12 fo11 + fo12 
Categoria 2 fo21 fo22 fo21 + fo22 
Total fo11 + fo21 fo12 + fo22 fo11+ fo12+ fo21+ fo22 
fo – frequência observada 
 
HIPÓTESES 
Estabeleça as hipóteses do seu teste considerando que: 
Ho: Não existe associação significativa entre as variáveis (as 
variáveis X e Y são independentes e não estão relacionadas) 
H1: Existe associação significativa entre as variáveis (as variáveis X 
e Y não são independentes e estão relacionadas) 
 
 
 
98 
 
PROCEDIMENTOS 
1º passo: Calcular a frequência esperada (fe) em cada célula sob a 
hipótese de independência. 
2º passo: Calcular a estatística 2 
a partir das diferenças entre frequencias observadas - fo (que vem na 
tabela) e frequências esperadas - fe (calculadas no primeiro passo) 
3º passo: Comparar o valor calculado da estatística do teste 𝜒2 com 
o valor tabelado da tabela Qui-quadrado – regra de decisão 
Figura 2. Regra de Decisão Teste Qui-quadrado 
 
geral"" total
"" "" colunatotalxlinhatotal
fe =
( )

−
=
e
eo
f
ff
2
2
 
 
99 
Obs.: Para uma tabela 2 x 2 (duas linhas por duas colunas) o 
valor tabelado será sempre 3,841 considerando um nível de 
significância de 5%. 
 
Restrições de uso 
Não utilizar quando o número de células com frequência esperada inferior 
a ‘5’ for superior a 25% do total de células da tabela. 
Figura 3. Descrição das etapas para a realização do Teste Qui-quadrado 
 
 
 
100 
EXEMPLO 1 
Um estudo foi realizado com o objetivo de 
investigar se o gênero de um indivíduo está 
relacionado com a presença de Diabetes 
Mellitus, suspeita-se que as mulheres tenham 
uma maior propensão a desenvolver Diabetes Mellitus do que os homens, 
porém deseja-se comprovar através de uma análise estatística se esta 
suspeita é realmente significativa. 
 
Gênero X Diabetes Mellitus 
 
Gênero 
Presença de Diabetes Mellitus 
Total Sim Não 
Masculino 30 370 400 
Feminino 50 550 600 
Total 80 920 1000 
 
 
Ho: Não existe associação significativa entre o gênero e a presença de 
Diabetes Mellitus 
H1: Existe associação significativa entre o gênero e a presença de Diabetes 
Mellitus 
 
fe = 
total 𝑐𝑜𝑙𝑢𝑛𝑎 x total 𝑙𝑖𝑛ℎ𝑎
total 𝑔𝑒𝑟𝑎𝑙
 
 
Passo 1: Defina as Hipóteses de Pesquisa 
Passo 2: Calcule as frequências esperadas - fe 
 
 
101 
Na tabela de nossa análise temos 4 frequencias observadas (fo): 30, 
50, 370 e 550. Para cada uma delas devemos obter a sua respectiva 
frequencia esperada (fe) 
 
 
Gênero 
Presença de Diabetes Mellitus 
Total Sim Não 
Masculino fo = 30 fo =370 400 (total linha) 
Feminino fo = 50 fo =550 600 
Total 80 (total coluna) 920 1000 (total geral) 
fe30 = 
80 x 400
1000
= 32 
 
 
Gênero 
Presença de Diabetes Mellitus 
Total Sim Não 
Masculino fo = 30 fo =370 400 
Feminino fo = 50 fo =550 600 (total linha) 
Total 80 (total coluna) 920 1000 (total geral) 
fe50 = 
80 x 600
1000
= 48 
 
 
Gênero 
Presença de Diabetes Mellitus 
Total Sim Não 
Masculino fo = 30 fo =370 400 (total linha) 
Feminino fo = 50 fo =550 600 
Total 80 920 (total coluna) 1000 (total geral) 
 
fe370 = 
920 x 400
1000
= 368 
 
Gênero 
Presença de Diabetes Mellitus 
Total Sim Não 
Masculino fo = 30 fo =370 400 
Feminino fo = 50 fo =550 600 (total linha) 
Total 80 920 (total coluna) 1000 (total geral) 
 
fe550 = 
920 x 600
1000
= 552 
 
 
 
102 
 Colocando em uma única tabela as frequências esperadas e 
observadas teremos: 
 
Gênero 
Presença de Diabetes Mellitus 
Total Sim Não 
Masculino Freq. observada: 30 
Freq. esperada: 32 
Freq. observada: 370 
Freq. esperada: 368 
400 
Feminino Freq. observada: 50 
Freq. esperada: 48 
Freq. observada: 550 
Freq. esperada: 552 
600 
Total 80 920 100 
 
𝜒2 = ∑
(𝑓𝑜 − 𝑓𝑒)2
𝑓𝑒
= 
(30 − 32)2
32
+
(50 − 48)2
48
+
(370 − 368)2
368
+
(550 − 552)2
552𝜒2 = ∑
(𝑓𝑜 − 𝑓𝑒)2
𝑓𝑒
= 0,125 + 0,083 + 0,011 + 0,007 = 0,226 
𝜒2 = 0,226 
 
 
 
 
Se o valor da Estatística do Teste 𝜒2 for SUPERIOR a 3,841 – Rejeita-se 
H0 
Se o valor da Estatística do Teste 𝜒2 for INFERIOR a 3,841 – Aceita-se H0 
Passo 3: Calcule a Estatística do Teste 𝜒2 
Passo 4: Regra de Decisão 
 
3,841 
Para tabelas 2 x 2 (duas colunas por 
duas linhas) o valor tabelado será 
3,841 para um nível de significância 
de 5%. 
 
 
103 
Para o nosso exemplo temos 𝜒2 = 0,226 este valor é INFERIOR a 
3,841 – então nossa decisão será ACEITAR H0. 
Nossa decisão no Passo 4 foi ACEITAR H0, então estamos 
aceitando a seguinte afirmação: 
Ho: Não existe associação significativa entre o gênero 
e a presença de Diabetes Mellitus 
Nossa conclusão para esta análise ao nível de significância de 5% 
será que não existe associação significativa entre o Gênero e a 
presença de Diabetes Mellitus, logo não podemos afirmar nesta 
pesquisa que esta doença é mais predominante em mulheres. 
EXEMPLO 2 
Em um tratamento contra depressão realizado com uma amostra de 
78 pacientes teve como objetivo comparar a eficiência de dois 
medicamentos: Líthum e Imipramina no que se refere á recaída da 
depressão. Os resultados observados foram: 
 
Recaída X Tipo de medicamento 
 
Resposta 
Medicamento 
Total Imipramina Lithium 
Recaiu 23 10 33 
Não recaiu 17 28 45 
Total 40 38 78 
 
Analise os dados e conclua ao nível de significância de 5%. 
 
Passo 5: Conclua 
 
 
104 
Passo 1. Hipóteses 
 
Ho: Não existe associação significativa entre o medicamento utilizado e a 
recaída da depressão 
H1: Existe associação significativa entre o medicamento utilizado e a recaída 
da depressão 
 
Passo 2. Cálculo das frequências esperadas (fe) 
 
fe23 = 
40 x 33
78
= 16,92 fe17 = 
40 x 45
78
= 23,08 
 
fe10 = 
38 x 33
78
= 16,08 fe28 = 
38 x 45
78
= 21,92 
 
Passo 3. Cálculo da Estatística do Teste 
𝜒2 = ∑
(𝑓𝑜 − 𝑓𝑒)2
𝑓𝑒
= 
(23 − 16,92)2
16,92
+
(10 − 16,08)2
16,08
+
(17 − 23,08)2
23,08
+
(28 − 21,92)2
21,92
 
𝜒2 = ∑
(𝑓𝑜 − 𝑓𝑒)2
𝑓𝑒
= 2,18 + 2,30 + 1,60 + 1,69 = 7,77 
𝜒2 = 7,77 
Passo 4. Regra de Decisão 
 
 
 
 
 
3,841 
 
 
105 
Para o nosso exemplo temos 𝜒2 = 7,77 este valor é SUPERIOR a 
3,841 – então nossa decisão será REJEITAR H0. 
 
Passo 5. Conclusão 
Nossa decisão no Passo 4 foi REJEITAR H0, então estamos rejeitando a 
seguinte afirmação: 
Ho: Não existe associação significativa entre o 
medicamento utilizado e a recaída da depressão 
 Se estamos rejeitando H0 que não existe associação então a hipótese 
que será utilizada é a que representa H1 
 
Existe associação significativa entre o medicamento utilizado e a 
recaída da depressão 
Nossa conclusão para esta análise ao nível de significância de 5% 
será que existe associação significativa entre o medicamento utilizado e 
a recaída da depressão. 
 
 
 
 
 
 
 
 
106 
EXERCÍCIOS 
1) Foi realizado um estudo observacional do tipo transversal, com o objetivo 
de determinar a presença de anticorpos anti-A. marginale e B. bovis em 
352 bezerras com idade entre quatro a 12 meses, oriundas de propriedades 
produtoras de leite B e de fazendas de leite cru refrigerado (leite C), na 
região do Campo das Vertentes de Minas Gerais. Os dados observados 
foram: 
 
Tipo de leite produzido na propriedade X Presença de bezerras soropositivas para 
A. marginale e B. bovis 
 
Tipo de Leite produzido 
A. marginale e B. bovis 
Total Positiva Negativa 
Leite B (LB) 166 10 176 
Leite Cru refrigerado – Leite C (LCR) 157 19 176 
Total 323 29 352 
Analise os dados e conclua ao nível de significância de 5%. 
 
2) Num estudo para verificar a eficácia de duas marcas de remédio no 
controle de hiperatividade, 400 hiperativos foram divididos aleatoriamente 
em 2 grupos de mesmo tamanho. Um grupo (200 pessoas) tomou a droga 
A e o outro grupo tomou a droga B. Depois de algum tempo de tratamento, 
verificou-se, em cada um dos grupos, quantas pessoas ainda estavam com 
sintomas de hiperatividade. Analise os dados e conclua ao nível de 
significância de 5% 
Droga X Hiperatividade 
 
Droga 
Hiperatividade 
Total Sim Não 
A 152 48 200 
B 132 68 200 
Total 284 116 400 
Analise os dados e conclua ao nível de significância de 5%. 
 
3) Os dados abaixo representam os resultados de um estudo realizado com 
dois tipos de anti-inflamatórios utilizados para o tratamento de lesões em 
cavalos. Os dados observados encontram-se na tabela abaixo: 
 
 
 
 
107 
 Anti-inflamatório X Tempo de melhora da lesão 
Anti-
inflamatório 
Tempo de melhora da lesão 
Total Até 24 horas Mais de 24 horas 
A 19 10 29 
B 71 11 82 
Total 90 21 111 
Analise os dados e conclua ao nível de significância de 5%. 
 
GABARITO 
1) 𝜒2 = 3,0 
Conclusão: Aceita-se Ho, logo NÃO existe associação significativa entre o 
tipo de leite produzido e a presença de anticorpos anti-A. marginale e B. 
bovis. 
2) 𝜒2 = 4,9 
Conclusão: :Rejeita-se H0, logo existe associação significativa entre o 
controle da hiperatividade e a droga utilizada. 
3) 𝜒2 = 6,2 
Conclusão: Rejeita-se H0, logo existe associação significativa entre o 
Anti-inflamatório utilizado e o tempo de melhora da lesão. 
 
 
 
 
 
108 
TESTES DIAGNÓSTICOS 
O QUE SÃO TESTES DIAGNÓSTICOS? 
Na área de Epidemiologia os testes diagnósticos se 
referem a distintos procedimentos como por exemplo 
testes de laboratório e exames clínicos. São 
informações, baseadas na teoria das probabilidades, 
que indicam as chances do resultado de um exame estar correto. 
VALIDADE X CONFIABILIDADE 
Em relação a um teste diagnóstico temos duas questões importantes 
a serem consideradas: a VALIDADE que corresponde a capacidade do 
teste em DISCRIMINAR os indivíduos doentes dos não doentes e a 
CONFIABILIDADE que é a capacidade do teste reproduzir o MESMO 
resultado ou ter resultado semelhante quando for repetido. 
Sobre a VALIDADE, podemos ainda destacar indivíduos que 
desenvolveram ou não determinada doença. Isso pode ser feito 
 
 
109 
comparando os resultados baseados nos testes diagnósticos com aqueles 
derivados de um teste mais definitivo, chamado de “padrão ouro”. Em 
testes diagnósticos, os dados obtidos são comparados com aqueles 
derivados do “padrão ouro” e os resultados desta comparação fornece uma 
medida de sensibilidade e especificidade. 
SENSIBILIDADE (S): é a probabilidade de um teste dar POSITIVO 
na PRESENÇA da doença, isto é, avalia a capacidade do teste 
detectar a doença quando ela está PRESENTE. 
ESPECIFICIDADE (E): é a probabilidade de um teste dar 
NEGATIVO na AUSÊNCIA da doença, isto é, avalia a capacidade do 
teste afastar a doença quando ela está AUSENTE. 
Figura 1. Testes Diagnósticos: O que parece ser e o que realmente é em 
um resultado de um teste. 
 
 
 
 
 
 
 
 
 
 
110 
Os testes diagnósticos são importantes uma vez que sabemos que 
dados obtidos em determinados tipos de exames podem emitir resultados 
errados por diversas razões. Ter o conhecimento da qualidade de um tipo 
de exame/teste para diagnosticar uma determinada doença é 
imprescindível para qualquer profissional da área da saúde. 
Figura 2. Testes Diagnósticos – VP, VN, FN, FP 
 
 
 
 
 
 
 
111 
 
 
 
Verdadeiro Positivo (VP): proporção de pacientes com resultados 
positivosno teste que estão realmente doentes. 
Falso Positivo (FP): proporção de pacientes com resultados positivos 
no teste que NÃO estão realmente doentes. 
 Falso Negativo (FN): proporção de pacientes com resultados 
negativos no teste que estão realmente doentes. 
Verdadeiro Negativo (VN): proporção de pacientes com resultados 
negativos no teste que NÃO estão realmente doentes. 
Quanto mais sensível um teste, maior seu valor verdadeiro 
negativo (maior a segurança de que a pessoa com teste negativo não tem 
a doença) e quanto mais específico um teste, maior seu valor verdadeiro 
positivo (maior a segurança do médico de que a pessoa com teste positivo 
tem a doença). O melhor teste diagnóstico seria aquele que identifica 
poucos falso negativos e falso positivos: alta sensibilidade e 
especificidade. 
 
 
 
112 
Figura 3. Testes Diagnósticos – Elementos para o cálculo da sensibilidade 
e da Especificidade 
Como calcular a 
Especificidade e a 
sensibilidade? 
 
 
 
 
 
 
 
EXEMPLO 
Avaliando-se 80 indivíduos para diagnóstico de câncer de 
laringe, foi utilizado para diagnóstico o método de Punção 
de linfonodo e depois posterior Biópsia (padrão-ouro) 
 
 
Punção de Linfonodo 
Biópsia 
Total Positivo Negativo 
Positivo 45 (a) 5 (b) 50 (a+b) 
Negativo 15 (c) 16 (d) 30 (c+d) 
...é a chance do teste apresentar 
resultado negativo sabendo-se que o 
paciente não é doente! 
...é a chance do teste apresentar 
resultado positivo sabendo-se que 
o paciente é doente! 
 
 
113 
Total 60 (a+c) 20 (b+d) 80 
Identifique: 
a) Verdadeiro Positivo (VP): 45/80 = 0,5625*100 = 56,25% 
b) Falso Positivo (FP): 5/80 = 0,0625*100 = 6,25% 
c) Falso Negativo (FN): 15/80 = 0,1875*100 = 18,75% 
d) Verdadeiro Negativo (VN): 16/80 = 0,2000*100 = 20,00% 
e) Especificidade (E): 
𝑑
(𝑐+𝑑)
=
16
30
= 0,5333 ∗ 100 = 53,33% 
f) Sensibilidade (S): 
𝑎
(𝑎+𝑏)
=
45
50
= 0,9000 ∗ 100 = 90,00% 
 
 
 
EXEMPLO 
Uma amostra de 400 pacientes foi investigada com o objetivo de verificar 
a qualidade do diagnóstico de pneumonia feito através da ausculta em 
relação ao padrão ouro para este resultado que é o Rx: 
 
Diagnóstico de Pneumonia em 400 pacientes 
 
Diagnóstico por ausculta 
Raio X 
Total Positivo Negativo 
Positivo 195 (a) 5 (b) 200 (a+b) 
 
 
114 
Negativo 10 (c) 130 (d) 200 (c+d) 
Total 205 (a+c) 195 (b+d) 400 
Identifique: 
a) Verdadeiro Positivo (VP): 195/400 = 0,4875*100= 48,75% 
b) Falso Positivo (FP): 5/400= 0,0125*100 = 1,25% 
c) Falso Negativo (FN): 10/400 = 0,0250*100= 2,50% 
d) Verdadeiro Negativo (VN): 130/400 = 0,3250*100 = 32,50% 
e) Especificidade (E): 
𝑑
(𝑐+𝑑)
=
130
200
= 0,6500 ∗ 100 = 65,00% 
f) Sensibilidade (S): 
𝑎
(𝑎+𝑏)
=
195
200
= 0,9750 ∗ 100 = 97,50% 
 
 
 
RISCO RELATIVO (RR) 
 
O risco relativo é uma relação da probabilidade do evento ocorrer 
no grupo exposto contra o grupo de controle (não exposto). Na Estatística e 
na Epidemiologia, risco relativo é o risco de um evento (ou de desenvolver 
uma doença) relativo à exposição. 
 O cálculo do RR em uma tabela 2x2 é assim definido: 
 
 
115 
 
 
RR = 
a
(a + b)
c
(c + d)
= [
𝑎
(𝑎 + 𝑏)
] ÷ [
𝑐
(𝑐 + 𝑑)
] 
 
 
 
 
 
 
 
 
 
 
EXEMPLO: 
Câncer de próstata X Hábito de Fumar 
 
É fumante 
Câncer de próstata 
Total Sim Não 
Sim 70 (a) 420 (b) 490 (a+b) 
Não 10 (c) 590 (d) 600 (c+d) 
Total 80 1010 1090 
 
 
116 
 
RR = 
a
(a + b)
c
(c + d)
= [
𝑎
(𝑎 + 𝑏)
] ÷ [
𝑐
(𝑐 + 𝑑)
] 
 
RR = [
70
(490)
] ÷ [
10
(600)
] = 8,6 
No caso acima descrito, RR = 8,6 
Então: há 8,6 vezes mais chance de fumantes contraírem câncer de 
próstata em relação ao grupo de não fumantes. 
 
Veja aqui um artigo que fala um pouco mais sobre probabilidade, risco ou 
chance 
Clique aqui para saber um pouco mais.... 
 
 
EXERCÍCIOS 
Calcule e interprete o Risco Relativo (RR) para cada um dos casos 
abaixo: 
a) Sedentarismo X AVC 
 
Sedentarismo 
AVC 
Total Sim Não 
Sim 195 5 200 
Não 10 130 140 
 
 
117 
Total 205 135 340 
 
 
 
b) Uso de Flúor X Cárie 
 
Usa Flúor 
Tem cárie 
Total Sim Não 
Sim 7 63 70 
Não 60 120 180 
Total 67 183 250 
 
 
c) Raça de cães X Presença de linfoma 
 
Raça 
Presença de Linfoma 
Total Sim Não 
Boxer 13 173 186 
Sem raça definida 408 612 1020 
Total 421 785 1206

Mais conteúdos dessa disciplina