Buscar

Apostila de Bioestatística PA1

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

A P O S T I L A
L I S A B R E U B A R C E L O S
BIOESTATÍSTICA
2 0 2 6 . 2
P A 1
F A C U L D A D E D E M E D I C I N A D E C A M P O S
A P O S T I L A D E B I O E S T A T Í S T I C A
A estatística é um ramo da matemática que possui
métodos apropriados para a coleta, a apresentação,
a análise e a interpretação de dados de observação.
Podemos aplicar a estatística em diversas áreas do
conhecimento. Uma delas é a área da saúde, onde
a chamamos de bioestatística. Esta, está
diretamente relacionada com a epidemiologia, que
estuda os fatores que determinam a frequência e a
distribuição das doenças em grupos de pessoas.
A Bioestatística e a Epidemiologia atuam no estudo
da frequência, da distribuição e dos determinantes
dos estados ou eventos relacionados à saúde em
específicas populações e a aplicação desse estudo
no controle dos problemas de saúde. 
Aplicação da Bioestatística na
Saúde e em Epidemiologia
Introdução
A B I O E S T A T Í S T I C A
A Bioestatística é o estudo voltado para a
compreensão do processo saúde/doença
no âmbito de populações. 
Para a população rural as politicas se
concentraram na distribuição de protetores
solares. Por outro lado, para uma jovem da
cidade, a distribuição será de anticoncepcional. 
Cada população terá uma demanda, e a
Bioestatística nos auxilia a identificar essas
populações e os seus agravos, para oferecer
fundamentos técnicos para a elaboração de
programas de saúde. 
Preocupa-se com o desenvolvimento de estratégias
para as ações voltadas à proteção e promoção da
saúde da comunidade. 
Inclui a vigilância, observação, elaboração e teste de
hipóteses, estudos observacionais e experimentais.
 
Identificação de perfis e fatores de risco
A avaliação de serviços de saúde, geralmente, leva
em consideração o acesso da população aos serviços
e a cobertura oferecia. 
Identificação, quantificação e
caracterização de danos à saúde da
população;
Identificação de fatores de risco e fatores
prognósticos para determinado agravo;
Ampliação da informação sobre a história
natural de um agravo;
Estimativa da validade e confiabilidade de
procedimentos de diagnóstico e
intervenção (o quanto determinado
equipamento é confiável; o ideal é 95% de
confiabilidade); 
Avaliação da eficácia/efetividade de um
procedimento terapêutico;
Testar a eficácia, a efetividade e o impacto
de estratégias de intervenção, assim como
qualidade, acesso e disponibilidade dos
serviços de saúde para controlar, prevenir e
tratar os agravos de saúde na comunidade.
A doença não ocorre aleatoriamente na
população;
A doença humana tem fatores causais,
prognóstico e preventivos que podem ser
identificados por meio de investigações
sistemáticas de diferentes populações ou
subgrupos de populações em diferentes pontos
no tempo e/ou no espaço. 
Vigilância em Saúde Pública
A vigilância é a observação contínua da distribuição
e tendências da incidência de doenças mediante a
coleta sistemática, consolidação e avaliação de
informes de morbidade e mortalidade. 
Em síntese, a Bioestatística na Saúde pode ser
entendida como fundamentada em dois
pressupostos: 
L I S A B R E U B A R C E L O S
2 0 2 6 . 2
Descrever a magnitude da doença na população;
Examinar a distribuição da doença na população
usando dados da estatística viral;
Analisar o comportamento das doenças segundo
características das pessoas, do tempo e lugar
Os objetivos da Bioestatística na Saúde Descritiva
são: 
Fenômeno Estatístico
É qualquer evento que se pretenda analisar, cujo
estudo seja passível da aplicação do método
estatístico. São divididos em três grupos: 
De massa ou coletivo: são aqueles que
não podem ser definidos por uma 
simples observação. Ex.: o preço da cerveja no
Litoral do RJ, preciso buscar os valores de várias
praias do litoral. 
Individuais: são aqueles que irão
compor os fenômenos de massa. Ex.:
Relato de caso; cada preço de cerveja. 
Multidão: quando as características
observadas para a massa não se
verificam para o particular.
Quando percebemos que para um grupo étnico,
por exemplo, não funcionou. Está, geralmente,
associado à genética.
Dado Estatístico: é um dado numérico e é
considerado a matéria-prima a qual iremos aplicar
os métodos estatísticos. 
População: é o conjunto total de elementos
portadores de, pelo menos, uma característica
comum. Ex.: População de Campos= Morar em
Campos. 
Amostra: é uma parcela representativa da
população que é examinada com o propósito de
tirarmos conclusões sobre essa população. É mais
rápido que usar todo mundo. 
Erro amostral: um paciente que morreu, ou que não foi
mais para as consultas = temos uma conta para minimizar
esse erro nos cálculos. 
Parâmetros: são valores singulares que existem na
população e que servem para caracterizá-la. Para
definirmos um parâmetro devemos examinar toda a
população. 
Estimativa: é um valor aproximado do parâmetro e
é calculado com o uso da amostra. 
Variável Qualitativa
Nominais: sem nenhuma ordem (Ex.: cor dos
olhos, sim ou não, presença ou ausência.)
Ordinais: algum tipo de ordem ou grau (Ex.: 1º
grau, 2º grau, 3º grau, pós-graduação;
nenhuma melhora, alguma melhora, muita
melhora; classe social= alta, média, baixa). 
Variável Quantitativa
Discreta ou Descontínua: seus valores são
expressos geralmente através de números
inteiros não negativos. Resulta normalmente
de contagens. (Ex.: nº de alunos presentes nas
aulas de bioestatísticas no semestre).
Contínua: resulta normalmente de uma
mensuração, e a escala numérica de seus
possíveis valores corresponde ao conjunto dos
números reais, podendo assumir qualquer
valor entre dois limites. 
Variável
É o conjunto de resultados possíveis de um
fenômeno. Característica a ser estudada. 
Quando seus valores são expressos por atributos
(Ex.: sexo, cor da pele). podem ser: 
Quando os dados são de caráter quantitativo, e o
conjunto dos resultados possui uma estrutura
numérica. Podem ser:
Atenção!
Idade em ANOS: número inteiro e positivo =
DESCONTÍNUA
Idade em MESES: número fracionado e até
negativo = CONTÍNUA
Termômetro: nesse caso o zero não é absoluto,
foi inventado, e por mais que o número da
temperatura seja inteiro e positivo, é
CONTÍNUO, pois ele passou por frações. 
Também serão contínuos: peso e altura. 
Variável Dependente: representa uma
grandeza cujo valor depende de como a variável
independente é manipulada. Ex.: a variável
dependente é quanto você ganha, que dependerá
da quantidade de tarefas que você realiza. 
Variável Independente: representa uma 
grandeza que está sendo manipulada pelo
experimento, é aquela candidata a explicar a
dependente. Ex.: Você realiza uma tarefa para
receber uma mesada, a cada tarefa realizada
você ganha R$ 3,00
Fator associado à forma de amostragem.
Na seleção da amostra procura-se reproduzir
as características observáveis da população -
uso do critério de proporcionalidade.
Em caso de desconhecimento da composição
da população deve-se utilizar algum critério de
aleatoriedade (sorteio).
Amostra tendenciosa – conclusões sem
consistência. 
Relacionada à precisão ou qualidade dos
dados.
Motivos da falta de precisão:
Falhas nos instrumentos de aferição; 
Problemas nos questionários empregados na
obtenção dos dados;
Falha humana.;
Modelo estatístico / desenho estatístico.
Centro: Um valor representativo ou médio, que
indica onde se localiza o meio do conjunto de
dados.
Variação: Uma medida de quanto os valores
dos dados variam.
Distribuição: A natureza ou forma da
distribuição dos dados (ex. uniforme, sino,
assimétrica).
 
Problemas usuais - Representatividade 
Problemas usuais - Fidedignidade
A importância da coleta de dados: fazer um bom
questionário, o qual não haja influência do
entrevistador, esse deve ser treinado
anteriormente. 
Amostragem: Se os dados amostrais não forem
coletados de maneira apropriada, eles podem ser
de tal modo inúteis que nenhuma manipulação
estatística poderá salvá-los. 
Características importantes dos dados
Medidas de Tendência
Central
Frequência Estatística
E T E N D Ê N C I A C E N T R AL
Levantamento de Dados
Média
Moda
Mediana
Média
Se o número de valores é ímpar, a mediana é
o número localizado exatamente no meio da
lista.
Se o número de valores é par, a mediana é a
média dos 2 valores do meio. 
Mediana: para calcular a mediana devemos
primeiro colocar os valores em ordem crescente
(ou decrescente) e, em seguida, aplicar um dos
dois processos abaixo: 
Moda: é o valor que ocorre mais
frequentemente. Uma distribuição pode ser
unimodal, bimodal, multimodal ou amodal. 
Outliers ou valores discrepantes: valores
amostrais que se localizam muito longe da
grande maioria dos outros valores
amostrais.
Tempo: Características dos dados que
mudam com o tempo. 
L I S A B R E U B A R C E L O S
2 0 2 6 . 2
Distribuição de Frequências 
Relacionam categorias ou classes de valores, juntamente com contagens (ou frequência) do número de
valores que se enquadram em cada categoria. 
Considere o seguinte
conjunto de dados: 
21, 21, 21, 22, 22, 23, 23, 24, 25, 25,
25, 25, 26, 26, 26, 28, 30. 
Construa uma distribuição com
todas as frequências. 
Solução:
Para construirmos uma tabela de frequências
para variáveis contínuas, os dados devem ser
agrupados em intervalos de classe, para
construirmos essas classes algumas definições
são necessárias: 
Amplitude Total ou "Range" (R): é a
diferença entre o maior e o menor valor
observado.
Ex.: R= 30 - 21 = 9. 
Fórmula de Sturges 
Intervalos de Classe: conjunto de
observações apresentadas na forma contínua,
sem superposição de intervalos, de tal modo
que cada valor do conjunto de observação
possa ser alocado em um dos intervalos. 
 k = 1 + 3,322(log10 n) 
k= intervalos 
n= valor total
Ex.: para um conjunto com 50 observações
obtemos log10(50) ≈ 1,699;
 k = 1 + 3,322 x 1,699 ≈ 6,6 ≈ 7 intervalos
Tamanho do intervalo (W): é obtido pela
divisão do valor da diferença entre o maior e o
menor valor = R, pelo número de intervalos = K.
 w = R/k
É de onde inicia e onde termina os valores de
cada intervalo de classe. No exemplo a seguir o
Tamanho da Classe é 5, sendo assim, a
amplitude dessa classe contemplará os 5
números que sucedem o número 19. 
Etapas para a construção de Tabelas
de Frequência para dados agrupados: 
 Encontrar o menor e o maior valor do
conjunto de dados (R);
Calcular o número de classes (K);
Calcular o tamanho do intervalo (W);
Determinar a frequência relativa de cada
classe.
1.
2.
3.
4.
Frequência simples ou absoluta: são os
valores que realmente representam o número
de dados de cada classe. 
Frequência relativa: são os valores das razões
entre as frequências absolutas de cada classe e
a frequência total da distribuição. 
Cálculo: frequência relativa individual dividida
pelo total e multiplicado por 100, pois é um
valor em porcentagem (%). 
Exemplo: 
O conjunto de dados abaixo representa as idades de
mulheres operadas no HEAA, e 2018 pelo serviço de
ginecologia. Construa intervalos de classes para o
mesmo.
19 19 20 21 23 23 23 23 24 24 25 25 26 26 26 27 27 27 29
29 29 29 30 31 31 31 33 33 33 34 37 37 37 37 40 40 40 40
43 43 44 44 47 48 48 48 51 52 52 53
R= 53 - 19 = 50
K = 1 + 3,322 x 1,699 ≈ 7 intervalos
W = 34/7 ≈ 5 idades em cada
O traço logo após o número 19 indica que ele
está incluso dentro dessa classe. Sendo assim,
estarão inclusas, nessa classe, as mulheres com
19, 20, 21, 22 e 23 anos, pois o 24 estará incluso
somente na classe de baixo. 
L I S A B R E U B A R C E L O S
2 0 2 6 . 2
Distribuição de
Frequências 
Exemplo: 
Os dados seguintes são referentes ao nível de glicose de 60 crianças:
1- Construa uma Distribuição de Frequência, determine o Nº de classes e o
melhor intervalo de classes:
2- Determine as Frequências simples de cada classe:
3- Determine das Frequências Relativas de casa classe:
4- Calcule a média, mediana, moda e amplitude (R=Range) dos valores.
L I S A B R E U B A R C E L O S
2 0 2 6 . 2
Média= 3976/ 60= 66,27 mg/dl
Moda= 65
Mediana= 65
R= 28
R= 83-55 = 28
K= 1+3,322 (Log 10 N)
K= 1+3,322 (Log 10 60)
K= 1+3,322 X 1,778
K= 1+5,9
K= 6,9 7 intervalos 
W= R/K
W= 28/7
W= 4 
~-
Números Ordenados
de forma Crescente:
0-5 = -5
4-5 = -1
6-5 = 1
8-5 = 3
7-5 = 2
(-5) = 25 
E assim suscetivelmente... 
Esse X com um traço em cima significa Média,
portanto, seguindo os valores do Banco de Dados
do exemplo, a média é 5. 
O desvio dos valores em relação à média no
exemplo acima foi encontrado diminuindo o valor
do banco de dados pelo valor da média:
A Variância foi encontrada a partir dos seguintes 
 passos: 
1º Realizou-se o quadrado de cada valor do banco
de dados:
2º Realizou-se a somatória de todos valores
quadrados e por fim, dividiu o valor da somatória
pela quantidade de números do banco de dados,
menos 1 (5-1= 4).
2
Quando coletamos dados para observar padrões,
testar hipóteses, ou mesmo apenas para descrever
um fenômeno, o resultado é quase sempre um
conjunto de informações muito complexo para ser
facilmente interpretado de maneira bruta. Temos
duas soluções práticas para estas situações:
Medidas de Variabilidade
O U D I S P E R S Ã O
As medidas de dispersão reduzem a
variação entre os dados a um único valor.
Todas as medidas a seguir são baseadas na média,
então só podem ser usadas se a média for a medida
de tendência central adequada para aquele conjunto
de dados.
Podemos calcular medidas que sumarizem
os nossos dados;
E podemos apresentá-los de
maneira gráfica
Amplitude Total 
Também conhecido como Range (R). É a diferença
entre o maior e o menor valor do conjunto de
dados.
Variância 
A variância é uma medida muito usada, e é
calculada a partir da distância, ou o desvio, de cada
medida para a média ao quadrado e dividido por N
menos 1:
Nós elevamos os desvios ao quadrado para que
o somatório não dê um resultado zero, já que
temos desvio “para cima” e “para baixo” da
média.
A variância é sempre maior ou igual a zero e é
uma medida quadrática. 
A variância é a soma dos quadrados dos
desvios, dividido por N menos 1 (n-1).
A Variância nos dá o desvio médio ao quadrado de
cada valor para a média. É quanto aquele valor se
distância/desvia da média. 
Realizar a raiz quadrada da Variância (S )
Desvio Padrão Amostral (S)
É definido como sendo a raiz quadrada positiva da
variância amostral. 
Além de realizar a raiz quadrada do valor da
Variância para encontrar o valor do Desvio Padrão,
podemos: 
Exemplo:
L I S A B R E U B A R C E L O S
2 0 2 6 . 2
2
S: (X1 - média) + (X2 - média) +...
n-1
2 2 2
É razão entre o Desvio Padrão (S) e a Média 
 ( X ) multiplicado por 100.
Coeficiente de Variação (CV)
É o desvio padrão expresso em porcentagem. Nos
auxilia a comparar desvios de variáveis que
possuem diferentes ordens de magnitude. 
Grupo I: 3,1,5 anos 
Grupo II: 55,57,53 anos 
(x = 3 anos; s2 = 4; s=2) : CV = 66,67%
(x = 55 anos; s2 = 4; s = 2) : CV = 3,64%
Vejam à dispersão dos dados em ambos os
grupos é a mesma, mas os CV são diferentes (no
grupo I a dispersão relativa é ALTA) 
Exemplo:
Erro Padrão 
É igual ao Desvio Padrão dividido pela raiz
quadrada do número de unidades amostrais (n):
Esta medida leva novamente em consideração o
número de unidades amostrais, o que faz com
que o esforço amostral de um pesquisador tenha
grande efeito sobre esta medida. Pois, quanto
maior o denominador (n), a tendencia é que o
erro seja menor (S). 
Intervalo de Confiança 
Expressa a probabilidade de 95% de que a média
real de uma população esteja de fato dentro do
intervalo: 
Padrão da Sociedade Científica: Intervalo de
Confiança de 95%
Para o nível de significância de 5%, esse valor é de
1,96. 
É muito frequente a confusão entre os
conceitos de erro padrão e desvio padrão.
Apesar de ambos tratarem sobre a variação da
média, são conceitos bem diferentes entre si.
O desvio padrão, como vimos, trata de um
índice de dispersão da amostra em relação à
média, enquanto o erro padrão é uma medida
que ajuda a avaliar a confiabilidade da média
calculada.
Desvio
Padrão 
Erro
Padrãoxxx
Os CV permitem comparar a homogeneidadedos
dados de fenômenos de qualquer natureza. 
Mas o que é HOMOGENEIDADE dos dados de
um fenômeno? 
Homogeneidade é a característica do fenômeno
em que se procura identificar a improtância da
dispersão dos dados em relação à magnitude das
observações. Dados mais homogêneos têm
dispersão relativamente menor. 
L I S A B R E U B A R C E L O S
2 0 2 6 . 2
Padrão Mundial para significância de análise de
testes: maior que 95%
Menor valor dividido pelo maior valor, depois
diminui por 1 (resultado em módulo) e multiplica
po 100 (pois é porcentagem).
No Grupo A, o maior peso no fim do período foi
84,71 Kg e o menor foi 75,85 Kg.
No Grupo B o maior foi 85,20 Kg e o menor foi
81,00 Kg
Diferença Significativa/ Significância
É um meio que utilizamos para avaliar se as variáveis
são significantes entre os grupos analisados.
Como encontrar esse valor? 
O enunciado da questão vai direcionar o seu
raciocínio, e você poderá dizer se entre os grupos
analisados há um resultado significante ou não.
Ex.: Dois grupos de indivíduos foram analisados em
relação à perda de peso durante seis meses. No
enunciado da questão dizia que para ter uma
significância na perda de peso, o grupo deveria
apresentar mais de 5%.
Grupo A
75,85/84,71 = 0,895 = 0,90
1 - 0,90 = 0,10 
0,10 x 100 = 10%
Grupo B
81,00/82,20 = 0,985 = 0,98
1 - 0,98 = 0,02
0,02 x 100 = 2%
Sendo assim, o Grupo A apresentou uma
significância perda de peso, ao contrário do
Grupo B. 
= 32,8
Variância (S ):
4
32,8
= 8,20
Ela NÃO é um bicho de sete cabeças, vamos desvendá-la por etapas...
Inicialmente vamos nos deparar com os valores que o professor dará na questão, para facilitar a
explicação, vou chamar essas valores de banco de dados. Essa tabela nos ajudará a encontrar a
Variância (S )
Primeiro vamos realizar
a média dos valores do
banco de dados: 
9+7+5+3+2/5 = 5,2
Ainda não acabou, vamos
calcular o quadrado dos
desvios agora, para 
 iniciarmos o raciocínio da
Variância.
3
3,8 = 14,44
1,8 = 3,24
(-0,2) = 0,04
(-2,2) = 4,84
(-3,2) = 10,24
2
2
2
2
2
Por fim vamos realizar a somatória dos valores
correspondente ao quadrado dos desvios. Logo
depois, vamos dividir a somatória pela
quantidade de números do banco de dados
menos 1 e encontraremos a variância. 
5-1 = 4
4
Bônus
"MARROM"
TABELA
Agora vamos encontrar o
desvio dos valores em
comparação à média,
como? Diminuindo o
valor do banco de dados
pelo valor da média: 
9-5,2 = 3,8
7-5,2 = 1,8
5-5,2 = -0,2
3-5,2 = -2,2
2-5,2 = -3,2 
OBS.: NÃO tem problema dar um
valor negativo nessa etapa. 
Quantidade de
números do
Banco de
Dados
1
2
3
4
5
L I S A B R E U B A R C E L O S
2 0 2 6 . 2
 
OBS.: A questão pode pedir ainda o desvio padrão, assim você vai realizar a raiz quadrada
do valor da variância. 
2
Desvio Padrão (S): 8,20 = 2,86
ARANGO, Héctor Gustavo. Bioestatística: teórica e
computacional. 3. ed. Rio de Janeiro, RJ: Guanabara
Koogan, c2009. 438 p. 
PAGANO, Marcello; GAUVREAU, Kimberlee. Princípios de
bioestatística. São Paulo, SP: Cengage Learning, c2004.
506 p. 
 
VIEIRA, Sonia. Introdução a bioestatística. 4. ed. Rio de
Janeiro, RJ: Elsevier, 2008. 345 p
Bibliografia
L I S A B R E U B A R C E L O S
2 0 2 6 . 2
Utilização de Calculadora Científica;
Facilita se você realizar os cálculos na seguinte
ordem: Variância - Desvio Padrão - Erro
Padrão - Coeficiente de Variação (CV);
Procure arredondar somente o valor de
resposta final. Se não for possível, pode
arredondar ao decorrer da conta, mas tome
cuidado para não arredondar demais e alterar o
resultado;
Utilize duas casas depois da vírgula para as
respostas (0,00).
 
Dicas para a Prova
 
 
Média= 
Variância Amostral
S= soma do quadrado dos desvios
 n-1
 
Desvio Padrão
S= S
Erro Padrão da Média
S(X)= S 
 n
CV% = S . 100
 X 
x
N
2
2

Outros materiais