Buscar

Bioestatistica_Cap1a4

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 124 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 124 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 124 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

UFRJ – Bioestatística
Emilia M. do Nascimento
1. O Papel da Estatística na Medicina
• Planejamento
• Execução
• Análise de dados
¾ Introdução 
9 A Estatística fornece, além dos métodos 
para tomada de decisões na presença de 
incerteza, as formas de planejamento de 
estudos.
9 Ex.: Aspirina e prevenção de doença coronariana
¾ Alguns exemplos 
9 Artigo: Physicians’ Health Study
• 22071 médicos americanos voluntários
• idade de 40 e 84 anos
• divididos aleatoriamente em 2 grupos
• grupo 1: tomou aspirina (11037 médicos)
• grupo 2: placebo (11034 médicos)
• pacientes acompanhados por 5 anos
9 Ex.: Aspirina (cont)
• proporção de infartos (gr. caso): 139/11037 = 0,013
• proporção de infartos (gr. controle): 239/11034 = 0,022
• A diferença das proporções é devido ao efeito da 
aspirina ou ao acaso?
• I.é, haveria o mesmo efeito se o estudo fosse repetido 
com outro grupo de pessoas? 
Tabela 1.1: Resultados relatados pelo Steering Committe of 
Physicians' Health Study Group em 1989
9 Ex.: Aspirina (cont)
• A probabilidade do efeito ser apenas devido ao acaso 
é menor que 1 em 10.000 ⇒ forte evidência do efeito 
protetor da aspirina.
• Pacientes que tiveram infarto: efeito da aspirina é
avaliado pela razão do risco de infarto nos 2 grupos.
• Razão de risco = 0,53 ⇒ o risco de quem toma 
aspirina é quase metade dos de quem não toma.
• A Estatística ajuda na tomada de decisão.
Tabela 1.1: Resultados relatados pelo Steering Committe of 
Physicians' Health Study Group em 1989
9 Ex.: Cirurgia conservadora em câncer de mama
• 3 opções: mastectomia total
tumorectomia
tumorectomia + radioterapia
• Os 2 tratamentos não são equivalentes 
comparando-se o tempo até a recidiva e o tempo até
a metástase.
• A radioterapia aumenta o tempo de sobrevida.
9 Ex.: Consumo de carne e câncer do cólon
• Quanto maior o consumo de carne, maior a 
incidência de câncer.
• Mas, nada se pode concluir: foram analisadas as 
médias ⇒ não se sabe se quem consome carne é
a mesma pessoa que desenvolve o câncer.
Incidência de câncer de 
cólon em função do 
consumo de carne em 
vários países
9 Ex.: Tabagismo e câncer de pulmão (1º estudo)
• Nº de fumantes e não fumantes entre homens 
com diagnóstico de câncer de pulmão e controles
¾ Estudo caso-controle
Grupo Fumantes Não fumantes
Câncer pulmonar 647 2
Controle 622 27
• A metodologia era muito criticada na época 
(1950), pela facilidade de serem produzidas 
associações falsas.
• Apesar da evidência, o estudo não foi 
convincente.
9 Ex.: Tabagismo e câncer de pulmão (2º estudo)
• Taxa de mortalidade por câncer pulmonar para 
fumantes e não fumantes
¾ Estudo de coorte acompanhamento prospectivo
0.07 ( 3 ) 0.57 ( 22 ) 1.39 ( 54 ) 2.27 ( 57 )
Não 
fumantes
Cigarros diários
1 - 14 15 - 24 25 +
• O risco de morte por câncer pulmonar das 
pessoas que fumam mais que 25 cigarros/dia é
aprox. 32 vezes maior (2,27 / 0,07 ≈ 32)
¾ Bioestatística
9 Conjunto de métodos estatísticos para tratamento 
da variabilidade nas ciência médicas e biológicas;
9 Fornece métodos para tomada de decisões 
ótimas na presença de incerteza, estabelecendo 
faixas de confiança para a eficácia dos tratamentos 
e verificando a influência de fatores de risco no 
aparecimento de doenças.
9 É o planejamento e a análise de estudos médicos 
e biológicos.
• Observacionais dados da história clínica 
Ex.: fumo e câncer no pulmão (não se pode alocar 
um fator aos indivíduos; usa-se os dados da sua 
história)
9 Planejamento
9 Estudos descritivos descrevem uma 
situação sem se preocupar com a comparação
Ex.: consumo de carne e câncer de cólon
9 Estudos comparativos
• Experimentais o pesquisador interfere na 
alocação do tratamento
Ex.: cirurgia conservadora de câncer de mama;
estudo da aspirina
9 Análise
™ Resposta dicotômica
Técnicas usadas no ex. da aspirina (resposta -
infarto ou não infarto): 
• teste χ2 para decidir se o tratamento é eficaz
• razão de chances para medir o seu efeito
¾ Inúmeras técnicas usadas em Bioestatística
™ Resposta não dicotômica
Outros testes (por ex., teste t)
™ Resposta: tempo de sobrevida
Testes para comparação das curvas
2. Organização da Pesquisa Médica
Uma Pesquisa feita pelo Incor, publicada em janeiro no 
American Journal of Cardiology e apresentada no 13º Congresso 
Interamericano de Cardiologia, concluiu que os pacientes com 
problemas cardíacos submetidos a cirurgias de ponte de safena 
apresentam uma evolução clínica semelhante a dos pacientes 
tratados com dietas e medicamentos. 
O médico argentino René Favaloro, o primeiro a realizar 
uma operação de ponte de safena no mundo, classifica de 
"confusos" os resultados de pesquisas como a realizada pelo Incor. 
¾ Introdução
9 Incor diz que safena e droga têm efeito igual
9 Passos para a avaliação crítica da notícia
• Estudo da associação entre a exposição a um 
fator e o desenvolvimento da doença
• Comparação de opções terapêuticas
• Estudo de fatores de prognósticos para 
pacientes submetidos a um dado tratamento
1) Identificar os problemas típicos da pesquisa clínica
• Estudos descritivos
• Ensaio clínico aleatorizado
• Estudos de coorte
• Estudos caso-controle
2) Desenhos do estudo
9 Estudos descritivos
• Informar sobre a distribuição de um evento, na 
população, em termos quantitativos. 
• Objetivos principais:
• Identificar grupos de risco;
• Sugerir explicações para as variações de 
freqüência, servindo de base ao 
prosseguimento de pesquisas, através de 
estudos analíticos.
9 Estudos caso-controle
• Compara grupo de doentes com não doentes
• Investigar a causa das doenças doenças raras
• Quantificar a proporção de expostos, nos grupos de 
casos e de controles.
• Dados coletados em determinado momento sobre a 
ocorrência da doença; e sobre a exposição no passado
• Estudo retrospectivo (dados ref. ao passado) ou 
prospectivo (dados coletados ao longo do tempo) 
9 Estudos de coorte
• Iniciam-se com um grupo de pessoas livres da doença 
classificadas de acordo com a exposição
• A coorte é acompanhada para identificar se o 
surgimento de novos casos da doença difere entre os 
grupos de expostos e não expostos
• Estudos longitudinais
• Podem ser prospectivos ou retrospectivos
• Muito onerosos
9 Ensaio clínico aleatorizado
• Estudos experimentais
• Comparação de tratamentos
• Objetivo estudar os efeitos de uma intervenção
• Dois grupos selecionados “aleatoriamente” formar os 
grupos com características semelhantes.
• Grupo tratamento recebe a terapêutica testada
• Grupo controle recebe a terapêutica padrão.
3. Descrição e Apresentação de Dados
9 Tipos de Variáveis
¾ Conceitos básicos 
Nominal
Qualitativa
Ordinal
Variável
Discreta
Quantitativa
Contínua
¾ Conceitos básicos 
9 Variáveis qualitativas (ou categóricas)
9 Nominal → dados classificados em categorias
9 Ordinal → ordenação
Ex: Sexo (2 categorias)
Tipo Sanguíneo (+ que 2 categorias)
Ex: Estadiamento da doença
Obs.: Só a ordem importa
Ex. a categoria 4 não é o dobro da cat. 2
9 Variáveis quantitativas
Resultado de contagens
Ex: Nº de bactérias / volume de urina
Nº de consultas / período
Nº de batimentos cardíacos / min
9 Variáveis Discretas
Ex: Peso
Altura
9 Variáveis Contínuas
• São anotadas até a precisão de medida usada
Ex: Tempo de sobrevida
2 anos 1 mês e 10 dias
Ex: Idade variável contínua que pode 
ser classificada como discreta
9 Dependendo da escala, uma variável pode 
ser classificada em mais de um tipo
Renda em SM pode ser classificada 
como discreta oucategórica ordinal 
(baixa, média, alta)
• Não significa que o estágio IV seja 2 
vezes pior que o II
• Nem que a diferença entre os estágios I 
e II seja equivalente que a entre III e IV
9 Diferença entre variável discreta e categórica
Estadiamento de câncer (I, II, III, IV)
Nº de crianças (0, 1, 2, 3, ...)
• 4 crianças é exatamente o dobro de 2 
crianças
• Uma família com 4 crianças tem 1 
criança a mais que uma com 3 crianças
9 Dados brutos
Obtidos diretamente da pesquisa; 
ainda não organizados
Geralmente apresentados em tabelas
9 Ex: Teor de gordura (g/24 horas) em 43 crianças
3.7 1.6 2.5 3.0 3.9 1.9 3.8 1.5 1.1
1.8 1.4 2.7 2.1 3.3 3.2 2.3 2.3 2.4
0.8 3.1 1.8 1.0 2.0 2.0 2.9 3.2 1.9
1.6 2.9 2.0 1.0 2.7 3.0 1.3 1.5 4.6
2.4 2.1 1.3 2.7 2.1 2.8 1.9
• Grande variação dos resultados
• A variabilidade exige que o padrão de referência 
seja expresso por uma faixa e não por um número
9 Dados brutos
9 Ex: Taxa de colesterol (mg/dl) em 80 pessoas
• Código 9 pacientes que não compareceram
• Observando os dados, não se pode saber em 
torno de que valor as medidas estão agrupadas, a 
forma da distribuição e a extensão da variabilidade.
• A Estatística Descritiva ajuda na percepção, 
avaliação e quantificação da variabilidade.
278 182 247 227 277 194 196 276 244 192
118 219 255 201 9 209 219 228 209 209
171 213 233 226 209 200 200 363 209 200
179 167 192 277 317 146 217 292 217 255
212 233 250 243 150 209 184 199 250 479
175 194 221 233 9 184 217 150 167 265
242 180 255 170 209 161 196 165 234 179
248 184 291 185 242 276 243 229 242 250
9 Dados brutos
Mês
Ano
2001 6 2 5 6 0 8 7 6 3 4 5 8
2002 10 9 7 6 3 4 6 4 5 4 0 1
2003 3 6 7 9 3 1 4 6 5 3 5 4
2004 7 2 5 8 6 4 2 5 1 6 5 2
Nov DezJul Ago Set OutMar Abr Mai JunJan Fev
9 Ex: Número de partos prematuros numa
maternidade
• Difícil extrair conclusões
• Repetição de alguns valores
• Podem ser organizados em tabelas de frequências
i xi fi
1 0 2
2 1 3
3 2 4
4 3 5
5 4 7
6 5 8
7 6 9
8 7 4
9 8 3
10 9 2
11 10 1
Total 48
Contagem ou 
tabulação
9 Distribuição de frequência→ dados tabulados não 
agrupados em classes
X→ nº de partos prematuros;
fi → nº de vezes que xi foi observado
Mês
Ano
2001 6 2 5 6 0 8 7 6 3 4 5 8
2002 10 9 7 6 3 4 6 4 5 4 0 1
2003 3 6 7 9 3 1 4 6 5 3 5 4
2004 7 2 5 8 6 4 2 5 1 6 5 2
Nov DezJul Ago Set OutMar Abr Mai JunJan Fev
9 Distribuição de frequências→ dados tabulados 
agrupados em classes
Ex: Distribuição de alturas de 100 pacientes
¾ |— inclusão do lim. inferior e exclusão do lim. sup.
Altura (cm) Número de pacientes
151 |– 159 5
159 |– 167 18
167 |– 175 42
175 |– 183 27
183 |– 191 8
Total 100
Ex: Distribuição de profissões entre suicidas potenciais
• Maior incidência entre profissionais mal remunerados, 
com sobrecarga de trabalho e sem perspectiva
• Alto percentual de menores e estudantes 
6,6% + 4,6% = 11,2%
Profissão Frequência Proporção
Serviços gerais 75 0.248
Doméstica 55 0.182
Do lar 53 0.175
Indeterminada 29 0.096
Emprego especializado 23 0.076
Menor 20 0.066
Desempregado 15 0.050
Estudante 14 0.046
Lavrador 12 0.040
Autônomo 4 0.013
Aposentado 2 0.007
Total 302 1
9 Tipos de frequência
• Frequência simples absoluta (fi)
• Frequência simples relativa (fri)
• Frequência relativa acumulada (Fri)
• Frequência absoluta acumulada (Fi)
9 Frequência simples absoluta (fi)
→ nº de obs. em cada classe
fi
4 |— 8 10
8 |— 12 12
12 |— 16 8
16 |— 20 5
20 |— 24 1
36
Classe
∑
¾ Somatório (∑)
∑
=
=++++=
5
1
451512963
i
ixEx.: x = {3, 6, 9,12 ,15} →
Generalizando: ∑
=
++++=
n
i
ni xxxxx
1
321 K
9 Frequência simples relativa (fri) 
→ proporção em relação ao total de obs.
 
n
ffr ii =
fi
4 |— 8 10 10/36 = 0.278 0.278 * 100 = 27.8
8 |— 12 12 12/36 = 0.333 0.333 * 100 = 33.3
12 |— 16 8 8/36 = 0.222 0.222 * 100 = 22.2
16 |— 20 5 5/36 = 0.139 0.139 * 100 = 13.9
20 |— 24 1 1/36 = 0.028 0.028 * 100 = 2.8
36
Classe fri fri (%)
∑ 1 100%
9 Construção da tabela de distribuição de 
frequências
1. Identificar o menor e o maior valor do conjunto 
de dados;
2. Escolher o nº de subintervalos de igual 
amplitude, englobando todos os dados sem 
superposição de intervalos;
3. Contar o nº de elementos pertencentes a cada 
classe (fi = frequência simples absoluta);
4. Calcular a frequência relativa de cada classe
fri = fi / n
(n = ∑ fi = nº total de observações)
9 Não existem normas para a construção da 
tabela de frequências
• Entre 5 e 15 classes
• Para amostra de tamanho n:
nº de classes = √n
ou
nº de classes = 1 + log2 n
9 Tamanho de cada classe
amplitude do conjunto / nº de classes
¾ Algumas regras práticas para determinar o nº
de classes
9 Ex: Distribuição de idades entre suicidas potenciais
• Maior incidência entre a faixa 20 |— 30
• Idades agrupadas em 7 classes
• 6 primeiras classes com mesma amplitude (10)
Idade (anos)
Frequência 
absoluta
(f i )
Frequência 
relativa
(fr i )
10 |– 20 56 18.54
20 |– 30 114 37.75
30 |– 40 58 19.21
40 |– 50 33 10.93
50 |– 60 19 6.29
60 |– 70 7 2.32
≥ 70 2 0.66
Indeterminada 13 4.30
Total 302 100
• Localização mais comum: cabeça / pescoço
¾ Distribuição de melanomas por localização 
anatômica
Localização anatômica Nº de casos %
Cabeça / pescoço 10 33.3
Tronco 7 23.3
Membros superiores 6 20.0
Membros inferiores 2 6.7
Acral 5 16.7
Total 30 100
9 Ex.: Melanomas
• O grande percentual de diagnósticos incorretos 
(23,3%) pode prejudicar a adequação do 
tratamento
¾ Distribuição de melanomas segundo diagnóstico 
clínico
9 Ex.: Melanomas
Diagnóstico clínico Nº de casos %
Correto 13 43.3
Duvidoso 10 33.3
Incorreto 7 23.3
Total 30 100
9Ex: Levantamento epidemiológico de 308 
idosos (81 sem demência e 227 com demência)
• A maioria dos idosos sem demência não 
apresenta alterações no grau de incapacidade
¾Distribuição de 81 idosos sem demência para 
algumas funções de comportamento
Funções de 
comportamento
Mobilidade 61 ( 75.3 %) 20 ( 24.7 %) 7 ( 8.6 %)
Agitação 60 ( 74.1 %) 21 ( 25.9 %) 1 ( 1.2 %)
Continência urinária 75 ( 92.6 %) 6 ( 7.4 %) 2 ( 2.5 %)
Sono 56 ( 69.1 %) 25 ( 30.9 %) 0 ( 0.0 %)
Humor objetivo 46 ( 56.8 %) 35 ( 43.2 %) 6 ( 7.4 %)
* O grupo "totalmente alterado" está contido no grupo "com alteração"
Sem 
alteração
Com alguma 
alteração
Totalmente 
alterado *
Grau de incapacidade
• A maioria (89,9%) dos idosos com demência 
apresenta alguma alteração de humor objetivo
9Ex: Levantamento epidemiológico de 308 
idosos (81 sem demência e 227 com demência)
¾Distribuição de 227 idosos com demência para 
algumas funções de comportamento
Funções de 
comportamento
Mobilidade 117 ( 51.5 %) 110 ( 48.5 %) 40 ( 17.6 %)
Agitação 121 ( 53.3 %) 106 ( 46.7 %) 6 ( 2.6 %)
Continência urinária 145 ( 63.9 %) 82 ( 36.1 %) 59 ( 26.0 %)
Sono 131 ( 57.7 %) 96 ( 42.3 %) 7 ( 3.1 %)
Humor objetivo 23 ( 10.1 %) 204 ( 89.9 %) 55 ( 24.2 %)
* O grupo "totalmente alterado" está contido no grupo "com alteração"
Grau de incapacidade
Sem 
alteração
Com alguma 
alteração
Totalmente 
alterado *
9 Frequência absoluta acumulada (Fi) 
→ (fi de cada classe) + (∑fi das classes anteriores)
fi Fi
4 |— 8 10 10
8 |— 12 12 22
12 |— 16 8 30
16 |— 20 5 35
20 |— 24 1 36
36
Classes
∑ 30+5 = 35
22+8 = 30
9 Frequência relativa acumulada (Fri) 
→ (fri de cada classe) + (∑fri das classes anteriores)
fi fri Fri Fri (%)
4 |— 8 10 0.278 0.278 27.8
8 |— 12 12 0.333 0.611 61.1
12 |— 16 8 0.222 0.833 83.3
16 |— 20 5 0.139 0.972 97.2
20 |— 24 1 0.028 1 100
36 1∑
Classes
9 Gráficos
• Gráfico de linha
• Diagrama de barras• Histograma
• Polígono de frequências
• Ogiva 
¾ Gráfico de linha
• Adequado para séries temporais
• Permite observar algum tipo de tendência e 
identificar eventos inusitados ex.: surto de 
uma doença
9 Ex.: AIDS no Brasil – 1980 a 1992
• Maior incidência no 
sexo masculino
9 Variáveis categóricas
9 Diagrama de barras tamanho de cada barra 
proporcional ao nº de indivíduos na categoria
¾ Ex.: Fraturas na face
C – carro | FF – arma de fogo | E – espancamento | A – atropelamento
M – moto | QA – queda de altura | QB – queda de bicicleta
FB – arma branca | O – outros 
C FF E A M QA O QB FB
35
0
N
ú
m
e
r
o
 
d
e
 
c
a
s
o
s
30
25
20
15
10
5
45
40
9 Variáveis quantitativas
¾ Histograma
• Gráfico de barras justapostas
• Eixo horizontal variável dividida em 
classes
• Eixo vertical uma barra para cada classe 
com altura igual à freq. absoluta ou relativa
• A barra é centrada no ponto médio da classe
9 Ex: Taxa de colesterol (mg/dl) (cont.)
Simples Acumulada Simples Acumulada
100 |– 150 2 2 0.03 0.03
150 |– 200 24 26 0.31 0.34
200 |– 250 35 61 0.45 0.79
250 |– 300 14 75 0.18 0.97
300 |– 350 1 76 0.01 0.98
350 |– 400 1 77 0.01 0.99
400 |– 450 0 77 0.00 0.99
450 |– 500 1 78 0.01 1
Total 78 - 1 -
Nível de 
colesterol
Frequência absoluta Frequência relativa
¾ Histograma
• A grande maioria tem 
colesterol em torno de 225.
• Boa descrição de como 
os níveis se distribuem em 
torno deste valor
9 Variáveis quantitativas
¾ Polígono de frequências
• Formado por segmentos de reta, que ligam as 
ordenadas correspondentes aos pontos médios 
de cada classe
9 Variáveis quantitativas
• Gráfico de linha formado por segmentos de 
reta que ligam as ordenadas correspondentes a 
cada Fi
¾ Ogiva: gráfico de frequências acumuladas
• eixo horizontal → intervalos de classe
• eixo vertical → para cada limite, assinalar 
a percentagem acumulada
9 Ex.: fi Fi Pontos médios
4 |— 8 10 10 6
8 |— 12 12 22 10
12 |— 16 8 30 14
16 |— 20 5 35 18
20 |— 24 1 36 22
36
Classes
∑
6
2
84 =+
Histograma e polígono de frequência
Classes
F
r
e
q
u
ê
n
c
i
a
 
a
b
s
o
l
u
t
a
0
2
4
6
8
1
0
1
2
0 4 8 12 16 20 24 28 4 8 12 16 20 24
0
5
1
0
1
5
2
0
2
5
3
0
3
5
Ogiva
Classes
F
r
e
q
u
ê
n
c
i
a
 
a
c
u
m
u
l
a
d
a
9 Ex: Taxa de colesterol (mg/dl) (cont.)
278 182 247 227 277 194 196 276 244 192
118 219 255 201 209 219 228 209 209 171
213 233 226 209 200 200 363 209 200 179
167 192 277 317 146 217 292 217 255 212
233 250 243 150 209 184 199 250 479 175
194 221 233 184 217 150 167 265 242 180
255 170 209 161 196 165 234 179 248 184
291 185 242 276 243 229 242 250
Simples Acumulada Simples Acumulada
100 |– 150 2 2 0.03 0.03
150 |– 200 24 26 0.31 0.34
200 |– 250 35 61 0.45 0.79
250 |– 300 14 75 0.18 0.97
300 |– 350 1 76 0.01 0.98
350 |– 400 1 77 0.01 0.99
400 |– 450 0 77 0.00 0.99
450 |– 500 1 78 0.01 1
Total 78 - 1 -
Nível de 
colesterol
Frequência absoluta Frequência relativa• nº de classes:√n = √78 = 8,83 ou 
1 + log2 n = 7,3⇒ 8 classes
• amplitude de cada 
classe:
(maior-menor)/8 = 
= (479-118)/8 = 45,12
⇒ 50 (escolha razoável)
9 Ex: Distr. de frequência da dosagem de ácido úrico
¾ Histograma
Simples Acumulada
3.0 |– 3.5 2 0.7 0.7
3.5 |– 4.0 15 5.6 6.3
4.0 |– 4.5 33 12.4 18.7
4.5 |– 5.0 40 15.0 33.7
5.0 |– 5.5 54 20.2 53.9
5.5 |– 6.0 47 17.6 71.5
6.0 |– 6.5 38 14.2 85.7
6.5 |– 7.0 16 6.0 91.7
7.0 |– 7.5 15 5.6 97.4
7.5 |– 8.0 3 1.1 98.5
8.0 |– 8.5 1 0.4 98.9
8.5 |– 9.0 3 1.1 100.0
Total 267 100.0 -
Ácido úrico 
(mg/dl)
%Frequência 
absoluta
¾ Polígono de 
frequência
¾ Ogiva
• Histograma e polígono de frequências visualizar 
a forma da distribuição da variável
• No exemplo, distribuição razoavelmente simétrica
• Sintetizam o conj. de dados com um só nº, que 
represente bem a distribuição da variável
• Se distribuição simétrica ⇒ média
• Se distribuição assimétrica ⇒ mediana
• Em dist. simétricas média e mediana 
aproximadamente iguais
9 Medidas de tendência central
¾ Média
• Dados não agrupados
9 Ex.: Peso de recém-nascidos
3,2 3,2 2,8 2,1 2,9 3,1 3,2 3,0 3,5 4,0
1,3
10
0,48,22,32,3 =++++= Kx
n
x
n
xxx
x
n
i
i
n
∑
==+++= 121 K
¾ Média
• Dados agrupados
9 Ex.:
∑
∑=
i
ii
f
xf
x
xi fi fi xi
3 2 6
12 3 36
9 2 18
2 8 16
∑ 15 76
07,5
15
76 === ∑
∑
i
ii
f
xf
x
¾ Média
• Dados agrupados em classes → xi é o ponto 
médio de cada classe.
9 Ex.:
2,11
36
404 === ∑
∑
i
ii
f
xf
x
fi xi fixi
4 |— 8 10 6 60
8 |— 12 12 10 120
12 |— 16 8 14 112
16 |— 20 5 18 90
20 |— 24 1 22 22
36 404∑
Classe
¾ Mediana
™ Ordenar os dados
™ Valor da mediana:
• Valor que divide a distribuição ao meio
• I.é, 50% das obs. ficam abaixo da mediana e 
50% ficam acima
2
2+n
n ímpar 
n par
2
1+n
média dos elementos de 
posição e
2
n
elemento de posição
¾ Mediana
9 Ex.: Peso de recém-nascidos
3,2 3,2 2,8 2,1 2,9 3,1 3,2 3,0 3,5 4,0
n = 10 média dos elementos de 
posição e
2
n
2
2+n
i.é, média dos elementos de 
posição 5 e 6
A mediana é a
média entre ⇒
3,1 e 3,2
15,3
2
2,31,3~ =+=x
¾ Quartis
9 Divide a distribuição em 4 partes iguais
Q1 Q2 Q3
0% 25% 50% 75% 100%
9 Posição do quartil de ordem i
• Resultado fracionário ⇒ posição = pos + 1
• Resultado inteiro ⇒ posição entre pos e pos + 1
4
nipos ⋅=
¾ Qi é o elemento de ordem (pos + 1) ou a média 
entre os elementos das posições pos e (pos + 1)
¾ Decis
9 Divide a distribuição em 10 partes iguais
9 Posição do decil de ordem i
• Resultado fracionário ⇒ posição = pos + 1
• Resultado inteiro ⇒ posição entre pos e pos + 1
40% 80%
D4 D8D1 D2 D3
60%0% 10% 20% 30% 50% 90% 100%
D9
70%
D5 D6 D7
10
nipos ⋅=
¾ Di é o elemento de ordem (pos + 1) ou a média 
entre os elementos das posições pos e (pos + 1)
¾ Percentis
9 Divide a distribuição em 100 partes iguais
9 Posição do percentil de ordem i
• Resultado fracionário ⇒ posição = pos + 1
• Resultado inteiro ⇒ posição entre pos e pos + 1
100
nipos ⋅=
¾ Pi é o elemento de ordem (pos + 1) ou a média 
entre os elementos das posições pos e (pos + 1)
¾ Ex. Níveis de albumina no sangue (g/dl)
4.44 4.47 4.48 4.51 4.54 4.54 4.61 4.64 4.66 4.68
4.68 4.69 4.71 4.73 4.76 4.76 4.76 4.81 4.86 4.86
4.87 4.88 4.90 4.90 4.95 4.95 4.96 4.97 4.98 4.98
4.99 5.00 5.01 5.01 5.01 5.02 5.04 5.05 5.08 5.09
5.09 5.10 5.11 5.11 5.16 5.17 5.18 5.18 5.19 5.24
5.24 5.26 5.27 5.27 5.29 5.32 5.35 5.46 5.50 5.85
9 Primeiro quartil (Q1)
15
4
60*1
4
==⋅= nipos → inteiro ⇒ posição entre 
15 e 16
¾ Q1 média entre 4,76 e 4,76 ⇒ Q1 = 4,76
¾Pelo menos 25% dos pacientes apresentam níveis 
de albumina menor ou igual a 4,76 g/dl
¾ Ex. Níveis de albumina no sangue (g/dl)
4.44 4.47 4.48 4.51 4.54 4.54 4.61 4.64 4.66 4.68
4.68 4.69 4.71 4.73 4.76 4.76 4.76 4.81 4.86 4.86
4.87 4.88 4.90 4.90 4.95 4.95 4.96 4.97 4.98 4.98
4.99 5.00 5.01 5.01 5.01 5.02 5.04 5.05 5.08 5.09
5.09 5.10 5.11 5.11 5.16 5.17 5.18 5.18 5.19 5.24
5.24 5.26 5.27 5.27 5.29 5.32 5.35 5.46 5.50 5.85
9 Percentil de ordem 80 (P80)
→ inteiro ⇒ posição entre 
48 e 49
¾ P80 média entre 5,18 e 5,19 ⇒ P80 = 5,185
¾Pelo menos 80% dos pacientes apresentam níveis 
de albumina menor ou igual a 5,185 g/dl
48
100
60*80
100
==⋅= nipos9 Percentil para dados agrupados
• Gráfico das frequências relativas acumuladas 
→ ogiva
• Uso de fórmula
P50 ≅ 14
9 Ex: Taxa de ácido úrico (cont.)
Simples Acumulada
3.0 |– 3.5 2 0.7 0.7
3.5 |– 4.0 15 5.6 6.3
4.0 |– 4.5 33 12.4 18.7
4.5 |– 5.0 40 15.0 33.7
5.0 |– 5.5 54 20.2 53.9
5.5 |– 6.0 47 17.6 71.5
6.0 |– 6.5 38 14.2 85.7
6.5 |– 7.0 16 6.0 91.7
7.0 |– 7.5 15 5.6 97.4
7.5 |– 8.0 3 1.1 98.5
8.0 |– 8.5 1 0.4 98.9
8.5 |– 9.0 3 1.1 100.0
Total 267 100.0 -
Ácido úrico 
(mg/dl)
%Frequência 
absoluta
P95 = 7,25 mg/dl⇒ cerca de 5% dos indivíduos 
têm taxas acima de 7,25 mg/dl
9 Medidas de dispersão
¾ Medem o grau de dispersão (variação) dos 
dados em torno da média.
ƒ Sejam, por exemplo, as notas de 3 grupos 
de alunos:
Grupo A: 6, 6, 6, 6, 6
Grupo B: 4, 5, 6, 7, 8
Grupo C: 2, 4, 6, 8, 10
¾Embora todos os grupos tenham obtido a 
média 6, observa-se que os valores se distribuem 
de forma diferente em torno da média.
9 Medidas de dispersão
ƒ Variância
ƒ Desvio-padrão
ƒ Coeficiente de variação
9 Variância populacional → dados não agrupados
 ( )
N
XX
N
i
i∑
=
−
= 1
2
2σ
• σ2 é a variância populacional 
• N é o tamanho da população
( )
1
1
2
2
−
−
=
∑
=
n
xx
s
n
i
i
• s2 é a variância amostral 
• n é o tamanho da amostra
9 Variância amostral → dados não agrupados
9 Variância amostral → dados não agrupados 
(outras fórmulas)
1
1
22
2
−
−
=
∑
=
n
xnx
s
n
i
i ( )
1
/
2
1
1
2
2
−
−
=
∑∑ ==
n
nxx
s
n
i i
n
i
iou
¾ Quanto maior a variância, maior a dispersão 
dos dados em torno da média
9 Ex. Variância amostral de x = (2, 4, 6, 8, 10)
xi (xi - x) (xi - x)
2
2 -4 16
4 -2 4
6 0 0
8 2 4
10 4 16
∑ 30 40
 
6
5
301 ===
∑
=
n
x
x
n
i
i
 ( ) ( )
10
4
40
151
5
1
2
1
2
2 ==−
−
=−
−
=
∑∑
== i
i
n
i
i xx
n
xx
s
 xi (xi)2
2 4
4 16
6 36
8 64
10 100
∑ 30 220
 
( ) 10
4
40
4
180220
15
65220
1
2
1
22
2 ==−=−
⋅−=−
−
=
∑
=
n
xnx
s
n
i
i
 ( )
10
4
180220
15
5
)30(220
1
2
2
1
1
2
2 =−=−
−
=−
−
=
∑∑ =
=
n
n
x
x
s
n
i i
n
i
i
ou
ou
9 Desvio-padrão populacional
2ss = • s2 é a variância amostral
• σ2 é a variância populacional2σσ =
9 Desvio-padrão amostral
9 Ex.: Peso de recém-nascidos
( )
1
1
2
2
−
−
=
∑
−
n
xx
s
n
i
i
1
1
22
2
−
−
=
∑
=
n
xnx
s
n
i
i
( )
1
/
2
1
1
2
2
−
−
=
∑∑ ==
n
nxx
s
n
i i
n
i
i
(3.2) (3.3)
(3.4)
9 Variância amostral → dados agrupados 
ou
 ( )
1
1
2
2
−
−
=
∑
=
n
fxx
s
k
i
ii
onde
 ∑
=
=
k
i
ifn
1
 ( )
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
−−= ∑ ∑= =
k
i
k
i ii
ii n
fx
fx
n
s
1
2
122
1
1
9 Ex.: Dados xi e fi, calcular a variância amostral
 xi fi fi xi (xi - x) (xi - x)2 (xi - x)2 fi
3 2 6 -2.07 4.28 8.57
12 3 36 6.93 48.02 144.07
9 2 18 3.93 15.44 30.89
2 8 16 -3.07 9.42 75.40
∑ 15 76 258.93
07,5
15
76 === ∑
∑
i
ii
f
xf
x
 ( )
5,18
115
93,258
1
1
2
2 =−=−
−
=
∑
=
n
fxx
s
k
i
ii
• ou
xi fi xi 2 xi 2 fi xi fi
3 2 9 18 6
12 3 144 432 36
9 2 81 162 18
2 8 4 32 16
∑ 15 644 76
 ( ) ( ) 5,18
15
5776644
14
1
15
76644
115
1
1
1 2
1
2
122 =⎥⎦
⎤⎢⎣
⎡ −=⎥⎦
⎤⎢⎣
⎡ −−=⎥⎥
⎥
⎦
⎤
⎢⎢
⎢
⎣
⎡
−−= ∑ ∑= =
k
i
k
i ii
ii n
fx
fx
n
s
9 Coeficiente de variação
x
sCV =
• Expresso em %;
• Medida de homogeneidade do conj. de dados;
• Vale 0 quando não há variabilidade entre os 
dados, ou seja, quando s=0. Isso ocorre quando 
todos os dados são iguais;
• Quanto menor o CV, maior a homogeneidade.
9 Coeficiente de variação
Grupo A 
xi (xi)2
6 36
6 36
6 36
6 36
6 36
∑ 180  
( ) 0
4
180180
15
65180
1
2
1
22
2 =−=−
−=−
−
=
∑
=
n
xnx
s
n
i
i
 
0=⇒ s 
0100*
6
0100 ==⋅=
x
sCV 
 
9 Ex.: Notas de 3 grupos de alunos
9 Coeficiente de variação
Grupo B 
xi (xi)2
4 16
5 25
6 36
7 49
8 64
∑ 190  
( ) 5,2
4
180190
15
65190
1
2
1
22
2 =−=−
−=−
−
=
∑
=
n
xnx
s
n
i
i
 
58,15,22 ===⇒ ss  
%4,26100*
6
58,1100 ==⋅=
x
sCV 
 
9 Ex.: Notas de 3 grupos de alunos
9 Coeficiente de variação
Grupo C 
xi (xi)2
2 4
4 16
6 36
8 64
10 100
∑ 220 
( ) 10
4
180220
15
65220
1
2
1
22
2 =−=−
−=−
−
=
∑
=
n
xnx
s
n
i
i
 
16,3102 ===⇒ ss  
%7,52100*
6
16,3100 ==⋅=
x
sCV 
 
¾ Mais homogêneo → grupo A → menor CV 
¾ Menos homogêneo → grupo C → maior CV
9 Ex.: Notas de 3 grupos de alunos
9 Ex.: Comparação do colesterol em 2 grupos
Grupo A: médicos residentes
média = 205 mg/dl e desvio-padrão = 22 mg/dl
Grupo B: médicos especialistas
média = 244 mg/dl e desvio-padrão = 45 mg/dl
¾ Conclusão:
• Médicos mais idosos apresentam média mais 
alta e maior variabilidade em torno da média
• CV do grupo A: 10,7% (mais homogêneo)
• CV do grupo B: 18,4%
9 Escore padronizado
• zi é o escore padronizado da observação i
• É o desvio da i-ésima obs. em relação à média 
dividido pelo desvio-padrão
• Fornece o nº de desvios-padrão que a obs. 
dista da média amostral.
ni
s
xxz ii ,,1, L=−=
9 Ex.: Peso de recém-nascidos
• Suponhamos que nasça um 
bebê de 4,1 kg
04,2
49,0
1,31,4 =−=−=
s
xxz ii
¾ Este peso está praticamente 2 
desvios-padrão acima da média.
9 Ex.: Dosagens laboratoriais
s
A B A B
Glicemia em jejum 85 12.5 90 79 0.40 -0.48
Ácido úrico 4.2 0.9 3.5 3.1 -0.78 -1.22
Triglicerídeos 105 30 97 66 -0.27 -1.30
Colesterol total 200 25 251 185 2.04 -0.60
Resultado 
original
Escore 
padronizadox
04.2
25
200251 =− 60.0
25
200185 −=−
¾ Paciente A → colesterol muito alto 
(2 desvios-padrão acima da média)
¾ Paciente B → nenhum resultado preocupante
¾ Coleta de dados
9 Cuidados a serem tomados → definição dos 
dados a serem coletados; como captar as 
informações; clareza do questionário
9 Instrumento de medida → depende do tipo de 
estudo ou da variável de interesse
• Experimento com cobaias → medida direta
• Inquérito → questionário
• Pesquisa clínica → formulário de 
informações ou prontuário 
¾ Banco de dados
9 O grau de dificuldade da construção do banco 
de dados varia de acordo com o nº de variáveis, 
tipo de dados, tamanho da amostra etc.
• Conferência das informações
• Verificar inconsistências
¾ Codificação
9 Variáveis dicotômicas → 0 e 1
9 Variáveis com k categorias → k-1 variáveis 
indicadoras (0 e 1)
• Categoria de referência → todas as variáveis 
indicadoras são iguais a 0 (ou a 1)
9 Variáveis contínuas → usar variáveis originais; 
só codificar se houver interesse apenas nas 
faixas pré-fixadas (ex. idade)
9 Ex.: Câncer de mama
• Supondo estádios não agrupados e estadiamento 
com 4 classificações (I, II, III e IV) ⇒ 3 variáveis 
indicadoras (I1, I2 e I3).
Categorias Códigos
Idade
< 60 0
≥ 60 1
Estadiamento
Estádios I e II 0
Estádios III e IV 1
Estádio I 1 I 2 I 3
I 0 0 0
II 1 0 0
III 0 1 0
IV 0 0 1
¾ Arredondamento
9 Se dígito seguinte ≥ 5 ⇒ arredondar para mais
• Exemplos: Arredondar até 1 casa decimal
87,72 → 87,7
90,58 → 90,6
98,04 → 98,0
9 De preferência, usar o mesmo nº de casas 
decimais em uma análise
9 Não arredondar o mesmo nº mais que uma vez
• Ex.: 87,348074 → 87,35 → 87,4Erro!
87,348074 → 87,3
¾ Boxplot
9 Útil para descrição de dados; visualização da 
variabilidade; e comparação entre grupos
ponto solto ponto externo valor máximo
0 ∗
Q1 Q3
valores
típicos
1,5 DQ
3 DQ
x~
¾ Boxplot
9 Desenha-se uma reta horizontal 
limitada pelo valor mínimo e máximo
9 Marcam-se os quartis nessa reta 
horizontal
9 Constrói-se um retângulo cortado por 
uma reta vertical, na posição de Q2
9 Q1 e Q3 são os limites do retângulo
¾ Boxplot
9 Calcula-se a distância interquartílica
9 Pontos externos: entre 1,5*DQ e 3*DQ
9 Pontos soltos: acima de 3*DQ
DQ = Q3 – Q1
¾ Boxplot
9Obs.: Se amplitude muito maior que DQ e 
Q2 mais próximo de Q1 do que de Q3
⇒ assimetria positiva e grande 
dispersão dos dados.
9Ex.: Doença de chagas
Dosagem de bilirrubina (mg/dl) de 46 crianças 
filhas de mães chagásicas
9Ex.: Doença de chagas (cont)
Estatísticas descritivas:
404,5=x
s = 2,967
xmin = 1,3
xmax = 12,5
Q1 = 3,175
Q2 = 4,3
Q3 = 7,05
Assimetria 
positiva
Amplitude: xmax - xmin = 11,2
DQ = Q3 – Q1 = 3,9
Amplitude >> DQ; e
Q2 muito mais próx. de Q1
⇒
9Ex.: Doença de chagas
ƒ dois outliers: ponto externo (6) e ponto solto (17)
ƒ valor ref. a 17 meses muito fora do padrão (3 meses)
ƒ valor 6 não considerado dado aberrante (conforme 
literatura)
ƒ criança que firmou a cabeça com 17 meses era 
portadora de paralisia cerebral
Distribuição da idade ao firmar a cabeça de 51 
crianças filhas de mães chagásicas
Simples Acumulada
2 10 19.61 19.61
3 28 54.90 74.51
4 10 19.61 94.12
5 1 1.96 96.08
6 1 1.96 98.04
17 1 1.96 100.00
Total 51 100.00 -
Frequência 
absoluta
%Idade ao firmar a 
cabeça (meses)
* 0
3 6 9 15 182 12
4. Probabilidade e
Avaliação de Testes Diagnósticos
¾Espaço amostral (E) – Conjunto de todos os 
resultados possíveis de um experimento aleatório
¾Eventos – subconjuntos do espaço amostral
¾Ex. : Lançamento de 1 dado
9E = {1, 2, 3, 4, 5, 6}
9B: evento número maior que 4
B= {5,6}
P(B) = 2/6
¾Ex. : Lançamento de 2 dados
E = {(1, 2), (1,3), ..., (6, 6)} 36 elementos
9F: evento soma igual a 10
F= {(4,6), (5,5), (6, 4)}
P(F) = 3/36
¾Evento interseção A ∩ B
¾Evento união A ∪ B
¾Eventos mutuamente exclusivos
9 A ocorrência de um impede a ocorrência do 
outro A ∩ B = φ
9Ex: no lançamento de uma moeda, “cara” e 
“coroa” são eventos mutuamente exclusivos
¾Propriedades da probabilidade
9 0 ≤ P(A) ≤ 1, ∀ A
9 P(E) = 1, onde E é o espaço amostral
9 Se A e B são mutuamente exclusivos
P(A ∪ B) = P(A) + P(B) A B
¾Valem as seguintes relações
9Se A e B são eventos quaisquer
P(A ∪ B) = P(A) + P(B) – P(A ∩ B)
9 P(A) = 1 - P(A)
¾Probabilidade Condicional
9 A ocorrência de um evento influencia a 
ocorrência de um outro
9 Ex: No lançamento de 2 dados:
A: soma igual a 8
B: resultado do 1º dado igual a 3
P(A | B) =?
Resultados possíveis: 
{(3,1), (3,2), (3,3), (3,4), (3,5), (3,6)}
Resultados de interesse: 
{(3,5)} 
P(A | B) = 1/6
¾Probabilidade Condicional
Pressão
arterial Excesso Normal Deficiente
Elevada 0,10 0,08 0,02 0,20
Normal 0,15 0,45 0,20 0,80
Total 0,25 0,53 0,22 1,00
Peso Total
¾Ex: Distribuição de peso e pressão arterial
A: ter pressão elevada ⇒ P(A)=0,2
9Qual a probabilidade de uma pessoa ter pressão 
elevada?
P(A∩B) = P(B) P(A|B)
ou
P(B∩A) = P(A) P(B|A)⇒
P(A∩B)
P(B)
P(A|B) =
Pressão
arterial Excesso Normal Deficiente
Elevada 0,10 0,08 0,02 0,20
Normal 0,15 0,45 0,20 0,80
Total 0,25 0,53 0,22 1,00
Peso Total
¾Ex: Distribuição de peso e pressão arterial
A: pressão elevada
B: excesso de peso ⇒ P(B)=0,25
P(A ∩ B) = 0,10
9Qual a probabilidade de uma pessoa ter pressão 
elevada, sabendo-se que tem excesso de peso?
P(A|B) = 0,10/0,25 = 0,4
™Dentre as pessoas com excesso de peso, 
40% tem pressão elevada
P(A∩B)
P(B)
P(A|B) =
¾Eventos independentes
9 A ocorrência de um não altera a probabilidade 
de ocorrência do outro 
9 I.é, a ocorrência de B não fornece nenhuma 
informação sobre a ocorrência de A
P(A|B) = P(A)
¾Ex. : Sorteando-se 2 cartas de 1 baralho, sem 
reposição, qual a probabilidade de ambas serem ás?
⇒ Eventos NÃO independentes
9 A: ás na 1ª extração ⇒ P(A)=4/52
9 B: ás na 2ª extração ⇒ P(B|A)=3/51
⇒ P(A∩B) = P(A) P(B|A) = (4/52)*(3/51) = 1/221 
¾Ex. : Sorteando-se 2 cartas de 1 baralho, com 
reposição, qual a probabilidade de ambas serem ás?
⇒ Eventos independentes
9 A: ás na 1ª extração ⇒ P(A) = 4/52
9 B: ás na 2ª extração ⇒ P(B|A) = P(B) = 4/52
⇒ P(A∩B) = P(A)*P(B) = (4/52)*(4/52) = 1/169 
¾Ex. : Qual o resultado mais provável:
- obter pelo menos um 6 em 4 jogadas de 1 dado ou
- obter soma 12 pelo menos uma vez em 24 jogadas 
de 2 dados?
Eventos independentes
9A: nº faces iguais a seis, em 4 jogadas de um dado
P(A≥1) = 1 - P(A=0) = 1 - (5/6)4 = 0,518
9 B: nº de somas doze em 24 jogadas de 2 dados
P(B≥1) = 1 - P(B=0) = 1 - (35/36)24 = 0,491
⇒ Resultado mais provável: 1ª alternativa
+ -
D a b a + b
~ D c d c + d
Total a + c b + d n
Doença TotalTeste
¾Qualidade de testes diagnósticos
9 sensibilidade: s = P(+ | D)
9 especificidade: e = P(- | ~D)
a
a + b
s = d
c + d
e =
¾Ex: 
Aplicação do teste ergométrico de tolerância a exercícios 
em 1465 pessoas com e sem doença coronariana
⇒ s = 815/1023 = 0,797
⇒ e = 327/442 = 0,740
+ -
D 815 208 1023
~ D 115 327 442
Total 930 535 1465
Doença 
coronariana
Teste Total
a
a + b
s =
d
c + d
e =
¾Limitações da sensibilidade e da especificidade
9 Não ajudam a decisão do médico, que ao 
receber um resultado positivo precisa avaliar se o 
paciente está ou não doente
¾Valor das predições
9 Valor preditivo positivo: VPP = P(D|+)
9 Valor preditivo negativo: VPN = P(~D|-)
+ -
D a b a + b
~ D c d c + d
Total a + c b + d n
Doença TotalTeste
a
a + c
VPP =
d
b + d
VPN =
9p=P(D) é a prevalência da doença, i.é, a proporção de 
doentes, ou a probabilidade de doença pré-teste
9s = sensibilidade
9e = especificidade 
+ -
D p ps p(1-s)
~ D 1-p (1-p)(1-e) (1-p)e
Total p+(1-p) ps+(1-p)(1-e) p(1-s)+(1-p)e
População Proporção com resultadoProporção
ps
ps + (1-p)(1-e)
VPP = 
(1-p)e
p(1-s)+(1-p)e
VPN = 
verdadeiros positivos ÷
total de positivos
verdadeiros negativos ÷
total de negativos
9 Proporção de falsos positivos
¾Decisões incorretas
PFP = P(~D | +) = 1 – P( D | +) = 1 - VPP
9 Proporção de falsos negativos
PFN = P( D | – ) = 1 – P(~D | – ) = 1 - VPN
¾Ex: Metástase de carcinoma hepático
s = 52/67 = 0,776
+ -
D 52 15 67
~ D 9 74 83
Total 61 89 150
Metástase Tomografia Total
e = 74/83 = 0,892
Para uma população cuja prevalência de metástase de 
carcinoma de fígado é de 2%, calcular VPP e VPN
ps 0,02 * 0,78
ps + (1-p)(1-e) 0,02 * 0,78 + (1-0,02)(1-0,89)
 = = 0,13VPP = 
(1-p)e (1-0,02)*0,89
p(1-s)+(1-p)e (1-0,02)(0,89)+0,02(1-0,78)
 = = 0,99VPN = 
p = 0,02
9 VPP=0,13 ⇒ Se o resultado do exame for 
positivo, há 13% de chance do indivíduo estar 
doente, contra 87% de não estar doente.
¾Ex.: 
Metástase de carcinoma hepático - conclusões
9 VPN=0,99 ⇒ Se o resultado do exame for 
negativo, há 99% de chance do indivíduo não estar 
doente, contra 1% de estar doente.
9 Antes de qualquer informação, o indivíduo tinha 
p=2% de chance estar doente. Se o resultado do 
exame for negativo, essa chance será reduzida 
para 1% (=1 – VPN).
9 Teste em paralelo
Resultado positivo se um ou outro teste for +
Tp+ = A+ ∪ B+
¾Combinação de testes diagnósticos
Teste A Teste B Teste em paralelo
- - -
- + +
+ - +
+ + +
9 sensibilidade: s = P(+ | D)
sp = sA + sB – sA sB
9 especificidade:e = P(- | ~D)
ep = eA eB (admitindo-se independência)
¾Combinação de testes diagnósticos
9 Teste em série
Resultado positivo se ambos os testes forem +
Ts+ = A+ ∩ B+
9 sensibilidade: s = P(+ | D)
sser = sA sB (admitindo-se independência)
9 especificidade: e = P(- | ~D)
eser = eA + eB – eA eB
Teste A Teste B Teste em série
- desnecessário -
+ - -
+ + +
¾Ex.: Diagnóstico de câncer pancreático
Teste sensibilidade (%) especifidade (%)
A (ultrasom) 80 60
B (tomografia) 90 90
C (A ou B +) 98 54
D (A e B +) 72 96
9 Teste C (em paralelo)
sp = sA + sB – sA sB = 0,8 + 0,9 – 0,8(0,9) = 0,98
ep = eA eB = 0,6(0,9) = 0,54
9 Teste D (em série)
sser = sA sB = 0,8(0,9) = 0,72
eser = eA + eB – eA eB = 0,6 + 0,9 – 0,6(0,9) = 
0 96
9 Sabendo-se a sens. e a espec. dos testes A e B, 
calcular sens. e espec. para os testes C e D
¾ Considerando a prevalência (p)
ps
ps + (1-p)(1-e)
VPP = (1-p)e
p(1-s)+(1-p)e
VPN = 
Teste s e VPP VPN
A 0,9500 0,9000 0,0876 0,9994
B 0,8000 0,9500 0,1391 0,9979
paralelo 0,9900 0,8550 0,0645 0,9999
série 0,7600 0,9950 0,6056 0,9976
¾ Ex.: Sabendo-se a sens. e a espec. dos testes e para 
uma prevalência de 1% (p=0,01)
ps 0,01 * 0,95
ps + (1-p)(1-e) (0,01 * 0,95) + (0,99 * 0,01)
VPP = = = 0,0876
(1-p)e 0,99*0,9
p(1-s)+(1-p)e 0,01(1-0,95)+0,99(0,9)
VPN = = = 0,9994
9 É necessário estabelecer o valor de referência 
ou ponto de corte, i.é, o valor a partir do qual o 
resultado do teste é + ou -
¾Testes diagnósticos para variáveis contínuas
9 Variando-se o ponto de corte, a sensibilidade e 
a especificidade também variam
9 É necessário escolher o valor que fornece a 
combinação de sensibilidade e especificidade mais 
adequada
¾Ex.: Distribuição da concentração sérica de digoxina
9critério 1: 
ponto de corte 1 ng/ml
(para resultado + ou –
no teste)
s = 18/21 = 0,86
e = 24/62 = 0,39
Digoxina
(ng/ml) Intoxicados Não intoxicados
0 |— 0,5 2 6
0,5 |— 1,0 1 18
1,0 |— 1,5 4 30
1,5 |— 2,0 4 8
2,0 |— 2,5 5 0
2,5 |— 3,0 1 0
3,0 |— 3,5 1 0
3,5 |— 4,0 1 0
4,0 |— 4,5 1 0
4,5 |— 5,0 1 0
Total 21 62
Pacientes
Classificação
de toxicidade + -
Intoxicado 18 3 21
Não intoxicado 38 24 62
Total 56 27 83
Teste de toxicidade Total
—
+
9critério 2: 
ponto de corte 1,5 ng/ml
(para resultado + ou –
no teste)
s = 14/21 = 0,67
e = 54/62 = 0,87
O critério 2 fornece 
perda de 
sensibilidade e ganho 
de especificidade 
¾Ex.: Distribuição da concentração sérica de digoxina
Digoxina
(ng/ml) Intoxicados Não intoxicados
0 |— 0,5 2 6
0,5 |— 1,0 1 18
1,0 |— 1,5 4 30
1,5 |— 2,0 4 8
2,0 |— 2,5 5 0
2,5 |— 3,0 1 0
3,0 |— 3,5 1 0
3,5 |— 4,0 1 0
4,0 |— 4,5 1 0
4,5 |— 5,0 1 0
Total 21 62
Pacientes
Classificação
de toxicidade + -
Intoxicado 14 7 21
Não intoxicado 8 54 62
Total 22 61 83
Teste de toxicidade Total
—
+
Referência
Soares, J. F., Siqueira, A. L. Introdução à Estatística 
Médica, UFMG, 1999.

Outros materiais