Buscar

apostila BIOESTATISTICA - DIOGO EDUARDO PASQUAL PENNA

Prévia do material em texto

Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
1
ÍNDICE 
CAPÍTULOS 
I-INTRODUÇÃO.................................................................... pág.4 
 Estatística Descritiva 
 Estatística Indutiva ou Inferencial 
a) coleta contínua 
b) coleta periódica 
c) coleta ocasional 
Apuração dos Dados; Apresentação dos Dados; Análise dos resultados; 
A Estatística nas Empresas 
 
II-POPULAÇÃO e AMOSTRA (ESTIMADOR ESTATÍSTICO)....pág.5 
Variável;Variável qualitativa (qualidade);Variável quantitativa (quantidade); 
População;Amostra 
Simbologia Utilizada para o estudo de uma população; 
Simbologia Utilizada para o estudo de uma amostra; 
 
III- CONSTRUÇÃO DE GRÁFICOS: em Barras, em Colunas, de Setores 
 
IV- MEDIDAS DE TENDÊNCIA CENTRAL – DADOS NÃO 
AGRUPADOS ...........................................................................................pág.8 
a)Cálculo da Média (mean): 
b)Cálculo da Moda (mode) 
c)Cálculo da Mediana (median): 
 
V- A DISTRIBUIÇÃO DE FREQUÊNCIA DE DADOS AGRUPADOS – 
MAS SEM INTERVALOS DE CLASSES..............................................pág.10 
Diagramas de freqüência - tabelas 
Média; Mediana e Moda – Exercícios diversos 
Dados Brutos e Rol 
 
VI – MEDIDAS DE DISPERSÃO OU VARIABILIDADE ................pág.14 
Desvio Médio; Variância; Desvio Padrão; Coeficiente de Variação de 
Pearson e de Thorndike; 
 
VI-a – SEPARATRIZES.........................................................................pág.19 
 (Quartis- Decis- Percentis) – Medidas de Posição – 
Coeficiente Percentílico de Curtose - 
Classificação das Curvas ( leptocúrtica; mesocúrtica e platicúrtica); Rol e 
Dados Brutos – Exercícios 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
2
 
VI-b –COEFICIENTE DE ASSIMETRIA.............................................pág.23 
 
VI–c–SÉRIES ESTATÍSTICAS DISCRETAS COM CÁLCULO 
ABREVIADO DA VARIÂNCIA E DESVIO PADRÃO (SEM CALCULAR 
O DESVIO MÉDIO)................................................................................pág.24 
 
VII – DISTRIBUIÇÃO DE FREQÜÊNCIA EM CLASSE ( DADOS 
AGRUPADOS).........................................................................................pág.25 
Dados Brutos e Rol 
Conceitos Básicos: 
1.Limites de Observação 
2.Intervalo de Observação 
3.Amplitude de Observação 
4.Definição do número de classes – Regra de Sturges 
5.Construção da Distribuição de Freqüência : 
6.Construção da Distribuição de Freqüência 
7.Classe de uma (Distribuição de Freqüência) 
8.Limites de Classe 
9.Amplitude de Classe (h) 
10.Limites da Distribuição de Freqüência 
11.Amplitude da Distribuição de Freqüência 
12.Número de observações 
13.Variável: 
14.Ponto Médio de Classe 
Fórmulas para calcular a mediana, a Moda calculada e a Curtose: 
15.O Cálculo da Mediana na Distribuição de Freqüência com Dados 
Agrupados ou Grupados 
16.O cálculo da Moda Calculada 
17.O cálculo da CURTOSE (Coeficiente Percentílico de Curtose) na 
Distribuição de Freqüência em Classes ( Dados Agrupados). 
18.Fórmulas para o cálculo dos quartis; Fórmula para o cálculo dos percentis; 
19.Classificação das Curvas; 
Gráfico da curva polida 
20.A freqüência calculada 
 
VIII – PROBABILIDADE.......................................................................pág31 
Experimento Aleatório 
Definição 
Espaço Amostral 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
3
Tipos de Probabilidade: 
 probabilidade clássica ( ou teórica) 
 probabilidade empírica ( ou estatística) 
 Probabilidade Subjetiva 
 
VIII. a) DISTRIBUIÇÃO DE PROBABILIDADE..............................pág.37 
 
VIII b) PROBABILIDADE CLÁSSICA.................................................pág.41 
 
 Probabilidade de um Evento 
 Probabilidade da não ocorrência de um evento 
 Probabilidade de uma união (eventos mutuamente excludentes) 
ou“o terceiro postulado de probabilidade” 
 Probabilidade de uma intersecção 
 Intersecção e união no mesmo exercício – utilização conjunta de 
ambos na mesma fórmula: 
 evento elementar: apenas um ponto amostral 
 evento certo: igual ao espaço amostral S 
 evento impossível: conjunto vazio 
 Princípio da Multiplicação 
 Amostragem com reposição 
 Amostragem sem reposição 
 Arranjos !
( )!
n
n k
 
 Combinações 
 Probabilidade Condicional Pr( )Pr( )
Pr( )
A B
A B
B

 
Eventos independentes: são dois eventos que não se afetam mutuamente. 
Probabilidade Condicional: é a probabilidade de ocorrência de um 
determinado evento, quando se sabe que outro evento ocorreu. 
 
 Eventos complementares (p + q =1  q = 1- p) 
 
 Eventos Independentes Pr( ) Pr( )A B A Pr( ) Pr( )A B A 
 Eventos Mutuamente Exclusivos 
 Exercícios 
 
IX – Regressão e Correlação Linear................................................. pág.51 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
4
X –Distribuição Normal Reduzida.................................................... pág.56 
 
XI- Intervalos de Confiança para a Média....................................... .pág 60 
 
XII-Testes de Hipóteses e Níveis de Significância......................... pág 66 
 
XIII – BIBLIOGRAFIA........................................................................pág.70 
 
Fórmulas ............................................................................... págs. 71 – 75 
 
Tabela z....................................................................................... pág.76-77 
 
---------------------------------------------------------------------------------------------- 
 
I-INTRODUÇÃO: 
 
A Estatística é uma parte da Matemática Aplicada que fornece métodos 
para a coleta, organização, descrição, análise e interpretação de dados e para a 
utilização dos mesmos na tomada de decisões. 
Estatística Descritiva: trata da coleta, da organização e da descrição dos 
dados. 
Estatística Indutiva ou Inferencial : trata da análise e da interpretação dos 
dados. 
A coleta pode ser direta ou indireta. A direta pode ser: 
a)coleta contínua: registro de nascimentos e óbitos e da freqüência dos 
alunos às aulas. 
b)coleta periódica: feita em intervalos constantes como os censos (10 em 
10 anos) e as avaliações mensais de alunos. 
c)coleta ocasional: quando feita extemporaneamente. Exemplo: no caso de 
epidemias que assolam ou dizimam rebanhos inteiros. 
 
A coleta indireta é feita através de dados colhidos por uma coleta direta 
(exemplo:pesquisa sobre a mortalidade infantil). 
 
Apuração dos Dados: é a soma e o processamento dos dados obtidos e a 
disposição mediante critérios de classificação. Pode ser manual ou eletrônica. 
Apresentação dos Dados: Os dados devem ser apresentados sob forma 
adequada (tabelas e/ou gráficos) tornando mais fácil o exame e o tratamento 
estatístico. 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
5
Análise dos resultados: O objetivo último da Estatística é tirar conclusões 
sobre o todo (população) a partir de informações fornecidas por parte 
representativa do todo (amostra). Nesta fase entramos na Estatística Indutiva 
ou Inferencial da onde tiramos conclusões e previsões. 
 
A Estatística nas Empresas : no mundo atual , a empresa é uma das vigas-
mestras da Economia dos Povos. 
 A direção de uma empresa, de qualquer tipo, privadas estatais ou 
governamentais (públicas), exige de seu administrador a importante tarefa de 
tomar decisões, e o conhecimento e o uso da Estatística facilitarão seu tríplice 
trabalho de organizar, dirigir e controlar a empresa. 
 Por meio de sondagem, de coleta de dados e de recenseamento de 
opiniões, podemos conhecer a realidade geográfica e social, os recursos 
naturais, humanos e financeiros disponíveis, as expectativas da comunidade 
sobre a empresa, e estabelecer suas metas, seus objetivos com maior 
possibilidade de serem alcançados a curto, médio ou longo prazos. 
 A Estatística ajudará em tal trabalho, como também na seleção e 
organização da estratégia a ser adotada do empreendimento e, ainda, na 
escolha das técnicas de verificação e avaliação da quantidade e da qualidade 
do produto e mesmo dos possíveis lucros e /ou perdas. 
 Tudo isso que se pensou, que se planejou, precisa ficar registrado, 
documentado, para evitar esquecimentos, a fim de garantir o bom uso do 
tempo, da energia e do material e, ainda, para um controle eficiente do 
trabalho. 
 O esquema do planejamento é o plano, que pode ser resumido, com 
auxílio da Estatística, em tabelas e gráficos, que facilitarão a compreensão 
visual dos cálculos matemático-estatísticos que lhes deram origem. 
 O homem e a mulher de hoje, em suas múltiplas atividades, lançam mão 
de processos e técnicas estatísticas, e só estudando-as evitaremos o erro das 
generalizações apressadas à respeito de tabelas e gráficos apresentados em 
jornais e revistas e na televisão, frequentemente cometido quando se conhece 
apenas “por cima” um pouco de Estatística. 
 Concluído este curso o aluno terá um conhecimento básico que deverá 
ser aperfeiçoado no futuro, mas o pontapé inicial será dado aqui. 
 
II-POPULAÇÃO e AMOSTRA (ESTIMADOR ESTATÍSTICO) 
 
variável: é o conjunto de resultados possíveis de um fenômeno. 
Matematicamente é representada pelas últimas letras do alfabeto: r, s, t, u. v, 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
6
w, x, y e z. A soma de todas as variáveis será representada aqui pela letra “n” 
ou 
1
n
i
fi

 . Símbolo de somatório  . 
Variável qualitativa (qualidade): é quando seus valores são expressos por 
atributos:sexo masculino ou feminino, cor da pele (amarela, branca, negra, 
vermelha, parda, etc.) . 
Variável quantitativa (quantidade):quando seus valores são expressos em 
números (salários, idades etc). Podem ser Contínuas ou Discretas. 
 
População: Conjunto a ser estudado 
Amostra: subconjunto finito de uma população. 
- a amostra deve ser suficientemente grande. 
- seus constituintes devem ter sido selecionados ao acaso. 
A Estatística Indutiva tem por objetivo tirar conclusões sobre as populações, 
com base em resultados verificados em amostras retiradas dessa população. 
Mas para as inferências serem corretas, é necessário garantir que a amostra 
seja representativa da população, isto é, deve possuir as mesmas 
características básicas da população, no que diz respeito ao fenômeno que 
desejamos pesquisar. É preciso que a amostra seja obtida por processos 
adequados.A amostragem pode ser simples ou complexa. É importante que 
cada elemento da população tenha a mesma chance de ser amostrado. 
Técnicas de Amostragem: 
 Amostragem casual ou aleatória simples. 
 Amostragem estratificada: utilizada quando a população se divide em 
subpopulações – estratos.(90 alunos(as) de uma escola) 
 
sexo população 10% Amostra 
MASCULINO 54 10x54/100 = 5,4 5 
FEMININO 36 10x36/100 = 3,6 4 
total 90 10x90/100 = 9 9 
Tabela n.º 01 
 Amostragem Sistemática: é quando os elementos da população já se 
acham ordenados, não havendo necessidade de construir o sistema de 
referência. São exemplos os prontuários médicos de um hospital, os 
prédios de uma rua, as linhas de produção. 
Exemplo: Suponhamos uma rua contendo novecentos prédios, dos quais 
desejamos obter uma amostra formada de cinqüenta prédios. 
900/50=18. Seriam selecionados 18 prédios através de sorteio 
sistemático. 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
7
 
Simbologia Utilizada para o estudo de uma população: 
 
 = mi ou mu (utilizada para representar a média da população). 
 = sigma ( utilizada para representar o desvio padrão da população) 
2 = sigma ao quadrado. (utilizado para representar a variância da população) 
N = n.º total de elementos da população (’N’ maiúsculo) 
 
Simbologia Utilizada para o estudo de uma amostra: 
 
X = X BARRA ( utilizado para representar a média da amostra). 
S = do inglês – standard deviation (utilizado para representar o desvio 
padrão da amostra. 
2S = S ao quadrado (utilizada para representar a variância da amostra) 
n = n.º total de elementos da amostra ( ‘n’ minúsculo) 
 
III-SOMATÓRIOS 
 
símbolo =  = Letra sigma maiúscula do alfabeto grego que representa uma 
soma. 
Exemplo: 1 2 3 4 5 6X X X X X X     pode ser representado abreviadamente por 
6
1
i
i
X

 (lê-se: somatório de iX com i variando de 1 a 6) 
Neste caso 1 é o limite inferior do somatório e 6 o limite superior do 
somatório. 
lim sup
lim inf
ite erior
i
ite erior
X 
Exemplo: calcule 
5
2
1
3
i
i

 resolução: 2 2 2 2 23.1 3.2 3.3 3.4 3.5    
5
2
1
3
i
i

 =3 + 12 + 27 + 48 + 75 
5
2
1
3
i
i

 = 165 
 
Exercícios de Aprendizagem: 
 
1- Calcule: a) 
6
1
(5 2)
i
i

 Resp: 93 ; b) 
2
3
(1 )
i
i

 Resp: 9 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
8
2- Calcule:  
10
0
1
2i
i

 Resp: 22 
 
3- EncontreS, sendo S = 
3 5
2 2
1 1
( 2 )
j r
j r r
 
   Resp: 39 
 
4- Calcule 
3 4
2
0 1
( 1) (4 )
n j
n j
 
    Resp: -12 
 
5- Calcule 
1
1
2nn


 Resp:  0 (aproximadamente zero) 
 
IV- MEDIDAS DE TENDÊNCIA CENTRAL – DADOS NÃO 
AGRUPADOS 
 
Média, mediana, moda. Separatrizes: Mediana, quartis, decis e percentis 
 Estudaremos a seguir três medidas de tendência central, são elas: 
 
Media – Mediana – Moda 
 
Dados os seguintes valores: 7, 8, 10, 10, 10, 9, 15, 13, 12, 11 
a) Cálculo da Média (mean): 
 
 = 7 8 9 10 10 10 11 12 13 15
10
         = 10,5 
A média é utilizada quando desejamos obter a medida de posição que possui 
maior estabilidade e quando houver necessidade de um tratamento algébrico 
ulterior. 
Desvantagem: é afetada pelos valores extremos. 
b) Cálculo da Moda: A moda é o valor que ocorre com maior freqüência. 
 
Mo = 10 
 
Se nenhum valor se repetisse a distribuição seria amodal (sem moda). Assim 
como poderia haver duas modas (bimodal), três modas (trimodal) e mais de 
três modas (multimodal). 
A moda é utilizada quando desejamos obter uma medida rápida e aproximada 
de posição e quando a medida de posição deve ser o valor mais típico da 
distribuição. 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
9
c)Cálculo da Mediana (median): é uma medida de posição definida como o 
n.º que se encontra no centro de uma série de números, estando estes dispostos 
segundo uma ordem (crescente ou decrescente). É o valor situado de tal forma 
no conjunto que o separa em dois subconjuntos de mesmo n.º de elementos. 
 
 Md = 7, 8, 9,10, 10, 10, 11, 12, 13, 15 
 
Verificamos que, estando ordenados os valores de uma série e sendo “n” o n.º 
de elementos da série, o valor mediano será: 
-O termo de ordem 1
2
n  , se n for ímpar 
-A média aritmética dos termos de ordem 1
2 2
n n
e  se n for par. 
 
No exemplo acima n é par. Então o cálculo da mediana será a soma dos 
termos centrais divididos por dois. 10 + 10 = 10. Ou então: 
 2 
0 010 10 1 5 6
2 2
e e  (é a média aritmética entre o quinto e o sexto elemento da 
distribuição) 
 
Mediana: 10 + 10 = 10 
 2 
Exercícios: 
 
)calcular a média, a moda e a mediana da série abaixo relacionada: 
 
5, 13, 10, 2, 18, 15, 6, 16, 9 
Resp: Md = 10;  = 10,4; amodal 
 
) 2, 6, 7, 10, 12, 13, 18, 21 
 
) 5, 7, 13, 15 
 
)5, 7, 10, 13, 65 
 
)2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
10
V- A DISTRIBUIÇÃO DE FREQUÊNCIA DE DADOS AGRUPADOS – 
MAS SEM INTERVALOS DE CLASSES 
 
 Quando trabalhamos com dados discretos (valores inteiros) utilizamos 
a seguinte organização dos dados: 
Suponha uma população com uma distribuição estatística conforme a tabela 
abaixo: 
Disciplina: BIOESTATÍSTICA 
 
n.º 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 
nota 5 4 6 8 3 5 7 6 8 4 6 9 7 5 7 5 6 8 7 9 4 6 6 8 7 
(tabela n.º 2) 
- População estatística: grupo dos 25 alunos de Bioestatística. 
- Unidade estatística: cada aluno desta turma 
- Variável estatística: as notas de uma prova de Bioestatística. 
 
Organização destes dados através de uma Tabela de Freqüência 
 
iX if iF rif riF 
3 1 1 1/25 = 4 % 4% 
4 3 4 3/25 = 12% 16% 
5 4 8 4/25 = 16% 32% 
6 6 14 6/25 = 24% 56% 
7 5 19 5/25 = 20% 76% 
8 4 23 4/25 = 16% 92% 
9 2 25 2/25 = 8 % 100% 
 25 100% 
(tabela n.º 03) 
iX = variável estatística: nota de cada aluno podendo variar de 0 a 10. 
if = freqüência simples ou absoluta é os valores que realmente representam o 
n.º de dados. 
iF = frequência acumulada é o total das freqüências de todos os valores 
inferiores ao limite superior de cada dado. 
rif = frequência relativa: são os valores das razões entre as freqüências simples 
e a freqüência total: rif = if /
1
n
i
fi

 . 
Pergunta-se: Quanto por cento dos alunos tirou nota igual ou inferior a 6? 
Resp: 56%. 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
11
Qual o percentual de alunos que tirou nota igual ou superior a 7 ? Resp: 44% 
Qual a nota que obteve o maior percentual de ocorrência ? Resp: 6 (24%). 
Desta forma, com os dados organizados, é possível tirar conclusões. 
 
Utilizando os dados das tabelas n.ºs 2 e 3, pág 5, calcule a média, a mediana 
e a moda. 
iX if iF iX . if 
3 1 1(até o prim.) 3x1 = 3 
4 3 4(até o quar.) 4x3 = 12 
5 4 8(até o oitavo) 5x4 = 20 
6 6 14(até o 14 ) 6x6=36 
7 5 19 7x5=35 
8 4 23 8x4=32 
9 2 25 9x2=18 
 25 156 
Tabela n.º 4 
Quando os dados estão agrupados utiliza-se as seguintes fórmulas para o 
cálculo da: 
Média =  = i i
i
X f
f


 =156
25
= 6,24 
Obs: Quando não temos freqüência utiliza-se: 
i
ri
f
f
n


, sendo n minúsculo 
quando se trata de amostra e N maiúsculo quando é toda a população que está 
sendo calculada. (n = total da amostra; N = total da população). 
 
Moda = não é necessário cálculos para obtenção da moda, basta observar na 
coluna das freqüências simples ou absolutas qual o valor que mais ocorre 
(aquele que têm a maior freqüência), neste caso é a nota 6. 
Mo = 6 
Mediana = Utiliza-se a fórmula : 
2
ifP  = 25/2 = 12,5 
Ou utiliza-se a regra: 1
2
n  025 1 13
2

 
Ou seja, a mediana está situada entre o 012 e o 013 elementos (soma-se os dois 
e divide-se por dois). Observa-se então na coluna das freqüências 
acumulada aonde se encontra o 13 (décimo-terceiro) elemento. Este 
corresponde a variável 6. 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
12
Md = 6 
Exercícios de Aprendizagem 
 ) Um dado foi jogado 20 vezes, sendo obtidos os seguintes pontos:1, 5, 6, 
5, 2, 2, 2, 4, 6, 5, 2, 3, 3, 1, 6, 6, 5, 5, 4, 2. 
Elabore um quadro com distribuição de freqüências absolutas, frequências 
absolutas acumuladas, freqüências relativas e freqüências relativas 
acumuladas. Qual a média, a mediana e a moda desta distribuição de 
freqüências com dados agrupados mas “sem intervalos de classe”. 
 
  )Após montar a tabela do exercício anterior ‘ ’ responda as questões 
abaixo: 
 
a)Quantas vezes o n.º 2 foi obtido no dado ? resp: 5 vezes 
 
b)Quantas vezes o n.º obtido do dado foi menor do que 5 ? resp: 11 vezes 
 
c)Qual o índice em % em que o n.º 6 foi obtido no dado ? resp: 20% 
 
d)Qual o índice em % em que n.ºs maiores do que4 foram obtidos no dado? 
Resp: 45% 
 
 ) A tabela abaixo mostra a média dos 25 alunos de uma turma de um 
curso de Administração noturno na disciplina de Matemática Aplicada. 
Responda as perguntas abaixo: 
a)Elabore uma quadro de freqüências absolutas, absolutas acumuladas; de 
freqüências relativas e relativas acumuladas. Calcule a média, a mediana e a 
moda desta distribuição. 
b)Quantos alunos obtiveram a média 6? Resp: 6 
 
c)Quantos alunos obtiveram média menor do que 6 ? resp: 12 
 
d)Quantos alunos obtiveram média superior a 6 ? 7 
 
e)qual o índice em % de reprovação considerando a média 5? Resp: 20% 
 
f)Qual o índice em % de alunos eu obtiveram média maior do que 7? 16% 
 
g) Qual o índice em % de alunos que obtiveram média maior ou igual a 5,0 e 
menor do que 7? Resp: 52 %. 
Quadro - Disciplina: Matemática Aplicada – Turma de Administração - 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
13
 
n.º 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 
nota 4 7 5 5 5 4 9 4 5 6 6 7 6 6 5 4 4 8 7 6 6 8 5 5 8 
Tabela n.º 5 
iX if iF iX if rif riF 
4 
5 
6 
7 
8 
9 
 
 Tabela n.º 6 
 ) Em uma escola, o conceito de cada bimestre é representado por 
letras: A, B, C, D e E. Em um determinado bimestre, os conceitos dos 
alunos em geografia foram os seguintes: 
 
 Disciplina: geografia – conceitos do bimestre 
n.º 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 
C B A C C D C D A A C E D D C B C B C C B 
 Tabela n.º 7 
Elabore um quadro de distribuição de frequências absolutas e freqüências 
absolutas acumuladas. 
 
 ) Os salários mensais, em dezenas de reais, dos 20 funcionários de 
uma empresa são: 
 
72, 72, 80, 88, 84, 72, 76, 80, 92, 72, 76, 80, 84, 72, 68, 76, 80, 72, 88 e 76 
Elabore um quadro de distribuição de freqüências absolutas e absolutas 
acumuladas. Calcule os salários: médio, mediano e modal. 
 
 
 
 
 
 
Tabela 8 (completar) 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
14
VI – MEDIDAS DE DISPERSÃO OU VARIABILIDADE 
 
Estudaremos aqui o Desvio Médio (dm); a Variância [ ( 2 2ou S  ]; o desvio 
padrão [ ou S   ] e os Coeficientes de Variação de Pearson e de 
Thorndike. 
 
Desvio Médio: O quadro abaixo mostra o n.º de acidentes ocorridos durante 
um ano, subdivididos em 4 trimestres em uma Fundição 
 
Trimestre 1.º 2.º 3.º 4.º 
Acidentes 5 8 6 9 
Tabela 9 
Cálculo da média de acidentes: 
 = 1 2 3 4 5 8 6 9
4 4
X X X X     
  = 7 
Calculemos agora as diferenças entre cada uma das notas e a média 
X ou X X      
dm = 6 1,5
4 4
  
  Daí podemos dizer que a fórmula 
para calcular o desvio médio quando não temos freqüência é a 
seguinte: 1 1
n n
i i
i i
X X X
dm ou dm
N n

 
     
   
 
 
 
x f X (media) d(desvio) f.d 2d f. 2d 
5 1 7 2 2 4 4 
8 1 7 1 1 1 1 
6 1 7 1 1 1 1 
9 1 7 2 2 4 4 
 4 10 
 
2
2
1
f X X
S
f





 (fórmula para o cálculo da variância de uma amostra) 
2
2 f X
f





(fórmula para o cálculo da variância da população) 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
15
 10
4
 = 2,5 (variância = somatório dos desvios elevados ao quadrado 
divididos pelo tamanho total da população) 
 
2s s (fórmula para calcular o desvio padrão da amostra) 
 
2  (fórmula para o calculo do desvio padrão da população) 
 
2,5  = 1,58 (desvio padrão = raiz quadrada da variância) 
 
CV= Coeficiente de Variação de Pearson 
 
CV = 1,58.100 .100
7
S
X
  0,2257.100 = 22,57% 
Exercício: Qual o desvio médio do conjunto de dados: 7, 12,, 20, 16, 10 
Resp: 4; 
Calcular o desvio padrão. 
Cálculo do Desvio Médio quando temos freqüências. 
Fórmula a ser utilizada: 1
n
i
X
N


  
 
Exemplo: 
O quadro a seguir nos mostra a distribuição dos erros cometidos por 25 
alunos numa prova de Biologia. Nessas condições, qual é o desvio médio 
dessa distribuição ? 
n.º de erros( ix ) 
 
n.º de 
alunos ( if ) 
aF (FREQ. 
ACUMULADA) 
X (MÉDIA) d= x X 
 
.i if d 
0 3 3 2 d= 0 2 =2 3x2=6 
1 6 9 2 d= 1 2 1  6x1=6 
2 8 17 2 d= 2 2 0  8x0=0 
3 5 22 2 d= 3 2 1  5x1=5 
4 2 24 2 d= 4 2 2  2x2=4 
5 1 25 2 d= 5 2 3  1x3=3 
 25 
 24 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
16
25
1
.
24
0,96
25
i
i
i
fi d
f
  


. Então o desvio médio é de 0,96. 
 
Calcular o desvio padrão e o coeficiente de variação da população acima. 
Dada a tabela abaixo, calcule o desvio padrão e o coeficiente de variação 
amostral: 
 
x f F x.f X X = 
d 
f.d 2 2X X d  
2 2. .f X X f d  
0 10 
1 19 
2 7 
3 7 
4 2 
5 1 
6 4 
 50 91 145,40 
2
2 145,4 ~ 1,7
1 49
f X X
s s
n

   

 ; 
1,7
.100 94,44%
1,8
X
X

  
. 91
1,8
50
X f
X
n
   
C.V= 1,7.100 94,44%
1,8
X
X

   
Exercícios complementares: 
a) O tempo gasto por 6 alunos para fazer um trabalho foi, em minutos: 6, 
5, 5, 3, 3 e 2. Nessas condições, calcule a média aritmética, o desvio 
médio, a variância, o desvio padrão e o coeficiente de variação dessa 
distribuição. 
x f F  x.f x  d f.d d² f.d² 
2 1 
3 2 
5 2 
6 1 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
17
Respostas: Dm(desvio médio) = 1,33; Média = 4; variância = 2; desvio padrão=1,41; Coeficiente 
de variação: 35,25%. Calcule também a mediana e a moda. 
b- A tabela a seguir nos mostra o n.º de operários acidentados por mês numa 
fábrica durante o ano de 1991. 
x f F  x.f x  d f.d 2d f. 2d 
3 4 
4 3 
6 1 
7 2 
8 2 
 
Respostas: media = 5; desvio médio = 1,83; variância = 3,83; desvio padrão = 1,96; coeficiente de 
variação= 39,2%. Calcule a mediana e a média. 
 
c-O quadro nos mostra o n.º de defeitos por carro de uma determinada marca 
numa frota de 40 veículos, calcule as medidas de dispersão e de tendência 
central. 
 
x f F  x.f x  d f.d 2d f. 2d 
0 6 
1 9 
2 7 
3 4 
4 9 
5 5 
 
 
Respostas: media = 2,4; desvio médio= 1,49; variância = 2,79; desvio 
padrão = 1,67; mediana = 2 ; moda = 1 e 4; moda calculada: 1,2. 
 
d- Determine a média aritmética, a moda, a mediana, o desvio padrão, o 
desvio médio, a variância e o coeficiente de variação de Pearson e de 
Thorndike, dos valores apresentados na tabela seguinte: 
 
x f F x.f  x  d f.d 2d f. 2d 
2 5 
3 10 
4 15 
5 12 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
18
6 5 
7 3 
 
Respostas: media = 4,22; desvio médio = 1,06; variância = 1,72; desvio padrão = 1,31 ; mediana = 
4; moda = 4; moda calculada: 
 
e- As alturas dos elementos de uma equipe de basquete são, em centímetros = 
195, 198, 201, 192, e 204. Nessas condições determine as medidas de 
tendência central (média, mediana e moda) e as de dispersão (desvio médio, 
variância, desvio padrão e coeficiente de Pearson). 
 
 
i (contador) x  x  d 2d 
1 192 198 
2 195 198 
3 198 198 
4 201 198 
5 204 198 
 
 
Respostas: 1
n
i
i
X
X
n


 = 990/5 = 198; desvio médio = 1
n
i
i
d
n


 = 18/5 = 3,6 
2
2 1
n
i
i
d
n
 
 2
2 1
n
i
i
d
n
 

=90/5 = 18; 2 18 ~ 4,24    
 
VI-a – SEPARATRIZES (Quartis- Decis- Percentis) – Medidas de Posição 
 
Assim como a média, a mediana e a moda são medidas de posição, os quartis, 
decis e percentis também são. 
Os quartis, decis e percentis são muito similares à mediana, uma vez que 
também subdividem a distribuição de medidas de acordo com a proporção das 
freqüências observadas, enquanto que a mediana divide a distribuição em duas 
metades ( à mediana ocupa a posição central de duas partes iguais deixando 
50% dos valores para cada lado), os quartis dividem-na em 4 quartos (4 
partes de 25% cada), os decis em 10 décimos ( 10 partes de 10% cada uma) e 
os pontos percentis dividem-na em 100 partes iguais. 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
19
Em função de que à fórmula para o cálculo da Curtose (coeficiente 
percentílico de curtose), utilizar apenas o 1Q  primeiro quartil = (n + 1) 
1
4
; 
3Q  terceiro quartil = (n + 1) 
3
4
; 90P = percentil 90 (noventa) = (n +1) 
90
100
 e 
10P  percentil 10(dez) = (n + 1) 
10
100
, utilizaremos apenas estas quatro 
separatrizes. 
A Fórmula de Curtose utilizada é a seguinte: 3 1
90 102( )
Q Q
c
P P



 
Em função da curtose temos a classificação das curvas em relação à curva 
normal ou curva de Gauss. 
Relativamente à curva normal temos: C=0,263 
 
C = 0,263  curva mesocúrtica ( curva de frequência com grau de 
achatamento igual ao da curva de Gauss) 
C < 0,263 curva leptocúrtica ( curva de freqüência com grau de 
achatamento menor do que o da curva de Gauss) 
C > 0,263 curva platicúrtica ( curva de freqüência com grau de achatamento 
maior do que a curva de Gauss). 
 
Formato das curvas classificadas conforme o grau de achatamento: 
CURVA MESOCÚRTICA CURVA LEPTOCÚRTICA CURVA PLATICÚRTICA
Exemplo: Sabendo-se que uma distribuição de frequência apresenta as 
seguintes medidas: 
 
1
1 1 13
( 1). (12 1). 3,25
4 4 4
Q n      1Q = 24,4 cm; 3Q = 41,2 cm; 10P = 20,2 cm; 
90P = 49,5 cm 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
20
 
41, 2 24, 4 16,8
0, 2866
2(49,5 20,2) 58,6
C

  

 onde concluímos que a distribuição é 
platicúrtica em relação a normal ou em relação a curva de frequência de 
Gauss, pois 0,2866 > 0,263. 
 
Exercícios de Fixação: 
a) Consideremos as seguintes temperaturas elevadas registradas em 12 
cidades européias em graus Fahrenheit em um dia de junho ( verão 
europeu): 
Dados Brutos coletados: 90 75 86 77 85 72 78 79 94 82 74 93 
Rol: dados organizados: 72 74 75 77 78 79 82 85 86 90 93 94 
A temperatura mediana corresponde ao quartil 2 e vale 80,5 ºF. 
80.5 ºF valem 26,94 ºC. Então n = 12. 
 
 
89 75,5 13,5 13,5
0,319
2(93,7 72,6) 2(21,10) 42,2
C

   

. Conclusão: como 0,319 > 0,263 a 
curva é platicúrtica em relação a normal. (é achatada). 
 
 
b) Observando os dois conjuntos abaixo diga qual dos dois apresenta maior 
dispersão: 
 
 10 11 11 11 12 12 12 12 13 14 14 ; 
 
Amplitude: 14-10= 4 
 
 1 5 6 9 11 12 12 15 18 21 22 ; 
 
 Amplitude : 22 -1= 21 
 
O 2.º conjunto é mais disperso do que o 1.º 
 
 
e)Os dados abaixo referem-se ao peso, em kilogramas, de 25 pacientes de um 
hospital: 
 
51,4 63,5 64,3 71,3 85,7 68,8 77,8 76,5 89,3 43,5 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
21
74,6 76,5 50,7 55,7 59,7 77,8 75,6 61,3 68,7 69,8 
 
64,5 65,7 63,7 81,0 46,7 
 
Calcule a media, mediana, moda, moda calculada; quartil 1, quartil 3, 
percentil, 10, percentil 90, amplitude, intervalo interquartil, desvio medio, 
variância, desvio padrão, coeficiente de variação de Pearson e de Thorndike, 
assimetria de Pearson, Curtose e frequências relativas e acumuladas. 
 
Resposta em kilos: =67,36; md=68,70; moda=76,5; moda calculada: 71,38; 
Quartil 1 =60,65; Quartil 3 = 76,50; percentil 10 = 49,10; percentil 90 = 82,88; 
amplitude = 45,8; intervalo interquartil = 15,85 ; desvio médio = 9,41; variância = 
133,73; desvio padrão = 11,56; Coeficiente de Variação de Pearson = 17,17 %; C.V. de 
Thorndike =16,83%; Assimetria = -0,3478 
Curtose = 0,234 
 
VI-b –COEFICIENTE DE ASSIMETRIA 
 
Calcula-se o coeficiente de assimetria através da fórmula abaixo, tendo-se 
conhecidas a média, a mediana e o desvio padrão. 
 
3( )
S
Md
A



 
Se o coeficiente estiver no intervalo de 0,15 < SA < 1 a assimetria é 
moderada. 
Se o coeficiente de assimetria for SA > 1 a assimetria é forte. 
Se a media e a mediana forem iguais 0SA  e a curva é simétrica. 
Se a mediana for maior do que a média a assimetria é negativa.(cauda para a 
esquerda onde mo md   ). 
Se a mediana for menor do que a média a assimetria é positiva ( cauda paraà 
direita onde mo md   ). 
 
Cálculo da variância e do Desvio Padrão da População: 
Fórmula: 
2
2 ( )x
N
  e 2  
N maiúsculo = n.º total da população 
Cálculo da variância e do Desvio Padrão da Amostra: 
 
2
2 ( )
1
x X
s
n


 e 
2s s 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
22
n minúsculo = n.º total da amostra. 
 
VI–C–SÉRIES ESTATÍSTICAS DISCRETAS COM CÁLCULO 
ABREVIADO DA VARIÂNCIA E DESVIO PADRÃO (SEM 
CALCULAR O DESVIO MÉDIO) 
 
Exercícios: 1-calcule: média; mediana; moda; quartil 3 e quartil 1; variância; 
desvio padrão; coeficiente de variação de Pearson e de Thorndike dos dados: 
 
Cruzamento (i) n.º de acidentes (X) X² 
1 7 49 
2 5 25 
3 8 64 
4 6 36 
5 4 16 
 X = 30  X² =190 
a)=6 acidentes; b)md=6 acidentes; c) mo=amodal; d) 3Q = calculado = 7,5 deduzido = 
7 acidentes; e) 1Q = 5 acidentes; calculado 4,5; f)variância: calcula-se pela fórmula: 
22
2 190 30
5 5
X X
n n

 
     
 
  =38- 36 =2 acidentes g)desvio padrão = 
 = 2 2 1,41   acidentes. h)CV de Pearson = 23,50%; i) CV de Thorndike = 23,50% 
Exercício n.º 2- Calcule a media, o desvio padrão e o coefic. de variação de 
Pearson: 
n.º de 
dependentes (X) 
n.º de 
empregados (f) 
f.X X² f.X² 
0 8 0 0 0 
1 7 7 1 7 
2 9 18 4 36 
3 3 9 9 27 
4 2 8 16 32 
5 1 5 25 25 
 30 47 / 127 
a)=1,57 dependentes; b) 
22
2 . . 127 47 4, 23 2, 46 1,77
30 30
f x f x
n n

 
        
 
  
b) desvio padrão 2 1,77 1,33    dependentes 
c) Coeficiente de variabilidade de Pearson = 84,71 % 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
23
Até aqui trabalhamos com a estatística discreta, valores inteiros. Daqui para 
frente trabalharemos com dados contínuos (valores reais). 
 
Exercício n.º 3 - Calcule a media, a mediana e a moda calculada, o intervalo 
interquartil, a amplitude e o coeficiente de assimetria e de curtose do conjunto 
abaixo: 
 
13 9 18 15 14 21 7 10 11 20 5 18 37 16 17 
 
Resp:  =15,4; md= 2Q  15; mo=18; 90 27, 4P  1Q  10; 3Q  18; 10P = 6,2; 90 27, 4P  
Amplitude= 32; intervalo interquartil=8; C = 0,1887 ; Assimetria= 0,162 
Desvio padrão =7,4. 
 
Exercício n.º 4- A partir dos dados abaixo calcule a media, moda, mediana, 
variância, desvio padrão; coeficiente de variação, coeficiente de assimetria , 
curtose, amplitude e intervalo interquartil dos dados a seguir que referem-se 
aos custos das mensalidades, em milhares de dólares, para 25 faculdades de 
artes estão relacionados abaixo: 
 
23 25 30 23 20 22 21 15 25 24 30 25 30 20 23 29 20 19 22 23 29 
23 28 22 28 
 
respostas: =24; md=23; mo=23;moda-calculada= 3 28Q  ; 10 19,6P  ; 
CV Pearson = 16,1; CV Thorndike = ; Coef. Assim= 0,7692; 
3 28Q  ; 1 21,5Q  ; 90 30P  ; 10 19,6P  ; curtose = 
 
VII – DISTRIBUIÇÃO DE FREQÜÊNCIA EM CLASSE ( DADOS 
AGRUPADOS) 
 
Dados Brutos : São aqueles que ainda não foram numericamente organizados. 
 
Rol: é um arranjo de dados numéricos brutos colocados em ordem crescente 
ou em ordem decrescente de grandeza. 
 
Quando se resumem grandes massas de dados brutos costuma-se 
frequentemente distribuí-los em classes ou categorias, determinando o número 
de indivíduos pertencentes a cada uma das classes. Essa distribuição em 
classes é denominada distribuição de freqüência. 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
24
Exemplo: Sejam as notas de 50 alunos (avaliadas de zero a cem) abaixo 
(dados brutos): 
 
80 67 60 98 25 31 49 39 12 27 45 40 46 53 59 64 71 85 87 53 59 
28 61 57 53 22 57 36 29 22 18 05 03 20 38 08 07 09 79 65 58 55 
48 41 15 63 75 79 75 37 
Rol: o próximo passo é colocar os dados brutos acima em ordem crescente ou 
decrescente para a seguir estudar e entender os conceitos básicos a seguir: 
 
3 5 7 8 9 12 15 18 20 22 22 25 27 28 29 31 36 37 38 39 40 41 
45 46 48 49 51 53 53 53 55 57 57 58 59 59 60 63 64 65 67 71 75 
75 79 79 80 85 87 98 
 
Conceitos Básicos 
 
1.Limites de Observação: são os valores extremos encontrados nos dados 
brutos. 
 
iL  limite inferior (menor valor dos dados coletados) 
iL  03 
 sL = limite superior (maior valor dos dados coletados) 
 sL = 98 
2.Intervalo de Observação: é definido pelos limites de observação. 
 
   ; 3;98i SL L  
 
3.Amplitude de Observação:é a diferença entre os limites de observação. 
 
98 03 95s iL L    98 03 95s iL L    
 
4.Definição do número de classes: 
 Para determinar o número de classes há diversos métodos. A regra de 
Sturges, um dos métodos, estabelece que o n.º de classes é igual 
a: 101 3.3logk n  onde k representa o n.º de classes e n o número total de 
observações. No exemplo acima n =50 e log de 50 = 1,69897 então aplicando 
a regra de Sturges temos: 
Poderíamos então montar a nossa distribuição em 07 classes. Mas podemos 
utilizar, por exemplo, 5 classes, nada impede nossa decisão. 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
25
Definindo a largura da classe: Como temo uma amplitude 95 de observação 
então dividindo-se 95 por 7 (classe) teremos aproximadamente 14. podemos 
assim definir a nossa distribuição em sete classes com largura 14 para cada 
classe. 
5.Construção da Distribuição de Freqüência : 
00 14-----6 
14 28-----7 
28 42-----9 
42 56-----8 
56 70----11 
70 84-----6 
84 98----3 
6.Construção da Distribuição de Freqüência:poderia ser assim: 
03 17 
17 31 
31 45 
45 59 
63 77 
77 91 
91 105  
Como existe a probabilidade de um aluno tirar a nota 0 e também a nota 100, a 
amplitude da DF é 100 e a nossa DF deveria conter as notas extremas 0 e 100 
e a DF ficaria com largura 15 e sete classes, com o seguinte formato: 
00 15 
15 30 
30 45 
45 60 
60 75 
75 90 
90 105 
O símbolo  significa que o intervalo de observação de cada classe é fechado 
à esquerda e aberto à direita, assim todos os limites superiores de classe não 
estão contidos nelas mas sempre na classe seguinte. Por exemplo: a 1.ª classe 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_____________________________________________________________________________________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
26
vai de 0 a 14, mas o 14 não está contido nessa classe e sim na 2.ª classe que 
vai de 14 a 28 e assim por diante. 
 
7.Classe de uma (Distribuição de Freqüência): é o nome dado a cada 
subintervalo da distribuição. 
 
8.Limites de Classe: são os valores extremos encontrados em cada classe e 
representados por l (éle) minúsculo. 
il = limite inferior de classe; sl = limite superior de classe 
Exemplo: 
 
il = 00 na classe 1 e sl =14 na classe 1 
 
9.Amplitude de Classe (h): é a diferença entre os limites de classe. A 
amplitude de classe pode ser variável ou constante. 
 
Exemplo: Largura da 1.ª classe s ih l l  = 14 - 00 = 14 
 
10.Limites da Distribuição de Freqüência: são o limite inferior da primeira 
classe e o limite superior da última classe. Esses limites geralmente não 
coincidem com os limites de observação. Deveria ser 00 e 100, mas como o 
limite superior observado foi 98, com 7 classes e largura 14 nossos limites 
ficaram: 
 
00
98S
Li
L


 
No nosso casso o limite inferior da distribuição é 00 e o limite inferior 
observado é 03. 
O limite superior da distribuição e o limite superior observado são , neste 
caso, igual, ou seja, 98. 
 
11.Amplitude da Distribuição de Freqüência: é a diferença entre os limites da 
distribuição. 
 
98 00 98DFH    , já a amplitude da observação é de 95. 
98 03 95obsH    
 
12.Número de observações: é o número que representa a quantidade dos dados 
a serem organizados. 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
27
 
Símbolo: n (amostra) ou N (população) ou 
1
n
i
i
f

 , em nosso exercício N = 
50. 
 
13.Variável: Variável é um símbolo que associamos ao conjunto objeto de 
estudo que representa esse conjunto. Atribuímos o símbolo x para esta 
variável. 
 
14.Ponto Médio de Classe: é a média aritmética simples dos extremos de cada 
classe. 
 
2
i s
i
l l
x

 em nosso exercício somando-se o limite inferior com o 
superior da 1.ª classe, por exemplo, obtemos: 00 14 7
2i
x

  , que é o ponto 
médio da 1.ª classe. 
 
 15.O Cálculo da Mediana na Distribuição de Freqüência com Dados 
Agrupados ou Grupados 
 
Fórmula utilizada: Md = 2 .
anterior
f
F
li h
f
 
 
  
 
  

 
Onde li = limite inferior da CME (classe mediana) 
 
2
f = Ponto central da distribuição – local aonde se encontra a md 
 anteriorF = Freqüência acumulada anterior à CME 
 h = largura da CME 
 f = freqüência simples ou absoluta da CME 
 
16.O cálculo da Moda Calculada: 
 
3( ) 2( )calculadaMo mediana média  
17.O cálculo da CURTOSE (Coeficiente percentílico de Curtose) na 
Distribuição de Freqüência em Classes ( Dados Agrupados). 
 
3 1
90 102( )
Q Q
C
P P



 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
28
18.Fórmulas para o cálculo dos quartis: 3
3
4
f
Q   ; 1
1.
4
f
Q   
 Fórmula para o cálculo dos percentis: 10
10
100
f
P   ; 90
90
100
f
P   
 
19.Classificação das Curvas: 
 
=0,263: mesocúrtica (curva de Gauss) 
 0,263: platicúrtica 
< 0,263 : leptocúrtica 
 
 Exercícios de Distribuição de Freqüência em Classes: 
 
a- Sabemos que a fração mínima de terras escriturava é de 2 (dois) 
hectares em zonas rurais, e que são taxadas com ITR (imposto 
territorial rural) em vez de IPTU (imposto predial e territorial urbano) 
e cujo fracionamento em módulos é feito pelo INCRA. A distribuição 
abaixo nos mostra as terras cultivadas de uma determinada região em 
hectares (h a). Frações territoriais rurais menores do que dois 
hectares devem ser licenciados pela FEPAM ou pela SEMMA, para 
terem escrituras reconhecidas e registradas em cartório. 
 
Classe x f F x.f  X  d F.d 2d f. 2d 
 2 8 10 
 8 14 9 
14 20 21 
20 26 7 
26 32 3 
 
Resposta: media = 15,08; Desvio médio: 5,5; variância = 45,27; Desvio Padrão = 6,72; 
Coeficiente de variação = 44,56%. ; Mediana = 15,7; moda = 
Moda Calculada= ;Quartil 1 = 9,7; Quartil 3 = 19,3; Percentil 10 = 5; Percentil 90 = 
24,3; Curtose 0,2; Assimetria= -0,3. 
 
b- Na tabela a seguir estão relacionados os valores correspondentes ao 
consumo individual de energia elétrica medido em quilowatts-hora em 
um grupo de 50 usuários particulares. 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
29
Dados Brutos 
 
58 62 80 57 8 126 136 96 144 19 90 86 38 94 82 75 148 
 
114 131 28 66 95 121 158 64 105 118 73 83 81 50 92 60 
 
52 89 58 10 90 94 74 9 75 72 157 125 76 88 78 84 36 
 
 Rol 
 
8 9 10 19 28 36 38 50 52 57 58 58 60 62 64 66 72 73 
 
74 75 75 76 78 80 81 82 83 84 86 88 89 90 90 92 94 94 
 
95 96 105 114 118 121 125 126 131 136 144 148 157 158 
 
Utilize a regra de Sturges (k = 1+ 3,3 log n) para determinar o número de 
classes. Lembre-se que o log 50 = 1,69897 
K = 1 + 3,3 log 50; K = 1+3,3 . 1,69807; K= 6,6 
Total = 7 classes. Definindo a largura das classes: 158 – 8 = 150/7 = 22,7 
 
classes x f F x.f  X  d f.d 2d f. 2d 
8 30 
30 52 
52 74 
74 96 
96 118 
118 140 
140 162 
 
Respostas: Média = 83,24; Mediana = 82,1; moda não calculada: 81,5; moda calculada (3md - 
2 ) = ; Q1 =61,9; Q3 = 99,7; P10 = 30; P 90 = 136,3 
Variância = 1255,3; Desvio Padrão= 35,4; CV= 42,6; Assimetria = 0,0966; Curtose= 0,177 (curva 
leptocúrtica); Intervalo Interquartil = 37,8; 
c-Em um estudo de seguro de acidentes com veículos motorizados no estado de Nova 
York, classificam-se as colisões fatais de acordo com a hora da manhã. Conforme 
tabelas abaixo. 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
30
[fonte: dados do New York State Department of Motor Vehicles – Departamento de 
Veículos motorizados do Estado de Nova York] 
Responda as questões abaixo: 
a) Média =.................................... 
b) Mediana =................................. 
c) Moda =...................................... 
d) Desvio médio =......................... 
e) Variância =.................................f) Desvio padrão =............................ 
g) Coeficiente de Variação de Pearson =.............................. 
h) Coeficiente de Variação de Thorndike=.............................. 
i) Assimetria =..................................................................... 
j) Quartil 1 =.................................................. 
k) Quartil 3 =............................................. 
l) Percentil 10 =........................................ 
m) Percentil 90 = 
n) Curtose (SEPARATRIZES) e classificação da curva em leptocúrtica, Mesocúrtica 
ou platicúrtica =.................................................. 
o) Intervalo Interquartil =............................................. 
p) Amplitude =................................................... 
q) Qual o percentual de acidentes fatais entre as zero (0) horas e às 4 da 
madrugada................... 
r) Qual o percentual de acidentes fatais entre as 8 da manhã e o meio dia (12 
horas)...................... 
HORA (f) (F) x .f.x 
cf 
Xx 
 
(d) f.d 
 
2d 
 
f. 2d fr. Fra 
00 02 
 
194 
02 04 
 
149 
04 06 
 
100 
06 08 
 
131 
08 10 
 
119 
10 12 
 
160 
 
 
 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
31
d)Exercício utilizando fórmulas da variância e do desvio padrão amostral: 
 
Considerando que distribuição de freqüência acima tenha seus dados obtidos 
através de uma amostragem calcule: a variância e o desvio padrão amostral 
utilizando as fórmulas: 
 
2
2 ( ) var
1
X X
S
n

 

 ; 
 = desvio padrão amostral: 
 
e)Exemplo: Determine a média e o desvio padrão da amostra do conjunto 
de dado. 
n.º de crianças em 50 famílias: 
 
1 3 1 1 1 1 2 2 1 0 1 1 0 0 0 1 5 0 3 6 3 0 3 1 1 
 
1 1 6 0 1 3 6 6 1 2 2 3 0 1 1 4 1 1 2 2 0 3 0 2 4 
 
Você coletou uma amostra aleatória do n.º de crianças por família em uma 
região. Os resultados estão dispostos na tabela acima. 
X f x.f X X 2( )X X 2( )X X .f 
0 10 0 -1,8 3,24 32,40 
1 19 19 -0,8 0,64 12,16 
2 7 14 0,2 0,04 0,28 
3 7 21 1,2 1,44 10,08 
4 2 8 2,2 4,84 9,68 
5 1 5 3,2 10,24 10,24 
6 4 24 4,2 17,64 70,56 
  =50  =91  =145,40 
 (media da amostra); 
 
2
2 ( ) . 145,4 1,7
1 50 1
X X f
s s
n

   
 
 (desvio padrão de 1,7 crianças) 
 
VIII – P ROBABILIDADE 
 
 O cálculo das probabilidades pertence ao campo da Matemática. 
Sua inclusão neste estudo, cujo objetivo é essencialmente a Estatística 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
32
encontra explicação no fato de que a maioria dos fenômenos de que trata a 
Estatística são de natureza aleatória ou probabilística. Conseqüentemente, o 
conhecimento dos aspectos mais fundamentais, do cálculo de probabilidades 
é uma necessidade essencial para o estudo da Estatística. 
 
Experimento Aleatório 
 
 Em quase tudo, em maior ou menor grau, vislumbramos o acaso. 
Assim a afirmação: “é provável que meu time do coração ganhe a partida 
hoje”, pode resultar: 
a)que apesar do favoritismo perca; 
b)que, como pensamos, ganhe; 
c)que empate. 
Como vimos , o resultado final depende do acaso. Fenômenos como esse 
denominamos fenômenos aleatórios ou experimentos aleatórios. 
----------------------------------------------------------------------------------------------. 
Aleatório: é aquilo que depende de acontecimentos futuros incertos; casual; 
fortuito; contingente; que pode ou não suceder; eventual; duvidoso; inopinado. 
Os postulados da probabilidade: 
1.º POSTULADO: As probabilidades são números reais positivos ou zero ; 
simbolicamente:P(A) 0 para qualquer evento A . 
2.º POSTULADO: Qualquer espaço amostral tem probabilidade 1; 
simbolicamente P(S) = 1 para qualquer espaço amostral S. 
 
Definição 
 
 Experimentos ou fenômenos aleatórios são aqueles que, mesmo 
repetidos várias vezes sob condições semelhantes apresentam resultados 
imprevisíveis, isto é, não podem ser previstos ou vistos com antecedência. 
Exemplos: 
1. O lançamento de uma moeda ( probabilidade: ½); 
2. A aposta em um jogo qualquer da loteria esportiva (probabilidade:1/3); 
3. A disputa de par ou ímpar (probabilidade: ½) 
4. O lançamento de uma dado (probabilidade: 1/6) 
5. O lançamento de um tetraedro ( probabilidade: ¼) 
6. Tirar uma dama num baralho de 52 cartas (probabilidade: 1/52) 
 
Espaço Amostral 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
33
 O conjunto S (space), de todos os resultados possíveis de um dado 
experimento aleatório chama-se espaço amostral. Qualquer elemento do 
espaço amostral é chamado de amostra ou ponto amostral. 
 
Exemplo 1: No lançamento de um dado o espaço amostral é o conjunto S = {1, 
 2, 3, 4, 5, 6} n(S) = 6 
Exemplo 2: Quando jogamos uma moeda o espaço amostral é o conjunto: 
 S = {CARA, COROA}. n(S) = 2. 
Exemplo 3: Ao disputarmos um par ou ímpar o espaço amostral da soma dos 
 Resultados, é S={PAR, IMPAR}. n(S) = 2. 
 
Tipos de Probabilidade 
 
 Há três tipos de probabilidade: clássica, empírica e subjetiva. A 
probabilidade de um evento E ocorrer é escrita com P(E) – lê-se “a 
probabilidade do evento E”. 
 
Definição- a) A probabilidade clássica ( ou teórica) é usada quando cada 
resultado no espaço amostral tem a mesma probabilidade de ocorrer. A 
probabilidade clássica para um evento E é dada por: 
 
P (E) = número de resultados em E , onde S = espaço amostral e 0 P(E)  1 
 n.º total de resultados em S 
 
Exemplo: Um dado de seis faces é jogado. Obtenha a probabilidade dos 
seguintes eventos: 
 
1.Evento A: obter um 3 – Solução: { P (3) = 1/6 ( ) f fP E ou
n f


 0,167} 
2.Evento B: obter um 7 – Solução: { P (7) = 0/6 = zero 
3.Evento C: obter um n.º menor do que 5. – Solução: há 4 resultados menores 
do que 5 - C={1, 2, 3 e 4}. Assim, 4/6 = 2/3  0,667. 
 
b) A probabilidade empírica ( ou estatística) baseia-se em observações 
obtidas de experimentos probabilísticos. A probabilidade empírica de 
um evento E é a freqüência relativa desse evento 
 
P(E) = Freqüência do Evento E onde 0 P(E)  1 
 frequência Total 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
34
( )
f f
P E ou
n f


 Exemplo: obtendo probabilidades empíricas. Um açude 
contém trêstipos de peixes: carpa húngara; catfish e bagre africano. Cada 
peixe no açude tem a mesma probabilidade de ser capturado. Você pesca 40 
peixes e anota seu tipo. Após cada captura, você devolve o peixe ao açude. A 
seguinte distribuição de freqüência mostra seus resultados. 
 
Tipo de Peixe (x) n.º de vezes em que foi pescado (f) 
Carpa húngara 13 
Catfish 17 
Bagre africano 10 
 
Se após isso você capturar um novo peixe, qual será a probabilidade de que 
ele seja uma carpa húngara ? 
 
P(Carpa Húngara) = 1.000f  
 
Na tabela abaixo temos algumas probabilidades de alguns eventos: 
 
Aparecer na televisão Uma em 490.000 
Cair um raio na Cabeça (U.S.A) Uma em 700.000 
Ganhar na Loteria de New York (acertar 6 de 
54 números) 
Uma em 25.827.165 
Probabilidade de acertar a placa de um 
automóvel 3 426 17.576;10 10.000  
Uma em 175.760.000 
Ser vítima de um crime sério 5% 
O congresso derrubar um veto 4% 
Escrever um livro de sucesso 0,00205 
Obter um Ph.D (doutorado em Filosofia) 0,008 
Usando as distribuições de freqüência para obter as probabilidades 
 
Exemplo: você levanta uma amostra de mil funcionários em uma companhia 
e registra a idade de cada um deles, os resultados estão a seguir na distribuição 
de freqüência abaixo. Pergunta: se você selecionar ao acaso outro 
funcionário, qual será a probabilidade de a idade dele estar entre 25 e 34 
anos ? 
 
 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
35
(x) idade dos funcionários Freqüência (f) 
 15 a 24 54 
25 a 34 366 
35 a 44 233 
45 a 54 180 
55 a 64 125 
65 ou mais 42 
 1.000f  
 
Solução: P(faixa etária entre 25 e 34)=366/1000 = 0,366 x 100 = 36,6% 
Qual a probabilidade de o funcionário não estar nesta faixa etária. 
P(E’) = 1 – P(E) = 1- 0,366 = 0,634. 
 
c)Probabilidade Subjetiva 
 
O terceiro tipo de probabilidade é a subjetiva. A probabilidade subjetiva 
resulta de intuição, estimativa, ou de um “palpite bem fundamentado”. Por 
exemplo, dado o estado de saúde do paciente e a extensão dos ferimentos , 
um médico pode sentir que esse paciente tem uma chance de 90% de se 
recuperar completamente. Um analista de negócios pode predizer que a 
chance dos funcionários de uma determinada companhia entrarem em greve 
é de 0,25. Um geólogo sismologista ou geofísico pode prever que a 
probabilidade de ocorrer um terremoto acima de 5 na escala Richter, em Los 
Angeles, nos próximos 100 anos é de 30%. 
 
Na tabela abaixo temos um resumo dos 3 tipos de probabilidade: 
 
Tipo Resumo Fórmula 
Probabilidade Clássica O n.º de resultados em S 
é conhecido e cada 
resultado é equiprovável 
P(E) = n.º de resultados no evento E 
 n.º de resultados no espaço amostral 
Probabilidade 
Empírica (estatística) 
A freqüência de 
resultados em S é 
estimada a partir da 
experimentação 
P(E) = frequencia do evento E = f = f 
 frequência Total n f 
Probabilidade Subjetiva As probabilidades resultam 
de intuição, experiência ou 
estimativa 
Nenhuma 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
36
Exercícios usando a distribuição de freqüência (probabilidade empírica) para 
obter probabilidades: 
Utilizando a TABELA abaixo responda: A probabilidade de um eleitor 
escolhido ao acaso ter entre 21 e 24 anos e a de não ter entre 18 e anos. 
 
Idade dos eleitores (x) Freqüência ( em milhões) (f ) 
18 a 20 anos de idade 10,8 
21 a 24 anos de idade 13,9 
25 a 34 anos de idade 40,1 
35 a 44 anos de idade 43,3 
45 a 64 anos de idade 53,7 
65 anos de idade ou mais 31,9 
Resposta: 
 
Exercícios – ESPAÇOS DE PROBABILIDADES: 
 
1.Seja um experimento aleatório deixar cair um dado e verificar o n.º da face 
voltada para cima. 
 
S = { 1, 2, 3, 4, 5, 6 } n(S) = 6 
 
a) Qual é a probabilidade de ocorrer um n.º menor ou igual a 4 ? 
 
 A= {1, 2, 3, 4} P(A) = 4/6 =2/3 ou 0,67 ou 67 % n(A) = 4 
 
b) Qual é a probabilidade de ocorrer um múltiplo de 3 ? 
 
 B={3, 6} P(B) = 2/6 = 0,33 ou 33% n(B) = 2 
 
c)Qual é a probabilidade de ocorrer um n.º maior do que 6 ? 
 
 C= P (C) = 0/6 P( C ) = 0 n( C ) = 0 
 
d)Qual é a probabilidade de ocorrer um n.º menor ou igual a 6 ? 
 
 D = { 1, 2, 3, 4, 5, 6}; P(D) = 6/6 = 1 ou 100% n(D) = 6 
 
e)Qual é a probabilidade de ocorrer um n.º maior ou igual a 2 ? 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
37
 E ={2, 3, 4, 5, 6}; P(E) = 5/6 = 0,8333 ou 83,3 % n(E) = 5 
 
2.No lançamento sucessivo de dois dados, cujos elementos do espaço amostral 
são equiprováveis determine: 
 
(1,1) (1,2) (1,3) (1,4) (1,5) (1,6) 
 
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6) 
 
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6) 
 
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6) 
 
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6) 
 
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6) 
 
Observe que na diagonal principal os valores se repetem.(i = j ); 
Acima da diagonal principal i < j; 
Abaixo da diagonal principal i > j; 
 
a)qual a probabilidade dos pares de números serem iguais ? 
 P(a) = 6/36; P(a) = 0,1667; P(a) = 16,67% 
 
b) qual a probabilidade da soma dos n.ºs ser 3 ? 
 
 (1,2) (2,1); P(b) = 2/36; P(b) = 0,0556; P(b) = 5,56% 
 
c)qual a probabilidade dos números serem 5 ou 7 ? 
Observação: “ou “ significa união ou adição. 
 
d)qual a probabilidade do n.º do 1.º dado ser menor do que o do 2.º dado ? 
 
P(d) = 15/36; P(d) = 41,67% 
 
VIII. a) DISTRIBUIÇÃO DE PROBABILIDADE 
 
 O conjunto dos valores de uma variável, associado às respectivas 
probabilidades, constitui uma distribuição de probabilidade. Onde 
1
( ) 1
n
i
i
P x

 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
38
Exemplos: 
 
1-Consideremos a distribuição do n.º de caras obtido ao se lançar uma 
moeda 3 vezes. 
 
As possibilidades são: 0, 1, 2, 3 (caras) e as probabilidades são: 
 
P(0) = 1/8; P(1) = 3/8; P(2) = 3/8; P(3) = 1/8. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Denominando ix os valores da variável e P ( ix ) as probabilidades respectivas, 
temos a seguinte distribuição de probabilidades: 
 
(variável) ix P( ix ) 
0 1/8 
1 3/8 
2 3/8 
3 1/8 
 1 
 
A representação gráfica desta distribuição de probabilidade é: 
 
 
 
Bioestatística em Saúde– Autor: ProfessorDiogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
39
 
 
 
 
 
 
 
2. Tomemos a distribuição do n.º de crianças do sexo masculino em 
famílias de 4 filhos. 
 
Construa a árvore de probabilidades. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
As probabilidades correspondentes são: ,
!
!( !)n x
n
c
x n x


 
P(0) = 
P(1) = 
P(2) = 
P(3) = 
P(4) = 
 
 
 
 
 
A distribuição de probabilidades e o gráfico correspondente são: 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
40
i
r
i
f
f
f


 P( ix ) 
0 1/16 
1 4/16 
2 6/16 
3 4/16 
4 1/16 
 1 
 
Freqüência Relativa (porcentagem da classe) 
 
 Quando o conjunto universo das possibilidades de uma prova é 
indeterminado, não de pode fixar a probabilidade que se associa a cada valor 
da variável. Nesse caso, usamos a freqüência relativa (fi) como estimativa da 
probabilidade. 
 Seja, por exemplo, uma prova que consiste em verificar o n.º de peças 
produzidas com defeito, semanalmente, por uma máquina durante 30 semanas. 
 
 ix 0 1 2 3 4 5 6 
 if 2 5 8 6 4 2 3 
 
 ix = n.º semanal de peças defeituosas onde: rif = i
f
N
 ou i
i
f
f
 
 if = n.º de semanas 
 
A freqüência relativa (fr), que constitui a estimativa da probabilidade de cada 
valor / 30ri if f , é dada por: ir
i
f
f
f


 
ix if / 30ri if f 
0 2 
1 5 
2 8 
3 6 
4 4 
5 2 
6 3 
 30 
 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
41
P(0) = …. ; P(1) = ….. ; P(2) = ……. ; P(3) = ….. ; 
 
 
P(4) = …… ; P(5) =……. ; P(6) =…….. ; 
 
 
VIII – b - PROBABILIDADE CLÁSSICA 
 
 Probabilidade de um Evento 
 
a-) ( )( )r
N E
p E
S

( )
( )r
N E
p E
S
 . Exemplos de determinação da probabilidade de 
um evento. 
 
1-Qual a probabilidade de obter-se uma cara em 3 jogadas de uma moeda 
honesta ? 
Resp: há 32 8 , resultados possíveis e, assim, S =8. Há 3 resultados que dão 
uma cara {KCC, CKC, CCK} e assim se “E” é o evento que resulta em uma 
cara, então N(E) = 3. Portanto, Pr(E) = 3/8 = 0,3740 = 37,40% 
 
Construa a árvore de probabilidades. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
2-Qual é a probabilidade de obter-se o total 5 na jogada de 2 dados ? 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
42
 
Resp: Há 36 resultados possíveis: s=36. Seja E o evento que consiste em 
obter 5 nos dados; E contém 4 resultados: 
 
E = {(1, 4), ( 2, 3), (3, 2), (4, 1)}, então N(E) = 4 e Pr(E) = 4/36 = 1/9 = 
11,11% 
 
 
4- Qual é a probabilidade de sair um às na extração de uma carta de um 
baralho ? 
 
Resp: como há 52 resultados possíveis, s =52. E seja “E”, o evento “extrair 
uma às, então “E” contém 4 resultados: 
Às de Copas (); Às de Ouros (); Às de Paus () e Às de Espadas () 
Então N(E) = 4 e Pr(E) =4/52 = 1/13 = 7,69%. 
Um baralho de cartas contém 4 naipes () com as seguintes cartas: 
As () Às() Às() Às() 
2 () 2 () 2() 2() 
3 () 3 () 3() 3() 
4 () 4 () 4() 4() 
5 () 5 () 5() 5() 
6 () 6 () 6() 6() 
7 () 7 () 7() 7() 
8 () 8 () 8() 8() 
9 () 9 () 9() 9() 
10 () 10() 10() 10() 
Figura Figuras Figura Figuras 
Vermelha Vermelhas Preta Pretas 
J () J() J() J() 
Q () Q() Q() Q() 
K () K() K() K() 
 
_____ _____ ______ ______ 
13 () 13 () 13 () 13 () TOTAL = 52 CARTAS 
 
26 são pretas ()() – naipes de paus e espadas ; 26 ()() são vermelhas- 
naipes de copas e ouro – 
Figuras: temos 4 figuras de cada naipe, Valete, Dama, Rei e Às, totalizando 
12 figuras ( 6 pretas e 6 vermelhas). 
Bioestatística em Saúde– Autor: Professor Diogo Eduardo Pasqual Penna – Mestre em Ciências / Geofísica pela Universidade Federal 
do Pará / Convênio Petrobrás – Belém-Pa - deppenna@gmail.com– www.faculdadefatima.com.br – 54 99647-0481 - 
_________________________________________________________________________ 
____________________________________________________________________ 
 Bioestatística em Saúde – FACULDADE FÁTIMA - Dezembro de 2006 - 
43
Encima destes dados podemos estudar todas as probabilidades em que estamos 
interessados. 
 
 Probabilidade da não ocorrência de um evento 
 
Muitas vezes interessa-nos saber a probabilidade de não ocorrência de 
um evento. Por exemplo, se, no jogo de dois dados, estamos interessados 
em não obter 7, e esta é 1/6 então há 5/6 de chances de não obter 7. 
N(E) = 30 e Pr(E) = 30/36 = 5/6. De um modo geral, se p é a 
probabilidade de ocorrência de um evento E, então 1-p é a probabilidade 
de não ocorrência deste evento. Podemos chamar de complemento de E ao 
conjunto que contém todos os resultados que não estão em E. 
Então Pr( CE ) = 1 – Pr ( E) e podemos chamar de CE de complemento de 
E. Outra forma é: p = 1 - q onde q é a não probabilidade ou o insucesso e 
p a probabilidade ou o sucesso. 
Este resultado é importante para os cálculos, pois, às vezes, é mais fácil 
calcular a probabilidade de não ocorrência de um evento do que a 
probabilidade de sua ocorrência. 
 
 Probabilidade de uma união (eventos mutuamente excludentes) ou 
“o terceiro postulado de probabilidade” 
 
A probabilidade de ocorrência de um ou outro evento é igual a soma de suas 
probabilidades. Por exemplo: a probabilidade de as condições meteorológicas 
melhorarem no decorrer de certa semana é de 0,62 e a probabilidade de se 
manterem inalteradas é de 0,23, então a probabilidade de às condições 
melhorarem ou se manterem alteradas é de 0,62 + 0,23 = 0,85. 
Suponhamos que nos interesse o total 5 ou o total 7 na jogada de dois dados. 
Evento A = obter 7: A={(1, 6) (2, 5) (3, 4) (4, 3) (5, 2) (6, 1)} 
Evento B = obter 5: B ={(1, 4) (2, 3) (3, 2) (4, 1)}. 
Seja C o evento obter 5 ou 7, então C = {(1, 6) (2, 5) (3, 4) (4, 3) (5, 2) (6, 1) 
(1, 4) (2, 3) (3, 2) (4, 1)}. Sendo assim C = A união com B 
Ou, representado matematicamente por C = A B. 
E se quiséssemos saber qual a probabilidade de ocorrer pelo menos um deles ? 
então basta somar as probabilidades: 
Pr(A ou B) = Pr(AB) = Pr (A) + Pr (B). Este resultado só é válido quando 
não há possibilidade de os eventos A e B ocorrerem simultaneamente. No caso 
de uma jogada de dois dados não é possível obter 5 e 7 em uma única jogada 
de um par de dados. Dois eventos que não podem ocorrer simultaneamente 
dizem-se

Continue navegando