Buscar

Apostila_de_Bioestatistica

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

Apostila de Bioestatística 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Apostila de Bioestatística 
 
Módulo 1: Introdução à Estatística (População e Amostra, Dados 
Qualitativos e Quantitativos) 
 
“Sem entusiasmo não há matemática.” Novalis 
 
“A Matemática é a mais simples, a mais perfeita e a mais antiga de todas as ciências.” Jacques Hadarmard 
 
I N T R O D U Ç Ã O A E S T A T Í S T I C A 
 
Bioestatística: é a estatística aplicada às ciências que estudam aspectos vitais (referentes à 
vida), como Biologia, Medicina, Farmácia, Nutrição, Enfermagem, Psicologia e outras. 
 
Estatística: é a parte da Matemática Aplicada que fornece métodos para a coleta, organização, 
apresentação, análise e interpretação de dados para a tomada de decisões. 
 
Algumas aplicações da estatística: 
 
_ Um professor comunica que a nota média da classe foi 7; 
_ O meteorologista informa que a probabilidade de chover hoje é de 30%; 
 
_ Um fabricante testa a resistência à ruptura, de cintos de segurança de automóveis, sem destruir 
toda a sua produção. 
 
A Estatística divide-se principalmente em: 
 
Descritiva: resume os dados e descreve fatos. Exemplos: médias de estudantes, taxa de 
desemprego, consumo médio de automóveis, índice pluviométrico, etc. 
 
Probabilidade: analisa situações que envolvem o acaso. Exemplos: chance de vitória em uma 
competição esportiva, decisão de imunizar ou não pessoas contra determinada doença, etc. 
 
Indutiva: analisa através de amostras, uma parcela pequena de determinada “população” e infere 
conclusões sobre a população toda. Exemplo: através do cálculo da idade média de alguns 
alunos de uma faculdade, determina uma aproximação, para a idade média de todos os alunos da 
faculdade. 
 
Em estatística, população é um conjunto de elementos com pelo menos uma característica em 
comum. É o conjunto universo que se pretende estudar, um conjunto de elementos com alguma 
característica em comum. Uma população poderia ser, por exemplo, todos os habitantes do seu 
município (população finita) ou, todas as orquídeas da Mata Atlântica (população infinita – não 
temos como determinar). Quando uma população concentra um grande número de elementos, 
seu estudo irá exigir grande dispêndio de tempo, material, pesquisadores, recursos financeiros, 
etc. Neste caso, trabalha-se não com toda a população, mas com uma parte chamada amostra, 
que é um subconjunto da população, ou seja, uma parte da população retirada para ser 
analisada. O estudo desta parcela deverá permitir que se conheça a população toda de forma 
geral. Resumidamente: 
 
População: é o conjunto formado por todos os elementos (pessoas, objetos, etc.) que contém 
pelo menos uma característica comum a qual temos interesse em estudar. 
 
Amostra: é uma parte da população retirada para ser analisada, a qual permite que se conheça 
tal população. 
 
Técnica de Amostragem: é um procedimento para se obter uma amostra que seja representativa 
de uma população. As técnicas usadas para obtenção de uma amostra podem ser classificadas 
como amostragens probabilísticas ou não-probabilísticas. 
 3
Apostila de Bioestatística 
 
Técnicas de amostragem não-probabilísticas são as que não permitem a retirada de uma amostra 
de forma aleatória, pois em algumas situações a amostragem se torna obrigatória. Dentre essas 
técnicas existe a amostragem por Conveniência. 
 
→ Amostragem por Conveniência: Ocorre quando o pesquisador seleciona os membros da 
população dos quais é mais fácil se obter informações. 
 
Amostragem probabilística é a técnica de seleção de uma amostra na qual cada elemento da 
população tem probabilidade conhecida e diferente de zero, de pertencer à amostra. Os principais 
tipos são: 
 
→ Amostragem Casual Simples ou Aleatória: os elementos da população são escolhidos ao 
acaso (sorte), é o processo mais elementar e frequentemente utilizado, embora não muito confiável. 
 
→ Amostragem Sistemática: os elementos da população são escolhidos a cada período (tempo ou 
quantidade), ou seja, a seleção dos elementos que constituirão a amostra pode ser calculada por um 
fator de sistematização ou feita por um sistema imposto pelo pesquisador, por exemplo, um policial 
pode parar um veículo a cada dez, outro exemplo, uma embalagem de um produto de uma linha de 
fabricação, pode ser retirada a cada 5 minutos. 
 
→ Amostragem Estratificada: é uma técnica muito utilizada, que separa a população em partes 
chamadas de estratos, por exemplo: sexo (masculino ou feminino), faixa etária, classe econômica, etc. 
Os elementos que constituirão a amostra são retirados dos estratos, em quantidade proporcional ao 
tamanho de cada estrato. Exemplificando, numa empresa onde trabalham 1.000 pessoas (800 homens e 
200 mulheres), deseja-se fazer uma pesquisa por amostragem, com 100 funcionários, quantos homens e 
quantas mulheres serão entrevistados? Como a amostra 100, corresponde a 10% da população de 1.000 
funcionários, devemos entrevistar 10% dos homens e 10% das mulheres, ou seja, serão entrevistados 80 
homens e 20 mulheres. 
 
Como calcular o tamanho de uma amostra: 
 
Mas o que é erro amostral? 
É a diferença entre o valor que a estatística pode acusar e o verdadeiro valor do parâmetro que se 
deseja estimar. 
O erro amostral tolerável é a margem de erro aceitável em um estudo estatístico. 
Para esclarecer melhor, é quando o apresentador do telejornal, em ano de eleições, anuncia: 
“O candidato Fulano de Tal tem 42% das intenções de voto, 2 para mais, 2 para menos.” 
Quando o apresentador cita “2 para mais, 2 para menos”, ele se refere ao erro amostral tolerável 
para aquela pesquisa de intenções de voto. 
 
 
 4
Tamanho da Amostra: 
Obs.: um passo importante antes de iniciar o cálculo do tamanho da amostra é definir qual o erro 
amostral tolerável para o estudo que será realizado. 
Observe a seguinte fórmula: 
 
 
 
 
Exemplo 01: 
Em uma empresa que contém 2000 colaboradores, deseja-se fazer uma pesquisa de satisfação. 
Quantos colaboradores devem ser entrevistados para tal estudo? 
N = 2000 Definindo o erro amostral tolerável em 2% (o erro é definido pela instituição da pesquisa) 
E0 = 0,02 
n0 = 1 / (E0)2 n = (N . n0) / (N + n0) 
n0 = 1 / (0,02)2 n = (2000 . 2500) / (2000 + 2500) 
n0 = 2500 n = 1111 colaboradores 
 
Com o erro amostral tolerável em 2%, 1111 colaboradores devem ser entrevistados para a 
pesquisa 
 Obs: Através deste segundo cálculo, é possível observar que, quando aumentamos a margem de 
erro, o tamanho da amostra reduz. 
Com o erro amostral tolerável em 2%, 1111 colaboradores devem ser entrevistados para a 
pesquisa 
 Obs: Através deste segundo cálculo, é possível observar que, quando aumentamos a margem de 
erro, o tamanho da amostra reduz. 
 
Exemplo 02: Vamos repetir os cálculos, definindo o erro amostral tolerável em 4%. 
Resp: n = 476 colaboradores
� n0 é a primeira aproximação do tamanho da amostra 
� N é o número de elementos da população 
 5
 
 
 
Dados: os dados são as informações obtidas através de observações, medidas, respostas de 
pesquisas ou contagens em geral. Os dados podem ser classificados em: 
 
_ NUMÉRICOS ou QUANTITAVIVOS; _ 
CATEGÓRICOS ou QUALITATIVOS. 
 
A escolha do processo a utilizar na análise ou descrição de dados estatísticos depende do tipo de 
dado considerado, após a classificação de suas variáveis. 
 
As variáveis quantitativas podem ser contínuas ou discretas. E as variáveis qualitativas podem ser 
nominais ou ordinais. 
 
Variáveis Quantitativas Contínuas (QC): podem assumir qualquervalor numérico num intervalo 
contínuo. Os dados referentes a tais variáveis dizem-se dados contínuos. Ou seja, quando pode 
assumir qualquer valor dentro de dois limites definidos, números “quebrados”, por exemplo: pesos 
de peças fabricadas, temperatura do corpo humano, etc. 
 
Variáveis Quantitativas Discretas (QD): assumem valores numéricos inteiros. Os dados 
discretos são o resultado da contagem do número de itens. Ou seja, quando só pode assumir 
valores pertencentes a um conjunto enumerável, números inteiros, como por exemplo, quantidade 
de peças fabricadas, número de filhos, etc. 
 
 
Variáveis Qualitativas Ordinais (QO): consistem de valores relativos (numéricos ou não) 
atribuídos para denotar ordem. Os dados referentes a tais variáveis dizem-se dados ordinais. Ou 
seja, apresenta uma ordenação, por exemplo: grau de escolaridade (Fundamental, Médio, 
Superior), nota obtida numa prova (de ZERO a DEZ ou de A até E ou de MB até I), etc. 
 
Variáveis Qualitativas Nominais (QN): referem-se a avaliações subjetivas. Os dados referentes 
a tais variáveis dizem-se dados nominais. Ou seja, não apresentam ordem, nem estrutura 
numérica, como por exemplo, religião, sexo, cor da pele, etc. 
 
 
A dificuldade para classificar dados, se dá em função da fácil confusão gerada entre uma variável 
quantitativa discreta e uma variável qualitativa ordinal. 
 
Por exemplo, num questionário estatístico, a pergunta: grau de importância que você dá ao seu 
curso (de 0 a 10) é uma variável qualitativa ordinal QO. Outro exemplo: soma da renda familiar 
(até $ 1.000,00, entre $ 1.000,00 e $ 2.000,00, acima de $ 2.000,00), é variável numérica, mas 
quando se pede para encaixar numa categoria, é classificada como variável qualitativa ordinal 
 
QO. 
 
Exemplo 1: Considere as afirmações a seguir e assinale a alternativa correta. 
I. A qualidade de um produto, defeituoso ou não defeituoso, trata de um dado qualitativo. 
II. A altura dos atletas do time de basquetebol da escola “Aprender”, trata de um dado qualitativo. 
III. O diâmetro dos parafusos produzidos por certa máquina trata de um dado quantitativo. 
a) Todas as afirmações estão corretas. 
b) Apenas a afirmação I está correta. 
c) Apenas as afirmações I e III estão corretas. 
d) Todas as afirmações estão incorretas. 
e) Apenas a afirmação III está correta. 
 
 6
Resposta Correta: C a altura dos atletas do time de basquetebol da escola “Aprender” trata de 
um dado QUANTITATIVO e não QUALITATIVO. 
 
Exemplo 2: Classifique as variáveis abaixo em Qualitativa Nominal (QN), Qualitativa Ordinal
(QO), Quantitativa Discreta (QD) e Quantitativa Contínua (QC). 
a) sexo (masculino ou feminino); b) idade; c) tempo de vida; d) peso; e) estado civil; f) tipo
de escola (pública/particular); g) número de alunos numa classe; h) disciplina que mais gosta;
i) rua de uma residência; j) número de uma residência. 
Respostas: a)QN b)QD c)QC d)QC e)QN f)QN g)QD h)QN i)QN j)QO 
 E X E R C Í C I O S 
 
1. População é um conjunto de: 
a) Pessoas. b) Elementos quaisquer. c) Pessoas com uma característica comum. 
d) Elementos com pelo menos uma característica em comum. 
e) Indivíduos de um mesmo município, estado ou país. 
 
2. Uma parte da população retirada para ser analisada denomina-se: 
a) Universo. b) Parte. c) Pedaço. d) Dados brutos. e) Amostra. 
 
3. A parte da estatística que resume os dados e descreve fatos denomina-se: 
a) Estatística da população. b) Estatística da amostra. c) Estatística Inferencial. 
d) Estatística descritiva. e) Estatística grupal. 
 7
Apostila de Bioestatística 
 
4. A variável, cor dos olhos, pode ser classificada como: 
 
a) Qualitativa nominal. b) Quantitativa discreta. c) Quantitativa contínua. d) 
Qualitativa discreta. e) Qualitativa contínua. 
 
5. A variável, número de filhos, pode ser classificada como: 
 
a) Qualitativa ordinal. b) Quantitativa discreta. c) Quantitativa contínua. d) 
Qualitativa discreta. e) Qualitativa contínua. 
 
6. A variável, peso, pode ser classificada como: 
 
a) Qualitativa nominal. b) Quantitativa discreta. c) Quantitativa contínua. d) 
Qualitativa discreta. e) Qualitativa contínua. 
 
7. A variável, tipo sanguíneo, pode ser classificada como: 
 
a) Qualitativa nominal. b) Quantitativa discreta. c) Quantitativa contínua. d) 
Qualitativa discreta. e) Qualitativa contínua. 
 
8. A variável, sexo, pode ser classificada como: 
 
a) Qualitativa nominal. b) Quantitativa discreta. c) Quantitativa contínua. d) 
Qualitativa discreta. e) Qualitativa contínua. 
 
9. Identifique nos exemplos abaixo, qual o de tipo de dado: 
a) nº de defeitos num carro. b) Salário (R$). c) Cor azul. d) muito dispendioso. 
 
10. Numa empresa, para estudar a preferência em relação a sabores de sucos naturais, sorteiam-
se 150 funcionários, entre os 850 funcionários próprios (não terceirizados). Responda: a) Qual a 
população envolvida na pesquisa? b) Que tipo de amostragem foi utilizado? c) Qual é a amostra 
considerada? 
 
Gabarito: 1)D 2)E 3)D 4)A 5)B 6)C 7)A 8)A 9)a)discreto b)contínuo c)nominal d)ordinal 
10)a)850funcionários b)aleatória c)150funcionários. 
 
Módulo 2: Agrupamento por classes e distribuições de frequências - 
Contribuições percentuais 
 
“Toda a educação científica que não se inicia com a Matemática é, naturalmente, imperfeita na sua base.” (Auguste 
 
Conte) 
 
“Não há ramo da Matemática, por mais abstrato que seja, que não possa um dia vir a ser aplicado 
aos fenômenos do mundo real.” (Lobachevsky) 
 
O R G A N I Z A Ç Ã O D E D A D O S 
 
Quando os dados são coletados para uma pesquisa, são chamados de dados brutos. Um 
exemplo de dado bruto corresponde ao valor médio (em dólares) de comercialização nos últimos 
10 meses da saca de soja, na Bolsa de Cereais, conforme apresentado abaixo: 
 
9,0 - 8,0 - 8,0 - 2,0 - 6,3 - 6,5 - 6,8 - 7,0 - 7,1 - 7,1 
 
Geralmente, este tipo de dado traz pouca ou nenhuma informação ao leitor, sendo necessário 
organizar os dados, com o intuito de aumentar sua capacidade de informação. 
 
Rol: A primeira forma de organização que vamos estudar é o Rol, que são os dados organizados 
em ordem crescente ou decrescente. 
 
2,0 – 6,3 – 6,5 – 6,8 – 7,0 – 7,1 – 7,1 – 8,0 – 8,0 – 9,0 
 8
Apostila de Bioestatística 
 
Como podemos observar, a simples organização dos dados em um rol aumenta muito a 
capacidade de informação destes. Pode-se verificar facilmente que o menor preço observado 
foi 2 dólares e o maior, 9 dólares, o que nos fornece uma amplitude total de variação da 
ordem de 7 dólares. Amplitude total corresponde à diferença entre o maior e o menor valor 
observado em um conjunto de dados, simbolizado por A. Outra informação que podemos obter 
nos dados por meio da organização em rol crescente, é que alguns preços, como 7,1 e 8,0, foram 
os mais frequentes, ou seja, os mais citados na pesquisa. 
 
Tabela: Para organizar os dados de uma forma mais eficiente, na qual se possa apresentar uma 
quantidade maior de informações, podemos usar as tabelas. Os elementos básicos de uma tabela 
são: o título, o corpo e a fonte. Quando temos poucos valores, podemos agrupá-los numa tabela 
simples. Por exemplo: 
 
Valor Médio da saca de soja 
xi fi 
2,0 1 
6,3 1 
6,5 1 
6,8 1 
7,0 1 
7,1 2 
8,0 2 
9,0 1 
Fonte: Bolsa de Cereais 
 
Quando temos muitos valores, fica inviável a tabela simples, dessa forma, os agrupamos numa 
tabela com intervalos de classe. Classes são intervalos nos quais os valores da variável analisada 
são agrupados (linhas da tabela). Distribuindo-se os dados observados em classes e contando-
se o número de observações contidas em cada classe, obtém-se a frequência de classe. A 
disposição tabular dos dados agrupados em classes, juntamente com as frequências 
correspondentes, se denominadistribuição de frequências. A partir dos dados do exemplo 
relativo ao preço da saca de soja, vamos construir uma distribuição de frequência: 
 
Valor Médio da saca de soja 
Xi (CLASSES) fi 
2 ├ 4 1 
4 ├ 6 0 
6 ├ 8 6 
8 ├ 10 3 
Fonte: Bolsa de Cereais 
 
Na tabela acima, dizemos que o limite inferior e o superior da segunda classe são 4 e 6. O ponto 
médio (PM) da primeira classe é 3. O ponto médio é a média aritmética entre o Li: Limite inferior; 
e o Ls: Limite superior. 
 
T I P O S D E F R E Q U Ê N C I A 
 
Como já vimos, após a coleta dos dados, não temos informações claras. Ou seja, na tabela 
abaixo, temos os dados brutos ou uma tabela primitiva, pois os dados não estão organizados. 
 9
Apostila de Bioestatística 
 
5,1 4,9 4,9 5,1 4,7 
5,0 5,0 5,0 5,1 5,4 
5,2 5,2 4,9 5,3 5,0 
4,5 5,4 5,1 4,7 5,5 
4,8 5,1 5,3 5,3 5,0 
 
Na tabela anterior, é difícil averiguar, qual o Menor valor, o Maior valor, a Faixa de valores, a 
Amplitude, etc. Por isso, é melhor organizarmos a tabela acima, num rol. 
 
4,5 4,7 4,7 4,8 4,9 
4,9 4,9 5,0 5,0 5,0 
5,0 5,0 5,1 5,1 5,1 
5,1 5,1 5,2 5,2 5,3 
5,3 5,3 5,4 5,4 5,5 
 
Através do Rol, fica fácil averiguar, o Menor valor (4,5), o Maior valor (5,5), a Faixa de valores (4,5 
a 5,5) e a Amplitude (1). 
 
Frequência simples ou absoluta (fi): É a quantidade de vezes que um dado aparece, ou seja, a 
frequência absoluta, ou apenas frequência, de um valor é o número de vezes que uma 
determinada variável assume esse valor. Ao conjunto das frequências dos diferentes valores da 
variável dá-se o nome de distribuição da frequência (ou apenas distribuição). Conforme tabela 
abaixo: 
 
xi fi 
4,5 1 
4,6 0 
4,7 2 
4,8 1 
4,9 3 
5,0 5 
5,1 5 
5,2 2 
5,3 3 
5,4 2 
5,5 1 
total 25 
 
Na tabela acima, temos uma observação direta, do número de vezes (frequência) que cada valor 
aparece. Quando uma tabela possui muitas linhas, podemos transformá-la de simples em 
intervalos de classe, conforme abaixo: 
 
xi Frequência 
 (fi) 
4,5 ├ 4,9 4 
4,9 ├ 5,3 15 
5,3 ├ 5,7 6 
total 25 
 
OBS.: _ A escolha do intervalo de classe (0,4) geralmente é arbitrário, embora possa ser definido 
por diferentes métodos de cálculo, como o método de Sturges. 
 
_ O símbolo significa intervalo fechado à esquerda e aberto à direita, ou 
seja: 4,5 4,9 significa 4,5 ≤ x < 4,9 ou [ 4,5 ; 4,9 [ 
 
_ Na tabela simples, percebe-se que não há nenhum resultado com 4,6, mas na tabela com 
intervalos de classe, não observamos este detalhe. Ou seja, a tabela simples é mais detalhada 
que a tabela com intervalos de classe. 
 10
Apostila de Bioestatística 
 
Frequência relativa (fr): São os valores das razões entre as frequências simples e a frequência 
total fr = fi / Σf . Ou seja, a frequência relativa, é a porcentagem relativa à frequência. O 
propósito das frequências relativas é o de permitir a análise ou facilitar as comparações, pois 
multiplicando a frequência relativa por cem, temos o percentual de cada dado. 
 
fr = fi / Σf ↔ fr = 1 / 25 ↔ fr = 0,04 X 100 = 4% 
 
xi fi fr 
4,5 1 4% 
4,6 0 0% 
4,7 2 8% 
4,8 1 4% 
4,9 3 12% 
5,0 5 20% 
5,1 5 20% 
5,2 2 8% 
5,3 3 12% 
5,4 2 8% 
5,5 1 4% 
total 25 100% 
Através da tabela acima e análise de dados, 20% das amostras apresentam o valor 5,0. 
 
Frequência acumulada (Fi): também chamada de Fi, é o total das frequências de todos os 
valores inferiores ao limite superior do intervalo de uma dada classe F = Σf . Ou seja, a 
frequência acumulada de um valor, é o número de vezes que uma variável assume um valor 
inferior ou igual a esse valor. 
 
F3 = Σf ↔ F = 1 + 0 + 2 ↔ F = 3 F6 = 1 + 0 + 2 + 1 + 3 + 5 ↔ F = 12 
 
 xi fi fr Fi 
 4,5 1 4% 1 
 4,6 0 0% 1 
 4,7 2 8% 3 
 4,8 1 4% 4 
 4,9 3 12% 7 
 5,0 5 20% 12 
 5,1 5 20% 17 
 5,2 2 8% 19 
 5,3 3 12% 22 
 5,4 2 8% 24 
5,5 1 4% 25 
 total 25 100% - 
 
Através da tabela acima e análise de dados, há 3 resultados com valores ≤ 4,7, há 12 resultados 
com valores ≤ 5. 
 
Frequência acumulada relativa (Fr): É a porcentagem relativa à frequência acumulada. Ou seja, 
a frequência relativa acumulada de uma classe é a frequência acumulada da classe, dividida pela 
frequência total da distribuição Fr = F / Σf. 
 
Fr1 = F / Σf ↔ Fr = 1 / 25 ↔ Fr = 0,04 Fr4 = 4 / 25 ↔ Fr = 0,16 
 11
Apostila de Bioestatística 
 
xi fi fr Fi Fr 
4,5 1 4% 1 4% 
4,6 0 0% 1 4% 
4,7 2 8% 3 12% 
4,8 1 4% 4 16% 
4,9 3 12% 7 28% 
5,0 5 20% 12 48% 
5,1 5 20% 17 68% 
5,2 2 8% 19 76% 
5,3 3 12% 22 88% 
5,4 2 8% 24 96% 
5,5 1 4% 25 100% 
total 25 100% - - 
 
Através da tabela acima e análise de dados, 16% das amostras apresentam valores ≤ 4,8. 
 
C O N T R I B U I Ç Õ E S P E R C E N T U A I S 
 
Note que f% = fr • 100 e F% = Fr • 100, pois se multiplicarmos a frequência relativa por 100, 
obtemos a mesma na forma percentual. 
 
Uma tabela de frequências, para variáveis quantitativas, apresenta, porém, outros conceitos que 
permitem uma maior profundidade para análise e devem ser adicionadas. São eles o PONTO 
MÉDIO (PM), a FREQUENCIA PERCENTUAL ACUMULADA (Fr%), onde: 
 __ 
PM xi é o valor médio de cada classe, ou intervalo, é o ponto médio de cada classe. Torna-se o 
valor representativo de cada classe. 
 
Fr% é a frequência percentual acumulada, obtida repetindo-se o primeiro valor de f% e somando 
aos demais. 
 
 
Veja como exemplo, uma tabela de frequências para a variável quantitativa “idades” de forma 
completa: 
 
Classes xi Xi (PM) f f% F% 
12 ├ 14 13 3 15 15 
14 ├ 16 15 5 25 40 
16 ├ 18 17 5 25 65 
18 ├ 20 19 7 35 100 
Total - 20 100 - 
 
 
Amplitude em tabelas de frequências: a amplitude de um rol é a diferença entre o maior e o 
menor valor. Numa tabela de frequências, temos a amplitude de cada classe, a amplitude total 
das classes, a amplitude dos pontos médios e a amplitude das frequências. Por exemplo, na 
tabela acima, temos que a amplitude de cada classe é 14 – 12 = 2, a amplitude total das Classes 
ou amplitude da distribuição é 20 – 12 = 8, a amplitude dos pontos médios é 19 – 13 = 6 e a 
amplitude das frequências é 7 – 3 = 4. 
 12
Apostila de Bioestatística 
 
Exemplo: um grupo de alunos foi consultado sobre o time paulista de sua preferência, e os votos 
foram registrados assim: Santos: I I, Palmeiras: I I I I, Corinthians: I I I I I I I I, São Paulo: I I I I I I. 
Construa a tabela de frequência correspondente a essa pesquisa. 
 
Times Contagem f f% F% 
Santos I I 2 10 10 
Palmeiras I I I I 4 20 30 
Corinthians I I I I I I I I 8 40 70 
São Paulo I I I I I I 6 30 100 
Total 20 100 - 
 
R E P R E S E N T A Ç Õ E S G R Á F I C A S 
Os resultados de uma pesquisa estatística podem ser apresentados em forma de ROL, de TABELA ou de GRÁFICO. 
 
Os Gráficos Estatísticos são importantes ferramentas para analisar e interpretar dados numéricos 
relativos a uma pesquisa, possibilitando melhor visualização. 
 
Uma tabela de distribuição de frequência pode ser representada através de um gráfico chamado Histograma, 
conforme abaixo: 
 
valor frequência (fi) 
 
 
4,5 ├ 4,9 4 
 
4,9 ├ 5,3 15 
 
5,3 ├ 5,7 6 
 
total 25 
 
 
Polígono de frequências: é um gráfico em linha, obtido unindo-se por segmentos de reta os 
pontos médios das bases superiores dos retângulos de um histograma. Para realmente obtermos 
um polígono (linha poligonal fechada) devemos completar a figura, ligando os extremos da linha 
obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. O 
polígono do histograma será usado em assuntos posteriores. 
 
 
 
 
 
 
 
 
 
 
Principais Tipos de Gráficos Estatísticos: os principais tipos de gráficos são: 
Em linha: Em colunas:13
Apostila de Bioestatística 
 
Em barras: Em colunas múltiplas: 
 
 
 
 
 
 
 
 
 
 
 
 
Em barras múltiplas: Em setores circulares: 
 
 
 
 
 
 
 
 
E X E R C Í C I O S 
 
1) O que é rol? 
a) sequência desordenada gerada a partir dos dados brutos. 
b) sequência dos dados brutos. 
c) dados brutos. 
d) dados gerados a partir da pesquisa. 
e) sequência ordenada gerada a partir dos dados brutos. 
 
2) O que é frequência? 
a) dados apresentados em sequência. 
 
b) fato que acontece em uma determinada coleta de 
dados. c) quantidade de vezes que a pesquisa é realizada. 
 
d) quantidade de vezes que um elemento ou fato acontece em uma determinada coleta de 
dados. e) coleta de dados. 
 
3) De acordo com a tabela dada, 
responda: a) Qual o número de classes. 
 
b) Qual é o intervalo de classe. 
c) Qual o intervalo que aparece a maior frequência? 
 
d) A estatura 176 cm ou 1,76 m, está na classe de qual frequência? 
ESTATURA DE 100 FUNCIONÁRIOS DE UMA EMPRESA 
 
Estatura (cm) xi nº de funcionários (fi) 
150 ├ 155 2 
155 ├ 160 5 
160 ├ 165 11 
165 ├ 170 39 
170 ├ 175 32 
175 ├ 180 10 
180 ├ 185 1 
 
4) Organizando os valores 89, 54, 34, 56, 56, 34, 80, 28 em um rol, temos: 
a) 89, 54, 34, 56, 80, 28 
 
b) 28, 34, 34, 54, 56, 56, 80, 89 
c) 89, 80, 56, 54, 34, 28 
d) 28, 34, 54, 34, 80, 56, 56, 89 
 14
Apostila de Bioestatística 
5) Nas séries de valores: A: 2; 4; 5; 8; 9 
B: 35; 17; 22; 46; 15; 26 
 
C: 16,1; 21,3; 25,6; 45,2 
Assinale a alternativa correta: 
 
a) A maior amplitude é da sequência C. 
b) A maior amplitude é da sequência A. 
c) A maior amplitude é da sequência B. 
 
d) As sequências A e B possuem amplitudes iguais. 
e) As sequências A e C possuem amplitudes iguais. 
 
6) Calcule a amplitude total dos conjuntos de dados: 
a) 1, 3, 5, 9 
b) 20, 14, 15, 19, 21, 24, 20 
c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2 
 
d) 100 |— 150, 150 |— 200, 200 |— 250, 250 |— 300, 300 |— 350, 350 |— 400 e) -2, -1, 
0, 1, 2, 3 
 
7) Os dados a seguir referem-se ao número de livros adquiridos, no ano passado, pelos 40 alunos 
de uma turma de curso técnico, em São José do Rio Pardo: 
4 2 1 0 3 1 2 0 2 1
0 2 1 1 0 4 3 2 3 5
8 0 1 6 5 3 2 1 6 4
3 4 3 2 1 0 2 1 0 3
Com relação a esses valores, pede-se: 
a) Organize os dados em uma tabela sem intervalos de classe. 
b) Responda: qual o percentual de alunos que adquiriram menos de 4 livros? 
 
8) A tabela abaixo apresenta a comissão recebida pelos funcionários de uma empresa. 
Comissões (R$) xi nº de funcionários fi 
100 ├ 150 4 
150 ├ 200 8 
200 ├ 250 16 
250 ├ 300 24 
300 ├ 350 20 
350 ├ 400 8 
Total 80 
Quantos funcionários ganham comissão inferior a R$ 300,00? 
 
a) 20 funcionários b) 28 funcionários c) 52 funcionários d) 38 funcionários 
 
9) Os dados da tabela a seguir, referem-se ao consumo familiar anual (kg) de um gênero 
alimentício. Complete a tabela. 
 
Peso fi Fr% 
42 ├ 54 6 
 9 
 19 
 11 
 5 
Total 
 
10) Em um escritório trabalham 40 pessoas cujas idades, em anos, são dadas em 
ordem crescente: 
 
18 - 19 - 20 - 20 - 20 - 24 - 24 - 24 - 24 – 24 - 28 - 28 - 28 - 30 - 30 - 30 - 30 - 30 - 32 - 32 - 35 - 
35 - 35 - 35 - 36 - 36 - 36 - 36 - 36 – 40 - 40 - 40 - 42 - 45 - 45 - 48 - 48 - 50 - 50 – 60 
 15
Apostila de Bioestatística 
 
Observe que a tabela seguinte está parcialmente preenchida com as idades agrupadas em 
intervalos (classes) que devem ter o mesmo comprimento. 
 
Idade (anos) xi nº de funcionários (fi) 
18 ├ 25 10 
25 ├ 32 8 
? 11 
? 6 
? 4 
53 ├ 60 1 
Pergunta-se: a) A classe que corresponde a 6 funcionários é: 
 
a) 35 ├ 42 b) 37 ├ 45 c) 39 ├ 46 d) 46 ├ 49 e) 50 ├ 60 
b) Relativamente ao total de funcionários desse escritório, a porcentagem dos que têm idades 
inferiores a 32 anos é: a) 45% b) 38% c) 37,5% d) 25% e) 12% 
 
11) Ao se lançar 24 vezes um dado de 10 lados (decaedro), obteve-se os seguintes resultados: 
4 2 6 1 2 3
5 6 3 4 2 1
1 6 5 4 5 6
8 7 10 9 7 8
 
Para os valores acima, construa uma tabela sem intervalos de classe e outra com intervalos 
de classe de amplitude 2. 
 
12) Complete a tabela abaixo: 
 Nacionalidade (xi) fi fr% Xi (PM) Fi Fr 
 
 Brasileira 6 
 Espanhola 3 
 Argentina 1 
 Total - - 
 
13) Com a tabela de distribuição de 
frequência abaixo, foi construído ao lado 
O histograma dessa distribuição. 
Complete no eixo nº de estudantes (fi), 
os valores correspondentes às classes. 
 Altura (cm) Frequência fi 
 [ 150 ; 157 [ 3 
 [ 157 ; 164 [ 9 
 [ 164 ; 171 [ 15 
 [ 171 ; 178 [ 7 
 [1 78 ; 185 ] 6 
 
 
14) O gráfico representativo ao lado é um 
gráfico: 
 
a) de setores; 
b) de barras; 
c) de colunas; 
d) em forma de histograma; 
e) em forma de polígono de freqüência. 
 16
Apostila de Bioestatística 
 
15) O gráfico representativo ao lado é um 
gráfico: 
 
a) de setores; 
b) de barras; 
c) de colunas; 
d) em forma de histograma; 
e) em forma de polígono de freqüência. 
 
 
 
 
 
 
Módulo 3: Medidas de Tendência Central (Média, Mediana e Moda) 
 
“A NOÇÃO DE INFINITO, DE QUE É PRECISO SE FAZER UM MISTÉRIO EM MATEMÁTICA, RESUME-SE NO 
SEGUINTE PRINCÍPIO: DEPOIS DE CADA NÚMERO INTEIRO EXISTE SEMPRE UM OUTRO.” (TANNERY) 
 
“Tudo são números.” (Ditos Pitagóricos) 
 
M E D I D A S D E T E N D Ê N C I A C E N T R A L 
 
As Medidas de Posição, também denominadas de medidas de tendência central, são as 
medidas que representam os fenômenos pelos seus valores médios, em torno dos quais tendem a 
concentrar-se os dados. São usadas para indicar um valor que resume um conjunto de números. 
As mais utilizadas são a média, a mediana e a moda. 
 
Média Aritmética: É a soma de todos os resultados obtidos dividido pela quantidade de valores. Utiliza-se a letra grega mu “µ” (leia-se “mi”) para a média de 
uma população de N elementos. E, a média de uma amostra de n elementos é representada pelo símbolo “		̅” (leia-se “xis barra”). 
Fórmulas: 
	̅		� 
∑ 
� 
∑ 
 
 
 
 
 
 
 
 
Quando o exercício não mencionar se os dados são amostrais ou populacionais, usaremos o símbolo 		̅, pois quase a totalidade das estatísticas são feitas através de dados amostrais. 
 
A média possui várias propriedades matemáticas, a que considero mais interessante é: 
 
“somando-se uma constante a cada valor, a média ficará aumentada do valor dessa constante. O 
mesmo ocorre com as operações de subtração, multiplicação e divisão.” 
 
Exemplo 1: Determinar a média aritmética dos valores amostrais: 5, 8, 10, 12 e 15. 
 
→ 
 
Exemplo 2: Em uma empresa de cosméticos, a exportação nos últimos 4 anos, em milhares de 
dólares, foi US$ 800,00; US$ 880,00; US$ 760,00 e US$ 984,00. Determine a média de 
exportações dessa empresa. 
 
→ 
 
 
Média Aritmética Ponderada (µp e ̅p): A fórmula anterior para calcular a média aritmética supõe que cada observação tem a mesma importância. A Média 
ponderada é uma média aritmética na qual será atribuído um peso a cada valor da série. 
 
 n 
 
X ∑ xi . pi 
 
 
= 
 
 i=1 
 
 p n 
 
 
∑ pi 
 
 i=1 
 
 
Exemplo 1: Um professor de Matemática adotou para 2013 os seguintes pesos para as notas 
bimestrais: 
 17
1° bimestre: peso 1 3° bimestre: peso 3 
2° bimestre: peso 2 4° bimestre: peso 4 
 
Qual será a média de um aluno que obteve as seguintes notas: 5, 4, 3 e 2 nos respectivos bimestres ? 
 
 (5.1)+(4.2)+(3.3)+(2.4) 5 +8 +9 +8 30 
X p = = = =3 10 10 10 
 
 
 
Mediana(Me): É o valor que ocupa a posição central de um conjunto de dados, desde que 
estejam colocados ordenadamente, seja em ordem crescente ou em ordem decrescente. 
 
Exemplo 1: Calcular a mediana dos dados: 5 ; 8 ; 4 ; 6 ; 7 ; 3 ; 4. 
 
OBS.: Quando a quantidade de dados for ímpar, o valor da mediana será dado pelo 
valor central da série de dados. 
 
 
 
 
 
 
 
 
 
 
 
 
 
. 
 
Exemplo 2: Calcular a mediana dos dados: 8 – 0 – 7 – 4 – 7 – 10 – 6 – 5. 
 
OBS.: Quando a quantidade de dados for par, o valor da mediana será dado pela 
média dos dois valores centrais da série de dados. 
 
 
 
 
 
 
 
 
 
 
 
 
Moda (Mo): É o valor que ocorre com maior frequência nos dados de uma pesquisa. Ou seja, É o 
valor que aparece a maior quantidade de vezes. É a única que pode ser usada para dados 
nominais. 
 
Exemplos 1: Determinar a moda dos dados: 4 4 5 5 5 6 7 8 9 
 
No grupo de dados acima, o valor que mais aparece é o valor 5, então, a moda vale 5. Mo = 5, 
nesse caso dizemos que a série é unimodal. 
 
Exemplos 2: Determinar a moda dos dados: 10 10 10 15 15 15 17 18 19 19 
 
No grupo de dados acima, os valores que mais aparecem são o 10 e o 15, então, a moda vale 10 
e 15. Mo = 10 e 15, nesse caso dizemos que a série é bimodal. 
 
Exemplos 3: Determinar a moda dos dados: 100 200 300 400 500 600 700 
 
No grupo de dados acima, não há repetição de valores, então não existe moda, nesse caso 
 18
dizemos que a série é amodal. 
 
OBS.: Uma série pode ser: amodal, unimodal, bimodal, trimodal e acima disso, polimodal. 
 
C O M P A R A Ç Ã O 
 
Medida Central Vantagens Limitações 
 
Média Reflete todos os valores. É influenciada por valores extremos. 
 
Mediana Insensível a valores Difícil de determinar para grandes 
extremos. quantidades de valores. 
 
 
 Indica o valor “típico” em Quando todos ou quase todos os valores 
 
Moda termos da maior ocorrem aproximadamente com a mesma 
 
 ocorrência. frequência, a moda nada acrescenta. 
 
 19
Apostila de Bioestatística 
 
Das três medidas, a média é a mais utilizada e a moda é a menos utilizada. Dados sobre renda 
pessoal ou valor de residências tem na mediana um valor mais adequado que na média, pois 
basta um valor muito alto, para inflacionar a média. 
 
E X E R C Í C I O S 
 
1) Dados os valores a seguir, 9 – 6 – 5 – 4 – 8 – 9 – 10 – 4 – 7 – 8 – 5 – 6 – 10, determinar a 
média aritmética dos mesmos. 
 
2) Dados os valores a seguir, 10 – 10 – 11 – 11 – 11 – 11 – 12 – 12 – 12 – 13 – 13 – 13 – 14, 
determinar a moda dos mesmos. 
 
3) Dados os valores a seguir, 9 – 6 – 5 – 4 – 8 – 9 – 10 – 4 – 7 – 8 – 5 – 6 – 10, determinar a 
mediana dos mesmos. 
 
4) Dados os valores a seguir, 9 – 5 – 4 – 9 – 10 - 7 – 4 – 5 – 10 – 3 - 3 – 9 – 10 - 6, determinar a 
mediana dos mesmos. 
 
5) Para a série de valores abaixo, calcule a média, a moda e a mediana. 
50 60 40 70 60 40 70 40 60 50 60 50 
 
6) A moda para a sequência numérica 4, 8, 8, 4, 9, 10, 8, 10, 4 e 11 é: 
 
7) Um aluno, nos três primeiros bimestres letivos do ano, obteve as seguintes notas em 
matemática: 4,5; 8,0 e 6,5. Quanto precisará de nota no 4° bimestre, para alcançar a média final 
7,0 ? 
 
8) Considere os dados apresentados na tabela, retirados de uma amostra do peso das crianças 
índias recém nascidas no Alto Xingu em 2012 e assinale a alternativa correta: 
 
Recém Massa a) A média amostral é de 1,7 kg. 
 
Nascido (kg) 
 
A 1,9 b) A série é bimodal. 
 
B 1,8 
 
C 1,5 c) O valor da mediana é 3,6 kg. 
 
D 1,5 
 
E 2,2 d) O valor da moda é 1,5 kg. 
 
 
F 1,8 
e) O valor da mediana é 1,8 kg. G 1,8 
 
 
H 2,0 
 
I 1,1 
 
J 1,7 
 
 
9) Considere os aspectos teóricos envolvidos nas medidas de tendência central e assinale a 
alternativa correta: 
 
a) A média aritmética amostral é indicada pela letra µ. 
 
b) O valor da média sempre coincide com o valor da 
mediana. c) A mediana é indicada por Mo. 
 
d) A moda é o valor mais frequente. 
e) O valor da moda sempre coincide com o valor da mediana. 
 20
Apostila de Bioestatística 
 
10) A média das idades dos 11 funcionários de uma empresa era de 40 anos. Um dos 
funcionários se aposentou com 60 anos, saindo da empresa. A média de idade dos 10 
funcionários restantes passou a ser de quanto? 
 
11) Num colégio, a nota de Matemática do 2º ano é obtida calculando a média ponderada das 
notas de Álgebra, Geometria e Trigonometria com pesos 3, 2 e 2, respectivamente. Qual a nota 
obtida por um aluno que teve 7,5 em Álgebra, 6,0 em Geometria e 5,5 em Trigonometria? 
 
Gabarito: 1)7 2)11 3)7 4)6,5 5)X = 54,17; Me = 55 e Mo = 60 6)4 e 8 7)9,0 8)E 9)D 10)38 anos 
11)6,5 
 
 
Módulo 4: Medidas de Tendência Central para Dados Agrupados 
 
“Um belo Teorema vale uma bela obra de arte.” Amoroso 
Costa “Aquele que deseja estudar ou exercer a Magia deve cultivar a Matemática.” (Matila Ghyka) 
 
Medidas Centrais (Dados Agrupados SEM Intervalos de Classes) 
 
Moda: A Moda para dados agrupados sem intervalos de classes, é calculada observando-se o 
maior valor da frequência. 
 
Exemplo: Calcular a moda dos valores representados na distribuição de frequências: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Média: A Média para dados agrupados sem intervalos de classes, é calculada de maneira 
análoga a média ponderada. 
 
Exemplo: Calcular a média das idades representadas na distribuição de frequências: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Mediana: Para dados agrupados sem intervalos de classe, identifica-se a frequência acumulada 
imediatamente superior à metade da soma das frequências. A mediana será o valor da variável 
que corresponde a tal frequência acumulada. 
 21
Apostila de Bioestatística 
 
Exemplo: Calcular o valor da mediana da distribuição dada: 
 
 
 
 
 
 
 
 
 
 
 
 
 
Como existem 34 valores, a mediana é calculada através do 17° e do 18° valor, observe que 
ambos aparecem na variável 2, logo Me = 2 . Para facilitar a compreensão, vou detalhar o 
procedimento: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Medidas Centrais (Dados Agrupados COM Intervalos de Classes) 
 
Média: A média para dados agrupados com intervalos de classes é calculada de maneira análoga 
a média ponderada, utilizando-se os pontos médios. 
 
Exemplo:Calcular a média das idades representadas na distribuição de frequências: 
 22
Apostila de Bioestatística 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Moda Bruta e Classe Modal: A classe que apresenta a maior frequência é denominada classe 
modal, uma vez agrupados os dados, é possível determinar imediatamente a classe modal, basta 
fixar o valor da variável de maior frequência. 
 
Exemplo: A tabela abaixo mostra os pesos das crianças em uma classe. Usando esta 
informação, encontre a classe modal e a moda bruta. 
 
Kg de massa (m) Frequência 
 
30≤ m < 40 7 
 
40≤ m < 50 6 
 
50≤ m < 60 8 
 
60≤ m < 70 4 
 
 
A classe modal é a classe que tem a maior 
frequência. Neste caso a classe modal é 50 ≤ 
m < 60. O método mais simples para o cálculo 
da moda consiste em tomar o ponto médio da 
classe modal. Damos a esse valor a 
denominação de moda bruta, no caso, Mo = 
55. 
 
Mediana Bruta e Classe Mediana: A classe que apresenta o valor central das frequências é 
denominada classemediana, uma vez agrupados os dados, é possível determinar imediatamente 
a classe mediana, por observação e contagem das frequências acumuladas, conforme já foi visto. 
 
Exemplo: A tabela abaixo mostra os pesos das crianças em uma classe. Usando esta 
informação, encontre a classe mediana e a mediana bruta. 
 
Kg de massa (m) Frequência 
 
30 ≤ m < 40 7 
 
40 ≤ m < 50 6 
 
50 ≤ m < 60 8 
 
60 ≤ m < 70 4 
 
 23
 
Como o total de crianças é 25, a classe mediana 
é a classe que tem o 13° valor de frequência. 
Neste caso a classe mediana é 40 
 
≤ m < 50. O método mais simples para o cálculo 
da mediana consiste em tomar o ponto médio da 
classe mediana. Damos a esse valor a 
denominação de mediana bruta, no caso, 
 
Me = 45. 
 24
Apostila de Bioestatística 
 
A moda bruta é o ponto médio da classe de maior frequência e a mediana bruta é o ponto médio 
da classe da frequência mediana. Para se obter uma moda e uma mediana mais precisa, para 
dados agrupados, existem várias fórmulas, de matemáticos como KING e CZUBER, essas 
fórmulas não serão estudadas nesse curso. 
 
E X E R C Í C I O S 
 
1) Calcular o valor da mediana da 
distribuição dada ao lado: 
 
 
 
 
 
 
 
 
 
 
 
2) (UFPel-RS) Na busca de solução para o problema da gravidez na adolescência, uma equipe de 
orientadores educacionais de uma instituição de ensino pesquisou um grupo de adolescentes de 
uma comunidade próxima a essa escola e obteve os seguintes dados: 
 
 
 
 
 
 
 
 
 
 
 
 
Com base nos textos e em seus conhecimentos, é correto afirmar, em relação às idades das 
adolescentes grávidas, que: 
 
a) a média é 15 anos. 
 
b) a mediana é 15,3 anos. 
 
c) a mediana 16,1 anos. 
 
d) a moda é 16 anos. 
 
e) a média é 15,3 anos. 
 
3) (Unimontes-MG) O serviço meteorológico registrou, em alguns estados brasileiros, as 
seguintes temperaturas: 
 25
Apostila de Bioestatística 
 
 
A moda e a mediana dessas temperaturas são, respectivamente, 
 
a) 39ºC e 24ºC 
 
b) 8ºC e 39ºC 
 
c) 8ºC e 21ºC 
 
d) 21ºC e 8ºC 
 
4) Considere os faturamentos mensais das seguintes filiais de uma grande empresa (em milhares 
de Reais) 
 
 
 
Utilize a medida de posição MEDIANA para comparar o desempenho das filiais. 
 
5) Na linha de produção de uma grande empresa farmacêutica, existem 7 diferentes testes no 
controle de qualidade. Sorteamos alguns dias e observamos 6.934 tubos de pomada, anotando o 
número de aprovações que cada pomada recebeu. 
 
 
Determine o número médio de aprovações por tubo de pomada produzido. 
 
6) Em uma pesquisa realizada numa Empresa Farmacêutica quanto aos salários médios de seus 
funcionários, verificou-se o seguinte resultado: 
 
 
 
 
 
 
 
 
 
 
Baseado nesses resultados determine o salário médio desses funcionários. 
 
7) Considere a tabela de distribuição das alturas, em cm, de 40 alunos de uma sala de aula. 
 
Calcule a média das alturas. 
 
8) Calcule a Moda da tabela ao lado para o dado qualitativo 
tipo sanguíneo de alguns indivíduos. 
 26
Apostila de Bioestatística 
 
 
9) Calcule a moda nas tabelas abaixo e diga qual o tipo de série modal. 
a) b) c) 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
10) Calcule a média, a moda bruta e a mediana bruta da tabela de distribuição das alturas, em 
cm, de 40 alunos de uma classe. 
 
CLASSE (cm) FREQUÊNCIA 
140 ├ 150 3 
150 ├ 160 3 
160 ├ 170 11 
170 ├ 180 6 
180 ├ 190 11 
190 ├ 200 6 
 
Gabarito: 1) 15,5 2) E 3) C 4) 24 e 39,5 5)X = 6,6 6) 830,40 7) 170,50 8) Mo = tipo O 9) a) Mo = 
4,5 (série unimodal) b) Mo = 4,5 e Mo = 4,6 (série bimodal) c) Não há Mo (série amodal) 10)Ẍ = 
174,25; Me = 175 e Mo = 165 e 185 
 
 
Módulo 5: Medidas de Dispersão (Amplitude, Variância, Desvio Padrão e 
Coeficiente de Variação) 
 
“DEUS É O GEÔMETRA ONIPOTENTE PARA QUEM O MUNDO É IMENSO PROBLEMA MATEMÁTICO.” 
 
(LEIBNIZ) 
“Zero, esse nada que é tudo.” (LAISANT) 
 
M E D I D A S D E D I S P E R S Ã O 
Vimos que um conjunto de valores pode ser convenientemente sintetizado, por meio de 
procedimentos matemáticos, em poucos valores representativos, tais como: média aritmética, 
mediana e moda. 
 
No entanto, quando se trata de interpretar dados estatísticos, mesmo aqueles já 
convenientemente simplificados, é necessário ter-se uma idéia retrospectiva de como se 
apresentavam esses mesmos dados nas tabelas. 
 
Para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou 
variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às medidas de 
dispersão ou de variabilidade. Pois são necessários dois tipos de medidas para descrever 
adequadamente um conjunto de dados. Além da informação quanto ao “meio” de um conjunto de 
números (estudado em medidas de tendência central), precisamos saber também a dispersão 
desses dados. As medidas de dispersão indicam se os valores estão relativamente próximos uns 
dos outros, ou separados. Essas dispersões tem como ponto de referência as medidas de 
tendência central. O valor zero indica a ausência de dispersão e quanto maior o valor, maior a 
dispersão. 
 27
Apostila de Bioestatística 
Ou seja, as medidas de dispersão ou de afastamento são medidas estatísticas utilizadas para 
verificar o quanto os valores encontrados em uma pesquisa estão dispersos ou afastados em 
relação à média ou em relação à mediana. Para avaliar o grau de variabilidade ou de dispersão 
são utilizadas as chamadas medidas de dispersão. Dessas medidas, estudaremos a amplitude, a 
variância, o desvio padrão e o coeficiente de variação. 
 
Amplitude Total (A): é a diferença entre o maior e o menor valor de uma série de dados. Quanto 
maior a amplitude total, maior a dispersão ou variabilidade dos valores da variável. 
 
Exemplo: No conjunto de números 4 , 6 , 8 , 9 , 12 , 17, 20, calcule a Amplitude. 
A = maior valor – menor valor 
 
A = 20 – 4 
A = 16 
Alternativamente, pode-se dizer que o intervalo de valores vai de 4 a 20. 
 
No caso de termos uma distribuição de frequência com intervalos de classe, calculamos a 
Amplitude total, pela diferença entre o limite superior da última classe e o limite inferior da 
primeira classe. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
O fato do intervalo só levar em conta dois valores extremos de um conjunto, nada informando 
quanto aos outros valores, torna sua utilização bastante limitada. 
 
Embora não faça parte do programa desse curso, vou falar um pouco sobre Desvio Médio (Dm) 
ou Desvio Médio Absoluto (DMA): É a média dos desvios dos valores a contar da média 
aritmética, ignorando-se o sinal de diferença, é uma dispersão calculada em relação a todos os 
valores, sem exceção. É calculado por meio da fórmula: 
 
 
 
 
 
O desvio médio tem algumas aplicações no controle de inventários, mas também não é muito 
utilizado, pois não apresenta propriedades matemáticas muito interessantes. 
 
Variância: É a média dos quadrados dos desvios dos valores a contar da média. Utiliza-se a letra 
grega sigma minúsculo elevado a 2 “σ²” para a variância de uma população de N elementos. E, a 
variância de uma amostra de n elementos é representada pela letra esse minúscula elevado a 2 
 
“s²”. O símbolo da variância é elevado a 2, porque essa medida de dispersão exprime em 
quadrados de unidades os valores observados e a média deles, ou seja, se estivermos calculando 
uma dispersão de comprimento em cm, a variância será obtida em cm². Por isso, também não é 
muito utilizada como medida de dispersão, mas o cálculo da variância é usado para se obter o 
desvio padrão, que é a medida de dispersãomais utilizada. Fórmula para a variância amostral: 
 28
Apostila de Bioestatística 
 
� ∑� � ̅ � � 
 
Substitui-se “n-1” por “n” no denominador para a variância da população, ou quando a finalidade é 
apenas descrever os dados e não fazer uma inferência sobre uma população. Nesse curso, 
usaremos “n”, somente quando o exercício mencionar que os dados são populacionais, ou seja, 
quando o exercício não mencionar se os dados são populacionais ou amostrais, vamos 
considerá-los amostrais e usar n-1. 
 
Exemplo 1: Calcule a variância para os valores amostrais 5; 7 e 9. 
 
 
Primeiro calculamos a média aritmética entre os valores: 
 ̅= ∑ → ̅= 5+7+9 = 7 
 
 
 
 
3 
 
 
 
Em seguida aplicamos a fórmula da variância: 
 
∑� � ̅�2 
 
�5 � 7�2 + �7 � 7�2 + �9 � 7�2 
 
4 + 0 + 4 
 
8 
 
 
2
 = 
 
= 
 
= 
 
= 
 
= 4
 
� 1 3 � 1 2
 
2 
 
 
 
Resposta: A variância entre os valores 5; 7 e 9 é 4. 
 
Exemplo 2: Calcule a variância para a distribuição de frequência abaixo: 
 
Valor f 
3 6 
5 11 
9 3 
Total 20 
 
Primeiro calculamos a média aritmética entre os valores: 
 ̅= ∑� ∙ � → ̅= �3∙6�+�5∙11�+�9∙3� = 18+55+27 = 100 = 5 
∑ 
 
 
 20 20 20 
 
 
Em seguida aplicamos a fórmula da variância para a distribuição de frequência: 
 
∑� � ̅�2 �3 � 5�2 ∙ 6 + �5 � 5�2 ∙ 11 + �9 � 5�2 ∙ 3 
 
4 ∙ 6 + 0 ∙ 11 + 16 ∙ 3 
 
2 = 
 
= 
 
= 
 
 
∑ � 1 
 
20 � 1 
 
19 
 
 
 
= 
24 + 0 + 48
= 
72 
= 3,79 
 
 
 
 
 19 19 
 
 
Se a tabela for com intervalo de classe, basta usar os valores dos pontos médios. 
 
Exemplo 3: Calcule a variância para a distribuição de frequência abaixo: 
 
Valor f 
1 ├ 5 6 
5 ├ 9 11 
9 ├ 13 3 
Total 20 
 
Primeiro calculamos a média: ̅= ∑� ∙ � → ̅= �3∙6�+�7∙11�+�11∙3� = 
 
∑ 
 
 
 20 
 
18+77+33 
= 
128 = 6,4 
 
 
20 20 
 
Em seguida, calculamos a variância: 
 29
Apostila de Bioestatística 
 
 
 
 
 
 
∑�					�			̅�2 �3	�	6,4�2	∙	6			�7	�	6,4�2	∙	11			�11	�	6,4�2	∙	3 
 
69,36			3,96			63,48 
 
2 = 
 
=
 
 
= 
 
 
 
20	�	1 19 
 
 
 ∑		�	1 
 
 
= 
136,8 
=	7,2 
 
 
 
 
 19 
 
 
A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média 
aritmética dos quadrados dos desvios. Ela é um número em unidade quadrada em relação à 
variável em questão, o que, sob o ponto de vista prático, é um inconveniente. Por isso, imaginou-
se uma nova medida que tem utilidade e interpretação práticas, denominada desvio padrão. 
 
Desvio Padrão: Utiliza-se a letra grega sigma minúsculo “σ” para o desvio padrão de uma 
população de N elementos. E, o desvio padrão de uma amostra de n elementos é representada 
pela letra esse minúscula “s”. O desvio padrão é simplesmente a raiz quadrada da variância. 
=	√ 
 
O desvio padrão é a medida de dispersão mais utilizada, desempenha papel relevante em toda a 
estatística e a sua unidade é a mesma da média. O desvio padrão dá uma idéia de como os 
valores de uma amostra estão dispersos em relação à média. Quanto maior o desvio padrão, 
maior é a dispersão dos valores em relação à média. Um desvio padrão igual a zero indica que 
todos os valores são iguais à média. 
 
O texto a seguir, foi extraído do livro O andar do bêbado. Para entender as medições, é 
fundamental compreender a natureza da variação nos dados causada por erros aleatórios. 
Suponha que ofereçamos diversos vinhos a 15 críticos, ou que os ofereçamos repetidamente a 
um mesmo crítico em dias diferentes, ou ambos. Podemos resumir as opiniões de forma 
ordenada utilizando a média das classificações. Mas isso não é a única coisa que importa: se os 
15 críticos concordarem que a nota de um vinho é 90, isso nos transmite uma mensagem; se os 
críticos expressarem as notas 80, 81, 82, 87, 89, 89, 90, 90, 90, 91, 91, 94, 97, 99 e 100, a 
mensagem é outra. Os dois conjuntos de dados têm a mesma média, mas diferem no quanto 
variam a partir dessa média. O modo como os dados estão distribuídos é uma informação muito 
importante; por isso, os matemáticos criaram uma medida numérica da variação, de modo a 
descrevê-la. Esse número é chamado de desvio padrão da amostra. Os matemáticos também 
medem a variação com base no quadrado desse número, o que é chamado de variância da 
amostra. O desvio padrão da amostra caracteriza o quanto um conjunto de dados se aproxima da 
média, ou, em termos práticos, a incerteza dos dados. Quando é baixo, todos os dados caem 
perto da média. Por exemplo, no caso em que todos os críticos deram nota 90 ao vinho, o desvio 
padrão da amostra é igual a 0, o que nos diz que todos os dados são idênticos à média. No 
entanto, quando o desvio padrão da amostra é alto, os dados não se aglomeram ao redor da 
média. Na série de classificações acima, que varia de 80 a 100, o desvio padrão é igual a 6, o que 
significa que, como regra, a maioria das classificações cairá a no máximo 6 pontos de diferença 
da média. Nesse caso, tudo o que podemos realmente dizer sobre o vinho é que sua classificação 
provavelmente se situa em algum lugar entre 84 e 96. 
 
Se você já leu um artigo científico com certeza deve ter percebido que os resultados geralmente 
são apresentados por meio da média aritmética. E logo em seguida a média, é apresentado um 
outro número, que curiosamente é precedido pelo símbolo de "mais ou menos". Exatamente 
como na tabela abaixo: 
 30
Apostila de Bioestatística 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Pois bem, este número depois do "mais ou menos" é o Desvio Padrão, que indica a dispersão dos 
dados dentro da amostra. Isto é: o quanto os resultados diferem da média. Por isso que ele 
sempre é apresentado junto da média. Um não faz sentido sem o outro. 
 
É importante ter em mente que quanto menor o desvio padrão, mais homogênea é a minha 
amostra. Em termos de pesquisas científicas, é isso que desejamos em nossos resultados. 
 
Na tabela acima, a média da velocidade da marcha dos homens foi de 1,1m/s e o Desvio Padrão 
foi de 0,13m/s. Isso significa que, no geral, boa parte da minha amostra caminha com uma 
velocidade entre 0,97 m/s e 1,23 m/s. Enfim, quando eu adiciono o Desvio Padrão a interpretação 
dos meus números, eu tenho ideia de quanto a velocidade da minha amostra varia em torno da 
média. 
 
Assumindo que nossa amostra possui uma distribuição normal e simétrica, (estudaremos isso em 
distribuição normal de probabilidades), o desvio padrão dá uma ideia de quanto os valores da 
amostra variam em torno da média, da seguinte maneira: 
 
Se calcularmos 1 desvio padrão acima e abaixo da média da tabela: média = 1,1 m/s; 1 desvio 
padrão abaixo da média = 0,97m/s e 1 desvio padrão acima da média = 1,23m/s, Podemos 
afirmar que aproximadamente 68% da minha amostra terá a velocidade da marcha dentro deste 
intervalo. 
 
Se eu quiser ir mais longe e calcular 2 desvios padrões, a porcentagem da minha amostra que se 
encontra dentro do intervalo subirá para 95%. 
 
Se eu calcular 3 desvios, esse valor sobre para 99%, veja na figura abaixo. A linha central 
simboliza a média e as áreas rachuradas os respectivos desvios padrão: 
 31
Apostila de Bioestatística 
 
A figura acima da curva normal ou curva de Gauss será estudada na próxima aula. 
 
Coeficiente de Variação (CV): O Índice de Variabilidade (IV) ou o Coeficiente de Variação 
 (CV) é a razão entre o desvio padrão e a média, o resultado normalmente é multiplicado por 100 
para que o coeficiente seja dado emporcentagem. O CV é utilizado quando dois grupos 
apresentam mesmo desvio padrão e médias diferentes, ou para se comparar duas ou mais séries 
de valores, quanto a sua dispersão ou variabilidade, quando expressas em unidades diferentes, 
ou ainda quando duas médias forem muito distantes. 
 
O Coeficiente de Variação (CV), é uma medida relativa de dispersão, onde a variabilidade, 
através do desvio padrão, é comparada com sua média, através da relação abaixo: 
CV= ̅ ∙ 
 
Onde s é o desvio padrão, 		̅é a média aritmética e o fator 100 é utilizado para apresentar a resposta na forma percentual. 
 
Normalmente, dizemos que um CV abaixo de 15% indica um grupo de dados com baixa 
dispersão. Um CV acima de 30% representa uma alta dispersão dos dados e, entre esses 
valores, o CV representa uma dispersão média. 
 
Exemplo 1: A análise de dois grupos diferentes de dados foi realizada e eles apresentaram o 
mesmo desvio padrão, mas valores médios diferentes: 
Grupo 1: (3; 1 e 5) → 		̅= 3; s² = 4 e s = 2 
Grupo 2: (55; 57 e 53) → 		̅= 55; s² = 4 e s = 2 
 
Qual deles possui maior dispersão? 
 
Vamos obter as variabilidades com relação as médias, através do cálculo dos coeficientes de 
variação para cada grupo: 
 
Grupo 1: � 23 ∙	100	�	66,7% (o desvio padrão é um percentual grande, comparado com o valor médio) 
 
Grupo 2: � 552 ∙	100	�	3,64% (o desvio padrão é um percentual pequeno, comparado com o valor médio) 
 
Observe que: 
 
_ Para o Grupo 1, o desvio padrão corresponde a 66,7% da média; _ 
Para o Grupo 2, o desvio padrão corresponde a 3,64% da média; 
 
Podemos concluir que: 
O Grupo 1 possui maior dispersão do que o Grupo 2 
 
Exemplo 2: (Grupos com unidades diferentes) Ao medir a variabilidade das alturas em cm e 
comparar com a variabilidade das massas em kg dos alunos. Os resultados foram: 
Alturas: s = 15 cm e 	̅	 = 165 cm Massas: s = 10 kg e 	̅	 = 65 kg 
 
Pela comparação direta dos desvios chegaríamos a conclusão que as alturas tem mais 
variabilidade do que as massas. Mas obtendo o CV: 
 32
Apostila de Bioestatística 
 
Alturas: CV = 9,1% Massas: CV = 15,4% 
 
Concluímos que: 
As massas tem maior variabilidade que as alturas. 
 
Exemplo 3: (Grupos com mesmas unidades, porém com médias distantes) Imagine que 
desejamos comparar a variabilidade das massas de adultos com as de recém-nascidos: 
Adultos: s = 10 kg , 	 ̅	 = 65 kg e CV = 15,4% 
Recém nascidos: s = 1 kg , 	̅	 = 3 kg e CV = 33,3% 
 
Analogamente ao exemplo 2, a comparação das variabilidades através do desvio nos levaria a 
decisão contrária, pois a maior variabilidade ocorreu entre os recém-nascidos. 
 
 E X E R C Í C I O S 
1) Calcule a amplitude, a variância e o desvio padrão dos valores: 4, 5, 6, 8, 9, 10 
2) Calcule o desvio padrão para a tabela abaixo: 
 Idade 14 15 16 17 18 19 20 
 Frequência 7 6 1 2 1 0 4 
3) Calcule a amplitude e o desvio padrão da tabela abaixo: 
 Estaturas (cm) Frequência 
 150 ├ 154 9 
 154 ├ 158 9 
 158 ├ 162 11 
 162 ├ 166 8 
 166 ├ 170 5 
 170 ├ 174 3 
 
4) Em um treinamento de salto em altura, os atletas realizaram 4 saltos cada um. Veja as marcas 
obtidas por três atletas e responda: 
 
* atleta A: 148cm, 170cm, 155cm, 131cm. 
* atleta B: 145cm, 151cm, 150cm, 152cm. 
* atleta C: 146cm, 151cm, 143cm, 160cm. 
a) Qual deles obteve a melhor média? b) Qual deles foi o mais regular? 
 
5) Calcule o CV das medidas das estaturas e dos pesos do grupo de indivíduos abaixo e 
responda qual apresenta o maior grau de dispersão. 
 
 Média Desvio Padrão 
ESTATURAS 175 cm 5 cm 
MASSAS 68 kg 2 kg 
 
6) Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com um coeficiente de 
variação de 3,3%. Qual o desvio padrão desse grupo? 
 
7) Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e CV = 2,9%. Determine a média 
da distribuição. 
 
Gabarito: 1)A = 6, s² = 5,6 e s = 2,36 2)2,28 3)24 e 6,03 4)O atleta A obteve a maior média, 151 
cm. O atleta B foi o mais regular, pois seu desvio padrão é o menor, aproximadamente 3,1 cm. 
5)As massas apresentam maior grau de dispersão 2,94%, sendo o das estaturas de 2,86% 6)5,41 
7)51,72

Outros materiais