Logo Passei Direto
Buscar
Material
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

UNIVERSIDADE FEDERAL DA INTEGRAÇÃO
LATINO�AMERICANA
BIOESTATÍSTICA
Disciplina de Bioestatística
Ciências Biológicas
Foz do Iguaçu�PR Brasil
Março�2016
Sumário
1 Estatística Descritiva 5
1.1 Conceitos Básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Organização dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3 Distribuição de frequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.1 Gráfico de distribuições de frequências em Classes . . . . . . . . . . . . 14
1.4 Medidas de Posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.4.1 Média Aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.2 Média Aritmética Ponderada . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.3 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4.4 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.4.5 Quartis, Decis e Percentis . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.5 Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.6 Medidas de Dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.6.1 Amplitude Total (AT) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.6.2 Variância e Desvio Padrão . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.6.3 Coeficiente de Variação . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.7 Apresentação dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.8 Tabela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.8.1 Tabela Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.8.2 Tabela de dupla entrada ou de contigência . . . . . . . . . . . . . . . . . 28
1.9 Gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.9.1 Elementos e Normas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.9.2 Principais tipos de Gráficos . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.9.3 Gráficos em Colunas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.9.4 Gráficos em Setores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Bioestatística - Prof
a
. Alessandra C. Sibim
SUMÁRIO 3
1.9.5 Gráfico em Barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.9.6 Gráficos em Linhas ou Lineares . . . . . . . . . . . . . . . . . . . . . . . 32
1.9.7 Gráfico Comparativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.9.8 Cartograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.10 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2 Probabilidade 38
2.1 Teoria de Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.1.1 Partição do espaço amostral . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.1.2 Operações com Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.2 Definição clássica de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.3 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.4 Eventos Independentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.5 Eventos mutuamente exclusivos . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.6 Probabilidade Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.7 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.8 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3 Noções de Amostragem 50
3.1 Principais planos de amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.1.1 Amostragem aleatória simples . . . . . . . . . . . . . . . . . . . . . . . . 50
3.1.2 Amostragem Sistemática . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.1.3 Amostragem Estratificada . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.1.4 Amostragem de Conglomerados . . . . . . . . . . . . . . . . . . . . . . . 52
4 Variável Aleatória 53
4.1 Variáveis Aleatórias Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.1.1 Função Discreta de Probabilidade ou Distribuição de Probabilidade . . . 54
4.1.2 Função de distribuição de probabilidade . . . . . . . . . . . . . . . . . . 54
4.2 Média de uma v.a. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.2.1 Propriedades da Esperança . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.3 Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.3.1 Propriedades da Variância . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Bioestatística - Prof
a
. Alessandra C. Sibim
SUMÁRIO 4
4.4 Principais distribuições discretas de probabilidade . . . . . . . . . . . . . . . . . 57
4.4.1 Distribuição de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.4.2 Distribuição Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.4.3 Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.5 Principais distribuições contínuas de probabilidade . . . . . . . . . . . . . . . . 61
4.5.1 Distribuição Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.5.2 Distribuição Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.5.3 Normal Padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.6 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
Bioestatística - Prof
a
. Alessandra C. Sibim
Capítulo 1
Estatística Descritiva
Estatística Descritiva é em geral utilizada na etapa inicial da análise quando to-
mamos contato com os dados pela primeira vez, com o objetivo de tirar conclusões de modo
informal e direto. Ou seja, pode ser definida como um conjunto de técnicas destinadas a des-
crever e resumir os dados a fim de que possamos tirar conclusões a respeito das características
de interesse, ou ainda, ela organiza e representa os dados. Ao se deparar com os dados que se
pretende analisar, observamos algumas características sobre essas medidas: quais são os tipos
de variáveis que estamos tratando e quais as técnicas de descrição gráfica e tabular que devemos
utilizar.
Variáveis: medidas obtidas da amostra. Por exemplo, desejamos registrar a idade das
pessoas ao morrer; a estatura ou peso dos indivíduos; o rendimento das famílias em uma grande
cidade; o número de empregados dispensados, por mês, em uma grande empresa; a distribuição
dos alunos por sexo; etc.
Uma variável pode ser:
Qualitativa: Quando seus valores forem expressos por atributos (não numéricas).
Dividem-se em:
• Nominal ( sexo, estado civil, etc. )
• Ordinal (estágios: primeiro, segundo, terceiro, etc.)
Quantitativas: Os valores da variável são numéricos. Divindo-se em:
• Contínuas: Quando podem assumir valores num intervalo. (peso, altura, etc. )
• Discretas: Quando assumem valores pontuais, geralmente de números inteiros. (número
de filhos de um casal, etc. )
Obs.: Em geral, as medições dão origem às variáveis contínuas e as contagens ou
enumerações às variáveis discretas.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 6
Resumo das Variáveis:
Nominal
Qualitativa
66
((
Ordinal
Variável
##
;;
Discreta
Quantitativa
66
((
Contínua
TÉCNICAS DE DESCRIÇÃO GRÁFICA E TABULAR
• Tabular: Os dados são organizados em linhas e colunas, com respectivas frequências,de
acordo com o tipo de fenômeno em estudo. As normas para construção são elaboradas
pelo Conselho Nacional de Estatística e divulgadas pelo IBGE.
• Gráfica: Permite visualização imediata dos resultados. Os tipos de gráficos dependem do
fenômeno em estudo. Ex: barras, em setores, de linhas, etc.
CARACTERÍSTICAS NUMÉRICAS PARA UM CONJUNTO DE DADOS:
• Medidas de Posição: são medidas centrais, que representam o centro da distribuição
podem-se considerar exemplos dessas medidas a média, a moda, a mediana e os quartis.
• Medidas de Dispersão: são medidas de dispersão em relação à média: a amplitude, desvio
padrão e a variância.
Probabilidade: Pode ser pensada como a teoria matemática utilizada para se estudar
a incerteza oriunda de fenômenos de caráter aleatório.
Inferência estatística: É o estudo de técnicas que possibilitam a extrapolação, a um
grande conjunto de dados, das informações e conclusões obtidas a partir de um subconjunto de
valores. (afirmações sobre o todo com base na amostra).
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 7
A Bioestatística é a estatística aplicada às ciências que estudam aspectos vitais (re-
ferentes a vida), como Medicina, Biologia, Nutrição, Farmácia, Psicologia, Enfermagem, Odon-
tologia entre outras. Na Medicina, especificamente, pode ser entendida em dois ambientes.
O primeiro, referente ao levantamento de informações, como registro de doenças, surtos, ende-
mias, epidemias, e de registros de qualidade de vida, como condições de alimentação, sanitárias,
habitacionais, de prevenção de doenças, educação etc. Denomina-se esse ambiente de ambiente
macro, e tem a ver fundamentalmente com a identificação, a planificação e a execução de ações
de Saúde Pública.
O segundo ambiente refere-se à elaboração de experiências e pesquisa científica, tais
como testes de vacinas, avaliação de terepêuticas e tratamentos, teste de medicamentos etc.
Denomina-se esse ambiente de ambiente micro, e tem a ver, naturalmente, com a pesquisa
laboratorial e científica.
1.1 Conceitos Básicos
População: É o conjunto de todos os elementos sobre as quais há o interesse de
investigar uma ou mais característica. A população pode ser formada por pessoas, domicílios,
peças de produção, cobaias, ou qualquer outro elemento a ser investigado.
Representaremos por �N� o número de elementos de uma população finita.
Amostra: É um subconjunto dos elementos que constituem a população, obtido atra-
vés de técnicas de amostragem a qual estudaremos mais adiante.
Representamos por �n� o número de elementos da amostra.
Censo: É o processo utilizado para levantar as características observáveis, abordando
todos os elementos de uma população.
Exemplos:
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 8
• Tirar conclusões sobre a altura, peso, idade de 50 estudantes de Ciências Biológicas da
UNILA, observando apenas 12 estudantes.
População = 50
Amostra = 12.
• Investigar a porcentagem de lajotas defeituosas fabricadas em uma indústria, durante 6
dias, examinando 20 peças por dia.
População = todos as lajotas fabricadas durante 6 dias.
Amostra = o subconjunto de 6x20=120 peças, selecionadas para estudo
Obs: I) Amostragem é mais vantajosa:
- População infinita
- Tempo limitado
- Teste destrutivo
- Custo muito alto
Obs: II) Censo é mais vanta-
joso:
- População pequena
- Tamanho da amostra grande
em relação a população
- Exigência de precisão completa
Parâmetros: é a medida numérica (média, variância, proporção, etc) que descreve
uma característica de interesse da população, geralmente os parâmetros populacionais são des-
conhecidos pois na maioria das vezes não obtemos todos os dados da população.
Estatística: alguma medida descritiva das variáveisX1, X2, . . . , Xn associadas à amos-
tra.
População Amostra
Parâmetros Estatísticas
Média µ =
∑
xi
N
x¯ =
∑
Xi
n
Variância σ2 =
∑
(xi−µ)2
N
S2 =
∑
(Xi−x¯)2
n−1
Proporção p = n
o
elementos com atributo
N
pˆ = n
o
elementos com atributo
n
Exercício: Classifique as seguintes variáveis em qualitativas (nominal/ordinal) ou
quantitativa (discreta/contínua).
a) Classe social
b) Número de clientes
c) Salário
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 9
d) Cidade
e) Departamento que trabalha
f) Número de filho
g) Diâmetro de uma peça
h)Nível de escolaridade
i) Número de processos analisados
j) Opinião sobre a reforma agrária
k) Peso de um produto
l) Qualidade do atendimento de um estabelecimento
m) Número de telefonemas
n) Estado Civil
o) Idade (anos)
p) Distância de sua casa na faculdade
q) Número de idas ao cinema por semana
1.2 Organização dos Dados
A questão inicial é: dado um conjunto de dados, como �tratar� os valores, numéricos
ou não, a fim de se extrair informações a respeito de uma ou mais características de interesse?
Basicamente, faremos uso de tabelas de frequências e gráficos, notando que tais procedimentos
devem levar em conta a natureza dos dados. Suponha, por exemplo, que um questionário foi
aplicado aos alunos de um curso da UNILA, fornecendo as seguintes informações:
Idade: Idade em anos;
Altura: Altura em metros;
Peso: Peso em quilogramas;
Estado Civil: Solteiro, casado, divorciado e viúvo.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 10
Estado civil Idade Peso Altura Estado civil Idade Peso Altura
solteiro 20 74 1,68 casado 46 70 1,70
solteiro 18 46 1,60 solteiro 19 70 1,78
solteiro 19 62 1,60 solteiro 28 58 1,65
solteiro 19 64 1,70 solteiro 21 68 1,60
solteiro 25 98 1,90 solteiro 23 62 1,70
solteiro 24 68 1,72 solteiro 19 66 1,74
solteiro 20 60 1,70 solteiro 20 74 1,80
solteiro 35 71 1,68 solteiro 22 90 1,86
solteiro 19 67 1,62 casado 58 98 1,80
solteiro 20 79 1,87 solteiro 24 74 1,73
solteiro 19 80 1,75 solteiro 20 70 1,70
solteiro 20 65 1,74 casado 26 95 1,60
solteiro 20 74 1,60 solteiro 20 46 1,54
solteiro 20 65 1,70 solteiro 21 69 1,57
solteiro 19 53 1,63 solteiro 19 57 1,57
solteiro 19 60 1,67 solteiro 19 59 1,61
solteiro 23 45 1,60 solteiro 17 58 1,49
divorciado 26 70 1,70 solteiro 20 62 1,70
solteiro 20 75 1,70 solteiro 20 60 1,65
solteiro 21 75 1,70 solteiro 22 49 1,60
solteiro 19 73 1,76
O conjunto de informações disponíveis, após a tabulação do questionário ou pesquisa
de campo, é denominado tabela de dados brutos e contém os dados da maneira que foram
coletados inicialmente. Em nosso caso temos quatro variáveis envolvidas sendo uma qualitativa
(estado civil) e as restantes quantitativas (idade, peso, altura).
1.3 Distribuição de frequências
As tabelas de dados brutos apesar de conter muita informação pode não ser prática
para respondermos às questões de interesse. Para a análise ficar mais prática vamos construir
uma nova tabela com as informações resumidas, para algumas das variáveis. Esta tabela será
denominada de tabela de frequência e, como o nome indica conterá os valores da variável e
suas respectivas contagens, as quais são denominadas frequências absolutas ou simplesmente
frequência (Fi).
Exemplo: Verificando os dados sobre a variável Estado Civil da tabela de dados brutos
temos
Estado Civil Fi
Solteiro 37
Casado 3
Divorciado 1
Viúvo 0
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 11
Para efeito de comparação com outros grupos de conjunto de dados, será conveniente
acrescentarmos uma coluna na tabela de frequências contendo o cálculo da frequência relativa,
definida por fi = Fi/n.
Estado Civil Fi fi
Solteiro 37 0,90
Casado 03 0,07
Divorciado 01 0,02
Viúvo 00 0,00
Ainda a respeito das distribuições de frequências,vamos considerar agora a variável
estatura. Partindo desses dados é difícil averiguar em torno de que valor tendem a se concen-
trar as estaturas, qual a menor ou qual a maior estatura, ou ainda, quantos alunos se acham
abaixo ou acima de uma dada estatura. Assim, conhecidos os valores de uma variável é difícil
formarmos uma ideia exata do comportamento do grupo como um todo, a partir dos dados de-
sordenados. A maneira mais simples de organizar os dados é através de um parâmetro crescente
ou decrescente. Podemos dispor esses dados através de uma tabela de frequências.
Alturas Frequência Alturas Frequência
1,49 1 1,72 1
1,54 1 1,73 1
1,57 2 1,74 2
1,60 7 1,75 1
1,61 1 1,76 1
1,62 1 1,78 1
1,63 1 1,80 2
1,65 2 1,86 1
1,67 1 1,87 1
1,68 2 1,90 1
1,70 10
Mas, o processo dado acima ainda é inconveniente, já que exige muito espaço, mesmo
quando o número de valores da variável n é de tamanho razoável, e não nos esclarece muita
coisa. Desta forma, o melhor seria formar agrupamentos. Assim, se um dos intervalos for, por
exemplo, 1,61 ` 1,67, em vez de dizermos que a estatura de 1 aluno é 1,61 m, de 1 aluno é 1,62
m, de 1 aluno 1,63 m e de 2 alunos 1,65 m, diremos que 05 alunos têm estatura entre 1,57 m
e 1,67. Deste modo, estaremos agrupando os valores da variável em intervalos, sendo que em
estatística, preferimos chamá-los de intervalos de classes.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 12
Tabela 1.1: Estatura dos alunos de um curso da UNILA, Foz do Iguaçu, 2013.
Altura em m (Fi) Fac fi xi
`
`
1,61 ` 1,67 05 16 0,12 1,64
`
`
`
`
TOTAL 41 � �
Fonte: alunos
O que se pretende com a construção desta tabela é realçar o que há de essencial nos
dados e, também, tornar o uso de técnicas analíticas para a sua total descrição, até porque a
Estatística tem por finalidade específica analisar o conjunto de valores, desinteressando-se por
casos isolados.
As distribuições de frequências são séries onde todos os elementos, época, local e es-
pécie, são fixos e os dados referentes ao fenômeno que se está representando são reunidos de
acordo com sua magnitude, ou seja, são agrupados de acordo com a intensidade ou variação
quantitativa do fenômeno. Consiste na organização dos dados de acordo com as ocorrências
dos diferentes resultados observados.
Elementos de uma Distribuição de Frequências
• Amplitude Total (AT): É a diferença entre o maior e o menor valor dos dados obser-
vados. AT = Vmax − Vmin.
• Classes (k): A sintetização dos dados em tabelas nos leva a separá-los em subconjuntos
segundo k classes de valores. Existem diversas maneiras para se encontrar o número de
classes (k), uma delas é a raiz quadrada do número de elementos (k =
√
n ou k =
√
N),
quando n ou N < 30, caso contrário utilizaremos a fórmula de Sturges: k = 1 + 3, 22 ·
log(n) (n ou N ≥ 30).
Na realidade, a prática do pesquisador é que vai determinar se o número de classes é
razoável (5 ≤ k ≤ 12), levando em conta a amplitude total (AT) e o número de elementos
(n ou N). Também é conveniente fazer algumas observações após sua construção.
Evitar em uma distribuição de frequências:
� Classes com frequência absoluta zero;
� Muitas classes com um número concentrado e semelhante de elementos.
• Amplitude das Classes (h): É o intervalo de valores estabelecido para cada classe.
h = AT
k
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 13
Obs:
{
h tem que ter o mesmo número de casas decimais que os escores.
k deve ser arredondado somente para um valor maior.
• Limites de Classes (li ou Ls): São os valores extremos de cada intervalo de classe
representados por: li = limite inferior e Ls = limite superior.
• Frequências Absolutas de Classes (Fi): É o número de dados cujos valores pertencem
a cada classe.
• Ponto Médio das Classes (xi): É o valor que representa os elementos de uma classe.
xi =
li+Ls
2
Obs: No caso de variáveis discretas cujo os dados não estejam reunidos em classes,
xi representa cada valor discreto que a variável assume, sem necessidade de valor para
representa-lo.
• Frequências Absolutas Acumuladas (Fac): Consiste em acumular o número de dados
de uma dada classe acrescido de todos os dados das classes anteriores.
• Frequências Relativas (fiou fi%): É a proporção de dados em cada classe, dada pela
expressão:
fi =
Fi
n
ou fi% =
Fi
n
.100
• Frequências Absolutas Acumuladas Percentuais (Fac%): Traduzem a percentagem
de dados acumulados até a classe i.
Exercício 1: Os dados a seguir representam 20 observações relativas ao índice pluvi-
ométrico em determinados municípios de um Estado.
Mílimetro de Chuva.
144 152 159 160
160 151 157 146
154 145 141 150
142 146 142 141
141 150 143 158
Construa a tabela de distribuição de frequência para este caso.
Exercício 2: Os dados a seguir mostram os resultados de 20 exames hematológicos
efetuados no Laboratório de Análises Clínicas da AISI-FMIt-Hospital Escola, referentes ao
número percentual de linfócitos, em um grupo de pacientes que apresentavam leucemia linfóide.
Percentual de linfócitos.
10 12 18 12
15 14 10 12
11 19 14 13
10 11 15 16
22 14 13 12
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 14
Construa a tabela de distribuição de frequência para este caso.
1.3.1 Gráfico de distribuições de frequências em Classes
Os principais gráficos para representação de distribuição de frequências são:
1. Histograma.
2. Polígono de frequências absolutas.
Histograma
O histograma é um gráfico de barras contíguas, com as bases proporcionais aos interva-
los das classes e a área de cada retângulo proporcional á respectiva frequência, seja a absoluta
ou a relativa. Quanto mais dados tiver na classe mais alto será o retângulo. A área total do
histograma será igual a 1.
Considere os seguintes dados fictícios, referentes aos hectáres produtivos no município
de Água Escura no ano 2000.
Tabela 1.2: Hectáres produtivos no município de Água Escura, 2000.
Hectáres Fi
05 ` 09 4
09 ` 13 6
13 ` 17 7
17 ` 21 5
21 ` 25 10
25 ` 29 8
29 ` 33 10
TOTAL 50
Fonte: dados fictícios
O gráfico para essa tabela de frequência é dado na Figura 1.1.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 15
Figura 1.1: Polígono de frequência para os hectáres produtivos no município de Água Escura,
2000.
Polígono de Frequência
O polígono de frequência é contruído unindo-se os pontos médios dos retângulos obtidos
no histograma. O que podemos observar na figura abaixo.
Figura 1.2: Polígono de frequência para os hectares produtivos.
Exercício 1: Construa o histograma e o polígono de frequência para a variável esta-
tura.
Exercício 2: Construa a tabela, o histograma e o polígono de frequência para a
variáveis idade e peso.
1.4 Medidas de Posição
As medidas de posição podem se apresentar de várias formas, dependendo do que se
pretende conhecer a respeito dos dados. Dentre elas as mais importantes são as medidas de
tendência central, que são assim denominadas devido a tendência dos dados observados se
agruparem em torno de valores centrais.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 16
As medidas de tendência central mais utilizadas são: a média aritmética, a moda e a
mediana.
1.4.1 Média Aritmética
Média é o quociente da divisão da soma dos valores da variável pela quantidade deles;
Seja (x1, . . . , xn) um conjunto de dados, a média desse conjunto é dada por:
x =
n∑
i=1
xi
n
sendo, x: a média, xi : os valores da variável e n: quantidade de valores.
1.4.2 Média Aritmética Ponderada
Dados agrupados sem intervalos de classe
Exemplo: Consideremos a distribuiçãorelativa a 34 famílias de quatro filhos tomando
para a variável o número de filhos do sexo masculino:
Número de meninos Fi
0 2
1 6
2 10
3 12
4 4
Σ= 34
Qual o número médio de meninos por família?
x =
n∑
i=1
xiFi
n
= (0×2)+(1×6)+(2×10)+(3×12)+(4×4)
34
= 78
34
∼= 2, 3
Assim a média é de 2,3 meninos por família.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 17
Dados agrupados com intervalos de classe
Convencionamos que todos os valores incluídos em um determinado intervalo da classe
coincidem com seu ponto médio, assim determinamos a média aritmética ponderada por
x =
n∑
i=1
xiFi
n
sendo xi o ponto médio da classe.
Exemplo: A tabela a seguir representa a idade dos alunos do curso de medicina
veterinária da UFBA, ano/1993. Calcule a idade média desses alunos.
Classe de Idade Fi xi xi.Fi
21 ` 24 7 22,5 157,5
24 ` 27 8 25,5 204
27 ` 30 1 28,5 28,5
30 ` 33 5 31,5 157,5
33 ` 36 7 34,5 241,5
Σ 28 142,5 789
x =
n∑
i=1
xi.Fi
n
=
789
28
∼= 28, 18
Logo a idade média dos alunos é de aproximadamente 28,2 anos.
1.4.3 Moda
Moda é o valor que ocorre com maior frequência em uma série de valores.
Exemplos:
• {7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10;
• { 3 , 5 , 8 , 10 , 12 } (amodal);
• { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A série é bimodal.
Dados agrupados sem intervalos de classe
Uma vez agrupados os dados, é possível obter imediatamente a moda: basta fixar o
valor da variável de maior frequência.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 18
Exemplo: Consideremos a distribuição relativa a 34 famílias de quatro filhos tomando
para a variável o número de filhos do sexo masculino:
Número de meninos Fi
0 2
1 6
2 10
3 12
4 4
Σ= 34
Qual a moda da variável número de meninos? Mo = 3
Dados agrupados com intervalos de classe
A classe que apresenta maior frequência é denominada classe modal. Existem alguns
métodos para calcular a moda: O método mais simples para o cálculo da moda consiste em
tomar o ponto médio da classe modal.
Exemplo: A tabela a seguir representa a idade dos alunos do curso de medicina
veterinária da UFBA, ano/1993.
Classe de Idade Fi xi
21 ` 24 7 �
24 ` 27 8 25,5
27 ` 30 1 �
30 ` 33 5 �
33 ` 36 7 �
Assim a moda é 25, 5, ou seja, há uma maior quantidade de alunos com idade de 25,5
anos.
1.4.4 Mediana
A mediana de um conjunto de valores ordenados(crescente ou decrescente), é o valor
situado de tal forma no conjunto que o separa em dois subconjuntos, de mesmo número de
elementos. A mediana é considerada uma separatriz, por dividir a distribuição ou o conjunto
de dados em duas partes iguais.
Para o cálculo da mediana devemos considerar
Med(X) =
{
x(n+1
2
), se n ímpar;
x(n2 )
+x(n2 +1)
2
, se n par.
Exemplos:
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 19
• X = {5, 2, 6, 13, 9, 15, 10} ordenando temos:
X = { 2, 5, 6,︸ ︷︷ ︸
=3elementos
9, 10, 13, 15︸ ︷︷ ︸
=3elementos
}
assim
Med(X) = 9
• Y = {1, 3, 0, 0, 2, 4, 1, 3, 5, 6} ordenando temos:
Y = {0, 0, 1, 1, 2, 3, 3, 4, 5, 6}
Med(X) =
2 + 3
2
= 2, 5
Dados agrupados sem intervalos de classe
Exemplo: Consideremos a distribuição relativa a 34 famílias de quatro filhos tomando
para a variável o número de filhos do sexo masculino:
Número de meninos Fi Fac
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
Σ= 34
p =
n∑
i=1
Fi
2
p =
34
2
= 17
a menor frequência que supera esse valor é o 18 que corresponde ao valor 2 da variável sendo
este o valor mediano, assim Med= 2 meninos.
Agora se tivermos,
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 20
xi Fi Fac
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Σ= 8
Temos p = 8
2
= 4 = Fac3
Logo
⇒Med = 15 + 16
2
= 15, 5
Dados agrupados com intervalos de classe
Exemplo: A tabela a seguir representa a idade dos alunos do curso de medicina
veterinária da UFBA, ano/1993.
Classe de Idade Fi Fac
21 ` 24 7 7
24 ` 27 8 15
27 ` 30 1 16
30 ` 33 5 21
33 ` 36 7 28
Σ= 28
p = 28
2
= 14; define a classe mediana, localizar p na frequência acumulada (Fac).
Md = li +
[
p2 − Fac(ant)
Fi
]
× h
= 24 +
(14− 7)
8
× 3
= 24 +
21
8
= 26, 63
em que, li é o limite inferior da classe mediana; Fac(ant) é a frequência acumulada da classe
anterior; h é a amplitude da classe e Fi é a frequência da classe mediana.
1.4.5 Quartis, Decis e Percentis
A mediana seja de uma população ou de uma amostra divide o conjunto de dados em
duas partes iguais. Também é possível dividi-lo em mais de 2 partes.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 21
Quando se divide um conjunto ordenado de dados em quatro partes iguais, os pontos
da divisão são conhecidos como quartil; o primeiro quartil, Q1; é o valor que divide aproxima-
damente, a quarta parte (25%) das observações abaixo dele, e os 75% restantes, acima dele. O
segundo quartil é exatamente a mediana (Med). O terceiro quartil, Q3, tem aproximadamente
os três quartos (75%) das observações abaixo dele. Para calcularmos os quartis primeiramente
temos que encontrar a posição dos mesmos. O que pode ser feito pelas seguintes expressões
pj = (n · j)/4, com j = 1,2 ou 3 e
Qj = li +
[
pj − Fac(ant)
Fi
]
× h (1.1)
com, li é o limite inferior da classe definida por pj; Fac(ant) é a frequência acumulada da classe
anterior; h é a amplitude da classe e Fi é a frequência da classe definida por pj.
Quando dividimos o conjunto de dados em dez partes iguais temos os decis e quando o
dividimos em cem partes temos os percentis, a fórmula para o cálculo dos decis(Dj) e percentis
(Pj) é a mesma que dos quartis (Eq. 3.1), bastando mudar o valor de p, no caso dos decis temos
pj = (n · j)/10, com j = 1, 2, . . . , 9 e para os percentis pj = (n · j)/100, com j = 1, 2, . . . , 99.
Observe que existem relações entre quartis, decis e percentis. Q1 = P25, Q2 = D5 = P50,
Q3 = P75, por exemplo.
1.5 Boxplot
O boxplot é um gráfico que fornece uma visualização da distribuição dos dados, além
de permitir detectar rapidamente uma possível assimetria dessa distribuição. Sua construção
é baseada nas seguintes medidas: na mediana, no primeiro e terceiro quartil e nos valores
extremos. A forma desse gráfico tem as seguintes características (veja a figura 1.3):
• A caixa (�box�) é delimitada pelo primeiro (Q1) e terceiro (Q3) quartil. A linha interior
da caixa corresponde a mediana (Med = Q2).
• A partir dos limites da caixa, considera-se duas linhas auxiliares que distam 1,5 o intervalo
interquartil d = Q3 −Q1. Essas linhas não aparecerão no gráfico final. Elas servem para
caracterizar os valores discrepantes que são os valores menores que L.I. = Q1− 1, 5 · d ou
valores maiores que L.S. = Q3 + 1, 5 · d. Os valores discrepantes serão representados no
gráfico com asteriscos (*).
• Os limites do gráfico, representados por uma linha à direita e à esquerda (�bigodes�) da
caixa, correspondem ao maior e ao menor valores não discrepantes do conjunto de dados.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 22
Figura 1.3: Boxplot.
1.6 Medidas de Dispersão
O resumo de um conjunto de dados por uma única medida de tendência central esconde
toda a informação sobre a variabilidade do conjunto de observações. Por exemplo, suponhamos
que se deseja comparar a performance de dois empregados, com base na seguinte produção
diária de determinada peça:
Empregado Variáveis Σ
A 70; 71; 69; 70; 70 350
B 60; 80; 70; 59; 81 350
Temos que x¯A = 70 e x¯B = 70, de acordo comas médias diríamos que a performance
de B é igual a de A, no entanto se observarmos a variabilidade, observamos que a performance
de A é bem mais uniforme.
Por esse motivo a dispersão dos dados em torno de sua média deve ser levada em
consideração. As principais medidas de dispersão são: variância, desvio-padrão, amplitude
total, e coeficiente de variação.
1.6.1 Amplitude Total (AT)
Amplitude Total ( AT ) é a diferença entre o maior e o menor valor observado.
AT = x
(máx)
− x
( mín)
Dados agrupados em classes: Neste caso a AT é dada pela diferença entre o limite superior
da última classe e o limite inferior da primeira classe.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 23
AT = Ls − li
A amplitude total não é muito utilizada como medida de dispersão, dado que ela contém
relativamente pouca informação quanto a dispersão, pois seu cálculo depende de apenas dois
valores do conjunto de dados. Aplicações da amplitude total como medida de dispersão podem
ser encontradas em controle de qualidade.
1.6.2 Variância e Desvio Padrão
A variância é a medida que fornece o grau de dispersão, ou variabilidade dos valores do
conjunto de observações em torno da média. Ela é calculada tomando-se a média dos quadrados
dos desvios em relação à média.
Dados não agrupados.
σ2x =
n∑
i=1
(xi − µ)2
N
→ dados populacionais, nesse caso representaremos variância por σ2.
S2 =
n∑
i=1
(xi − X¯)2
n−1 → dados amostrais, nesse caso representaremos a variância por S2.
Dados agrupados em tabelas de frequência
σ2x =
n∑
i=1
(xi − µ)2.Fi
N
→ dados populacionais, nesse caso representaremos variância por
σ2.
S2 =
n∑
i=1
(xi − X¯)2.Fi
n−1 → dados amostrais, nesse caso representaremos a variância por S2.
Desvio Padrão
Como a variância é uma medida de dimensão igual ao quadrado da dimensão dos
dados, pode-se causar problemas de interpretação. Então costuma-se usar o desvio padrão, que
é definido como a raiz quadrada da variância
S =
√
S2 ou σ =
√
σ2
Propriedades do desvio padrão e da variância
1. Somando (ou subtraindo) um valor constante e arbitrário, k a cada elemento de um
conjunto de números, o desvio padrão desse conjunto não se altera, essa propriedade
também vale para variância.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 24
2. Multiplicando (ou dividindo) por um valor constante c, cada elemento de um conjunto
de números, o desvio padrão fica multiplicado (ou dividido) pela constante c, no caso da
variância ela fica multiplicada pela constante elevado ao quadrado.
1.6.3 Coeficiente de Variação
O Coeficiente de variação é uma medida relativa da dispersão ou variabilidade dos
dados em termos relativos ao seu valor médio:
CV% = σ
µ
.100 ou CV% = S
X¯
.100
Critérios para interpretação.
Quanto menor for o coeficiente de variação, mais representativa dos dados será a média.
Coeficiente de variação acima de 50%, a média não é representativa.
• Se 0% ≤ CV% < 30%, conclui-se pela baixa variabilidade dos dados e a média é uma
ótima medida para representar os dados;
• Se 30% ≤ CV% < 50% , conclui-se pela média variabilidade dos dados e a média é uma
boa medida para representar os dados;
• Se CV% ≥ 50% , conclui-se pela alta variabilidade dos dados e a média não é uma medida
apropriada para representar os dados. Neste caso, deve-se pensar na mediana ou moda.
Exemplo: Voltando ao exemplo da performance dos dois empregados, vamos calcular
a variância, o desvio padrão e o coeficiente de variação dos dois conjuntos de valores de produção
diaria dos empregados A e B.
Empregado Variáveis Σ
A 70; 71; 69; 70; 70 350
B 60; 80; 70; 59; 81 350
Já vimos que: X¯A = 70 e X¯B = 70
Variância de A.
S2A =
n∑
i=1
(xi − X¯)2
n−1 =
(70−70)2+(70−71)2+(70−69)2+(70−70)2+(70−70)2
5−1 =
1+1
4
= 2
4
= 0, 5
Desvio padrão e coeficiente de variação de A.
SA =
√
0, 5 = 0, 7 e CV A% =
0,7
70
.100 = 1
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 25
Variância de B.
S2B =
n∑
i=1
(xi − X¯)2
n− 1 =
(70− 60)2 + (70− 80)2 + (70− 70)2 + (70− 59)2 + (70− 81)2
5− 1
=
100 + 100 + 121 + 121
4
=
442
4
= 110, 5
Desvio padrão e coeficiente de variação de B.
SB =
√
110, 5 = 10, 51 e CV B% =
10,51
70
.100 = 15, 01
Conclusão: as duas médias representam muito bem os dados, no entanto é fácil veri-
ficar que a dispersão dos valores de B é muito maior que a de A.
Exemplo: Considere a seguinte distribuição de frequências correspondente aos dife-
rentes preços de um determinado produto em vinte lojas pesquisadas.
Preços (R$) N
o
de lojas
50 2
51 5
52 6
53 6
54 1
Soma 20
Determinar a média, a variância, o desvio padrão e o coeficiente de variação dos preços.
Adicionando as colunas complementares, a tabela completa fica:
Preços (R$) N
o
de lojas xi.Fi (xi −X) (xi −X)2 (xi −X)2.Fi
50 2 100 -1,95 3,8025 7,605
51 5 255 -0,95 0,9025 4,5125
52 6 312 0,05 0,0025 0,015
53 6 318 1,05 1,1025 6,615
54 1 54 2,05 4,2025 4,2025
Σ 20 1039 22,95
A partir da última tabela, obtemos os valores desejados como segue:
x¯ =
n∑
i=1
xi.Fi
n
= 1039
20
= 51, 95(R$)
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 26
S2 =
n∑
i=1
(xi − X¯)2.Fi
n−1 =
22,95
19
= 1, 21(R$)2
S =
√
1, 21 = 1, 1(R$) e CV% = 1,1
51,95
.100 = 2, 12
A média, nesse caso, é uma ótima medida para representar os dados, pois existe uma
baixa variabilidade em torno desse valor.
Exemplo: Um comerciante atacadista vende determinado produto em sacas que de-
veriam conter 16,50 kg. A pesagem de 40 sacas revelou os resultados representado na tabela:
Classes de peso Fi
14,55 ` 15,05 1
15,05 ` 15,55 3
15,55 ` 16,05 8
16,05 ` 16,55 9
16,55 ` 17,05 10
17,05 ` 17,55 6
17,55 ` 18,05 3
Soma 40
Determinar a média, a variância, o desvio padrão e o coeficiente de variação dos pesos.
Segue a tabela com as colunas complementares:
Classe de peso Fi xi xiFi (xi −X)2 (xi −X)2.Fi
14,55 ` 15,05 1
15,05 ` 15,55 3
15,55 ` 16,05 8
16,05 ` 16,55 9
16,55 ` 17,05 10
17,05 ` 17,55 6
17,55 ` 18,05 3
Total 40
A partir da última tabela, obtemos os valores desejados como segue:
x¯ =
n∑
i=1
xi.Fi
n
=
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 27
S2 =
n∑
i=1
(xi − x¯)2.Fi
n−1 =
S = e CV% =
O coeficiente de variação mostra a baixa variabilidade dos dados em torno da média,
o que faz com que essa medida seja uma ótima medida para representar os dados.
1.7 Apresentação dos Dados
Após obtidos, os dados devem ser organizados em tabelas e/ou gráficos para que possam
ser interpretados.
1.8 Tabela
Tabela é um quadro que resume um conjunto de observações de uma população ou
amostra. Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis
podem assumir, para que se tenha uma visão global das alterações dessa(s) variável (is). Para
isso utiliza-se de tabelas ou de gráficos. Uma tabela compõem-se de
• Corpo: conjunto de linhas e colunas que contêm informações sobre a variável em estudo;
• Cabeçalho: parte superior da tabela que especifica o conteúdo das colunas;
• Coluna Indicadora: parte da tabela que especifica o conteúdo das linhas;
• Linhas: retas horizontais imaginárias que facilitam a leitura dos dados que se inscrevem
nos seus cruzamentos com as colunas;
• Casa ou Célula: espaço destinado a um só número;
• Título: conjunto de informações, as mais completas possíveis, respondendo as perguntas:
O quê? Quando? Onde? Localizado no topo da tabela.
Considera-se como elementos complementares da tabela a Fonte, as Notas, e as Chamadas,
colocadas,de preferência no seu rodapé.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 28
Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. .
1.8.1 Tabela Simples
Tabela simples representa os valores de uma única variável.
Tabela 1.3: Número de médicos na população, países selecionados, 1984
País Habitantes por Médico
Chile 1 230
Brasil 1 080
França 320
EUA 470
Argentina 370
Fonte: Arango 2009
1.8.2 Tabela de dupla entrada ou de contigência
Tabela de contingência é a representação, em uma única tabela, de valores de mais
de uma variável, isto é, a conjugação de duas tabelas. Em áreas de saúde, por exemplo,
podem utilizadas para cálculos de indicadores epidemiológicos (sensibilidade, especificidade,
prevalência, valor preditivo positivo, valor preditivo negativo, entre outros).
A ideia de análise bidimensional é bem intuitiva; pretendemos avaliar o grau de re-
lação (associação) entre variáveis e descrevê-lo a partir de resultados estatísticos. Quando
consideramos duas ou mais variáveis, podemos nos deparar com as seguintes situações: to-
das as variáveis são qualitativas; todas as variáveis são quantitativas; identificamos variáveis
qualitativas e quantitativas presentes no banco de dados.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 29
Tabela 1.4: Relação de desidrogenase láctica (DHL) com complicações em 201 adultos com
sarampo.
Nível de DHL (Ul/ml) Com complicações Sem complicações Total
Inferior 250 20 15 35
250 - 499 58 20 78
599 - 749 54 15 69
Mais de 750 17 2 19
Total 149 52 201
1.9 Gráficos
O gráfico estatístico nada mais é que outra forma de apresentação dos dados estatísticos,
com maior clareza que a tabela, muito embora as comparações numéricas proporcionadas pelas
tabelas sejam mais exatas. O objetivo do gráfico é o de produzir, no investigador ou no público
em geral, uma impressão rápida e viva do fenômeno em estudo, já que os gráficos tem um efeito
visual mais rápido à compreensão que as tabelas.
Meios de comunicação apresentam, diariamente, gráficos das mais variadas formas
para auxiliar na apresentação das informações. Graças à proliferação de recursos gráficos, cuja
construção tem sido cada vez mais simplificada em programas computacionais, existe hoje uma
infinidade de tipos de gráficos que podem ser utilizados.
Deve ser notado, entretanto, que a utilização de recursos visuais na criação de grá-
ficos deve ser feita cuidadosamente; um gráfico desproporcional em suas medidas pode dar
falsa impressão de desempenho e conduzir a conclusões equivocadas. Obviamente, questões de
manipulação incorreta da informação podem ocorrer em qualquer área e não cabe culpar a Esta-
tística. O uso e a divulgação ética e criteriosa de dados devem ser pré-requisitos indispensáveis
e inegociáveis.
Características
• Simplicidade
• Clareza
• Veracidade
1.9.1 Elementos e Normas
• Título: acima do gráfico, completo, claro e conciso;
• Fonte: abaixo do gráfico;
• Moldura: para dar efeito estético ao gráfico;
• Legenda: não deve prejudicar a leitura do gráfico.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 30
• Desenho: no desenho incluem-se apenas as coordenadas necessárias para guiar a leitura
do gráfico;
• Escala: a escala horizontal deve ser lida da esquerda para a direita e a vertical de baixo
para cima;
• Cor: o colorido não deve causar ilusões de ótica;
• Forma: a altura do gráfico deve ter, aproximadamente, 75% da largura, de modo que,
incluindo o título, legenda e o rodapé, a moldura do gráfico assuma mais ou menos, a
forma quadrada.
1.9.2 Principais tipos de Gráficos
Muitas vezes o uso indevido dos gráficos pode trazer um idéia falsa a respeito dos dados
que estão sendo analisados. Por isso é importante analisar qual o melhor tipo de gráfico a ser
empregado em cada estudo.
1.9.3 Gráficos em Colunas
Os gráficos em colunas tem por finalidade comparar grandezas, por meio de retângulos
de igual largura e alturas proporcionais às respectivas grandezas. Esse gráfico é preferível ao
gráfico em barras, que veremos mais a frente, se as legendas a se inscreverem sob os retângulos
forem breves.
Exemplo: Distribuição por Tipo Sanguíneo dos recém-nascidos do Hospital da Facul-
dade de Medicina de Itajubá, MG, 1996
Tabela 1.5: Distribuição por Tipo Sanguíneo, recém-nascidos, HE,1996
Tipo Sanguíneo Recém-nascidos Percentual
A 29 0,15
B 13 0,07
AB 3 0,02
O 51 0,27
Total 96 1
Fonte: Arango,H.G.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 31
Fonte: Arango, H.G.
1.9.4 Gráficos em Setores
É a representação gráfica dos dados estatísticos em um círculo por meio de setores.
As áreas são proporcionais aos valores dada série. Utilizado principalmente para verificação de
percentuais de cada valor dada série com o total.
Fonte: Arango, H.G.
1.9.5 Gráfico em Barras
Tem a mesma finalidade do gráfico em colunas e é preferível a esse, quando as legendas
a se inscreverem ao lado dos retângulos forem longas.
Exemplo: Relação entre o envenenamento humano em crianças e as causas mais
frequentes desse episódio.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 32
Tabela 1.6: Seis mais frequentes causas de intoxicação infantil (1 - 5 anos), Brasil, 1987-1991
Causas Percentual
Plantas 5,70%
Pesticidas domésticos 6,50%
Animais peçonhentos 8,50%
Produtos Químicos 11,30%
Produtos domésticos 12,40%
Outros 17,60%
Medicamentos 38,00%
Fonte: Arango,H.G.
Fonte: Arango, H.G.
1.9.6 Gráficos em Linhas ou Lineares
Esse tipo de gráfico é mais utilizado para representar grandezas, quando um dos fatores
for o tempo, quando analisamos uma variável ao longo do tempo.
Exemplo: Faturamento do Comércio Eletronico no Brasil nos Anos de 2002 até 2006.
Tabela 1.7: Faturamento do Comércio Eletrônico (em Bilhões de Reais)- Brasil 2002-2006)
ANO FATURAMENTO(bilhões R$)
2002 0,9
2003 1,2
2004 1,8
2005 2,5
2006 4,3
Fonte: Info ex(fev 2007).
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 33
1.9.7 Gráfico Comparativo
Exemplo: Comparativo entre a proporção de biópsias renais provenientes do Hospital
das Clínicas e entre outros hospitais, no estado de Minas Gerais, no período de 1980 a 1990.
Tabela 1.8: Proporção de biópsias renais provenientes do Hospital das Clínicas em relação a
outros hospitais, MG, 1980 a 1990.
Período
Procedência
Hospital das Clínicas Outros
80 48 52
81 54 100
82 55 90
83 94 98
84 46 92
85 92 195
86 55 203
87 100 250
88 110 248
89 103 305
90 110 360
Fonte: Arango,H.G.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 34
Fonte: Arango,H.G.
1.9.8 Cartograma
O cartograma é a representação sobre uma carta geográfica. Este gráfico é empregado
quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com áreas
geográficas ou políticas.
Fonte: MOPECE
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 35
1.10 Exercícios
1. Medições estabeleceram que uma pipeta calibrada para 10 ml contém na verdade 9,96;
9,98; 9,92; 9,98 e 9,96 ml. Calcule:
i) a média dessas medições;
ii) a variação das medidas;
iii) a moda e a mediana.
2. O exame final de uma disciplina do curso de Ciências Biológicas pesa quatro vezes mais
do que cada um dos três exames parciais. Qual desses dois alunos tem uma média mais
alta, o que tirou 72, 80 e 65 nos exames parciais e 82 no exame final ou o que tirou 81,
87 e 75 nos exames parciais e 78 no exame final?
3. Entre os formados de 2012 de uma certa universidade no Paraná, 382 formados em ciênciashumanas receberam ofertas de emprego com salários anuais médios de 24 373 reais, 450
formados em ciências sociais receberam ofertas de emprego com salários anuais médios
de 22 684 reais e 113 formados em ciência da computação receberam ofertas de emprego
com salários anuais médios de de 31 329 reais. Qual foi a média de salário anual oferecida
a esses 945 formados?
4. Os dados abaixo referem-se ao tempo (em segundos) para carga de um aplicativo, num
sistema compartilhado (20 observações).
10,1 7,3 8,5 5 4,2 3,1 2,2 9 9,4 6,1
3,3 10,7 1,5 8,2 10 4,7 3,5 6,5 8,9 6,1
Fonte: Dados fictícios
a) Construa uma tabela de frequência agrupando os dados em intervalos de classe de
amplitude 2 a partir de 1.
b) Construa o histograma.
c) Calcule o primeiro, segundo e o terceiro quartil e interprete-os.
d) Esboce o boxplot para esses dados.
5. Os dados a seguir referem-se aos rendimentos médios, em kg/ha, de 32 híbridos de milho
recomendados para a Região Oeste catarinense
Tabela 1.9: Rendimento médios, em kg/ha, de 32 híbridos de milho, Região Oeste, 1987/88.
3.973 4.550 4.770 4.980 5.117 5.403 6.166
4.500 4.680 4.778 4.993 5.166 5.513 6.388
4.550 4.685 4.849 5.056 5.172 5.823
4.552 4.760 4.960 5.063 5.202 5.889
4.614 4.769 4.975 5.110 5.230 6.047
Fonte: Andrade e Ogliari
a) Construa uma tabela de frequência agrupando os dados em intervalos de classe.
b) Construa o histograma.
c) Calcule o primeiro, segundo e o terceiro quartil e interprete-os.
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 36
6. Os dados a seguir são resultados de um experimento no qual um pesquisador está pro-
curando verificar se existe associação entre hábito de crescimento (3= indeterminado
trepadore 4=indeterminado prostrado) e porte (Tr= trepador, EB= ereto na base e Pr=
prostado) na cultura de feijão de vagem.
Tabela 1.10: Hábito de crescimento (H) e porte (P) para 50 materiais de feijão de vagem.
H P H P H P H P H P
4 Tr 4 Tr 4 Tr 4 Pr 4 Tr
4 EB 4 Tr 4 Tr 4 Tr 3 Pr
3 Pr 3 Pr 3 Tr 4 Pr 3 Pr
4 Tr 3 Pr 4 Tr 3 Pr 3 Pr
4 Tr 3 Pr 4 Tr 4 Tr 4 Tr
4 Tr 3 EB 4 Tr 3 Pr 4 Tr
3 Pr 4 EB 4 Tr 4 Pr 4 Tr
3 EB 4 EB 4 Tr 3 Pr 4 Tr
4 Tr 4 Tr 3 Pr 4 Tr 3 Pr
4 Tr 4 Tr 4 Tr 4 Tr 4 Tr
Fonte: Andrade e Ogliari
a) Construa uma tabela de frequência conjunta para as variáveis hábito de crescimento e
porte.
b) Faça um gráfico de coluna múltipla para a distribuição de frequência conjunta do item
�a�.
7. A tabela a seguir apresenta as frequências relativas de ocorrências de faixas de alturas
(em cm) para uma amostra de 500 crianças de 12 anos de idade.
Classe de alturas Frequência Relativa (%)
100 ` 110 10%
110 ` 120 20%
120 ` 130 25%
130 ` 140 35%
140 ` 150 10%
Total 100%
a) Calcule a variância e desvio-padrão para a tabela acima.
b) Calcule o coeficiente de variação para os dados. Em sua opinião, a média e o desvio-
padrão são boas medidas para descrever o conjunto de dados? Justifique.
c) Construa o gráfico adequado para essa tabela.
d) Calcule Q1,Q3, D8 e P12.
e) Esboce o boxplot para esses dados.
8. Um grupo de cem estudantes tem uma estatura média de 163,8 cm com um coeficiente
de variação de 3, 3%. Qual o desvio padrão desse grupo? R: 5,41
Bioestatística - Prof
a
. Alessandra C. Sibim
1. ESTATÍSTICA DESCRITIVA 37
9. Uma distribuição apresenta as seguintes estatísticas: s=1,5 com e C.V. = 2, 9%. Deter-
mine a média dessa distribuição. R: 51,724
10. Um grupo de 85 moças tem estatura média de 160,6 com com um desvio padrão de 5,97
cm. Outro grupo de 125 moças tem uma estatura média de 161,9 cm, sendo o desvio
padrão igual a 6,01 cm. Qual o coeficiente de variação de cada um dos grupos? Qual o
grupo mais homogêneo?
11. Medidas as estaturas de 1017 alunos do curso de Psicologia, obtivemos x¯ = 162, 2 cm e
s = 8, 01 cm. O peso médio desses mesmos indivíduos é 52 kg, com um desvio padrão de
2,3 kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso?
12. A seguir temos a distribuição de frequência dos pesos de uma amostra de 45 alunos:
Pesos(Kg) 40 ` 45 45 ` 50 50 ` 55 55 ` 60 60 ` 65 65 ` 70
Número de alunos 04 10 15 08 05 03
a) Determinar a média e a mediana.
R: 53,5
b) Determinar a variância, o desvio padrão e o coeficiente de variação. O que você pode
concluir? R: var= 45; d.p.= 6,708; C.V.=0,125
Bioestatística - Prof
a
. Alessandra C. Sibim
Capítulo 2
Probabilidade
Introdução
Os profissionais que trabalham com genética e ciências aplicadas estão, em geral, envol-
vidos tanto com a análise quanto com o planejamento de sistemas, nos quais as características
dos componentes do sistema são não determinísticas. Assim, a compreensão e a utilização da
probabilidade é essencial para a descrição, o planejamento e a análise de tais sistemas.
O estudo formal da teoria de probabilidade aparentemente se originou nos séculos XVII
e XVIII, na França, e foi motivado pelo estudo dos tradicionais jogos de azar. A verdadeira
teoria surgiu das correspondências entre Pascal e Fermat.
Laplace comentou as teorias de Pascal do seguinte modo: �A teoria das probabilidades
no fundo não é mais do que o bom senso traduzido em cálculo, permite calcular com exatidão
aquilo que as pessoas sentem por uma espécie de instinto. É notável que tal ciência, que
começou nos estudos sobre jogos de azar, tenha alcançado os mais altos níveis do conhecimento
humano�.
A teoria de probabilidade evolui de tal forma que no século XX possui uma axiomática
dentro da teoria matemática. Tal efeito deve-se sobretudo a Kolmogorov.
O cálculo das probabilidades está associado aos experimentos, os quais podem ser
classificados em dois tipos:
• Experimento determinístico: é aquele que repetido sob condições quase idênticas condu-
zem a um mesmo resultado.
• Experimento aleatório: é aquele que repetido sob condições quase idênticas produzem
resultados diferentes em geral.
Bioestatística - Prof
a
. Alessandra C. Sibim
2. PROBABILIDADE 39
2.1 Teoria de Conjuntos
Um conjunto que contém todos os resultados possíveis para um dado experimento é
chamado espaço amostral, geralmente representado por Ω. Por exemplo, conta-se o número
de veículos que passam por um posto de pedágio das 24 as 8 horas, assim Ω = N.
Se Ω for finito ou infinito enumerável então se diz espaço amostral discreto. Os sub-
conjuntos associados ao espaço amostral são denominados eventos, ou seja, A ⊂ Ω. A é um
evento, temos ainda que Ω é o evento certo e ∅ o evento impossível.
2.1.1 Partição do espaço amostral
Diremos que os eventos A1, A2, . . . , An formam uma partição de Ω, se são disjuntos
dois a dois e sua união é Ω, ou seja,
n⋃
i=1
Ai = Ω com Ai ∩ Aj = ∅, para todo i 6= j.
Figura 2.1: Partição do espaço amostral (K=6).
2.1.2 Operações com Eventos
Seja Ω um espaço amostral associado a um experimento. Sejam A e B dois eventos,
tais que A ∈ P(Ω) e B ∈ P(Ω), isto é, A ⊂ Ω e B ⊂ Ω. Definimos:
i) Ac = {ω ∈ Ω;ω 6∈ A}.
ii) A ∪B= {ω ∈ A ou ω ∈ B (ou ambos) }.
iii) A ∩B = {ω ∈ A e ω ∈ B}.
iv) (A ∪B)c = Ac ∩Bc e (A ∩B)c = Ac ∪Bc (Leis de De Morgan)
Bioestatística - Prof
a
. Alessandra C. Sibim
2. PROBABILIDADE 40
2.2 Definição clássica de probabilidade
A probabilidade de um evento é calculada como a razão existente entre o número de
eventos favoráveis a este particular evento e o número de eventos equiprováveis.
P (A) =
n
o
casos favoráveis a A
n
o
eventos possíveis
=
]A
]Ω
Exemplo: Lança-se um dado honesto, qual a probabilidade de ocorrer a face 3?
Sendo: A= ocorrer a face 3, então P (A) = 1
6
Axiomas: Seja E um experimento e Ω o espaço amostral associado ao mesmo. A cada
evento A desse espaço amostral associamos uma medida P (A), denominada probabilidade de
A,que satisfaça:
i) 0 ≤ P (A) ≤ 1;
ii) P (Ω) = 1;
iii) P (
n⋃
i=1
Ai) =
n∑
i=1
P (Ai) se forem disjuntos 2 a 2, ou seja (Ai ∩ Aj) = 0, para todo i 6= j.
Algumas propriedades
1) Se ∅ é o evento impossível, então P (∅) = 0;
2) Se A e B são dois eventos quaisquer então:
P (A ∪B) = P (A) + P (B)− P (A ∩B);
3) Se A ⊂ B, então P (A) ≤ P (B);
4) P (Ac) = 1− P (A).
Exercício: Prove as propriedades acima.
Bioestatística - Prof
a
. Alessandra C. Sibim
2. PROBABILIDADE 41
Exemplo: Considere um experimento e os eventos A e B associados, tais que
P (A) = 1
2
, P (B) = 1
3
e P (A ∩B) = 1
4
. Encontre:
a) P (Ac) e P (Bc);
b) P (A ∪B);
c) P (Ac ∩Bc);
d) P (Ac ∪Bc);
e) P (Ac ∩B).
2.3 Probabilidade Condicional
Se A e B são eventos de um espaço amostral Ω, então a probabilidade condicional do
evento A dado que ocorreu o evento B, é dado por
P (A|B) = P (A ∩B)
P (B)
, com P (B) > 0;
Também,
P (B|A) = P (A ∩B)
P (A)
, com P (A) > 0;
Então:
P (A ∩B) = P (A|B) · P (B) ou P (A ∩B) = P (B|A) · P (A)(Teorema do produto).
Exemplo: Numa população composta por 200 animais de duas raças X e Y , os ani-
mais podem ser fecundos e não fecundos. Vinte por cento doas animais da raça X são fecundos;
trinta por cento dos animais da raça Y são não fecundos e setenta e cinco por cento dos animais
são da raça X. Considere os eventos:
H={o animal é da raça X} M={o animal é da raça Y }
A= {o animal é fecundo} B={o animal não é fecundo}
Os dados podem ser representados como:
Raça Fecundidade Total
Não fecundo(B) Fecundo (A)
X(H)
Y(M)
Total 200
i) Sabendo que o animal é fecundo, qual a probabilidade de escolhermos um animal da
raça Y ?
ii) Sabendo que o animal é da raça Y , qual a probabilidade de escolhermos um animal não
Bioestatística - Prof
a
. Alessandra C. Sibim
2. PROBABILIDADE 42
fecundo?
Resolução:
Exemplo: Sendo P (A) = 1
3
; P (B) = 3
4
e P (A ∪B) = 11
12
calcular P(A|B).
Resolução:
Exemplo: Duas bolas são retiradas de uma urna (sem reposição) que contém 2 bolas
brancas, 3 pretas e 4 verdes. Qual a probabilidade de que ambas:
a) sejam verdes;
b) sejam da mesma cor.
Resolução:
Exercício: E se as retiradas forem feitas com reposição?
Generalização do teorema do produto:
P (
n⋂
i=1
Ai) = P (A1)P (A2|A1)P (A3|A2 ∩ A1) . . . P (An|A1 ∩ . . . ∩ An−1).
Exemplo: Uma urna contém 7 bolas brancas e 5 pretas. Retiramos três bolas da urna
sem reposição. Assumindo que cada bola da urna é igualmente provável de ser retirada, qual a
probabilidade de todas serem brancas?
Resolução:
Bioestatística - Prof
a
. Alessandra C. Sibim
2. PROBABILIDADE 43
2.4 Eventos Independentes
Dois eventos são independentes quando a realização de um dos eventos não afeta a
probabilidade de realização do outro e vice versa.
Definição: A e B são eventos independentes se, e somente se, P (A∩B) = P (A)·P (B).
Exemplo: Lançam-se três moedas. Verificar se são independentes os eventos:
A: saída de cara na primeira moeda.
B: Saída de coroa na segunda e cara na terceira moeda.
Resolução:
Exemplo: Em uma caixa temos 10 peças das quais 4 são defeituosas. São retiradas
duas peças, uma após a outra com reposição. Calcular a probabilidade de ambas serem boas.
Resolução:
2.5 Eventos mutuamente exclusivos
Dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a
realização do outro(s). Assim no lançamento de uma moeda, o evento �tirar cara� e o evento
�tirar coroa� são mutuamente exclusivos, já que ao se realizar um deles, o outro não se realiza.
Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é
igual à soma das probabilidades de que cada um deles se realize: P (A ∪B) = P (A) + P (B).
OBS: Se A e B são mutuamente exclusivos, então A e B são dependentes, pois se A ocorre B
não ocorre.
Exemplo 3: Sejam A e B eventos tais que P(A)=0,2; P(B)= q e P (A ∪ B) = 0, 6.
Calcular q considerando:
a) mutuamente exclusivos;
b) independentes.
Bioestatística - Prof
a
. Alessandra C. Sibim
2. PROBABILIDADE 44
Resolução:
Exercícios
1) A probabilidade de que um homem esteja vivo daqui a 30 anos é
2
5
; a de sua mulher é de
2
3
.
Determinar a probabilidade de que daqui 30 anos:
a) ambos estejam vivos; R:4/15
b) somente o homem esteja vivo; R:2/15
c) somente a mulher esteja viva; R:2/5
d) pelo menos um esteja vivo. R:4/5
2) Sejam A e B dois eventos em um espaço amostral, tais que P (A) = p , P (B) = 0, 2 e
P (A ∪B) = 0, 5 e P (A ∩B) = 0, 1. Determine o valor de p. R= 0,4
3) Se P (A ∪B) = 0, 8; P (A) = 0, 5 e P (B) = x, determine o valor de x no caso de:
a) A e B serem mutuamente exclusivos; R= 0,3
b) A e B serem independentes. R= 0,6
Bioestatística - Prof
a
. Alessandra C. Sibim
2. PROBABILIDADE 45
2.6 Probabilidade Total
Se C1, C2, . . . Ck representam uma partição de Ω e se A é um evento arbitrário em Ω,
então a probabilidade total de A é dada por
P (A) = P (C1)P (A|C1) + P (C2)P (A|C2) + . . . P (Ck)P (A|Ck)
=
k∑
i=1
P (Ci)P (A|Ci).
Exemplo: Suponha que um fabricante de sorvetes recebe 20% de todo o leite que
utiliza da uma fazenda F1, 30% de outra fazenda F2 e 50% de F3. Um órgão fiscalizador
inspecionou as fazendas e descobriu que 20% do leite produzido por F1 era adulterado por
adição de água, enquanto F2 e F3, essa proporção era de 5% e 2%, respectivamente. Na
indústria de sorvetes os galões de leite são armazenados em um refrigerador sem identificação
das fazendas. Para um galão escolhido ao acaso, vamos analisar o leite para decidir sobre sua
adulteração ou não.
Se denotarmos A o evento �adulteração de leite�, temos que P (A|F1) = 0, 2; P (A|F2) =
0, 05; P (A|F3) = 0, 02. Além disso, F1, F2 e F3 formam uma partição do espaço amostral pois
uma dada amostra de leite vem, necessariamente, de uma e apenas uma das três fazendas.
Desta forma, o evento A pode ser escrito em termos de interseções de A com os eventos F1, F2
e F3, então:
A = (A ∩ F1) ∪ (A ∩ F2) ∪ (A ∩ F3)
. em que os eventos (A ∩ Fi) (i = 1, 2, 3) são mutuamente exclusivos entre si. Logo:
P (A) = P (A ∩ F1) + (A ∩ F2) + (A ∩ F3)
= P (A|F1)P (F1) + (A|F2)P (F2) + (A|F3)P (F3)
Podemos, ainda, estar interessados em saber a probabilidade de que a amostra adul-
terada tenha sido obtida do leite fornecido pela fazenda F1, isto é, P (F1|A), o que implica em
inverter a probabilidade condicional conhecida P (A|F1) . Situações como essa são típicas para
uso do resultado apresentado a seguir.
2.7 Teorema de Bayes
Suponha que os eventos C1, C2, . . . Ck formem uma partição de Ω e que suas proba-
bilidades sejam conhecidas. Suponha, ainda, que para um evento A, se conheçam as probabili-
dades P (A|Ci) para todo i = 1, 2, . . . , k. Então para qualquer j,
P (A|Cj) = P (A|Cj)P (Cj)k∑
i=1
P (A|Ci)P (Ci)
, j = 1, 2, . . . , k.
Bioestatística - Prof
a
. Alessandra C. Sibim
2. PROBABILIDADE 46
Do exemplo anterior, podemos calcular a probabilidade desejada, isto é,
P (F1|A) = P (F1 ∩ A)
P (A)
=
P (A|F1)P (F1)
P (A|F1)P (F1) + P (A|F2)P (F2) + P (A|F3)P (F3) ,
e, então
P (F1|A) = 0, 2 · 0, 2
0, 2 · 0, 2 + 0, 3 · 0, 05 + 0, 5 · 0, 02 = 0, 615
Portanto, a probabilidade de que a amostra de leite em questão tenha sido produzida pela
fazenda F1 é de 0,615 em contraste com as probabilidades 0,231 e 0,154 para as fazendas F2 e
F3, respectivamente.
Exemplo: Uma companhia que produz rádio tem três linhas de montagem produzindo
15%, 35% e 50% respectivamente, de sua produção. Suponha que a probabilidade de um rádio
sair defeituoso por uma dessas linhas de montagem sejam 0,01; 0,05; e 0,02. Se um rádio
é escolhido aleatoriamente da produção da companhia, qual é a probabilidade queele seja
defeituoso?
Resolução:
Exemplo: Suponhamos a seguinte configuração:
• Urna 1: 3 bolas pretas, 1 branca e 5 vermelhas.
• Urna 2: 4 bolas pretas, 3 brancas e 2 vermelhas.
• Urna 3: 2 bolas pretas, 3 brancas e 3 vermelhas.
Escolhe-se uma urna ao acaso e dela extraiu-se uma bola ao acaso, verificando-se que a bola é
branca. Qual a probabilidade da bola ter vindo da urna 2? e da 3?
Resolução:
Exercício: A urna A contém 3 fichas vermelhas e 2 azuis, a urna B contém 2 ver-
melhas e 8 azuis. Joga-se uma moeda �honesta�. Se a moeda der cara, extrai-se uma ficha da
urna A; se der coroa, extrai-se uma ficha da urna B. Uma ficha vermelha é extraída. Qual a
probabilidade de ter saído cara no lançamento?
Bioestatística - Prof
a
. Alessandra C. Sibim
2. PROBABILIDADE 47
2.8 Exercícios
1. Considere o conjunto universo (espaço amostral) dos inteiros de 1 a 10 ou Ω = {1, 2, 3, 4, 5, 6, 7, 8,
9, 10}. Sejam A = {2, 3, 4}, B = {3, 4, 5} e C = {5, 6, 7}. Liste os elementos dos seguintes
conjuntos:
a) AC ∩B.
b) AC ∪B.
c) (AC ∩BC)C .
d) [A ∩ (B ∩ C)]C .
e) [A ∩ (B ∪ C)]C .
2. Defina um espaço amostral para cada um dos seguintes experimentos aleatórios.
a) Investigam-se famílias com quatro crianças, anotando-se a configuração segundo o sexo.
b) Lence um dado até que a face 5 apareça pela primeira vez.
c) De todos os alunos do curso de C. B., escolhe-se um ao acaso e anota-se a sua altura.
3. Considere uma urna contendo três bolas pretas e cinco bolas vermelhas. Retire duas
bolas, sem reposição. Calcule, considerando as probabilidades dos eventos:
a) Bola preta na primeira e segunda extrações;(R:
3
28
)
b) Bola preta na segunda extração;(R:
3
8
)
c) Bola vermelha na primeira extração.(R:
5
8
)
4. A probabilidade de que A resolva um problema é
2
3
e a probabilidade de que B resolva é
3
4
. Se ambos tentarem independentemente, qual a probabilidade do evento ser resolvido?
(R: 0, 92)
5. Num experimento com tomates em casa de vegetação, têm-se 26 vasos distribuídos se-
gundo o seguinte delineamento:
Variedade Adubos Total
1 2 3
1 3 4 2 9
2 1 3 3 7
3 5 2 3 10
Total 9 9 8 26
Sorteia-se um vaso ao acaso:
a) Qual a probabilidade de ser tratado com o adubo 1?
b) Qual a probabilidade de ser da variedade 3?
c) Sabendo que é tratado com o adubo 2, qual a probabilidade de ser da variedade 2?
6. Em uma população 90% das pessoas apresentam fator Rh+. Qual a probabilidade de que,
nessa população, casais apresentem:
a) Rh− e Rh−? (R: 0,01)
b) Rh+ e Rh+? (R: 0,81)
c) Marido Rh+ e Esposa Rh−? (R: 0,09)
d) Marido Rh− e Esposa Rh+? (R: 0,09)
e) Rh+ e Rh−? (R: 0,18)
Bioestatística - Prof
a
. Alessandra C. Sibim
2. PROBABILIDADE 48
7. Um time de futebol ganha com probabilidade 0, 7 se chove e com 0, 8 se não chove. Em
setembro, a probabilidade de chuva é de 0, 3. O time de futebol ganhou uma partida em
setembro, qual a probabilidade de ter chovido nesse dias? (R: 0, 27)
8. Em uma determinada Universidade, 20% dos homens e 1% das mulheres têm mais de 1,8m
de altura. Além disso, 40% dos estudantes são mulheres. Se um estudante é selecionado
aleatoriamente e se constata que tem mais de 1,8m de altura, qual é a probabilidade de
ser mulher? (R: 0, 0322)
9. Uma moeda é viciada de modo que a probabilidade de sair cara é 4 vezes maior a de sair
coroa. Para dois lançamentos independentes dessa moeda, determinar:
a) a probabilidade de sair somente cara.(R: 0,64)
b) a probabilidade de sair pelo menos uma cara.(R: 0,96)
c) a probabilidade de dois resultados iguais.(R: 0,68)
10. Peças produzidas por uma máquina são classificadas como defeituosas (D), recuperáveis
(R) e perfeitas (P) com probabilidades 0, 1, 0, 2 e 0, 7, respectivamente. De um grande
lote foram sorteadas duas peças com reposição. Calcule:
a)P(duas serem defeituosas).(R:0,01 )
b)P(pelo menos uma ser perfeita). (R: 0,91)
c)P(uma ser perfeita e uma recuperável).(R:0,28)
11. Uma turma de Ciências Biológicas teve a seguinte distribuição das notas finais na matéria
de Estatística: 4 pessoas do sexo masculino e 6 do sexo feminino foram reprovados; 8 do
sexo masculino e 14 do sexo feminino foram aprovados. Denote por M se o aluno for do
sexo masculino e A se ele for aprovado. Para um aluno sorteado ao acaso dessa classe,
calcule:
a)P(aprovado ou do sexo feminino).(R:0,87)
b)P(reprovado e do sexo feminino).(R:0,19)
12. Numa certa escola de primeiro grau, a probabilidade de um aluno selecionado aleatori-
amente provir de um lar com somente o pai ou a mãe presente é 0,36 e a probabilidade
de ele provir de um lar com somente o pai ou a mãe presente e ser um estudante fraco
(que geralmente é reprovado) é 0,27. Qual é a probabilidade de um aluno selecionado
aleatoriamente ser um estudante fraco, dado que ele provém de um lar com somente o pai
ou a mãe presente? (R:0,75)
13. A probabilidade de Henrique gostar de um filme que estreou nos cinemas é de 0,70 e a
probabilidade de Janaína, sua namorada, gostar do filme é de 0,60. Se a probabilidade
de Henrique gostar da estréia e de Janaína não gostar é de 0,28, qual é a probabilidade
de que Henrique goste da estréia, dado que Janaína não irá gostar? (R:0,70)
14. Um júri consiste em 15 pessoas que somente completaram o Ensino Médio e em 9 pessoas
que tiveram alguma educação superior. Se um advogado seleciona ao acaso dois membros
do júri para uma arguição, qual é a probabilidade de nenhum dos dois ter tido alguma
educação superior? (R:0,38)
15. Num certo estado onde os automóveis devem ser testados quanto à emissão de gases
poluentes, 25% de todos os automóveis emitem quantidades excessivas de gases poluentes.
Bioestatística - Prof
a
. Alessandra C. Sibim
2. PROBABILIDADE 49
Ao serem testados, 99% de todos os automóveis que emitem quantidades excessivas de
gases pouluentes são reprovados, mas 17% dos que não emitem quantidades excessivas de
gases poluentes também são reprovados. Qual é a probabilidade de um automóvel que
é reprovado no teste efetivamente emitir uma quantidade excessiva de gases poluentes?
(R:0,66)
16. Um aluno responde a um teste de múltipla escolha com 4 alternativas com uma só correta.
A probabilidade de que ele saiba a resposta certa de uma questão é de 30%. Se ele não sabe
a resposta certa existe a possibilidade de acertar no �chute�. Não existe a possibilidade
de ele obter a resposta certa por �cola�. Se ele acertou a questão, qual a probabilidade de
ele realmente saber a resposta? (R:0,63)
Bioestatística - Prof
a
. Alessandra C. Sibim
Capítulo 3
Noções de Amostragem
A amostragem é naturalmente usada em nossa vida diária. Por exemplo para verificar
o tempero de um alimento em preparação podemos provar (observar) uma pequena porção
deste alimento. Estamos fazendo uma amostragem, ou seja, extraindo do todo (população)
uma parte (amostra), com o propósito de avaliarmos(inferirmos) sobre a qualidade de tempero
de todo o alimento.
Nas pesquisas científicas, em que se quer conhecer algumas características de uma
população, também é muito comum se observar apenas uma amostra de seus elementos e a partir
dos resultados dessa amostra, obter valores aproximados, ou estimativas, para as características
populacionais de interesse. Este tipo de pesquisa é usualmente chamado levantamento por
amostragem.
Num levantamento por amostragem, a seleção dos elementos que serão efetivamente
observados, deve ser feita sob uma metodologia adequada, de tal forma que os resultados da
amostra sejam informativos para avaliar características de toda a população.
3.1 Principais planos de amostragem
Para fazermos um plano de amostragem devemos ter bem definidos os objetivos da
pesquisa, a população a ser amostrada, bem como os parâmetros que precisamos estimarpara
atingir aos objetivos da pesquisa. Para efetuar a seleção dos elementos que farão parte da
amostra precisamos estabelecer a unidade de amostragem, ou seja, a unidade a ser selecionada
para chegar aos elementos da população. A seleção dos elementos que farão parte da amostra
pode ser feita sob alguma forma de sorteio. São as chamadas amostragens aleatórias.
3.1.1 Amostragem aleatória simples
Para a seleção de uma amostra aleatória simples precisamos ter uma lista completa dos
elementos da população. Este tipo de amostragem consiste em selecionar a amostra por meio
de um sorteio, sem restrição.
Bioestatística - Prof
a
. Alessandra C. Sibim
3. NOÇÕES DE AMOSTRAGEM 51
A amostra aleatória simples tem a seguinte propriedade qualquer subconjunto da popu-
lação com mesmo número de elementos, tem a mesma probabilidade de fazer parte da amostra.
3.1.2 Amostragem Sistemática
Muitas vezes é possível obter uma amostra de características parecidas com a amostra
aleatória simples, por um processo bem mais rápido que o anterior. Por exemplo se queremos
tirar uma amostra de 100 placas, dentre 500 placas, podemos tirar, sistematicamente, uma
placa a cada cinco (5000/1000) = 5. Para garantir que cada placa da população tem a mesma
probabilidade de pertencer à amostra, devemos sortear a primeira placa dentre as 5 primeiras.
Numa amostragem sistemática, a relação N/n é chamada de intervalo de seleção.
3.1.3 Amostragem Estratificada
Consiste em dividir a população em subgrupos que denominaremos estratos. Os quais
devem ser internamente mais homogêneos do que a população toda com respeito as variáveis
em estudo.
Sobre os diversos estratos da população, são realizadas seleções aleatórias de forma
independente.
Estrato 1
//
subgrupo 1 da amostra
''
Estrato 2
//
subgrupo 2 da amostra
//
Amostra estratificada
Estrato k
//
subgrupo k da amostra
77
Devemos escolher um critério de estratificação que forneça estratos bem homogêneos,
com respeito ao que se está estudando.
Amostragem Estratificada Proporcional
A proporcionalidade do tamanho de cada estrato da população é mantida na amostra.
Por exemplo, se um estrato corresponde a 20% do tamanho da população, ele também deve
corresponder a 20% da amostra.
A amostragem estratificada proporcional garante que cada elemento da população tem
a mesma probabilidade de pertencer a amostra.
Exemplo: Com o objetivo de levantar o estilo de liderança preferido pela comunidade
de uma escola, vamos realizar um levantamento por amostragem. A população é composta por
10 professores, 10 servidores administrativos e 30 alunos. Supondo que a preferência quanto ao
estilo de liderança possa ser relativamente homogêneo dentro de cada categoria, vamos realizar
uma amostragem estratificada proporcional por categoria, para obter uma amostra global de
tamanho n=10.
Bioestatística - Prof
a
. Alessandra C. Sibim
3. NOÇÕES DE AMOSTRAGEM 52
Tabela 3.1: Cálculo do tamanho da amostra em cada estrato.
Estrato Proporção na população Tamanho do subgrupo da amostra
Professor 10/50=0,2 0,2.10=2
Servidores 10/50=0,2 0,2.10=2
Alunos 30/50=0,6 0,6.10=6
Para selecionar aleatoriamente cada elemento da amostra, podemos por exemplo usar
a tabela de números aleatórios.
3.1.4 Amostragem de Conglomerados
Chamamos conglomerados a um agrupamento de elementos da população. Por exem-
plo, numa população de domicílios de uma cidade, os quarteirões formam conglomerados de
domicílios.
Este tipo de amostragem consiste num primeiro estágio, em selecionar conglomerados
de elementos e num segundo estágio, faz-se nova seleção, tomando amostras de elementos dos
conglomerados extraídos no primeiro estágio. Todas as seleções devem ser aleatórias. Em
algumas pesquisas em grande escala, a amostragem pode ser feita em mais estágios.
Observações:
• a amostragem de conglomerados tende a produzir uma amostra que gera resultados me-
nos precisos quando comprada com uma amostra aleatória simples de mesmo tamanho.
Contudo, seu custo financeiro tende a ser bem menor.
• por não exigir uma lista de todos os elementos da população, pesquisas onde os elementos
da população estão dispostos sobre grandes áreas territoriais, a amostragem de conglo-
merados torna-se muito mais econômica que a aleatória simples.
Exemplo: Considere o problema de selecionar uma amostra de domicílios de uma
cidade. Podemos tomar as ruas como conglomerados, como indicado no quadro abaixo, em que
A1 representa o 1
o
domicílio da Rua A, A2 o segundo e assim por diante.
Ruas Domicílios
A A1, A2, A3, A4, A5, A6
B B1, B2, B3, B4, B5, B6, B7, B8, B9, B10
C C1, C2, C3, C4, C5, C6, C7, C8, C9, C10
D D1, D2, D3, D4
E E1, E2, E3, E4, E5, E6, E7, E8
Vamos selecionar uma amostragem de conglomerados, selecionando 3 ruas e, nas ruas
selecionadas, uma fração de amostragem de 50% de domicílios.
Em um primeiro estágio vamos selecionar as ruas. Em seguida, num segundo estágio,
em cada rua selecionada sortearemos 50% dos domicílios.
Bioestatística - Prof
a
. Alessandra C. Sibim
Capítulo 4
Variável Aleatória
Emmuitas situações o nosso interesse está mais relacionado com quantidades associadas
aos possíveis resultados do que neles individualmente. Por exemplo, em um experimento de
germinação de sementes, o interesse não está relacionado simplesmente com a germinação de
cada semente mas, no número total de sementes que germinaram. Outros exemplos seriam:
rendimento de grãos de milho (em kg/ha), número de dias da emergência à floração (ciclo da
cultura), altura de plantas (em cm), número de plantas sadias colhidas na área útil de uma
parcela, número de insetos capturados numa armadilha. Essas quantidades associadas aos
possíveis resultados de um experimento aleatório são denominadas variáveis aleatórias.
Variável aleatória (v.a.) é a função que associa a todo evento pertencente a uma
partição do espaço amostral um único número real. É classificada como discreta ou contínua.
A variável aleatória é discreta se assume valores num conjunto enumerável com certa proba-
bilidade, por exemplo número de filhos em uma família. Por outro lado será contínua se
seu conjunto de valores é qualquer intervalo dos números reais, o que seria um conjunto não
enumerável, por exemplo tempo de reação a certo medicamento.
4.1 Variáveis Aleatórias Discretas
Exemplo: Lançam-se três moedas. Seja X: número de ocorrências da face cara. De-
terminar a distribuição de probabilidade de X. O espaço amostral do experimento é: Ω =
{(c, c, c), (c, c, k), (c, k, c), (k, c, c), (c, k, k), (k, c, k), (k, k, c), (k, k, k)}.
Se X é o número de caras, X assume os valores 0, 1, 2 e 3. Podemos associar a es-
ses números eventos que correspondam à ocorrência de nenhuma, uma, duas ou três caras
respectivamentes.
Podemos também associar às probabilidades de X assumir um dos valores, as proba-
Bioestatística - Prof
a
. Alessandra C. Sibim
4. VARIÁVEL ALEATÓRIA 54
bilidades dos eventos correspondentes:
P (X = 0) =
1
8
P (X = 1) =
3
8
P (X = 2) =
3
8
P (X = 3) =
1
8
4.1.1 Função Discreta de Probabilidade ou Distribuição de Probabi-
lidade
É a função que associa a cada valor assumido pela variável aleatória a probabilidade
do evento correspondente, isto é
P (X = xi) = P (xi) = Pi, i = 1, 2, . . . (4.1)
ou ainda,
X x1 x2 x3 . . .
Pi p1 p2 p3 . . .
Uma função de probabilidade satisfaz: 0 ≤ pi ≤ 1 e
∑
i pi = 1.
No exemplo anterior temos que
f(x) = P (X = x) =

1/8, se x = 0
3/8, se x = 1
3/8, se x = 2
1/8, se x = 3
4.1.2 Função de distribuição de probabilidade
A função de distribuição ou função acumulada de probabilidade de uma variável alea-
tória discreta X é definida, para qualquer número real x,pela seguinte expressão:
F (x) = P (X ≤ x)
No caso do lançamento da moeda, a variável aleatória X assumia quatro valores, 0, 1, 2, 3 com
probabilidades 1/8, 3/8, 3/8 e 1/8 respectivamente. Podemos estabelecer F (x) como segue
F (x) =

0, se x < 0
1/8 se 0 ≤ x < 1
4/8 se 1 ≤ x < 2
7/8 se 2 ≤ x < 3
1 se x ≥ 3
Bioestatística - Prof
a
. Alessandra C. Sibim
4. VARIÁVEL ALEATÓRIA 55
Propriedades da função distribuição:
1. Para todo x ∈ R, 0 ≤ F (x) ≤ 1 ;
2. F (x) é uma função monótona não decrescente. Isto é, se x1 ≤ x2, então F (x1) ≤ F (x2)
3. lim
x→−∞
F (x) = 0 e lim
x→+∞
F (x) = 1;
4.2 Média de uma v.a.
Existem características numéricas que são muito importantes em uma distribuição de
probabilidade de uma variável aleatória, discreta ou contínua. As duas características numéri-
cas são a média e a variância.
A média é também chamada de valor esperado, de esperança matemática ou de média popula-
cional de uma v.a., e sua representação é E(X) ou µx.
Exemplo: Um agricultor produz pepinos para conserva. Sabe-se que a probabilidade
de ele produzir pepinos de primeira classe (entre 6 e 9 cm) é 60%, de segunda classe (entre 9
e 12 cm) é 20%, de terceira classe ( maiores que 12 cm) é 10% e afilados é 10%. Qual o lucro
médio esperado pelo agricultor por caixa de pepino, se ele obtém um lucro de 600 u.m. por
caixa de pepino de primeira classe, um lucro de 500 u.m. por caixa de pepinos de segunda
classe, um lucro de 390 u.m. por caixa de pepinos de terceira classe e uma perda de 50 u.m.
por caixa de pepinos afilados?
Resolução:
Definição: A esperança de uma v.a. discreta X é a soma de todos os produtos possíveis
da v.a. pela respectiva probabilidade.
E(X) = µ =
n∑
i=1
xi · P (xi) (4.2)
Exercício: Em famílias com quatro crianças, vamos admitir, para simplificar, que a
relação de proporções de crianças que nascem do sexo masculino e feminino seja 1:1. Seja
X a v.a. �números de meninos em famílias com quatro crianças�. Qual a média esperada de
meninos, se observarmos uma quantidade bastante grande de casais com quatro filhos?
Bioestatística - Prof
a
. Alessandra C. Sibim
4. VARIÁVEL ALEATÓRIA 56
4.2.1 Propriedades da Esperança
Seja X e Y variáveis aleatórias e c uma constante:
1. E(c) = c;
2. E(c.X) = cE(X)
3. E(X ± Y ) = E(X)± E(Y )
4. E(
∑
Xi) =
∑
E(Xi)
5. E(aX ± b) = aE(X)± b
6. E(X − µx) = 0
4.3 Variância
O fato de conhecermos a média de uma distribuição de probabilidade já nos ajuda
bastante, porém não temos uma medida que nos dê o grau de dispersão de probabilidade em
torno dessa média. A medida que dá o grau de dispersão de probabilidade em torno da média
é a variância.
V ar(X) = σ2 = E(X2)− (E(X))2 (4.3)
em que,
E(X2) =
n∑
i=1
x2iP (xi)
Alternativamente a variância pode ser calcula por
V ar(X) = σ2 =
n∑
i=1
(xi − µ)2 · P (xi)
4.3.1 Propriedades da Variância
1. V ar(c) = 0;
2. V ar(c · x) = c2V ar(X);
3. V ar(aX ± b) = a2V ar(X); a,b constantes;
Exemplo: Para o exemplo do lucro por caixa de pepinos em conserva, temos a seguinte
variação:
Bioestatística - Prof
a
. Alessandra C. Sibim
4. VARIÁVEL ALEATÓRIA 57
xi (lucro) Prob(xi) xi
2 xi.Prob(xi) xi
2
.Prob(xi)
-50 0,10 2.500 -5 250
390 0,10 152.100 39 15.210
500 0,20 250.000 100 50.000
600 0,60 360.000 360 216.000
Total 494 281.460
E(X2)= 281.460 e E(X)= 494
Logo, σ2 = 281.460− (494)2= 37.424 u.m.2/caixa.
O valor encontrado é expresso em u.m.
2
e não, na unidade original u.m.. Uma medida
expressa na unidade original, obtida a partir da variância, é o desvio padrão que é dado por:
D.P.(X) = σX =
√
σ2X
No nosso exemplo o desvio padrão é, σX =
√
37.424 = 194, 45 u.m./caixa.
Esse valor procura representar, o quanto, em média, cada valor da variável se desvia
da média, para mais ou para menos.
Exercício: Seja
F (x) =

0, se x < 0
0, 1 se 0 ≤ x < 1
0, 3 se 1 ≤ x < 2
0, 5 se 2 ≤ x < 3
0, 8 se 3 ≤ x < 4
0, 9 se 4 ≤ x < 5
1 se x ≥ 5
a) Construir gráfico de F(x).
b) Determinar a função de probabilidade de X, E(X) e Var(X).
c) Sendo Y = 3X − 2, calcule E(Y) e Var(Y).
4.4 Principais distribuições discretas de probabilidade
Nesta seção estudaremos alguns modelos probabilísticos padrões que podem ser usados
em diversas situações práticas. O problema passa a ser, então, determinar qual modelo é o
mais apropriado para a situação em estudo e como aplicá-lo adequadamente.
Lembrando que para identificarmos uma v.a. discreta, temos que conhecer quais re-
sultados podem ocorrer e quais são as probabilidades associadas aos resultados. A seguir, são
apresentadas as principais distribuições de probabilidade ou modelos de probabilidade.
Bioestatística - Prof
a
. Alessandra C. Sibim
4. VARIÁVEL ALEATÓRIA 58
4.4.1 Distribuição de Bernoulli
Provavelmente os experimentos mais simples são aqueles em que observamos a pre-
sença ou não de alguma característica, que são conhecidos como ensaios de Bernoulli. Alguns
exemplos:
a) lançar uma moeda e observar se ocorre cara ou não;
b) numa linha de produção, observar se um item, tomado ao acaso, é ou não defeituoso;
c) verificar se um servidor de uma intranet está ou não ativo.
Denominamos sucesso e fracasso os dois eventos possíveis em cada caso. O ensaio de Bernoulli é
caracterizado por uma variável aleatória X, definida por X = 1, se sucesso; X = 0, se fracasso.
A função de probabilidade de X é dada por
x P (x)
0 q
1 p
Total 1
em que, p = P (sucesso) e q = 1−p. A distribuição fica completamente especificada ao atribuir-
mos um valor para p. No exemplo (a), se o lançamento for imparcial e a moeda perfeitamente
equilibrada, p = 1/2.
De maneira geral,
P (X = x) = px(1− p)1−x (4.4)
com X = 0, 1.
Outras características da distribuição de Bernoulli:
E(X) = p (4.5)
V ar(X) = p · (1− p) (4.6)
Notação: X ∼ B(p).
4.4.2 Distribuição Binomial
Considere a repetição de n ensaios de Bernoulli independentes e todos com a mesma
probabilidade de sucesso p. A variável aleatória X que conta o número total de sucessos é
denominada Binomial com parâmetros n e p e sua função de probabilidade é dada por
P (X = k) =
(
n
k
)
· pk · qn−k (4.7)
Bioestatística - Prof
a
. Alessandra C. Sibim
4. VARIÁVEL ALEATÓRIA 59
E(X) = n · p (4.8)
V ar(X) = n · p · q (4.9)
Notação: X ∼ Bin(n, p)
Exemplo: Numa criação de coelhos, a taxa de nascimento de machos é de 40%. Qual
a probabilidade de que nasçam pelo menos dois coelhos machos, num dia em que nasceram 19
coelhos?
Resolução:
Exemplo: Encontre a média e a variância da variável aleatória Y = 3X + 2, sendo
que X ∼ Bin(20, 0, 3).
Resolução:
4.4.3 Distribuição de Poisson
Esta distribuição é largamente utilizada para contagens de indivíduos, plantas, colônias
de bactérias, ítens ou objetos por intervalo de tempo, comprimento, área ou volume. A unidade
de medida deve ser definida de tal modo que o valor esperado das contagens seja baixo (menor
que 10).
Uma aplicação importante da ditribuição de Poisson na área biológica, diz respeito
ao estudo do padrão de dispersão de uma certa espécie vegetal ou aninal numa determinada
área. Portanto, esta distribuição é muito utilizada em estudos de dinâmica de populações e de
entomologia.
Consideremos a seguinte situação em uma central telefônica: o número de chamadas
que chegam a um telefone durante uma hora. X= 0,1,2, . . . Qual a distribuição probabilidade
de X?
Suposições:
1) Os números de chamadas que ocorrem em intervalos de tempos disjuntos são independentes.
2) O número de chamadas que chegam durante um intervalo pequeno de tempo é muito pequeno
(zero) ou é um (1).
3) O número de chamadas que ocorrem durante um intervalo de temposó depende da central
e da duração do intervalo.
Bioestatística - Prof
a
. Alessandra C. Sibim
4. VARIÁVEL ALEATÓRIA 60
Então temos n ensaios de Bernoulli. X: Número de sucessos em n ensaios de Bernoulli.
Portanto X ∼ Bin(n, p). Mas quando n → ∞ e p → 0, o valor esperado E(X) = n · p → λ,
sendo λ > 0, é possível mostrar que(
n
k
)
· pk · qn−k np→λ−→ e
−λλk
k!
Então, sendo λ a taxa de ligações por unidade de tempo, as probabilidades de X podem ser
calculadas pela distribuição de Poisson com parâmetro λ > 0, e sua função de probabilidade é
dada por
P (X = k) =
e−λ · λk
k!
(4.10)
com k = 0, 1, 2, . . ., e λ sendo usualmente referido como a taxa de ocorrência .
E(X) = V ar(X) = λ (4.11)
Notação: X ∼ Po(λ)
Exemplo: Numa área dividida em quadrantes de 0,50 m
2
, foram encontrados em mé-
dia 2,5 espécimes. Considerando que o modelo de Poisson com média igual a 2,5 seja adequado
para representar a variável X, o número de espécimes por 0,50 m2. Pergunta-se:
a) Qual a probabilidade de se encontrarem num quadrante exatamente quatro espécimes?
b) Qual a probabilidade de se encontrar no máximo um espécime num quadrante?
Resolução:
Exemplo: Em uma central telefônica chegam 300 telefonemas por hora. Qual a
probabilidade de que:
i) Num minuto não haja nenhum chamado?
ii) Em 2 minutos haja 2 chamadas?
iii)Em t minutos não haja chamadas?
Resolução:
Exercício: Um telefone recebe, em média, cinco chamadas por minuto. Supondo que
a distribuição de Poisson seja adequada nessa situação:
a) obter a probabilidade de que o telefone não receba chamadas durante um intervalo de um
minuto?
b) obter a probabilidade de no máximo 2 chamadas em quatro minutos.
Bioestatística - Prof
a
. Alessandra C. Sibim
4. VARIÁVEL ALEATÓRIA 61
4.5 Principais distribuições contínuas de probabilidade
Apresentamos agora, dois modelos teóricos para variáveis aleatórias contínuas.
4.5.1 Distribuição Exponencial
A distribuição exponencial tem forte ligação com a distribuição discreta de Poisson.
Enquanto esta pode ser usada para modelar o número de ocorrências em um período (de tempo
ou comprimento), a distribuição exponencial pode modelar a variável aleatória contínua que
representa o intervalo (de tempo ou comprimento) entre as ocorrências. Exemplos:
a) tempo (em minutos) até a próxima inspeção a uma obra;
b) tempo (em segundos) entre pedidos a um servidor;
c) distância (em metros) entre defeitos de uma fita.
A distribuição exponencial pode ser usada quando as suposições de Poisson (independência
entre as ocorrências e taxa média de ocorrência constante no intervalo considerado) estiverem
satisfeitas.
A f.d.p. de uma variável aleatória X com distribuição exponencial é dada por:
f(x) =
{
λe−λx, se x ≥ 0
0, se x < 0
(4.12)
A esperança e a variância da distribuição de X são dadas respectivamentes por:
E(X) =
1
λ
(4.13)
V ar(x) =
1
λ2
. (4.14)
Notação: X ∼ Exp(λ).
Para calcular probabilidades com a exponencial, precisamos resolver a integral corres-
pondente.
P (a < X < b) =
∫ b
a
λe−λxdx = e−λa − e−λb. (4.15)
Note que a inclusão ou não dos extremos a e b não altera o cálculo efetuado.
Propriedade (Falta de memória da exponencial): Seja X ∼ Exp(λ), s e t > 0, então
temos que
P (X ≥ t+ s|X ≥ s) = P (X ≥ t) (4.16)
Supondo que X representa o tempo de vida de um equipamento, podemos fazer a seguinte
interpretação para a propriedade da falta de memória: a probabilidade do equipamento durar
Bioestatística - Prof
a
. Alessandra C. Sibim
4. VARIÁVEL ALEATÓRIA 62
pelo menos t+ s anos, sabendo-se já durou s, é igual à probabilidade de um equipamento novo
durar pelo menos t anos. Em outras palavras, a informação da �idade� do equipamento pode
ser esquecida e o que importa, para o cálculo da probabilidade, é quantos anos a mais queremos
que dure.
Exemplo: O intervalo de tempo, em minutos, entre emissões consecutivas de uma
fonte radioativa é uma variável aleatória com distribuição exponencial com média de 5 minutos.
Calcule a probabilidade:
a) de haver uma emissão em um intervalo inferior a 2 minutos.
b) do intervalo ser superior ou igual a 7 minutos, sabendo-se que ele é superior a 5 minutos.
Resolução:
4.5.2 Distribuição Normal
A normal é considerada a distribuição de probabilidades mais importante, pois permite
modelar uma infinidade de fenômenos naturais e, além disso, possibilita realizar aproximações
para calcular probabilidades de muitas variáveis aleatórias que têm outras distribuições. É
muito importante também na inferência estatística.
Uma v.a. contínuaX tem distribuição normal com parâmetros µ e σ2, (−∞ < µ < +∞)
e σ > 0, se a sua função de probabilidade é dada por:
f(x) =
1√
2piσ2
exp
{
−(x− µ)
2
2σ2
}
.
com (−∞ < x < +∞)
Notação: X ∼ N(µ, σ2), em que µ representa a média e σ2 a variância de X. σ = √σ2
é o desvio padrão.
A função de distribuição da normal não tem forma fechada e, de fato, o cálculo de
probabilidades com essa densidade não podem ser feitos por integração, pois esta não possui
primitiva. Assim, valores de probabilidades acumuladas são obtidos por integração numérica
e apresentadas em tabelas. Não é necessário fazer uma tabela para cada par de valores dos
parâmetros que se tem interesse.
4.5.3 Normal Padrão
A distribuição normal possui uma importante propriedade que permite que qualquer
variável aleatória com esta distribuição possa ser transformada em outra variável com distri-
buição normal com parâmetros µ = 0 e σ2 = 1.
Bioestatística - Prof
a
. Alessandra C. Sibim
4. VARIÁVEL ALEATÓRIA 63
Teorema: Se X ∼ N(µ, σ2), então a variável Z é da forma:
Z =
X − µ
σ
téra distribuição N(0, 1)
O gráfico da densidade Normal Padrão é apresentado na Figura 4.1.
−4 −2 0 2 4
0.
0
0.
1
0.
2
0.
3
0.
4
x
f(x
)
Figura 4.1: Densidade da Normal Padrão.
Verificaremos agora a correspondência entre X e Z, por meio do exemplo:
Seja X ∼ N(20; 4). Encontrar os valores reduzidos correspondentes a:
i) X= 16 ii) X= 18
iii) X= 20 iv) X= 22 v) X=24
Exemplo: Seja X ∼ N(100; 25). Calcular:
a)P (100 ≤ X ≤ 106)
b) P (89 ≤ X ≤ 107)
c) P (112 ≤ X ≤ 116)
Bioestatística - Prof
a
. Alessandra C. Sibim
4. VARIÁVEL ALEATÓRIA 64
d) P (X ≤ 108)
Resolução:
Exemplo: A distribuição de altura de 500 estudantes do sexo masculino de uma
universidade é aproximadamente normal, com média 1,70 m e desvio padrão de 2,5 cm.
a) Quantos estudantes tem altura inferior a 1,75 m?
b) Quantos estudantes tem altura entre 1,72 e 1,80 m?
Resolução:
Exercício: A distribuição da altura de plantas de Amaranthus hybridus, pode ser
aproximada por uma distribuição normal de média 29,7 cm e desvio padrão de 2,7 cm. Qual a
probabilidade de uma planta apresentar altura:
a) entre 29,7 e 32 cm?
b) acima de 32 cm?
c) entre 27 e 32 cm?
d) entre 25 e 27 cm?
Bioestatística - Prof
a
. Alessandra C. Sibim
4. VARIÁVEL ALEATÓRIA 65
4.6 Exercícios
1. Num jogo de dados, Ana paga R$ 20,00 a José e lança 3 dados. Se sair face 1 com um
dos dados apenas, Ana ganha R$ 20,00. Se sair face 1 em dois dados apenas, Ana ganha
R$ 50,00 e se sair 1 nos três dados, Ana ganha R$ 80,00. Calcular o lucro líquido médio
de Ana em uma jogada.
2. Uma urna tem 20 bolas pretas e 30 brancas. Retiram-se 25 bolas com reposição. Qual a
probabilidade de que:
a) Duas sejam pretas? (R: 0,00038)
b) Pelo menos três sejam pretas? (R: 0,99957)
3. Numa estrada há 2 acidentes para cada 100 km. Qual a probabilidade de que em:
a) 250 Km ocorram pelo menos 3 acidentes? (R: 0,875348)
b) 300 Km ocorram 5 acidentes? (R: 0,160623)
4. A probabilidade de um arqueiro acertar o alvo com uma única flecha é de 0,20. Lançam-se
30 flechasno alvo. Qual a probabilidade de que:
a) Exatamente 4 acertem o alvo? (R: 0,1325)
b) Pelo menos 3 acertem o alvo? (R: 0,95581)
5. Num rebanho bovino 30% dos animais estão atacados de febre aftosa. Retira-se, ao acaso,
uma amostra de 10 animais. a) Verifique se a variável �número de animais doentes� pode
ser estudada pelo modelo binomial. Justifique.
b) Qual a probabilidade de se encontrarem 6 animais doentes? (R: 0,037)
c) Qual a probabilidade de se encontrarem no máximo 2 animais doentes?
d) Qual a média e a variância de animais doentes?
e) Qual a probabilidade de se encontrarem 3 animais sadios?
6. Determine o número esperado de de meninos em uma família com oito crianças, supondo
ser a distribuição do sexo igualmente provável. Qual a probabilidade de ocorrer o número
esperado de meninos? Interprete esta probabilidade. (R: 4, Prob(X=4)= 0,27)
7. Um lote de aparelhos de TV é recebido por uma firma. 20 aparelhos são inspecionados.
O lote é rejeitado se pelo menos 4 forem defeituosos. Sabendo-se que 1% dos aparelhos é
defeituoso, determinar a probabilidade de que a firma rejeite todo o lote.(R: 0,00004)
8. Sabe-se que 20% dos animais submetidos a um certo tratamento não sobrevivem. Se esse
tratamento foi aplicado em 20 animais e se X é o número de não sobreviventes:
a) Qual a distribuição de X?
b) Calcular E(X) e V AR(X).
c) Calcular P (2 < X ≤ 4). (R:0,42356)
d) Calcular P (X ≥ 2). (R:0,93082)
9. Seja X ∼ N(4, 1) . Determine:
(a) P (X ≤ 4); (R:0,5)
(b) P (4 < X < 5); (R:0,34134)
(c) P (2 ≤ X < 5); (R:0,81859)
(d) P (5 ≤ X ≤ 7);(R:0,15731)
Bioestatística - Prof
a
. Alessandra C. Sibim
4. VARIÁVEL ALEATÓRIA 66
(e) P (X ≤ 1);(R:0,00135)
(f) P (0 ≤ X ≤ 2) (R:0,02272).
10. Para X ∼ N(90, 100), obtenha:
(a) P (X ≤ 115); (R:0,99379)
(b) P (X ≥ 80);(R:0,84134)
(c) P (X ≤ 75); (R:0,06681)
(d) P (85 ≤ X ≤ 110)(R:0,66871).
11. Para X ∼ N(−5, 10), calcule:
(a) P (−5 < X ≤ −2); (R:0,32894)
(b) P (X ≤ 0); (R:0,94295)
(c) P (X > −6); (R:0,62552)
(d) P (−7 ≤ X ≤ −6) (R:0,11013).
12. A velocidade de transferência de um arquivo de um servidor da universidade para um
computador pessoal na casa de um estudante, em uma noite de dia de semana, é distri-
buída normalmente, com média de 60kbits por segundo e um desvio padrão de 4kbits por
segundo.
a) Qual é a probabilidade de o arquivo se transferir a uma velocidade de 70kbits por
segundo ou mais? (R: 0, 0062)
b) Qual é a probabilidade de o arquivo se transferir a uma velocidade menor que 58kbits
por segundo? (R: 0, 3085)
13. O diâmetro (X) de certa espécie de árvore é uma variável aleatória com distribuição
normal de média 50 cm e desvio padrão de 6 cm. Se o diâmetro de uma árvore diferir da
média de mais de 10 cm, está árvore é vendida por 10 u.m.; caso contrário, é vendida por
20 u.m.. Qual o preço médio de venda de cada árvore? (R: 19,5 u.m.)
14. Sabe-se que uma moeda mostra a face cara quatro vezes mais do que a face coroa, quando
lançada. Esta moeda é lançada 4 vezes. Seja X o número de caras que aparece, determine:
a) E(X). (R: 3,2)
b) Var(X). (R: 0,64)
c) P (X ≥ 2). (R: 0,9728)
d) P (1 ≤ X < 3). (R: 0,1792)
15. Uma urna contém 6 bolas numeradas de 1 a 6. Uma pessoa paga R$600,00 e retira
aleatoriamente uma bola. Se retirar a bola 6 recebe R$1500,00, se retirar as bolas 2, 3,
4 ou 5 nada acontece, e se retirar a bola 1irá escolher outra bola, sem repor a primeira
e, se esta segunda for a bola 6, recebe R$3600,00, caso contrário, nada recebe. Calcular
quanto a pessoa que está jogando espera lucrar. (R: -230,00)
Bioestatística - Prof
a
. Alessandra C. Sibim
Bioestatística - Prof
a
. Alessandra C. Sibim
4. VARIÁVEL ALEATÓRIA 68
Bioestatística - Prof
a
. Alessandra C. Sibim
4. VARIÁVEL ALEATÓRIA 69
Bioestatística - Prof
a
. Alessandra C. Sibim

Mais conteúdos dessa disciplina