Introdução a Estatística

•
FASA

Luis Fernando Macedo
29.03.2016
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 82 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 82 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 82 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Probabilidade e Estatística

28.930 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
Cap´ıtulo 1
Estat´ıstica Descritiva
1.1 Introduc¸a˜o
1.1.1 Estat´ıstica
A palavra estat´ıstica deriva do latim ”status”e tem dois significados dis-
tintos. Frequentemente usado no plural, o termo estat´ıstica designa todo conjunto
coerente de dados nume´ricos relativos a um grupo de indiv´ıduos. Assim, por ex-
emplo, pode-se falar em estat´ısticas de produc¸a˜o industrial ou agr´ıcola (quantidades
produzidas, custos de produc¸a˜o, prec¸os de venda, etc), de estat´ısticas demogra´ficas
(natalidade, mortalidade), de estat´ısticas de desemprego, de acidentes de estrada,
etc.
Por outro lado, a palavra estat´ıstica designa tambe´m, o conjunto de me´todos
que permitem reunir e analisar dados de observac¸a˜o.
De acordo com Fisher -“A Estat´ıstica e´ a matema´tica aplicada a dados
de observac¸a˜o”. Ela tem por objetivo o uso de me´todos cient´ıficos para coleta,
organizac¸a˜o, resumo, apresentac¸a˜o e ana´lise de dados, bem como a obtenc¸a˜o de
concluso˜es va´lidas a serem utilizadas nas tomadas de deciso˜es.
Assim todo estudo estat´ıstico pode ser decomposto em pelo menos duas
fases:
- a reunia˜o ou coleta dos dados estat´ısticos
- sua ana´lise e interpretac¸a˜o.
A coleta de dados pode ser realizada de duas formas:
1
2
- por simples observac¸a˜o dos fenoˆmenos em que se tem interesse - estudo
observacional e
- por experimentac¸a˜o, ou seja, provocando-se voluntariamente a aparic¸a˜o
de certos fenoˆmenos controlados.
A ana´lise estat´ıstica pode ser decomposta em duas etapas, uma dedutiva ou
descritiva e a outra indutiva. A Estat´ıstica Descritiva tem por objetivo resumir e
apresentar os dados observados sob a forma de: tabelas (descric¸a˜o tabular), gra´ficos
(descric¸a˜o gra´fica) e paraˆmetros e suas estimativas (descric¸a˜o parame´trica).
A Infereˆncia Estat´ıstica permite estender ou generalizar dentro de certas
condic¸o˜es as concluso˜es obtidas. Frequentemente, a observac¸a˜o ou a experimentac¸a˜o
e´ relativa a apenas uma frac¸a˜o dos indiv´ıduos em que se tem interesse. As concluso˜es
relativas a essa frac¸a˜o, chamada amostra, devem, enta˜o, ser estendidas tanto quanto
poss´ıvel ao conjunto de indiv´ıduos que formam a “populac¸a˜o”. Essa fase indutiva
comporta evidentemente certos riscos de erro, que podem ser medidos, usando-se a
teoria das probabilidades. Quando em um estudo trabalha-se com amostras, tem-se
uma pesquisa por amostragem. Quando se utiliza a populac¸a˜o toda tem-se o censo.
As diferentes etapas de todo estudo estat´ıstico na˜o sa˜o, entretanto, independentes.
1.1.2 Varia´veis
Varia´vel e´ uma medida ou classificac¸a˜o obtida de cada elemento da populac¸a˜o
ou amostra. A representac¸a˜o de dados torna-se mais fa´cil por meio da utilizac¸a˜o
de varia´veis. E´ importante notar que a varia´vel aleato´ria e´ representada por letra
maiu´scula e o valor observado pela mesma letra, pore´m minu´scula. Assim, por
exemplo, os dados apresentados na Tabela 1.1, a varia´vel X refere-se ao peso de 24
animais do Cerrado brasileiro, em kg. Tem-se ainda que xi, i = 1, ..., 24, representa
o peso observado de um determinado animal i, por exemplo,
x1 = 250, x2 = 20, x3 = 10, ..., x24 = 60.
Outro exemplo pode ser
3
Tabela 1.1: Peso de 24 animais do Cerrado brasileiro, em kg.
Animal X Animal X Animal X
Anta 250 Gato-do-mato 3 Cateto 20
Ariranha 20 Gato-maracaja´ 6 Prea´ 1
Bugio-preto 10 Gato-mourisco 10 Quati 5
Cachorro-do-mato 8 Jaguatirica 15 Raposa-do-campo 8
Capivara 70 Lobo-guara´ 20 Suc¸uarana 60
Cervo 100 Lontra 10 Tamandua´-bandeira 30
Cotia 3 Onc¸a-pintada 100 Tatu-bola 3
Gamba´ 1 Paca 8 Veado-do-campo 60
Y : tipos de famı´lias de algumas espe´cies de plantas encontradas no Parque
Nacional da Serra da Canastra
yj: Asteraceae, Bignoniaceae, Melastomataceae, j = 1, 2, 3 (famı´lias).
Os tipos de varia´veis mais comumente utilizadas na descric¸a˜o de dados sa˜o:
Varia´veis

Quantitativas
 discretascont´ınuas
Qualitativas
 nominaisordinais
a) Varia´veis quantitativas representam quantidades. Podem ser de natureza
discreta ou cont´ınua.
Sa˜o de natureza discreta as varia´veis que podem assumir apenas valores den-
tro do conjunto dos nu´meros naturais. Exemplo: nu´mero de frutos por ramo, nu´mero
de parasitas por hospedeiro, nu´mero de ovos por ninho, nu´mero de sementes germi-
nadas, nu´mero de insetos coletados em armadilhas, nu´mero de brotos em estudos de
cultura de tecidos, etc.
4
Sa˜o de natureza cont´ınua as varia´veis que podem assumir qualquer valor em
um intervalo. Exemplo: alturas de plantas, pesos de animais, velocidade de animais,
concentrac¸a˜o de uma soluc¸a˜o, biomassa de plantas ou animais, etc.
b) Varia´veis qualitativas descrevem categorias, qualidades. Sa˜o relativas a
dados categorizados. Exemplo: rac¸a, sexo, cor da pele, ta´xon, grau de infecc¸a˜o, etc.
E´ poss´ıvel, a`s vezes, estabelecer uma correspondeˆncia dessas varia´veis com
varia´veis quantitativas discretas. E´ o caso, por exemplo, de:
sexo: masculino, feminino ⇒ xi = 0, 1, i = 1, 2
condic¸a˜o: morto, vivo ⇒ xi = 0, 1, i = 1, 2
graus de infecc¸a˜o: ⇒ xi = 0, 1, 2, 3, i = 1, 2, 3, 4.
1.1.3 Somato´rio
E´ uma notac¸a˜o bastante utilizada dentro da estat´ıstica. Considere, por
exemplo, a varia´vel aleato´ria X, que representa o nu´mero de espe´cimes de zarro-
americano (Aythya affinis) coletados ao longo dos anos de 1965 a 1980, conforme a
Tabela 1.2.
Tabela 1.2: Nu´mero de espe´cimes de zarro-americano (Aythya affinis) coletados ao
longo dos anos de 1965 a 1980.
Ano 1965 1966 1967 1968 1969 1970 1971 1972
Nu´meros 19 28 4 13 28 36 17 30
Ano 1973 1974 1975 1976 1977 1978 1979 1980
Nu´meros 21 32 34 16 22 16 23 31
Tem-se, enta˜o, que x1 = 19, x2 = 28, ..., x16 = 31. Logo, o total de zarros-
americanos coletados de 1965 a 1980 e´ dado por
T = x1 + x2 + ...+ x16 =
16∑
i=1
xi = x. = 370
5
Figura 1.1: Zarro americano.
Podem ser obtidas, ainda, a soma dos quadrados e o quadrado da soma
16∑
i=1
x2i = x
2
1 + x
2
2 + ...+ x
2
16 = 9706
e (
16∑
i=1
xi
)2
= (x1 + x2 + ...+ x16)
2 = 3702 = 136900.
Outro exemplo, seria o da Tabela 1.3 que mostra o nu´mero me´dio de ca-
maro˜es-espinho coletados na ba´ıa de Ubatuba de acordo com o local no qual o tran-
secto foi feito e com o esta´gio reprodutivo do camara˜o.
Tabela 1.3: Nu´meros me´dios de camaro˜es-espinho coletados na ba´ıa de Ubatuba
de acordo com o local no qual o transecto foi feito e com o esta´gio reprodutivo do
camara˜o.
Transecto
Esta´gio j = 1 j = 2 j = 3 j = 4 j = 5 j = 6 Totais
Ov´ıgero y11 = 4,0 y12 = 7,0 y13 = 4,5 y14 = 1,0 y15 = 5,5 y16 = 3,5 y1. = 25,5
Na˜o-ov´ıgero y21 = 3,0 y22 = 6,5 y23 = 5,0 y24 = 2,0 y25 = 5,0 y26 = 3,5 y2. = 25,0
Totais y.1 = 7,0 y.2 = 13,5 y.3 = 9,5 y.4 = 3,0 y.5 = 10,5 y.6 = 7,0 y.. = 50,5
6
Pode-se representar cada valor observado por yij, isto e´, yij e´ o nu´mero
de camaro˜es-espinho referente ao i-e´simo esta´gio reprodutivo e j-e´simo transecto.
Assim, tem-se, por exemplo
y.. =
2∑
i=1
6∑
j=1
yij = y11 + · · ·+ y16 + y21 + · · ·+ y26 = 50, 5
y1. =
6∑
j=1
y1j = y11 + · · ·+ y16 = 25, 5
y.2 =
2∑
i=1
yi2 = y12 + y22 = 13, 5
Propriedades do somato´rio:
a)
n∑
i=1
k = nk
b)
n∑
i=1
kxi = k
n∑
i=1
xi
c)
n∑
i=1
(xi ± yi) =
n∑
i=1
xi ±
n∑
i=1
yi
d)
n∑
i=1
(xi ± k) =
n∑
i=1
xi ± nk.
1.2 Estat´ıstica Descritiva
Tem por objetivo resumir e apresentar dados de observac¸a˜o (populac¸a˜o ou
amostra), de modo a simplificar sua interpretac¸a˜o por meio de descric¸a˜o tabular,
gra´fica ou parame´trica.
1.2.1 Varia´vel Qualitativa – Descric¸a˜o Tabular e Gra´fica
Primeiro caso: Uma so´ varia´vel
Seja o exemplo que se segue. Os alunosda sexta turma de Cieˆncias Biolo´gicas
da ESALQ/USP observaram durante dois dias o nu´mero de visitas de polinizadores
a um espe´cime de Heliconia rostrata. Obtiveram os resultados: das 8h a`s 10h, 10h
7
a`s 12h, 12h a`s 14h e das 14h a`s 16h, respectivamente, 17, 28, 18 e 19 polinizadores
visitaram a planta.
Figura 1.2: Heliconia rostrata.
A representac¸a˜o tabular e´ feita por meio de tabelas de mono-entrada ou de
classificac¸a˜o simples ou tabelas de frequeˆncias. As frequeˆncias podem ser absolu-
tas simples, absolutas acumuladas, relativas simples, relativas acumuladas, depen-
dendo do interesse do pesquisador. Uma tabela e mesmo um gra´fico deve apresentar:
cabec¸alho, corpo e rodape´.
O cabec¸alho deve conter o suficiente para que sejam respondidas as questo˜es:
o queˆ? (fato), onde? (lugar) e quando? (e´poca). O corpo e´ apresentado por colunas
e sub-colunas dentro das quais sera˜o registrados os dados. O rodape´ e´ reservado
para as observac¸o˜es pertinentes, bem como para a identificac¸a˜o da fonte dos dados.
Assim, para o exemplo dado, tem-se a Tabela 1.4.
A descric¸a˜o gra´fica, dentre outras, pode ser feita de treˆs formas: gra´fico
de colunas (ou barras), de linhas e de setores circulares. Esses gra´ficos podem ser
obtidos considerando-se frequeˆncia absoluta, frequeˆncia relativa, frequeˆncia absoluta
acumulada e frequeˆncia relativa acumulada.
a) Gra´fico de colunas e de linhas
Os resultados da Tabela 1.4 podem ser representados graficamente como
mostra a Figura 1.3.
8
Tabela 1.4: Nu´mero de visitas de polinizadores a um espe´cime de Heliconia rostrata
observados por alunos da sexta turma de Cieˆncias Biolo´gicas da ESALQ-USP no ano
de 2009, em dois dias de observac¸a˜o.
Intervalo Frequeˆncia Frequeˆncia Freq. abs. Freq. rel.
(xi) absoluta (fi) relativa (f
′
i) acumulada acumulada
08:00-10:00 17 0,207 17 0,207
10:00-12:00 28 0,341 45 0,548
12:00-14:00 18 0,220 63 0,768
14:00-16:00 19 0,232 82 1,000
82 1,000 - -
08:00−10:00 10:00−12:00 12:00−14:00 14:00−16:00
Horário
N
úm
er
o 
de
 v
is
ita
s
0
5
10
15
20
25
30
0
5
10
15
20
25
30
Horário
N
úm
er
o 
de
 v
is
ita
s
08:00−10:00 10:00−12:00 12:00−14:00 14:00−16:00
Figura 1.3: Gra´ficos de colunas e de linhas para o nu´mero de polinizadores observa-
dos.
b) Gra´fico de setores circulares
E´ a representac¸a˜o gra´fica, em um c´ırculo, por meio de setores. E´ utilizado,
principalmente, quando se pretende uma visualizac¸a˜o em relac¸a˜o ao total. Para cons-
9
tru´ı-lo, divide-se o c´ırculo em setores, cujas a´reas sera˜o proporcionais a`s frequeˆncias.
Essa divisa˜o pode ser feita por regra de treˆs. Assim, no exemplo dado

82 visitas− 360o
x1 = 74
o37′48′′
17 visitas− x1

82 visitas− 360o
x2 = 122
o58′48′′
28 visitas− x2
x3 = 79
o01′12′′, x4 = 83o24′36′′.
08:00−10:00
10:00−12:00
12:00−14:00
14:00−16:00
34,1% 20,7%
22,0% 23,2%
Figura 1.4: Gra´fico de setores circulares para o nu´mero de polinizadores observados.
Segundo caso: duas varia´veis
Se no exemplo de visitas de polinizadores a um espe´cime de Heliconia ros-
trata, ale´m da varia´vel “n´ıvel”, tambe´m, for considerada a varia´vel “dia de coleta”, os
resultados obtidos podem ser representados em uma tabela de dupla-entrada, como
a Tabela 1.5.
A descric¸a˜o gra´fica pode ser feita por meio dos gra´ficos de colunas e de
linhas, dentre outras, agrupando-se as colunas por dia de coleta ou por intervalos de
coletas, conforme e´ mostrado na Figura 1.5.
10
Tabela 1.5: Nu´mero de visitas de polinizadores a um espe´cime de Heliconia rostrata
observados por alunos da sexta turma de Cieˆncias Biolo´gicas da ESALQ-USP no ano
de 2009, em dois dias de observac¸a˜o.
Hora Primeiro dia Segundo dia Total
08:00-10:00 9 8 17
10:00-12:00 13 15 28
12:00-14:00 9 9 18
14:00-16:00 10 9 19
Total 41 41 82
Primeiro dia Segundo dia
0
5
10
15
8−10
10−12
12−14
14−16
8−10
10−12
12−14 14−16
08:00−10:00 10:00−12:00 12:00−14:00 14:00−16:00
0
5
10
15
1
2
1
2
1 2
1
222
Figura 1.5: Gra´ficos de colunas para o nu´mero de polinizadores observados.
1.2.2 Varia´vel Quantitativa Discreta – Descric¸a˜o Tabular e
Gra´fica
Primeiro caso: Uma so´ varia´vel
a) Tabela Primitiva ou Tabela de Dados Brutos – E´ a tabela inicial dos
dados, geralmente, sem qualquer crite´rio que permita informac¸o˜es “estat´ısticas”.
Assim, por exemplo, em uma pesquisa em sala de aula pode-se solicitar a quinze
alunos que digam o nu´mero de pessoas que moram em suas casas, enfatizando que a
11
Tabela 1.6: Um exemplo de tabela de frequeˆncias.
xi fi
x1 n1
x2 n2
· · · · · ·
xV nV
Total N =
∑
i fi
“honestidade”moral cient´ıfica da coleta de dados pode ser mais importante do que
o pro´prio me´todo estat´ıstico adotado na ana´lise desses dados. A` medida que os
alunos va˜o dando a informac¸a˜o solicitada, os dados va˜o “entrando”, sem um crite´rio
espec´ıfico.
Outro exemplos seriam dados coletados no campo, como, por exemplo,
nu´mero de sementes germinadas, nu´mero de plantas doentes, etc.
b) Rol – E´ a tabela de dados dispostos em ordem, geralmente, crescente (ou
decrescente)
Apesar de pouco informativa apresenta algumas vantagens sobre a tabela
primitiva, pois facilmente se obteˆm os valores de
- limite inferior: l ou LI
- limite superior: L ou LS
- amplitude total: A = L− l ou A = LS − LI
Apresenta desvantagens quando o conjunto de dados e´ grande.
c) Tabela de Frequeˆncias – As duas tabelas anteriores sa˜o usadas, em geral,
apenas para “controle”do pesquisador. Quando a pesquisa e´ publicada, a tabela
de frequeˆncias e´ a que deve ser apresentada: espac¸o de publicac¸a˜o, quantidade de
informac¸a˜o, etc. Esse tipo de tabela conte´m, no caso mais simples duas colunas,
uma com os valores observados (xi) e a outra com as frequeˆncias absolutas (fi),
como mostrado na Tabela 1.6. Podem tambe´m, ser inclu´ıdas colunas com frequeˆncias
12
Tabela 1.7: Nu´mero de pessoas que moram nas casas de 15 alunos amostrados.
.
xi fi ai a
′
i pi Fi
3 3 3 15 0,2 0,2
4 4 7 12 0,27 0,47
5 5 12 8 0,33 0,80
6 1 13 3 0,07 0,87
7 1 14 2 0,07 0,94
8 1 15 1 0,07 1,00
absolutas acumuladas, frequeˆncias relativas, frequeˆncias relativas acumuladas.
Suponha que na pesquisa com os quinze alunos sobre o nu´mero de pes-
soas que moram em suas casas, os resultados obtidos foram aqueles apresentados na
Tabela 1.7 em que ai e´ a frequeˆncia acumulada direta do valor xi, a
′
i e´ a frequeˆncia
acumulada inversa do valor xi, pi e´ a frequeˆncia relativa
fi
N
do valor xi e Fi e´ a
frequeˆncia relativa acumulada direta do valor xi.
Sera´ visto, posteriormente, que a frequeˆncia relativa e´ um “bom”estimador
de probabilidade e que Fi e´ um “bom”estimador da func¸a˜o acumulada de probabili-
dade.
Graficamente as varia´veis quantitativas discretas sa˜o descritas por meio de
gra´ficos de linhas e de barras.
Segundo caso: Duas ou mais varia´veis
Exemplo: Na mesma pesquisa com os 15 alunos, pode-se solicitar para infor-
marem dentre os moradores quantos sa˜o “assalariados”, obtendo-se os dados brutos,
o rol das n-uplas, ordenando-se por uma das varia´veis e uma tabela de dupla-entrada,
em que a varia´vel aleato´ria X representa o nu´mero de moradores por resideˆncia e
a varia´vel aleato´ria Y representa o nu´mero de assalariados, conforme mostrado na
Tabela 1.8.
13
Tabela 1.8: Tabela de frequeˆncias, classificada de acordo com o nu´mero de pessoas
que moram nas casas de 15 alunos amostrados e nu´mero de assalariados.
X
Y 2 3 4 5 6 Totais (f.j)
1 1 1 1 1 0 4
2 0 1 3 2 1 7
3 01 2 1 0 4
Totais (fi.) 1 3 6 4 1 15
Note que as frequeˆncias marginais de X reproduzem a tabela ja´ constru´ıda
quando se considerou apenas a varia´vel X. De modo ana´logo pode ser feito para a
varia´vel Y . Ale´m disso,
∑
ij
fij =
∑
i
fi =
∑
j
fj = N = nu´mero de dados
A tabela de dupla entrada pode ser constru´ıda com frequeˆncias relativas.
1.2.3 Varia´vel Quantitativa Cont´ınua – Descric¸a˜o Tabular e
Gra´fica
Primeiro caso: Uma so´ varia´vel
a) Tabela primitiva ou tabela de dados brutos
Exemplo: Os dados da Tabela 1.9 referem-se a peso de 50 colmos de cana-
de-ac¸u´car (em g).
b) Rol – Ordenando-se os dados obteˆm-se os limites inferior e superior e a
amplitude total.
l = LI = 10, 20
L = LS = 22, 10
A = 22, 10− 10, 20 = 11, 90.
14
Tabela 1.9: Peso de 50 colmos de cana-de-ac¸u´car (em g).
14,11 16,12 17,78 13,54 17,59 17,09 17,26 20,35 13,34 20,08
14,77 13,61 14,85 17,76 17,46 16,08 14,14 15,06 20,67 17,60
15,26 14,17 16,39 12,00 15,55 14,78 20,48 20,04 16,78 13,59
19,70 19,56 19,18 19,21 15,94 19,12 20,90 17,11 14,06 19,38
19,36 16,07 22,10 14,62 18,05 10,20 16,51 20,39 15,63 14,30
c) Tabela de classes
Note que ao contra´rio das varia´veis discretas, as varia´veis cont´ınuas apresen-
tam muitos valores diferentes. Desse modo, uma tabela de frequeˆncias teria muitas
linhas e seria, portanto, pouco explicativa. Para contornar esse problema, usam-se,
para descrever as varia´veis cont´ınuas, tabelas de classes ou tabelas de intervalos.
Faz-se, enta˜o, a partic¸a˜o do rol em intervalos de amplitude, geralmente, iguais de-
nominadas classes.
O nu´mero ideal de classes de uma tabela depende, muitas vezes, mais do
bom senso do pesquisador do que de regras r´ıgidas pre´-estabelecidas. Na˜o ha´ uma
fo´rmula exata. Boas aproximac¸o˜es podem ser obtidas por:
(i)
k =
 ≤ 5 se N ≤ 25' √N se N > 25
(ii) Sturges k ' 1 + 3, 22 log(N).
A amplitude de cada classe e´ obtida por n =
A
k
. No exemplo dado, tem-se
k =
√
50 ≈ 7 e h = 22, 10− 10, 20
7
= 1, 7
Os gra´ficos mais comumente usados para descrever as varia´veis quantitativas
cont´ınuas, sa˜o histograma e pol´ıgono de frequeˆncia, usando-se frequeˆncias absolutas,
e ogivas de Galton crescente ou decrescente, usando-se frequeˆncias acumuladas.
O histograma e´ constitu´ıdo de uma sequeˆncia de retaˆngulos justapostos em
15
Tabela 1.10: Tabela de frequeˆncias simples (fi), simples acumuladas crescentes (ai),
simples acumuladas decrescentes (a′i), relativas simples (Pˆi), relativas acumuladas
(Fi) para os dados da Tabela 1.9, mi representa o ponto me´dio do intervalo.
Peso mi fi ai a
′
i Pˆi Fi
10,0 ` 12,0 11,0 1 1 50 0,02 0,02
12,0 ` 14,0 13,0 5 6 49 0,10 0,12
14,0 ` 16,0 15,0 14 20 44 0,28 0,40
16,0 ` 18,0 17,0 14 34 30 0,28 0,68
18,0 ` 20,0 19,0 8 42 16 0,16 0,84
20,0 ` 22,0 21,0 7 49 8 0,14 0,98
22,0 ` 24,0 23,0 1 50 1 0,02 1,00
que cada retaˆngulo tem como base a amplitude de classe e como altura a frequ¨eˆncia
da classe que descreve. O pol´ıgono de frequeˆncias consiste de uma linha poligo-
nal fechada que une os pontos Pi(mi, fi), i = 1 · · · , k. Para “fechar”o pol´ıgono
de frequeˆncias, supo˜e-se uma classe imediatamente anterior e outra imediatamente
posterior, ambas com frequeˆncias nulas e procede-se de modo ana´logo.
Pesos de colmos de cana−de−açúcar
Fre
qu
ên
cia
s
0 10 20 30 40
0
1
2
3
4
0
5
10
15
4 12 20 28 36
Figura 1.6: Histograma e ogivas de Galton para os dados de pesos de colmos de
cana-de-ac¸u´car.
16
A ogiva de Galton crescente consiste de uma linha poligonal que une os
pontos Pi(Li, ai), enquanto que a ogiva de Galton decrescente consiste de uma linha
poligonal que une os pontos Pi(li, a
′
i).
O histograma e as ogivas de Galton para os dados de pesos de colmos de
cana-de-ac¸u´car, esta˜o representados na Figura 1.6.
1.3 Descric¸a˜o parame´trica
1.3.1 Introduc¸a˜o
Os dados relativos a uma varia´vel quantitativa, apresentados em uma tabela,
da˜o visa˜o geral do problema em estudo. Entretanto, e´ extremamente conveniente
proceder a uma descric¸a˜o dos dados usando-se medidas que mostrem, de maneira
bastante concisa, certas caracter´ısticas da amostra.
As medidas de tendeˆncia central, tambe´m chamadas medidas de posic¸a˜o,
estabelecem o valor em torno do qual os dados se distribuem. Esta˜o entre elas:
me´dia aritme´tica, me´dia geome´trica, me´dia harmoˆnica, me´dia quadra´tica, mediana,
quartis, decis, percentis e moda.
As medidas de dispersa˜o permitem quantificar a variabilidade dos valores
observados, ao redor de um paraˆmetro de posic¸a˜o. Esta˜o entre elas: amplitude total,
variaˆncia, desvio-padra˜o, erro-padra˜o da me´dia, coeficiente de variac¸a˜o (medida de
dispersa˜o relativa), desvio-quartil, desvio semi-quart´ılico e desvio quartil reduzido.
As medidas de assimetria medem o grau de simetria de uma distribuic¸a˜o en-
quanto que as medidas de curtose medem o grau de achatamento de uma distribuic¸a˜o.
Esta˜o entre elas: coeficientes de Pearson e coeficientes de Fisher.
Uma distribuic¸a˜o pode ser: sime´trica, assime´trica positiva ou assime´trica
negativa e, ainda, leptocu´rtica, mesocu´rtica ou platicu´rtica.
Existem, ainda, as medidas de associac¸a˜o que envolvem a dispersa˜o de pon-
tos referentes a duas varia´veis, e podem ser citadas: covariaˆncia e coeficiente de
correlac¸a˜o.
17
Resta lembrar que para a maioria dos paraˆmetros, deve-se considerar, sepa-
radamente, o caso de se´ries estat´ısticas (uma simples enumerac¸a˜o das observac¸o˜es)
e aquele das distribuic¸o˜es de frequeˆncias considerando-se tabelas de frequeˆncias e de
classes de frequeˆncias.
E´ prefer´ıvel, geralmente, proceder a` reduc¸a˜o parame´trica dos dados, dire-
tamente, a partir dos valores observados, mesmo se as distribuic¸o˜es de frequeˆncias
foram estabelecidas, por exemplo, em vista da representac¸a˜o gra´fica dos resultados.
Em particular, e´ preciso evitar efetuar a reduc¸a˜o dos dados a partir de distribuic¸o˜es
grupadas em classes.
1.3.2 Medidas de tendeˆncia central ou de posic¸a˜o
Estabelecem o valor em torno do qual os dados se distribuem.
1.3.2.1 Me´dia aritme´tica
Primeiro caso: Dados na˜o agrupados
Dado um conjunto de N valores
ΩX = {x1, x2, . . . , xN}
define-se a me´dia aritme´tica como
x¯ =
x1 + x2 + . . .+ xN
N
.
Os s´ımbolos x¯, mˆ ou µˆ representam estimativas da me´dia m ou µ da popu-
lac¸a˜o. Os s´ımbolos m e µ representam os paraˆmetros da populac¸a˜o.
Como exemplo, sejam os dados de produc¸a˜o de cana-de ac¸u´car da Tabela
1.9. Tem-se:
50∑
i=1
xi = 839, 69 N = 50 x¯ = 16, 8g.
18
Segundo caso: Dados colocados sob a forma de tabelas de frequeˆncias
Seja a Tabela 1.11 de frequeˆncias.
Tabela 1.11: Tabela de frequeˆncias
xi fi xifi
x1 f1 x1f1
· · · · · · · · ·
xk fk xkfk
Totais N =
k∑
i=1
fi
k∑
i=1
xifi
A me´dia aritme´tica e´ obtida por
mˆ = x¯ =
k∑
i=1
xifi
k∑
i=1
fi
.
Tabela 1.12: Nu´mero de moradores por resideˆncia, de 15 alunos amostrados.
xi fi xifi
3 3 9
4 4 16
5 5 25
6 1 6
7 1 7
8 1 8
Totais 15 71
Exemplo: Considerando-se o exemplo do nu´mero de moradores por
resideˆncia, de 15 alunos amostrados, pode-se construir a Tabela 1.12, a partir da
19
qual se obte´m a me´dia aritme´tica
x¯ =
71
15
= 4, 7 moradores por resideˆncia.
Terceiro caso: Dados colocados sob a forma de tabelas de classes de frequeˆncias
Seja a Tabela 1.13 de classes de frequeˆncias. A me´dia aritme´tica e´ obtida
Tabela 1.13: Tabela de classes de frequeˆncias.
Classes mi fi mifi
c1 ` c2 m1 f1 m1f1
c2 ` c3 m2 f2 m2f2
· · · · · · · · · · · ·
ck ` ck+1 mk fk mkfk
Totais N =
k∑
i=1
fi
k∑
i=1
mifi
porx¯ =
k∑
i=1
mifi
N
,
em que mi e´ o ponto me´dio da classe e N =
k∑
i=1
fi.
Propriedades da me´dia aritme´tica:
1)
N∑
i=1
(xi − x¯) = 0
As diferenc¸as di = xi−x¯ sa˜o chamadas desvios, discrepaˆncias ou afastamento
de cada xi em relac¸a˜o a x¯.
2)
∑N
i=1 (xi − x¯)2 = 0 e´ mı´nima, isto e´, a soma dos quadrados dos desvios
de cada observac¸a˜o xi em relac¸a˜o a uma medida de posic¸a˜o k e´ a menor poss´ıvel
quando k e´ a me´dia aritme´tica.
20
Exemplo: Considere os dados de peso de 50 colmos de cana-de-ac¸u´car da
Tabela 1.9 com a Tabela 1.14 de classes de frequeˆncias. A me´dia aritme´tica e´ obtida
Tabela 1.14: Tabela de classes de frequeˆncias para os dados da Tabela 1.9.
Peso mi fi mifi
10,0 ` 12,0 11,0 1 11,0
12,0 ` 14,0 13,0 5 65,0
14,0 ` 16,0 15,0 14 210,0
16,0 ` 18,0 17,0 14 238.0
18,0 ` 20,0 19,0 8 152,0
20,0 ` 22,0 21,0 7 147,0
22,0 ` 24,0 23,0 1 23,00
Totais 50 846
por
x¯ =
846
50
= 17g.
1.3.2.2 Mediana
E´ um paraˆmetro de posic¸a˜o tal que a metade das observac¸o˜es lhe sa˜o infe-
riores (ou iguais) e a outra metade superiores (ou iguais).
Primeiro caso: dados na˜o-agrupados
Feita a ordenac¸a˜o dos n dados a mediana e´ dada por
md = xn+1
2
se n e´ ı´mpar, e
md =
xn
2
+ xn
2
+1
2
se n e´ par.
Exemplo: Um estudo foi conduzido com adolescentes mulheres que sofriam
de bulimia e os resultados das medidas de entrada calo´rica dia´ria (kcal/kg) esta˜o na
21
Tabela 1.15. A mediana e´ dada por
md =
x12 + x13
2
=
21, 6 + 22, 9
2
= 22, 25
Tabela 1.15: Medidas de entrada calo´rica dia´ria (kcal/kg) de 24 adolescentes mulhe-
res.
15,9 18,9 25,1 16,0 19,6 25,2
16,5 21,5 25,6 17,0 21,6 28,0
17,6 22,9 28,7 18,1 23,6 29,2
18,4 24,1 30,9 18,9 24,5 30,6
Outro exemplo: As alturas (cm) de nove alunos do terceiro ano do curso de
Cieˆncias Biolo´gicas da ESALQ/USP, 2009 foram
X: { 172; 180; 183; 183; 185; 187; 189; 189; 191}.
A mediana e´ dada por
md = x5 = 185.
Segundo caso: dados colocados sob a forma de tabelas de frequeˆncias
Distribuic¸a˜o do nu´mero de moradores por resideˆncia, de 15 alunos sorteados
no terceiro ano de Cieˆncias Biolo´gicas, 2009
xi fi a
′
i
3 3 3
4 4 7
5 5 12
6 1 13
7 1 14
8 1 15
md = x 15+1
2
= x8 = 5
22
Terceiro caso: dados colocados em uma tabela de classes de frequeˆncias
Um modo de se obter a mediana e´ por meio de um processo gra´fico,
utilizando-se a Ogiva de Galton. No exemplo de dados de bulimia tem-se a Ogiva
de Galton.
Figura 1.7: Ogiva de Galton crescente para os dados de bulimia
Tabela 1.16: Tabela de classes de frequeˆncias para os dados da Tabela 1.15.
Peso mi fi
15,9 ` 18,9 17,4 7
18,9 ` 21,9 20,4 5
21,9 ` 24,9 23,4 4
24,9 ` 27,9 23,4 3
27,9 ` 30,9 26,4 4
30,9 ` 33,9 29,4 1
Totais 24
Outro modo de se obter a mediana e´ usando-se a fo´rmula
md = lmd +
(N
2
−∑ fi)h
fmd
23
em que lmd e´ o limite inferior da classe mediana,
∑
fi e´ a soma das frequeˆncias
anteriores a` classe mediana, h e´ a amplitude da classe mediana e fmd e´ frequeˆncia
da classe mediana.
Para os dados de bulimia da Tabela 1.15, com tabela de classes de frequeˆncias
na Tabela 1.16, tem-se
md = 20, 4 +
24
2
− 7
5
· 3 = 23, 4.
1.3.2.3 Moda
E´ o elemento de uma se´rie de dados que ocorre com maior frequeˆncia.
Primeiro caso: dados na˜o-agrupados
No exemplo de dados na˜o agrupados de bulimia (Tabela 1.15), a moda e´
igual a 18,9, pois aparece duas vezes enquanto que as outras observac¸o˜es apare-
cem apenas uma vez. Para o exemplo de alturas de alunos, as modas sa˜o 183 e 189cm.
Segundo caso: dados agrupados em uma tabela de frequeˆncias
Para o exemplo de nu´mero de moradores por resideˆncia, de 15 alunos do ter-
ceiro ano de Cieˆncias Biolo´gicas, 2009, a moda e´Mo = 5 (e´ o valor xi correspondente
a` maior frequeˆncia fi)
xi 3 4 5 6 7 8
fi 3 4 5 1 1 1
Terceiro caso: dados agrupados em uma tabela de classes de frequeˆncias
Uma maneira de se obter a moda e´ por meio de um processo gra´fico,
utilizando-se o histograma de frequeˆncias simples. No exemplo de cana-de-ac¸u´car,
tem-se Mo = 18, 23, conforme Figura 1.8.
Outro modo de se obter a moda e´ usando-se a fo´rmula de Czuber
Mo = l +
∆1
∆1 +∆2
.h
24
Figura 1.8: Histograma dos pesos de colmo de ac¸u´car com ca´lculo da moda.
em que l e´ o limite inferior da classe modal, ∆1 e´ a diferenc¸a entre a frequeˆncia
da classe modal e a imediatamente anterior, ∆2 e´ a diferenc¸a entre a frequeˆncia da
classe modal e a imediatamente posterior e h e´ a amplitude da classe.
Para os dados da Tabela 1.15 com Tabela 1.16 de classes de frequeˆncias,
tem-se
Mo = 15, 9 +
7
7 + 2
.3 = 18, 23.
1.3.2.4 Me´dia geome´trica
Dado o conjunto de N valores ΩX = {x1, x2, . . . , xN}, se os dados forem na˜o agrupa-
dos, a me´dia geome´trica e´ obtida por
x¯g = n
√
x1.x2 . . . xN =
n
√√√√ N∏
i=1
xi.
Se os dados estiverem em uma tabela de classes de frequeˆncias, enta˜o,
x¯g =
n
√√√√ N∏
i=1
xfii
sendo xi a me´dia da classe i com frequeˆncia fi.
Exemplo: Durante o primeiro semestre do ano de 1970 a relac¸a˜o
x =
prec¸o de gasolina
prec¸o do o´leo diesel
25
foi x1 = 2, 50 e no segundo semestre foi x2 = 2, 00. Enta˜o,
mgx =
√
2× 2, 5 =
√
5 = 2, 236
Note que se y = 1
x
⇒ y1 = 12,5 e y2 = 12 . Logo,
mgy =
√
1
2, 5
× 1
2
=
√
1
5
= 0, 447 =
1
mgx
.
Se fosse utilizada a me´dia aritme´tica, ter-se-ia
x¯ 6= 1
y¯
.
1.3.2.5 Me´dia harmoˆnica
E´ utilizada no ca´lculo de velocidades me´dias e custo me´dio de bens comprados com
uma quantia fixa. Dado o conjunto de N valores ΩX = {x1, x2, . . . , xN}, para dados
na˜o agrupados, a me´dia harmoˆnica e´
x¯h =
N
1
x1
+ 1
x2
+ . . .+ 1
xN
=
N∑N
i=1
1
xi
isto e´, e´ o inverso da me´dia aritme´tica dos inversos dos valores.
Para dados em tabelas de frequeˆncias
x¯h =
N∑k
i=1
fi
xi
.
Exemplo: As cidades A, B e C sa˜o equidistantes umas das outras. Um
motorista viaja de A para B a 30km/h de B para C a 60 km/h e de C para A a 120
km/h. Qual a velocidade me´dia desenvolvida no percurso?
x¯h =
3
1
30
+ 1
60
+ 1
120
= 51, 428km/h.
26
1.3.2.6 Me´dia quadra´tica
E´ utilizada, principalmente, na determinac¸a˜o de diaˆmetro de a´rvores de secc¸a˜o ou
a´rea me´dia. Dado o conjunto de valores ΩX = {x1, x2, . . . , xN}, para dados na˜o-
agrupados, a me´dia quadra´tica e´
x¯q =
√
x21 + x
2
2 + . . .+ x
2
N
N
=
√∑
x2i
N
.
Para dados em tabelas de frequeˆncias,
x¯q =
√
1
N
∑
fix2i .
1.3.2.7 Separatrizes: Decis, Quartis e Percentis
Quartis dividem um conjunto de dados ordenados em quatro partes iguais, enquanto
que os decis em dez partes iguais e os percentis em cem partes iguais. Assim, teˆm-se
treˆs quartis (Q1, Q2, Q3), nove decis (D1, D2, ...,D9) e noventa e nove percentis (P1,
P2,...,P99). Tem-se, ainda, que Md = Q2 = D5 = P50.
O processo gra´fico utilizado para a determinac¸a˜o dessas separatrizes e´ seme-
lhante ao utilizado para a mediana, a partir da Ogiva de Galton. Quanto a`s fo´rmulas
tem-se:
Q1 =
lQ1 + (
N
4
−∑ fi)
fQ1 .h
.
1.3.2.8 Relac¸a˜o entre me´dia, mediana e moda
Em uma distribuic¸a˜o sime´trica observa-se que
x¯ = md = mo.
27
Figura 1.9: Exemplo de uma distribuic¸a˜o sime´trica
Em uma distribuic¸a˜o assime´trica positiva observa-se que x¯ > md > mo
enquanto que na assime´trica negativa x¯ < md < mo.
1.3.3 Medidas de dispersa˜o
1.3.3.1 Introduc¸a˜o
As medidas de tendeˆncia central, embora de extrema importaˆncia, na˜o sa˜o suficientes
para o estudo completo das distribuic¸o˜es.
Exemplo inicial: Em um ensaio de cana-de-ac¸u´car em que se testaramtreˆs
variedades foram obtidas as produc¸o˜es:
variedade A: 86,0 87,0 88,0 88,0 88,0 89,0 90,0
variedade B: 84,0 86,0 88,0 88,0 88,0 90,0 92,0
variedade C: 87,0 87,0 88,0 88,0 88,0 89,0 89,0.
Verifica-se que:
x¯A = x¯B = x¯C = 88, 0
∑
x2 = 54218 s2 = 1, 67
mdA = mdB = mdC = 88, 0
∑
x2 = 54248 s2 = 6, 67
moA = moB = moC = 88, 0
∑
x2 = 54212 s2 = 0, 67.
28
Tornam-se necessa´rias, portanto, outras medidas para se fazer a escolha de
uma determinada variedade. Um novo crite´rio, enta˜o, poderia ser: a variedade mais
regular, isto e´, a variedade cujas produc¸o˜es apresentam menor dispersa˜o.
1.3.3.2 Amplitude total
E´ a mais rudimentar das medidas de dispersa˜o. E´ a diferenc¸a entre o maior e o
menor dos valores de uma se´rie de dados.
A = xmax − xmin
No exemplo dado:
AA = 4, 0 AB = 8, 0 AC = 2, 0
Tem a desvantagem de levar em considerac¸a˜o apenas os valores extremos.
1.3.3.3 Desvio (di) em relac¸a˜o a` me´dia
Primeiro caso: dados na˜o agrupados
di = xi − x¯ na amostra
e
di = xi − µ na populac¸a˜o
Segundo caso: dados em tabelas de classes de frequeˆncias
di = mi − x¯
Fato:
∑
di =
∑
(xi − x¯) =
∑
xi − nx¯ = 0
1.3.3.4 Variaˆncia
E´ a mais importante das medidas de variac¸a˜o e e´ definida como a me´dia dos
quadrados dos desvios.
29
Primeiro caso: dados na˜o agrupados
Populac¸a˜o: σ2 =
∑
(xi − µ)2
n
=
1
n
[∑
x2 − (
∑
x)2
n
]
Amostra: s2 =
∑
(xi − x¯)2
n− 1 =
1
n− 1
[∑
x2 − (
∑
x)2
n
]
Nota: Perde-se um grau de liberdade ao estimar-se σ2 com base na
estimativa da me´dia.
No exemplo de peso das treˆs variedades de cana-de-ac¸u´car:
s2A = 1, 67 s
2
B = 6, 67 s
2
C = 0, 67
Poder-se-ia, portanto, nesse caso escolher a variedade C.
No exemplo de dados de produc¸a˜o de cana-de-ac¸u´car (t/ha), da Tabela 1.9,
tem-se
∑
x2 = 14445, 64
∑
x = 839, 69
s2 =
1
50− 1
(
14445, 64− 839, 69
2
50
)
= 7, 02g2
Segundo caso: dados em tabelas de frequeˆncias
σ2 =
1
n
∑
fi(xi − µ)2 = 1
n
[∑
fix
2
i −
(
∑
fixi)
2
n
]
s2 = 1
n−1
∑
fi(xi − x¯)2 = 1
n− 1
[∑
fix
2
i −
(
∑
fixi)
2
n
]
Exemplo: Distribuic¸a˜o do nu´mero de moradores por resideˆncia
30
xi fi fixi fix
2
i
3 3 9 27
4 4 16 64
5 5 25 125
6 1 6 36
7 1 7 49
8 1 8 64
15 71 365
s2 =
1
14
[
365− 71
2
15
]
= 2, 07
Terceiro caso: dados em tabelas de classes de frequeˆncias
s2 =
1
n− 1
k∑
i=1
fi(mi − x¯)2 = 1
n− 1
[∑
fim
2
i −
(
∑
fimi)
2
n
]
sendo mi e´ o ponto me´dio da classe i e n =
∑
fi
Em outro exemplo de dados de produc¸a˜o de cana-de-ac¸u´car (t/ha) tem-se:
mi fi mifi m
2
i fi
74,0 ` 79,2 76,6 4 306,4 23470,24
79,2 ` 84,4 81,8 5 409,0 33456,20
84,4 ` 89,6 87,05 14 1218,0 105966,00
89,6 ` 94,8 92,2 7 645,4 59505,88
94,8 ` 100,0 97,4 2 194,8 18973,52
100,0 ` 105,2 102,6 4 410,4 42107,04
3184,0 283478,88
s2 =
1
35
[
283478, 88− 3184, 0
2
36
]
=
1871, 7689
35
= 53, 4791 ' 53, 48t/ha
31
1.3.3.5 Desvio-padra˜o
Observando-se a fo´rmula para o ca´lculo da variaˆncia, veˆ-se que o numerador e´ uma
soma de quadrados. Assim, se a unidade foi, por exemplo, metro (m), tem-se que
a variaˆncia sera´ dada em m2. Para se voltar a` varia´vel original, necessita-se, enta˜o,
extrair a raiz quadrada da variaˆncia que e´ o desvio-padra˜o. Assim, tem-se:
Populac¸a˜o: σ =
√
σ2
Amostra: s =
√
s2
s =
√
53, 48 = 7, 32 dados de cana-de-ac¸u´car agrupados
s =
√
2, 07 = 1, 44 dados de habitantes por resideˆncia
1.3.3.6 Coeficiente de variac¸a˜o
Trata-se de uma medida relativa de dispersa˜o, u´til para a comparac¸a˜o em termos
relativos do grau de concentrac¸a˜o em torno da me´dia de se´ries distintas. E´ dado por:
Populac¸a˜o: CV =
σ
µ
ou CV (%) = 100 · σ
µ
Amostra: CV =
s
x¯
ou CV (%) = 100 · s
x¯
Para efeitos pra´ticos, costuma-se considerar que CV superior a 50% indica
alto grau de dispersa˜o e, consequentemente, pequena representabilidade da me´dia.
Enquanto que para valores inferiores a 50% a me´dia sera´ tanto mais representativa
do fato quanto menor for o seu CV. O coeficiente de variac¸a˜o mede o desvio-padra˜o
em unidades da me´dia.
Assim se temos duas amostras de peso (em kg) de gado Canchim aos 8 meses
Amostra A: 347, 380, 328, 410, 380, 348, 329, 320, 330, 305
Amostra B: 350, 343, 325, 348, 334, 327, 317, 342, 341, 330
x¯A = 347, 7 x¯B = 335, 7
s2A = 1067, 79 s
2
B = 116, 9
sA = 32, 68 sB = 10, 81
CVA = 0, 094 CVB = 0, 032
32
Portanto, veˆ-se que a dispersa˜o relativa da amostra B e´ menor do que a da
amostra A.
1.3.3.7 Erro-padra˜o da me´dia
Obtido por
σ(x¯) =
σ√
n
para populac¸a˜o
s(x¯) =
s√
n
para amostra
Pode ser verificado que me´dias e desvios-padra˜o sa˜o por si mesmos sujeitos
a` variac¸a˜o e formam populac¸o˜es de me´dias e de desvios-padra˜o.
Espera-se que me´dias sejam menos varia´veis que observac¸o˜es individuais.
Assim, o erro-padra˜o da me´dia e´ uma medida de dispersa˜o de um conjunto de
me´dias, utilizando-se apenas uma me´dia. Nos exemplos dados, tem-se:
s(x¯) =
7, 09√
36
= 1, 182 para dados de cana-de-ac¸u´car na˜o-agrupados
s(x¯) =
3, 31√
36
= 0, 552 para dados de cana-de-ac¸u´car agrupados
s(x¯) =
1, 44√
15
= 0, 372 para dados de habitantes por resideˆncia
Cap´ıtulo 2
PROBABILIDADES
2.1 Conceituac¸a˜o
2.1.1 Experimento Aleato´rio (E)
E´ aquele que repetido sob as mesmas condic¸o˜es pode levar a resultados
diferentes, isto e´, na˜o se pode prever seu resultado, em raza˜o do fato de que todos
os fatores que determinam o resultado na˜o podem ser medidos ou controlados.
Exemplos:
E1: Lanc¸ar uma moeda e observar o resultado da face voltada para cima.
E2: Lanc¸ar duas moedas e observar o resultado das faces voltadas para cima.
E3: Lanc¸ar dez moedas e observar o nu´mero de caras.
E4: Lanc¸ar um dado e observar o nu´mero mostrado na face de cima.
E5: Lanc¸ar dois dados e observar o nu´mero mostrado na face de cima.
E6: Lanc¸ar dois dados e observar a soma dos nu´meros mostrados na face de
cima.
E7: Plantar 10 sementes de feija˜o e observar o nu´mero de sementes germi-
nadas.
E8: Fazer o cruzamento de dois animais e observar o sexo do animal que
nasceu.
Analisando esses experimentos verifica-se:
a) Cada experimento podera´ ser repetido sob as mesmas condic¸o˜es in-
definidamente.
33
34
b) Na˜o se conhece um particular valor do experimento “a priori”, pore´m,
podem-se descrever todos os poss´ıveis resultados - as possibilidades.
c) Quando o experimento for repetido um grande nu´mero de vezes, surgira´
uma regularidade, isto e´, havera´ uma estabilidade da frac¸a˜o f =
s
n
(frequeˆncia re-
lativa), em que o nu´mero n e´ o nu´mero de repetic¸o˜es e s e´ o nu´mero de sucessos
de um particular resultado estabelecido antes da realizac¸a˜o. Essa caracter´ıstica e´
fundamental para o ca´lculo da probabilidade de um certo evento. Assim,
n
f
2.1.2 Espac¸o Amostral
E´ o conjunto de todos os resultados poss´ıveis associados a um experimento,
representado por S. Sendo S um conjunto, ele podera´ ser finito ou infinito. Nos
exemplos dados
a) E1 : S1 = {k, c} em que c = cara, k = coroa
b) E2 : S2 = {(c, c), (c, k), (k, c), (k, k)}
c) E3 : S3 = {0, 1, 2, ..., 10}
d) E4 : S4 = {1, 2, 3, 4, 5, 6}
e) E5 : S5 = {(1, 1), (1, 2), (1, 3), ..., (6, 6)}
f) E6 : S6 = {2, 3, 4, ..., 12}
g) E7 : S7 = {0, 1, 2, ..., 10}
h) E8 : S8 ={feˆmea, macho}
35
2.1.3 Evento
E´ um subconjunto de S, ou seja, um conjunto de resultados de um experi-
mento. Nos exemplos dados
a) A1: sair cara ⇒ A1 = {c}
b) B1: sair pelo menos uma cara ⇒ B1 = {(c, c), (k,c), (c, k)}
c) C1: na˜o sair cara ⇒ C1 = {0}
d) D1: sair o treˆs ⇒ D1 = {3}
e) X1: sair o par (5, 6)⇒ X1 = {(5, 6)}
f) F1: sair soma onze ⇒ F1 = {(5, 6), (6, 5)}
g) G1: pelo menos 8 sementes germinaram ⇒ G1 = {1, 2, 3, ..., 8}
h) H1: nascer macho ⇒ H1={macho}.
Tipos de Eventos
Evento Imposs´ıvel – aquele que nunca ocorre. Representado por ∅. Por
exemplo, no jogo de dois dados sair soma 13.
∅ = {13}
Evento Simples ou Elementar – e´ aquele que conte´m apenas um dos
elementos do espac¸o amostral. Exemplos: A1, C1, D1, H1.
Evento Certo – e´ o pro´prio espac¸o amostral S.
A = S
Evento Complementar – Dado um evento A de um espac¸o amostral S,
define-se o evento complementar de A, como o subconjunto de todos os elementos
de S que na˜o esta˜o em A, isto e´,
A¯ = {x : x ∈ S e /∈ A}
36
Propriedades
a) A ∪ A¯ = S
b) A ∩ A¯ = ∅
Exemplo: Em E4 = {1, 2, 3, 4, 5, 6}, podem-se definir os eventos comple-
mentares
A: sair face par ⇒ A = {2, 4, 6}
A¯: sair face ı´mpar ⇒ A¯ = {1, 3, 5}.
Eventos Mutuamente Exclusivos
Dois eventos A1 e A2 sa˜o mutuamente exclusivos, se eles na˜o podem ocorrer
simultaneamente, isto e´, A1∩A2 = ∅. Exemplo: Em E4, podem-se definir os eventos
mutuamente exclusivos
A1: sair o nu´mero 2, A1 = {2}
A2: sair nu´mero ı´mpar, A2 = {1, 3, 5}
A1 ∩ A2 = ∅.
Eventos Independentes
Dois eventos A1 e A2 sa˜o dependentes, se a ocorreˆncia de um deles depende
de que o outro tenha ocorrido, ou na˜o. Dois eventos A1 e A2 sa˜o independentes, se
a ocorreˆncia de um deles independe de que o outro tenha ocorrido, ou na˜o.
Exemplo: Seja
37
E: Retirar 2 bolas de uma urna com 2 bolas brancas e uma preta, sem
reposic¸a˜o.
Os eventos
A1: A primeira bola e´ branca e
A2: A segunda bola e´ branca
sa˜o dependentes, pois a chance de ocorreˆncia da segunda bola branca muda, depen-
dendo da cor da primeira bola.
2.2 Definic¸a˜o de Probabilidade
Dado um espac¸o amostral S, a probabilidade de um evento A, representada
por P (A), e´ uma func¸a˜o definida em S, que associa um valor nume´rico ao evento A,
satisfazendo os axiomas:
a) 0 ≤ P (A) ≤ 1
b) P (S) = 1
c) Se A e B sa˜o eventos mutuamente exclusivos (A ∩B = ∅), enta˜o:
P (A ∪B) = P (A) + P (B).
Nos problemas pra´ticos o valor P (A) pode ser obtido por
P (A) =
tamanho de A
tamanho de S
.
Exemplos
1) Joga-se um dado. Qual a probabilidade de sair pelo menos 3?
Soluc¸a˜o: Dado que S = {1, 2, 3, 4, 5, 6} e A = {3, 4, 5, 6}, enta˜o
P (A) =
4
6
=
2
3
.
2) Uma urna conte´m 5 bolas brancas, 7 pretas e 3 vermelhas. Tiram-se 5
bolas de uma vez. Calcule as probabilidades dos eventos que se seguem.
a) Sa´ırem 3 bolas brancas e 2 vermelhas.
38
p1 =
C35C
2
3
C515
=
10
1001
.
b) Na˜o sair nenhuma bola branca.
p2 =
C510
C515
=
12
143
.
c) Sair pelo menos uma preta.
p3 = 1− P (nenhuma bola preta) = 1− C
5
8
C515
=
421
429
.
2.3 Teoremas
1. Se ∅ e´ o conjunto vazio, enta˜o P (∅) = 0.
Prova:
A e ∅ sa˜o disjuntos, pois A ∩ ∅ = ∅
P (A ∪ ∅) = P (A) + P (∅)
P (A) = P (A) + P (∅), pois A ∪ ∅ = A
Logo, P (∅) = 0.
2. Se A¯ e´ o complemento de A, enta˜o P (A¯) = 1− P (A).
Prova:
Como A ∪ A¯ = S e A ∩ A¯ = ∅, enta˜o
P (A ∪ A¯) = P (A) + P (A¯) por (c),
P (S) = P (A) + P (A¯) e por (b)
1 = P (A) + P (A¯)⇒ P (A¯) = 1− P (A).
39
3. Se A ⊂ B,enta˜o P (A) ≤ P (B).
Prova:
Pelo Diagrama de Venn, B = A ∪ (B ∩ A¯) e, portanto,
P (B) = P (A) + P (B ∩ A¯) por (c), mas
P (B ∩ A¯) ≥ 0 por (a), enta˜o,
P (B) ≥ P (A) ou P (A) ≤ P (B).
4. Se A e B sa˜o dois eventos quaisquer, enta˜o:
P (A ∪B) = P (A) + P (B)− P (A ∩B)
i) Se A e B sa˜o mutuamente exclusivos, P (A ∩ B) = 0 e decorre imediata-
mente pelo axioma (c)
P (A ∪B) = P (A) + P (B)
ii) Se A ∩B 6= ∅
Pelo diagrama de Venn, A ∪B = A ∪ (A¯ ∩B).
Logo, como A e A¯ ∩B sa˜o mutuamente exclusivos
P (A ∪B) = P (A) + P (A¯ ∩B), mas
40
B = (B ∩ A) ∪ (B ∩ A¯).
Logo, P (B) = P (B∩A)+P (B∩A¯), pois (B∩A) e (B∩A¯) sa˜o mutuamente
exclusivos. Enta˜o,
P (B ∩ A¯) = P (B)− P (B ∩ A) e, portanto,
P (A ∪B) = P (A) + P (B)− P (B ∩ A).
5. Se A e B sa˜o dois eventos quaisquer, enta˜o:
P (A ∩B) = P (A¯ ∪ B¯) e P (A ∪B) = P (A¯ ∩ B¯)
2.4 Espac¸os amostrais finitos equiprova´veis
Quando a cada ponto amostral de um espac¸o amostral esta´ associada a
mesma probabilidade, o espac¸o amostral chama-se equiprova´vel ou uniforme. Em
particular, se S conte´m n pontos, a probabilidade de cada ponto sera´ igual a
1
n
.
Por outro lado, se um evento A conte´m r pontos, enta˜o,
P (A) = r
1
n
=
r
n
.
Esse me´todo de avaliar P (A) e´ frequentemente colocado da seguinte forma
P (A) =
nu´mero de elementos de A
nu´mero de elementos do espac¸o amostral
ou
P (A) =
nu´mero de casos favora´veis
nu´mero total de casos
=
n(A)
n(S)
.
41
2.5 Probabilidade Condicional, Teorema do Pro-
duto, Eventos Independentes
Exemplo inicial: Uma urna conte´m duas bolas brancas e treˆs bolas verdes.
Retiram-se duas bolas 1 a 1. Sejam os seguintes eventos:
A: a primeira bola e´ branca
B: a segunda bola e´ branca
Considere o experimento:
1) Com reposic¸a˜o da primeira bola
P (A) =
2
5
e P (B) =

P (B|A) = 2
5
P (B|A¯) = 2
5
2) Sem reposic¸a˜o da primeira bola
P (A) =
2
5
e P (B) =

P (B|A) = 1
4
P (B|A¯) = 2
4
=
1
2
Observac¸o˜es:
i) P (B|A) e´ a probabilidade de B dado que ocorreu A.
ii) P (B|A¯) e´ a probabilidade de B dado que na˜o ocorreu A.
iii) Note que no primeiro caso (com reposic¸a˜o) a ocorreˆncia do evento B na˜o
depende de que A tenha, ou na˜o, ocorrido.
P (B|A) = P (B|A¯) = 2
5
= P (B).
iv) Note que no segundo caso (sem reposic¸a˜o) a ocorreˆncia do evento B
depende de que A tenha, ou na˜o, ocorrido.
P (B|A) = 1
4
6= P (B|A¯) = 1
2
.
42
Outro exemplo: Considere o experimento E e os eventos A e B
E: lanc¸ar um dado honesto
A: ocorrer face par
B: ocorrer face 2
Enta˜o, sem du´vida P (A) =
1
2
e P (B) =
1
6
.
Suponha que o dado tenha sido lanc¸ado e que ja´ tenha ocorrido face par.
Nessas condic¸o˜es, qual a probabilidade de ocorrer face 2, isto e´, P (B|A) =?
O espac¸o amostral S
′
agora esta´ reduzido de S para A.
S
′
= {2, 4, 6} = A
P (B|A) = n(B)
n(S ′)
=
n(B)
n(A)
=
1
3
.
Definic¸a˜o: Dados os eventos A e B de um espac¸o amostral S, define-se a
probabilidade condicional de B dado que ocorreu A, por
P (B|A) = P (A ∩B)
P (A)
com P (A) 6= 0, pois A ja´ ocorreu.
P (B|A) =
n(A ∩B)
n(S)
n(A)
n(S)
=
n(A ∩B)
n(A)
.
No exemplo, A = {2, 4, 6} e B = {2}, e, portanto,
A ∩B = {2} ⇒ m(A ∩B) = 1
m(A) = 3⇒ P (B|A) = 1
3
.
Dessa definic¸a˜o decorre o
Teorema do Produto: “A probabilidade de ocorreˆncia de dois eventos A
e B, do mesmo espac¸o amostral e´ igual ao produto da probabilidade de um deles
pela probabilidade condicional do outro, dado o primeiro.”
43
P (B|A) = P (A ∩B)
P (A)
⇒ P (A ∩B) = P (A)P (B|A)
ou
P (A|B) = P (A ∩B)
P (B)
⇒ P (A ∩B) = P (B)P (A|B).
No exemplo da urna, considere o evento
C: ambas as bolas sa˜o brancas.
Enta˜o,
P (C) = P (A ∩B) = P (A) · P (B|A)
Note que:
1) Com reposic¸a˜o da primeira bola
P (A ∩B) = P (B)P (B|A), em que P (B|A) = P (B)
P (A ∩B) = P (A) · P (B) = 2
5
· 2
5
=
4
25
2) Sem reposic¸a˜o da segunda bola
P (B|A) 6= P (B)
P (A ∩B) = P (A) · P (B|A) = 2
5
· 1
4
=
1
10
Definic¸a˜o: Um evento A e´ independente de um evento B se a probabilidade
de A ocorrer na˜o e´ influenciada pelo fato de B ter ocorrido, ou na˜o, ou seja, se
P (A) = P (A|B).
E´ evidente que, se A e´ independente de B, B e´ independente de A. Assim
P (B) = P (B|A).
Considerando o teorema do produto, seA e B sa˜o independentes, enta˜o
P (A ∩B) = P (A) · P (B).
Observac¸a˜o: Dados k eventos A1, A2, ..., Ak diz-se que eles sa˜o indepen-
dentes se eles forem independentes 2 a 2, 3 a 3,..., k a k.
44
Exemplos:
1) Em um lote de 12 pec¸as, 4 sa˜o defeituosas; 2 pec¸as sa˜o retiradas uma
apo´s a outra, sem reposic¸a˜o. Qual a probabilidade de que ambas sejam boas?
Soluc¸a˜o:
A: a primeira pec¸a e´ boa
B: a segunda pec¸a e´ boa
P (A ∩B) = P (A) · P (B|A) = 8
12
7
11
=
14
33
2) Em um certo cole´gio, 25% dos estudantes foram reprovados em
matema´tica, 15% em qu´ımica e 10% em matema´tica e qu´ımica ao mesmo tempo,
isto e´,
P (A) =
1
4
, P (B) =
15
100
=
3
20
e P (A ∩B) = 1
10
.
Um estudante e´ aleatoriamente escolhido.
a) Se ele foi reprovado em qu´ımica, qual e´ a probabilidade de ele ter sido
reprovado em matema´tica?
P (A|B) =
1
10
3
20
=
2
3
.
b) Se ele foi reprovado em matema´tica qual e´ a probabilidade de ele ter sido
reprovado em qu´ımica?
P (B|A) =
1
10
1
4
=
4
10
=
2
5
.
c) Qual a probabilidade de ele ter sido reprovado em qu´ımica ou matema´tica?
P (A ∪B) = P (A) + P (B)− P (A ∩B) = 0, 25 + 0, 15− 0, 10 = 0, 30.
45
Um outro exemplo do Teorema da Soma
Lanc¸a-se um dado honesto. Qual a probabilidade de ocorrer
a) Face menor do que 5 ou face par?
A = {1, 2, 3, 4} ⇒ P (A) = 4
6
B = {2, 4, 6} ⇒ P (B) = 3
6
A ∪B = {1, 2, 3, 4, 6}
A ∩B = {2, 4} ⇒ P (A ∩B) = 2
6
P (A ∪B) = P (A) + P (B)− P (A ∩B) = 5
6
b) Face menor do que 5 ou face maior que 5?
A = {1, 2, 3, 4} ⇒ P (A) = 4
6
C = {6} ⇒ P (C) = 1
6
A ∪ C = {1, 2, 3, 4, 6}
A ∩ C = ∅ ⇒ P (A ∩ C) = 0
P (A ∪ C) = 4
6
+
1
6
=
5
6
c) Face par ou face ı´mpar?
B = {2, 4, 6} ⇒ P (B) = 3
6
D = {1, 3, 5} ⇒ P (D) = 3
6
B ∪D = S ⇒ P (S) = 1
B ∩D = ∅
P (B ∪D) = 1
46
2.6 Teorema de Bayes ou das probabilidades co-
nhecidas “a priori”
Definic¸a˜o: Sejam A1, A2, ..., An, n eventos mutuamente exclusivos, tais que
A1 ∪ A2 ∪ ... ∪ An = S
Sejam P (Ai) as probabilidades conhecidas dos va´rios eventos e B um evento
qualquer de S tal que conhecemos todas as probabilidades condicionais P (B|Ai).
Enta˜o, para cada i, tem-se:
P (Ai|B) = P (Ai ∩B)
P (B)
=
P (Ai ∩B)
P (A1 ∩B) + ...+ P (An ∩B) =
P (Ai)P (B|Ai)
P (A1)P (B|A1) + ...+ P (An)P (B|An)
Exemplos
1) Em uma gaiola meta´lica 4% dos coelhos machos e 1% das feˆmeas pesam
mais do que 1,8 kg. Por outro lado, 60% dos coelhos sa˜o feˆmeas. Se um coelho
escolhido aleatoriamente pesa mais de 1,8 kg, qual a probabilidade de ser feˆmea?
Soluc¸a˜o:
Logo, podem-se considerar os eventos:
A1 : coelho feˆmea
A2 : coelho macho
B : coelho pesa mais de 1,8 kg
47
e as probabilidades
P (A1) = 0, 6, P (B|A1) = 0, 01
P (A2) = 0, 4, P (B|A2) = 0, 04
P (A1|B) = 0, 6 · 0, 01
0, 6 · 0, 01 + 0, 4 · 0, 04 =
0, 006
0, 022
=
3
11
.
2) Uma cl´ınica envia amostras de equinos para 3 laborato´rios de ana´lises A,
B e C nas seguintes proporc¸o˜es 0,2; 0,3 e 0,5, respectivamente. A probabilidade de
cada um dos laborato´rios elaborar uma ana´lise errada e´ de, respectivamente,
1
2
,
1
3
e
1
6
.
Logo, podem-se considerar os eventos:
A1 : ana´lise feita pelo laborato´rio A
A2 : ana´lise feita pelo laborato´rio B
A3 : ana´lise feita pelo laborato´rio C
B : realizar uma ana´lise errada
e as probabilidades
P (A1) = 0, 2 P (B|A1) = 1
2
P (A2) = 0, 3 P (B|A2) = 1
3
P (A3) = 0, 5 P (B|A3) = 1
6
.
a) Uma ana´lise resultou errada, qual a probabilidade de ter sido feita pelo
laborato´rio A? Pelo B? Pelo C?
P (A1|B) =
0, 2 · 1
2
0, 2 · 1
2
+ 0, 3 · 1
3
+ 0, 5 · 1
6
=
0, 1
1, 7
6
= 0, 3529
P (A2|B) = 0, 3529 P (A3|B) = 0, 2941
b) Qual a probabilidade de um exame executado resultar errado?
48
P (B) = P (A ∩B1) + P (A ∩B2) + P (A ∩B3)
= P (A1) · P (B|A1) + P (A2) · P (B|A2) + P (A3) · P (B|A3) = 1, 7
6
= 0, 2833.
3) Uma urna A conte´m 1 bola preta e 1 vermelha. Uma urna B conte´m 2
bolas pretas e 3 vermelhas. Uma bola e´ escolhida ao acaso na urna A e colocada na
urna B. Uma bola e´, enta˜o, extra´ıda, ao acaso, da urna B. Qual a probablidade de
que a primeira bola seja vermelha, sabendo-se que a segunda foi preta?
Soluc¸a˜o:
Sejam os eventos e as respectivas probabilidades
A1 : a bola de A para B foi preta ∴ P (A1) =
1
2
A2 : a bola de A para B foi vermelha ∴ P (A2) =
1
2
X: a bola tirada de B e´ preta
∴ P (X|A1) = 3
6
=
1
2
e P (X|A2) = 2
6
.
Logo,
P (A2|X) =
1
2
· 2
6
1
2
· 2
6
+
1
2
· 3
6
=
2
5
.
4) O cara´ter pescoc¸o pelado das galinhas e´ dado por um fator gene´tico
dominante Na. Um animal de constituic¸a˜o gene´tica NaNa ou Nana, tem pescoc¸o
pelado, mas tera´ pescoc¸o coberto se tiver a constituic¸a˜o nana. Tendo um galo
de pescoc¸o pelado sido cruzado com galinhas de pescoc¸o coberto, foram obtidos 5
pintos, todos de pescoc¸o pelado. Qual a probabilidade de que o galo seja puro para
o fator Na?
49
Soluc¸a˜o:
Sejam os eventos:
A1 : galo puro NaNa
A2 : galo de constituic¸a˜o gene´tica Nana
B : 5 pintos Nana
e as probabilidades
P (A1) =
1
2
, P (B|A1) = 1
P (A2) =
1
2
, P (B|A2) =
(
1
2
)5
.
Logo,
P (A1|B) =
1
2
· 1
1
2
· 1 + 1
2
· 1
32
=
32
33
= 0, 97.
2.7 Exerc´ıcios
1) Considere o experimento E: Lanc¸ar um dado e uma moeda. Pede-se:
a) Construa o espac¸o amostral
b) Enumere os seguintes eventos
A = {coroa, marcado por nu´mero ı´mpar}
B = {cara, marcado por nu´mero ı´mpar}
C = {mu´ltiplos de 3}
c) Expresse os eventos
I) B
II) A ou B ocorrerem
III) B e C ocorrerem
IV) A
⋃
B
d) Quais dos eventos A, B e C sa˜o mutuamente exclusivos?
50
2) Determine a probabilidade de:
a) Sair um nu´mero par no lanc¸amento de um dado na˜o-viciado.
b) Sair um rei ao se extrair uma carta de um baralho.
c) Sair soma 5 no lanc¸amento de dois dados.
3) Um grupo de 15 elementos apresenta a seguinte composic¸a˜o:
Homens Mulheres
Menores 5 3
Adultos 5 2
Um elemento e´ escolhido ao acaso. Pergunta-se:
a) Qual a probabilidade de ser homem?
b) Qual a probabilidade de ser adulto?
c) Qual a probabilidade de ser menor e mulher?
d) Sabendo-se que o elemento escolhido e´ adulto, qual a probabilidade de ser
homem?
e) Dado que a escolha e´ mulher, qual a probabilidade de ser menor?
4) Considere que existam numa populac¸a˜o animais de geno´tipos dos tipos
BB, Bb e bb, sendo os indiv´ıduos BB e Bb pretos e os do tipo bb brancos. As
probabilidades dos 6 tipos de acasalamento esta˜o resumidas na tabela a seguir:
BB Bb bb
BB
4
25
5
25
6
25
Bb -
3
25
4
25
bb - -
3
25
51
Dado que um descendente e´ branco, quais as probabilidades dos diversos
cruzamentos?
5) Denomina-se “screening program” a avaliac¸a˜o total de uma populac¸a˜o
sobre determinada doenc¸a. Para se ter essa avaliac¸a˜o, cada indiv´ıduo e´ submetido
ao mesmo teste cl´ınico. Em um destes programas foram apurados os resultados que
se seguem:
Doenc¸a Positivo (A) Negativo (B) Total
Presente (B) 950 50 1000
Ausente (B) 10 990 1000
Total 960 1040 2000
Calcular as probabilidades condicionais apropriadas e responder se este teste
cl´ınico e´ apropriado e se o programa deve ou na˜o ser executado.
Informa-se que:
a) P (A|B): quanto maior, mais sens´ıvel sera´ o teste
b) P (A|B): quanto menor, mais espec´ıfico sera´ o teste
c) P (B|A): falsos positivos
d) P (B|A): falsos negativos
Observac¸a˜o: Por (a) e (b) ter-se-a´ a resposta a` primeira pergunta e por (c)
e (d) a resposta a` segunda pergunta.
Num laborato´rio, apo´s um experimentocom reac¸a˜o em cadeia de polimerase
(PCR), foram obtidos dez tubos de ensaio, numerados de 1 a 10. Sabe-se que em
treˆs deles a reac¸a˜o na˜o ocorreu como o esperado.
1) Considerando o experimento com reposic¸a˜o, e os evendos:
A = o primeiro tubo conte´m reac¸a˜o que na˜o ocorreu como o esperado
B = o segundo tubo conte´m reac¸a˜o que na˜o ocorreu como o esperado
52
1.1. A e B sa˜o independentes?
1.2. A e B sa˜o mutuamente exclusivos?
1.2. Determine P (A), P (B), P (A
⋂
B) e P (A
⋃
B)
2) Refac¸a o item (1) considerando o experimento com reposic¸a˜o.
Cap´ıtulo 3
Varia´veis Aleato´rias
3.1 Definic¸a˜o
Define-se uma varia´vel aleato´ria como uma func¸a˜o X, que associa a cada ele-
mento s ∈ S um nu´mero real X(s), ou seja, associa valores nume´ricos aos resultados
de um experimento.
Exemplo 1:
E: lanc¸amento de duas moedas
X: nu´meros de caras obtidos nas duas moedas
S = {(c, c); (c, k); (k, c); (k, k)}
X = {0, 1, 2}
53
54
Assim, uma varia´vel aleato´ria tem domı´nio em S e contradomı´nio em <.
Uma varia´vel aleato´ria pode ser: discreta ou cont´ınua. Sera´ discreta se o nu´mero
poss´ıvel de valores de X (seu contradomı´nio) for finito ou infinito numera´vel. Sera´
cont´ınua se o seu contradomı´nio for um intervalo ou uma colec¸a˜o de intervalos. No
exemplo, X e´ uma varia´vel discreta.
3.2 Varia´veis Aleato´rias Discretas
3.2.1 Func¸a˜o de Probabilidade
A probabilidade de que a varia´vel aleato´ria X assuma o valor x, e´ a func¸a˜o
de probabilidade de X representada por P (X = x) ou simplesmente P (x). A func¸a˜o
P (X = x) determina a distribuic¸a˜o de probabilidades da varia´vel aleato´ria e deve
satisfazer os axiomas:
a) 0 6 P (xi) 6 1
b)
∑
i P (xi) = 1
No exemplo 1, tem-se a distribuic¸a˜o de probabilidade de X:
X = x 0 1 2
P(X = x) 1
4
1
2
1
4
Graficamente
x
P(x)
0 1 2
1/4
1/2
Exemplo 2:
E2 : lanc¸ar dois dados e observar a soma dos nu´meros obtidos.
X = x 2 3 4 5 6 7 8 9 10 11 12
P(X = x) 1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
55
Graficamente
x
P(x)
2 3 4 5 6 7 8 9 10 11 12
1/36
2/36
3/36
4/36
5/36
6/36
3.2.2 Func¸a˜o de Distribuic¸a˜o Acumulada
Define-se Func¸a˜o de Distribuic¸a˜o Acumulada da varia´vel aleato´ria X, no
ponto x, como sendo a probabilidade de que X assuma um valor menor do que ou
igual a x, isto e´,
F (x) = P (X 6 x)
Propriedades:
a) F (x) =
∑
xi6x P (xi)
b) F (−∞) = 0
c) F (∞) = 1
d) P (a < X 6 b) = F (b)− F (a)
e) P (a 6 X 6 b) = F (b)− F (a) + F (X = a)
f) P (a < X < b) = F (b)− F (a)− F (X = b)
No exemplo 1:
X = x 0 1 2
P(X = x) 1
4
1
2
1
4
F(x) 1
4
3
4
1
Exemplo 3:
E3: lanc¸ar um dado e observar o nu´mero da face superior
X = x 1 2 3 4 5 6
P(X = x) 1
6
1
6
1
6
1
6
1
6
1
6
F(x) 1
6
2
6
3
6
4
6
5
6
6
6
56
x
F(x)
1 2
1/4
3/4
1
x
P(x
)
1 2 3 4 5 6
1/6
x
F(x
)
1 2 3 4 5 6
1/6
2/6
3/6
4/6
5/6
1
3.3 Varia´vel Aleato´ria Cont´ınua
Func¸a˜o Densidade de Probabilidade
Seja X uma v.a. cont´ınua. A func¸a˜o densidade de probabilidade f(x) e´ uma
func¸a˜o que satisfaz a`s seguintes condic¸o˜es:
a) f(x) ≥ 0
b)
∫
R
f(x)dx = 1
Ale´m disso,
P (a < X < b) =
∫ b
a
f(x)dx
Propriedades:
a) P (X = x0) =
∫ x0
x0
f(x)dx = 0
b)
P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b)
=
∫ b
a
f(x)dx
57
Verifica-se que f(x), densidade de probabilidade, na˜o e´ probabilidade.
Somente quando a func¸a˜o for integrada entre dois limites, ela produzira´ uma
probabilidade que sera´ a a´rea sob a curva da func¸a˜o entre x = a e x = b, para a < b.
Exemplo 4
Seja X uma v.a.c. com func¸a˜o densidade de probabilidade (f.d.p)
f(x) =
 2x se 0 < x < 10 para outros valores
f(x) e´ f.d.p., pois
a) f(x) ≥ 0
b)
∫∞
−∞ f(x)dx =
∫ 1
0
2xdx = [x2]10 = 1
Exemplo 5
Uma v.a. tem a seguinte func¸a˜o densidade de probabilidade
f(x) =

0 se x < 0
kx2 se 0 < x < 1
0 se x ≥ 1
Pede-se:
a) Determinar k
b) Fazer o gra´fico de f(x)
c) Obter P (0 < X < 1
2
)
Soluc¸a˜o:
a)
k
∫ 1
0
x2dx = k
[
x3
3
]1
0
=
k
3
= 1⇒ k = 3
∴ f(x) = 3x2 para 0 < x < 1
58
b)
c)
P (0 < X <
1
2
) = 3
∫ 1
2
0
x2dx = 3
[
x3
3
]1/2
0
=
[
1
2
]3
=
1
8
3.4 Paraˆmetros
De uma maneira geral, as distribuic¸o˜es teo´ricas podem ser caracterizadas
por paraˆmetros ana´logos a`queles da estat´ıstica descritiva.
3.4.1 Esperanc¸a Matema´tica, Valor Esperado ou Me´dia de
uma varia´vel aleato´ria
Define-se esperanc¸a matema´tica de uma v.a.d. X, como
µx = E(X) = ΣxiP (xi)
e de uma v.a.c., como
µx = E(X) =
∫ ∞
−∞
xf(x)dx.
Exemplo 6:
E1: lanc¸ar duas moedas
X: nu´mero de caras
xi 0 1 2
P (xi)
1
4
1
2
1
4
µx = 0 · 1
4
+ 1 · 1
2
+ 2 · 1
4
= 1
Espera-se que para um nu´mero grande de jogadas ocorra em me´dia uma
cara.
Exemplo 7:
E1: lanc¸ar dois dados
59
X: soma dos nu´meros mostrados na face de cima
xi 2 3 4 5 6 7 8 9 10 11 12
P (xi)
1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
µx =
1
36
[2 + 6 + 12 + 20 + 30 + 42 + 40 + 36 + 30 + 22 + 12] =
252
36
= 7
Exemplo 8:
f(x) =
 2x, para 0 < x < 10, para outros valores
µx = E(X) =
∫ 1
0
2x2dx =
[
2x3
3
]1
0
=
2
3
Exemplo 9:
f(x) =
 3x2, para 0 < x < 10, para outros valores
µx = E(X) =
∫ 1
0
3x3dx =
[
3x4
4
]1
0
=
3
4
Propriedades da Me´dia (Esperanc¸a):
1. A me´dia de uma constante e´ a pro´pria constante.
E(K) =
∑
i
KP (xi) = K
∑
P (xi) = K
E(K) =
∫ ∞
−∞
Kf(x)dx = K
∫ ∞
−∞
f(x)dx = K
2. Multiplicando-se uma v.a. X por uma constante, sua me´dia fica multipli-
cada por essa constante.
E(KX) =
∑
KxiP (xi) = K
∑
xiP (xi) = KE(X)
E(KX) =
∫ ∞
−∞
Kxf(x)dx = K
∫ ∞
−∞
xf(x)dx = KE(X)
60
3. E(X ± Y ) = E(X)± E(Y )
4. E(X ±K) = E(X)±K
5. E(X − µx) = E(X)− µx = 0
6. E(XY ) = E(X) · E(Y ) se X e Y forem independentes
3.4.2 Variaˆncia
Define-se variaˆncia de uma v.a., como:
σ2x = Var(X) = E[X − E(X)]2
logo
σ2x = Var(X) = Σ(xi − µx)2P (xi) se X v.a.d.
e
σ2x = Var(X) =
∫ ∞
−∞
(x− µx)2f(x)dx se X v.a.c.
Exemplo 10:
E: Lanc¸ar duas moedas
X: Nu´mero de caras
E(X) = 1
Var(X) = (0− 1)2 · 1
4
+ (1− 1)2 · 1
2
+ (2− 1)2 · 1
4
= 1
2
Exemplo 11:
f(x) =
 2x, para 0 < x < 10, para outros valores
61
E(X) = 2
3
Var(X) = 2
∫ 1
0
(
x− 2
3
)2
xdx = 2
∫ 1
0
(
x2 − 4
3
x+
4
9
)
xdx = 2
∫ 1
0
(
x3 − 4
3
x2 +
4
9
x
)
dx
= 2
(
x4
4
− 4
3
· x
3
3
+
4
9
· x
2
2
)1
0
= 2
(
1
4
− 4
9
+
4
18
)
= 2
(
9− 16 + 8
36
)
=
1
18
Propriedades da Variaˆncia:
1) A variaˆncia de uma constante e´ zero.
Var(K) = E{(K − E(K))2} = E[K −K] = 0
2) Multiplicando-se uma v.a por uma constante, sua variaˆncia fica multipli-
cada pelo quadrado da constante.
Var(KX) = E{[KX − E(KX)]2} = K2E{X − E(X)}2 = K2Var(X)
3) Somando-se ou subtraindo-se uma constante K a uma v.a., sua variaˆncia
na˜o se altera.
Var(X ±K) = E{[(X ±K)− E(X ±K)]2} = E{[X ±K − E(X)±K]2}
= E{[X − E(X)]2} = Var(X)
4) Var(X) = E{[X − E(X)]2} = E{X2 − 2XE(X) + [E(X)]2}
= E(X2)− 2[E(X)]2 + [E(X)]2 = E(X2)− [E(X)]2
Obs.: Em muitos casos essa propriedade facilita grandemente o ca´lculo da
variaˆncia.
Exerc´ıcios
62
1) Seja X uma v.a.c. com f.d.p
f(x) =
 k(x+ 3),para 1 ≤ x ≤ 80, para outros valores de x
Pede-se:
a) Determinar k
b) P (2 < X < 6)
c) P (X ≤ 3)
d) P (X ≥ 3)
e) E(X)
f) E(X2)
g) σ2x
2) Considere a distribuic¸a˜o de probabilidade da v.a.d. X, em que X= nu´mero
de pontos obtidos quando se lanc¸a um dado uma so´ vez. Pede-se:
a) Gra´fico da func¸a˜o de probabilidade
b) E(X) = µx
c) E(X2)
d) σ2x = E(X
2)− [E(X)]2
3) Sejam as varia´veis aleato´rias discretas:
X = nu´mero de tubos cuja reac¸a˜o na˜o ocorreu como o esperado na amostra
escolhida
Y = nu´mero de tubos cuja reac¸a˜o ocorreu com sucesso na amostra escolhida
3.1. Determine as distribuic¸o˜es de probabilidade de X e Y, considerando o experi-
mento com reposic¸a˜o e, em seguida, sem reposic¸a˜o.
3.2. Compare E[X] nos casos com e sem reposic¸a˜o.
3.3. Idem (3.2) para E[Y ], Var[X] e Var[Y ].
63
3.4. Compare E[X] + E[Y ] com o tamanho da amostra retirada. (n = 2)
4) Sabendo-se que sob certas condic¸o˜es, o ciclo vital da praga A, que atua
na cana-de-ac¸u´car, pode ser descrito por:
f(x) =
 6(x− x2), se x ∈ [0; 1]0, caso contra´rio
4.1. Verifique se f(x) pode ser estudada como uma func¸a˜o densidade de probabili-
dades.
4.2. Esboce um gra´fico para f(x).
4.3. Determine E[X] e Var[X].
4.4. Determine e identifique no gra´fico da func¸a˜o: a) P (0 < x < 1/4)
b) P (1/4 < x < 3/4)
c) P (x > 3/4).
Cap´ıtulo 4
Distribuic¸o˜es de probabilidade
4.1 Definic¸a˜o
Entre as varia´veis aleato´rias existem algumas que se destacam por sua im-
portaˆncia quanto a` representatividade de grande parte de fenoˆmenos biolo´gicos.
Assim, por exemplo, sabe-se que varia´veis como peso, altura, idade, etc teˆm
distribuic¸a˜o normal de probabilidade enquanto que o nu´mero de sementes germi-
nadas pode ter distribuic¸a˜o binomial; o nu´mero de insetos presos em uma armadilha
luminosa e o nu´mero de reac¸o˜es nocivas motivadas pela injec¸a˜o de certo soro podem
ter a distribuic¸a˜o de Poisson.
Sa˜o estudadas, a seguir, algumas distribuic¸o˜es de v.a. mais utilizadas. Den-
tre as v.a.d., sera˜o vistas:
- Distribuic¸a˜o de Bernoulli
- Distribuic¸a˜o Binomial
- Distribuic¸a˜o Poisson
Dentre as de v.a.c, podem ser consideradas:
- Distribuic¸a˜o Normal
- Distribuic¸a˜o de χ2-quadrado
- Distribuic¸a˜o t de Student
- Distribuic¸a˜o F de Snedecor
65
66
4.2 Distribuic¸a˜o de Bernoulli
4.2.1 Definic¸a˜o
Um experimento de Bernoulli e´ aquele ao qual podem ser associados apenas
dois resultados: sucesso (se acontecer o evento de interesse) ou fracasso (se na˜o
acontecer o evento de interesse). Tem-se, enta˜o, uma v.a.d. X que assume valor 1
caso ocorra o evento A (sucesso) e o valor 0 caso na˜o ocorra (insucesso ou fracasso),
com probabilidades, respectivamente, p = P (X = 1) e q = 1 − p = P (X = 0), isto
e´, a distribuic¸a˜o de probabilidade de X e´
X = x x1 = 0 x2 = 1
P (X = x) q = 1− p p
sendo que q + p = 1− p− p = 1.
Exemplos:
E1: Planta-se uma semente de feija˜o
A: a semente germina com probabilidade p
A¯: a semente na˜o germina com probabilidade 1− p
E2: Lanc¸a-se um dado honesto e observa-se o valor da face voltada para
cima
A: virar face 3, x2 = 1 e P(X = x2) =
1
6
A¯: virar face diferente de 3, x1 = 0 e P(X = x1) =
5
6
.
Observa-se que no experimento E1 a probabilidade “p” na˜o e´ conhecida “a
priori”. Em alguns casos desse tipo, obteˆm-se informac¸o˜es sobre estimativas de “p”
em reviso˜es de bibliografia ou estima-se “p” experimentalmente.
4.2.2 Me´dia, Variaˆncia e Desvio-Padra˜o
Sa˜o obtidos por
67
µx = µ = E(X) = Σ
2
i=1xiP (xi) = 0 · q + 1 · p = p
σ2 = Var(X) = E[X − E(X)]2 = E(X2)− [E(X)]2
E(X2) = Σ2i=1x
2
iP (xi) = 0
2 · q + 12 · p = p
σ2 = p− p2 = p(1− p) = p · q
σx =
√
σ2x =
√
pq.
Em E2 tem-se
µx = 0.
5
6
+ 1.
1
6
=
1
6
σ2x =
(
0− 1
6
)2
.
5
6
+
(
1− 1
6
)2
.
1
6
=
1
6
(
1− 1
6
)2
=
5
36
σx =
√
5
36
=
√
5
6
4.3 Distribuic¸a˜o Binomial
4.3.1 Definic¸a˜o
Seja uma sequeˆncia de n ensaios independentes e repetidos de Bernoulli.
Enta˜o se a v.a. X representa o nu´mero de sucessos nesses n ensaios, diz-se que X
tem distribuic¸a˜o binomial de probabilidades com paraˆmetros n e p e com func¸a˜o de
probabilidade dada por:
P (X = x) = Cxnp
xqn−x
Veˆ-se que P (X = x) e´ f.d.p., pois
a) P (X = x) ≥ 0,∀x
b)
∑
P (X = x) =
n∑
x=0
Cxnp
xqn−x = C0np
0qn + C1np
1qn−1 + . . .+ Cnnp
nq0
= (p+ q)n = 1
Exemplo:
Um recipiente conte´m um grande nu´mero de sementes de feija˜o para as
quais o fornecedor garante um poder de germinac¸a˜o de 0,8. Se 5 dessas sementes sa˜o
plantadas, determine:
68
a) A distribuic¸a˜o de probabilidades para a varia´vel
X: nu´meros de sementes germinadas.
Distribuic¸a˜o de Probabilidade de X
X = xi P (X = xi) P (X = xi)
0 0,00032 P (0) = C50 (0, 8)
0(0, 2)5
1 0,00640 P (1) = C51 (0, 8)
1(0, 2)4
2 0,05120 P (2) = C52 (0, 8)
2(0, 2)3
3 0,20480 P (3) = C53 (0, 8)
3(0, 2)2
4 0,40960 P (4) = C54 (0, 8)
4(0, 2)1
5 0,32768 P (5) = C55 (0, 8)
5(0, 2)0
b) A probabilidade de que germinem no ma´ximo 4 sementes.
P [X ≤ 4] = P (0) + P (1) + P (2) + P (3) + P (4) = 0, 67232 ou
P [X ≤ 4] = 1− P (X = 5) = 1− 0, 32768 = 0, 67232.
4.3.2 Me´dia, Variaˆncia e Desvio-Padra˜o
Como X v.a.d. binomial nada mais e´ do que a soma de n varia´veis indepen-
dentes do tipo Bernoulli, tem-se:
µx = µ = E(X) = ΣxP (X = x) = np
σ2 = E[X − E(X)]2 = E(X2)− [E(X)]2 = npq
σx =
√
σ2x =
√
npq
No exemplo dado
µx = 5 · 0, 8 = 4 germinac¸o˜es
σ2x = 5 · 0, 8 · 0, 2 = 0, 8 germinac¸o˜es ao quadrado
σx =
√
0, 8 = 0, 894 germinac¸o˜es.
69
No mesmo exemplo, ainda suponha que o agricultor precisa obter 100 mudas.
Qual o nu´mero mı´nimo de sementes que ele deve plantar? Qual a variabilidade do
nu´mero de sementes germinadas?
µ = np⇒ 100 = n · 0, 8⇒ n = 125
σ2x = npq = 125 · 0, 8 · 0, 2 = 20
σx = 4, 47 ' 5
Exerc´ıcios
1) Certo tratamento quando aplicado a bovinos com certa enfermidade cura
60% dos casos. Tendo dois bovinos sob esse tratamento, qual a probabilidade:
a) de que os dois morram
b) de que os dois sejam curados
c) de que um seja curado e o outro na˜o.
Qual o nu´mero me´dio de curas e qual sua variabilidade?
Distribuic¸a˜o de Probabilidade de X
X = xi 0 1 2
P (X = xi) 0,16 0,48 0,36
em que X: nu´mero de sobreviventes, p = 0, 6, q = 1− 0, 6 = 0, 4 e n = 2.
Soluc¸a˜o:
a) P (X = 0) = C02 (0, 6)
0(0, 4)2 = 0, 16
b) P (X = 2) = C22 (0, 6)
2(0, 4)1 = 0, 48
c) P (X = 1) = C12 (0, 6)
1(0, 4)1 = 0, 36
µ = np = 2 · 0, 6 = 1, 2 curas
σ2 = npq = 2 · 0, 6 · 0, 4 = 0, 48 curas2
σ =
√
0, 48 = 0, 6928 curas.
70
2) Certa doenc¸a dada em pintos tem uma fatalidade de 30%. Em 6 casos
dessa doenc¸a, estabelec¸a a distribuic¸a˜o de probabilidade da v.a
X: nu´mero de sobreviventes
Baseado nessa distribuic¸a˜o, calcule:
a) a probabilidade de que todos sobrevivam
b) a probabilidade de que nenhum sobreviva
c) a probabilidade de que os dois sobrevivam
d) a probabilidade de que pelo menos dois sobrevivam
e) a probabilidade de que no mı´nimo quatro morram
f) o nu´mero me´dio de sobreviventes
g) a variaˆncia e o desvio-padra˜o do nu´mero de sobreviventes.
h) Se um produtor de frangos quer obter no final de um determinado per´ıodo
150 frangos, baseado na incideˆncia dessa doenc¸a, qual o nu´mero mı´nimo de pintos
que ele deve comprar? Qual a variabilidade desse nu´mero?
Distribuic¸a˜o de Probabilidade de X
X = xi 0 1 2 3 4 5 6
P (X = xi) 0,00073 0,01021 0,05954 0,18522 0,32414 0,30253 0,11764
p = 0, 7 q = 0, 3 n = 6
Soluc¸a˜o:
a) P (X = 6) = 0, 11764
b) P (X = 0) = 0, 00073
c) P (X = 2) = 0, 05954
d) P(X ≥ 2) = 1− P (X = 0)− P (X = 1) = 0, 98906
e) P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) = 0, 07048
f) µ = np = 6 · 0, 7 = 4, 2
g) σ2 = npq = 6 · 0, 7 · 0, 3 = 1, 26 σ = √1, 26 = 1, 12
h) 150 = n · 0, 7⇒ n = 214 frangos
σ2 = npq = 214 · 0, 7 · 0, 3 = 45⇒ σ = 6, 7.
71
4.4 Distribuic¸a˜o de Poisson
4.4.1 Definic¸a˜o
Existem experimentos, nos quais o nu´mero de sucessos e´ conhecido ou facil-
mente determina´vel mas o nu´mero de insucessos na˜o pode ser determinado. E´ o que
acontece quando se tem interesse no nu´mero de insetos presos em uma armadilha
luminosa ou no nu´mero de a´caros que atacam determinada cultura ou no nu´mero de
brotos por explante.
SeX e´ a varia´vel aleato´ria discreta tal que sua distribuic¸a˜o de probabilidades
e´ do tipo
P (X = x) =
λxe−λ
x!
, x = 0, 1, 2, . . . , λ > 0
enta˜o, X tem distribuic¸a˜o de Poisson com paraˆmetro λ (λ e´ o nu´mero me´dio de
sucessos). Verifica-se que P (X = x) representa uma leg´ıtima distribuic¸a˜o de proba-
bilidade, pois:
a) P (X = x) ≥ 0, ∀x
b)
∑∞
x=0
λxe−λ
x!
= e−λ
∞∑
x=0
λx
x!
= e−λ
[
1+
1
1!
λ+
1
2!
λ2+
1
3!
λ3+. . .
]
= e−λeλ = 1.
4.4.2 Me´dia, Variaˆncia e Desvio-padra˜o
Sa˜o obtidos por:
µX = E(X) =
∞∑
x=0
x
λxe−λ
x!
= e−λ
∞∑
x=1
x
λx−1λ
x(x− 1)! = e
−λ
∞∑
x=1
λx−1
(x− 1)! .λ = e
−λ.eλ.λ = λ
σ2X = E(X
2)− [E(X)]2
E(X2) =
∞∑
x=0
x2
e−λλx
x!
=
∞∑
x=1
x2
e−λλx
x!
=
∞∑
x=1
x
e−λλx
(x− 1)! =
∞∑
x=1
(x− 1 + 1) e
−λλx
(x− 1)!
=
∞∑
x=1
e−λλx
(x− 1)! +
∞∑
x=1
(x− 1) e
−λλx
(x− 1)! = λ+
∞∑
x=2
x
e−λλx
(x− 2)! = λ+ λ
2
σ2X = λ+ λ
2 − λ2 = λ
σX =
√
σ2X =
√
λ.
72
Exemplo:
Em um determinado hospital veterina´rio existem em me´dia 3 diagno´sticos
de ca˜es raivosos. Qual a probabilidade de que ocorram 2 diagno´sticos no pro´ximo
meˆs?
P (X = 2) =
32.e−3
2!
= 0, 2240.
4.4.3 Relac¸a˜o entre as distribuic¸o˜es Binomial e de Poisson
Na distribuic¸a˜o Binomial se n e´ grande, mas a probabilidade p de ocorreˆncia
de um evento e´ proxima de zero, de modo que q = 1− p, e´ pro´ximo de 1, o evento se
diz um evento raro. Na pra´tica, considera-se como raro um evento em que o nu´mero
de provas e´ no mı´nimo 50 e np e´ menor do que 5. Em tais casos, a distribuic¸a˜o
binomial e´ muito bem aproximada pela distribuic¸a˜o de Poisson com λ = np. Tal
resultado ja´ era de se esperar pois, fazendo λ = npn tem-se pn =
λ
n
e se λ e´ pequeno
e n tende para infinito, enta˜o, p→ 0 e q → 1.
Considerando-se a func¸a˜o de distribuic¸a˜o de probabilidade da varia´vel
aleato´ria discreta X binomial
P (X = x) = Cxnp
xqn−x =
n!
x!(n− x)!p
x(1− p)n−x
=
n(n− 1)(n− 2) . . . (n− x+ 1)
x!
px(1− p)n−x
e, fazendo-se p =
λ
n
, tem-se:
P (X = x) =
n(n− 1)(n− 2) . . . (n− x+ 1)
x!
(
λ
n
)x(
1− λ
n
)n−x
=
n(n− 1)(n− 2) . . . (n− x+ 1)
nx
λx
x!
(
1− λ
n
)n(
1− λ
n
)−x
= 1
(
1− 1
n
)(
1− 2
n
)
. . .
(
1− x− 1
n
)
λx
x!
(
1− λ
n
)n(
1− λ
n
)−x
Quando n→∞, enquanto x e λ permanecem constantes, tem-se:
limn→∞ 1
(
1− 1
n
)(
1− 2
n
)
. . .
(
1− x− 1
n
)
= 1,
73
limn→∞
(
1− λ
x
)n
= 1 e limn→∞
(
1− λ
n
)n
= e−λ.
Portanto, sob as condic¸o˜es limites dadas, tem-se:
B(X;n, p)⇒ e
−λλx
x!
,
para X = 0, 1, 2, . . ., isto e´,
lim
n→∞
P (x = x) =
e−λλx
x!
que e´ a func¸a˜o densidade de probabilidade de uma varia´vel aleato´ria discreta com
distribuic¸a˜o de Poisson.
Exemplo:
A probabilidade de um indiv´ıduo sofrer uma reac¸a˜o nociva resultante da
aplicac¸a˜o de uma determinada vacina e´ 0,001. Determinar a probabilidade de entre
2000 indiv´ıduos:
a)Nenhum sofrer reac¸a˜o
b) Mais do que 2 sofrerem a reac¸a˜o
Soluc¸a˜o
a) Por Poisson
λ = np = 2000.0, 001 = 2
P (X = 0) = e−2
20
0!
=
1
e2
= 0, 1353
Pela Binomial
P (X = 0) = C02000(0, 001)
0(0.999)2000 = 0, 1353
b) Por Poisson
P (X > 2) = 1− e−22
0
0!
− e−22
1
1!
− e−22
2
2!
= 1− 0, 1353− 0, 2706 = 0, 3235
Pela Binomial
74
P (X = 1) = C12000(0, 001)
1(0.999)1999 = 0, 2707
P (X = 2) = C22000(0, 001)
1(0.999)1998 = 0, 2708
P (X > 2) = 1− 0, 1352− 0, 2707− 0, 2708 = 0, 3233.
4.5 Distribuic¸a˜o Normal
4.5.1 Introduc¸a˜o
A distribuic¸a˜o normal tem sido considerada como a mais importante das
distribuic¸o˜es de varia´vel aleato´ria cont´ınua e, e´ ba´sica para o desenvolvimento de
testes estat´ısticos tais como, o teste “t”, o teste “F” e o teste “χ2” e outros.
Dentro do campo de Cieˆncias sa˜o consideradas varia´veis normalmente dis-
tribu´ıdas as varia´veis: altura, peso, idade, produc¸a˜o, total de leite, quantidade de
rac¸a˜o consumida, diaˆmetro a` altura do peito, biomassa, etc.
A equac¸a˜o matema´tica da curva normal foi desenvolvida por De Moivre em
1773 e, posteriormente, Gauss (1775-1855) tambe´m obteve a equac¸a˜o de um estudo
de erros em medidas repetidas da mesma varia´vel, e devido a ele, ela e´ chamada
tambe´m distribuic¸a˜o de Gauss.
4.5.2 Definic¸a˜o
Uma varia´vel aleato´ria cont´ınua X tem distribuic¸a˜o normal se sua func¸a˜o
densidade de probabilidade for dada por:
f(x) =
1
σ
√
2pi
e
−
(x− µ)2
2σ2 ,−∞ < x <∞
em que µ e σ sa˜o paraˆmetros que devem satisfazer a`s condic¸o˜es −∞ < x < ∞ e
σ > 0. Ale´m disso, sera´ provado que µ e σ correspondem, respectivamente, a` me´dia
e ao desvio-padra˜o da distribuic¸a˜o, e enta˜o, representa-se X ∼ N(µ, σ2).
Como f(x) e´ uma func¸a˜o densidade de probabilidade, enta˜o,
a)f(x) ≥ 0, ∀x, pois 1
σ
√
2pi
> 0 e e
−
(x− µ)2
2σ2 > 0
75
b)
∫∞
−∞ f(x)dx = 1
Prova: ∫ ∞
−∞
f(x)dx =
1
σ
√
2pi
∫ ∞
−∞
e
−
(x− µ)2
2σ2 dx,
fazendo-se
x− µ
σ
= z ⇒ dx = σdz, quando x → ∞ ⇒ z → ∞ e x → −∞ ⇒ z →
−∞.
Logo,
∫ ∞
−∞
f(x)dx =
1
σ
√
2pi
∫ ∞
−∞
e
−
z2
2 σdz =
1√
2pi
∫ ∞
−∞
e
−
z2
2 dz
e como g(z) = e
−
z2
2 e´ uma func¸a˜o par, pois g(z) = g(−z),
tem-se: ∫ ∞
−∞
f(x)dx =
1√
2pi
2
∫ ∞
0
e−
z2
2 dz.
Fazendo-se
z2
2
= t ⇒ 2zdz
2
= dt ⇒ dz = t
−1/2
√
2
dt, quando z = 0 ⇒ t = 0 e
z →∞⇒ t→∞.
Logo,∫ ∞
−∞
f(x)dx =
1√
2pi
2√
2
∫ ∞
0
t−1/2e−tdt =
1√
pi
∫ ∞
0
t−1/2e−tdt =
1√
pi
Γ(
1
2
) =
1√
pi
√
pi = 1
pois Γ(α+ 1) =
∫∞
0
xαe−xdx. Portanto,∫ ∞
−∞
f(x)dx = 1.
4.5.3 Paraˆmetros: me´dia, variaˆncia e desvio-padra˜o
Se X e´ uma v.a.c. com distribuic¸a˜o normal de paraˆmetros µ e σ, isto e´,
X ∼ N(µ, σ2), enta˜o, X tem como me´dia µ e como variaˆncia σ2.
Demonstrac¸a˜o:
a) E(X) =
1
σ
√
2pi
∫ ∞
−∞
xe
−
(x− µ)2
2σ2 dx
76
Fazendo-se
x− µ
σ
= z ⇒ x = σz + µ ⇒ dx = σdz, quando x → ∞ ⇒
z →∞ e x→ −∞⇒ z → −∞. Enta˜o,
E(X) =
1
σ
√
2pi
∫ ∞
−∞
(σz + µ)e
−
z2
2 σdz
= σ
1√
2pi
∫ ∞
−∞
ze
−
z2
2 dz + µ
1√
2pi
∫ ∞
−∞
e
−
z2
2 dz.
Mas,
∫∞
−∞ ze
−
z2
2 dz = 0, pois g(z) = ze
−
z2
2 e´ func¸a˜o ı´mpar, isto e´, g(z) =
−g(−z) e 1√
2pi
∫ ∞
−∞
e
−
z2
2 dz = 1. Logo,
E(X) = µ.
b) µ2 = E[(X − µ)2] = 1
σ
√
2pi
∫ ∞
−∞
(x− µ)2e−
(x− µ)2
2σ2 dx
Fazendo-se
x− µ
σ
= z ⇒ x − µ = σz ⇒ dx = σdz, quando x → ∞ ⇒ z →
∞ e x→ −∞⇒ z → −∞. Logo,
E[(X − µ)2] = 1
σ
√
2pi
∫ ∞
−∞
σ2z2e
−
z2
2 σdz
=
σ2√
2pi
∫ ∞
−∞
z2e
−
z2
2 dz
=
2σ2√
2pi
∫ ∞
0
z2e
−
z2
2 dz
pois, g(z) = z2e
−
z2
2 e´ func¸a˜o par, isto e´, g(z) = g(−z).
Fazendo-se
z2
2
= t⇒ z =
√
2t1/2 ⇒ dz =
√
2
1
2
t−1/2dt =
1√
2
t−1/2dt, quando
z = 0⇒ t = 0 e z →∞⇒ t→∞. Logo,
E[(X − µ)2] = 2σ
2
√
2pi
∫ ∞
0