Buscar

Apostila Probabilidade e Distribuição de Probabilidade

Prévia do material em texto

PROBABILIDADE 
 
DISTRIBUIÇÃO DE PROBABILIDADE 
 
 
 
 
 
 
 
 
 
 
 
1 
 
 
 
CAPÍTULO I 
1 - INTRODUÇÃO 
 
É conveniente dispormos de uma medida que exprima a incerteza presente em afirmações tais 
como: “É possível que chova amanhã” ou “Não há chance de vitória”, em termos de uma escala 
numérica que varie do impossível ao certo. Esta medida é a probabilidade. 
O conceito de probabilidade é fundamental para o estudo de situações onde os resultados são 
variáveis, mesmo quando mantidas inalteradas as condições de sua realização. Por exemplo, jogando-
se um dado, tem-se seis resultados possíveis de cada vez; a observação do sexo das crianças nascidas 
em uma maternidade durante um mês conduz a dois resultados possíveis em cada caso – menino ou 
menina. Em ambos os casos, embora não sejamos capazes de afirmar de antemão que resultado 
particular ocorrerá, temos condições de descrever o conjunto de todos os resultados possíveis do 
experimento. A sua repetição continuada mostra uma certa regularidade nos resultados, o que permite 
estudar o experimento, apesar da incerteza nele presente. Assim sendo, no estudo dos fenômenos não-
determinísticos ou aleatórios, verifica-se a necessidade de descrever tal fenômeno por um modelo 
matemático que permita explica-lo da melhor forma. Tais modelos são os chamados modelos 
probabilísticos ou distribuições de probabilidades. 
 
Exemplo. Deseja-se estudar as proporções de ocorrência das faces de um dado. O procedimento prático 
seria lança o dado um certo número n de vezes e contar o número ni de vezes que ocorre cada face i, 
i=1, 2, 3, 4, 5, 6. As proporções ni/n determinam a distribuição de freqüências do fenômeno. 
Outra maneira de construir a distribuição de freqüências é através das suposições teóricas: 
a) A primeira suposição é que só podem ocorrer 6 tipos de faces; 
b) a segunda suposição é admitir que todas as faces tem a mesma probabilidade (chance) de 
ocorrência, ou seja, o dado é perfeitamente equilibrado (não-viciado). 
Nestas condições, com as suposições feitas, têm-se o seguinte modelo teórico de freqüências 
para as faces de um dado é: 
Face 1 2 3 4 5 6 Total 
Freqüência teórica p1=1/6 p2=1/6 p3=1/6 p4=1/6 p5=1/6 p6=1/6 
6
i=1pi=1 
 
2 - EXPERIMENTO ALEATÓRIO, ESPAÇO AMOSTRAL E EVENTO 
 
Do exemplo acima, pode-se verificar que todo experimento ou fenômeno que envolve um 
elemento casual (aleatório) terá um MODELO PROBABILÍSTICO especificado quando se 
estabelece: 
- um ESPAÇO AMOSTRAL: será denotado por S e consiste de todos os resultados possíveis de um 
experimento. 
- um EVENTO é qualquer subconjunto de resultados possíveis. Será denotado por letras maiúsculas 
que representam os subconjuntos do espaço amostral. Assim, o próprio S é um evento, chamado 
evento certo e o conjunto vazio, , também é um evento, chamado evento impossível. 
- uma PROBABILIDADE, que será denotada por P(x) ou chance de ocorrência do evento x. É um 
valor que varia entre 0 e 1 e a soma das probabilidades de todos os resultados possíveis do experimento 
deve ser igual a 1. É possível encontrar a probabilidade, P(A), de qualquer subconjunto ou evento A  
S. 
Exemplos: 
i) Lançar uma moeda e observar a face voltada para cima. Tem-se, neste caso, dois resultados 
possíveis: cara e coroa. Então, o espaço amostral é o conjunto S = {cara, coroa}. 
2i) Realizam-se a contagem do número de bactérias de um certo tipo em uma câmara de contagem. 
Tem-se, então, S = {0, 1, 2, 3, ...}. 
2 
 
 
 
3i) Uma moeda é lançada duas vezes. Se C indica cara e R indica coroa, então, um espaço amostral 
será: S = {w1, w2, w3, w4} onde w1 ={CC}, w2={CR), w3 = {RC} e w4= {RR}. 
4i) Considere o experimento que consiste em observar o tempo de vida de uma lâmpada. Um espaço 
amostral conveniente é: S = { t; t > 0}, isto é, o conjunto de todos os números reais não negativos. Se 
A é o evento “o tempo de vida da lâmpada é inferior a 20 minutos”, então, A ={ t; 0 < t < 20}. 
Este é um exemplo de espaço amostral contínuo, pois a variável “t” é contínua. 
 
Exercício 
1. Descreva os espaços amostrais para os experimentos abaixo relacionados: 
a)- Jogar um dado e observar o número mostrado na face de cima. S = {1,2,...,6} 
b) Jogar uma moeda 8 vezes e observar o número de caras obtido. S = {0,1,2,...,8} 
c) Contar o número de peças defeituosas produzidas num período de 24hs em uma linha de produção. 
S = {0,1,2,...,n} 
d) Jogar duas moedas e observar o resultado. S = { cc, ck, kc, kk } 
e) Num certo bairro, indagar a uma família se ela costuma utilizar-se de algum programa de 
alimentação popular. S = { s,n } 
f) Retirar uma fusível de um lote e medir seu tempo de vida antes que se queime. S = {t; t>0} 
 
2.1 - OPERAÇÕES COM EVENTOS 
 
Seja S um espaço amostral qualquer e sejam A e B subconjuntos ou eventos de S. Assim tem-se: 
 União (): o evento de AB é formado pelos pontos do espaço amostral que pertence a pelo 
menos um dos eventos, ou seja, AB acontece quando pelo menos um dos 
eventos ocorre. 
 Interseção (): o evento AB é formado pelos pontos do espaço amostral que pertencem 
simultaneamente aos dois eventos, ou seja, AB acontece quando A e B 
ocorrem simultaneamente. 
Obs.: Se A e B não têm elementos em comum, então são mutuamente exclusivos 
se não podem ocorrer simultaneamente. 
 Complementar (c): o evento A complementar (Ac) é formado elementos que não estão em A. 
 
Exemplo 
Lançam-se duas moedas. Sejam A={o evento de sair duas faces iguais} 
B={o evento de sair a primeira moeda cara} 
S={(ca,ca) ; (ca,co) ; (co,ca) ; (co,co)}; A={(ca,ca) ; (co,co)}; 
B={(ca,ca) ; (ca,co)} 
Determine os eventos: 
a) AB={(ca,ca) ; (ca,co) (co,co)} 
b) AB={(ca,ca)} 
c) A
c
={(ca,co) ; (co,ca)} 
 
3 - PROBABILIDADE 
3.1) DEFINIÇÃO CLÁSSICA 
Seja A um evento qualquer de um espaço amostral S. Se os eventos simples de S têm todos a 
mesma probabilidade de ocorrência, ou seja, são equiprováveis, podemos calcular a probabilidade do 
evento A como: 
No exemplo 1, lançamento de um dado, não havia razão para se dizer que uma das faces tinha 
preferência sobre as outras, pois uma das suposições era de que qualquer face tinha a mesma 
probabilidade de ocorrer. Assim se A é o evento ocorrer face 6, a probabilidade clássica de A, é dada 
por: 
3 
 
 
 
)S(N
)A(N
)A(P 
. 
em que 
N(A), é o número de elementos de A e N(S) é o número de elementos de S. 
 
Exemplo: Considere o lançamento de um dado. Seja A o evento que ocorrerá se, e somente se, um 
número maior que 4 aparecer, isto é, A={5, 6}. 
S={1, 2, 3, 4, 5, 6} 
Consequentemente, P(A)=2/6. 
 
3.2) PROBABILIDADE E FREQUÊNCIA RELATIVA 
Observou-se que a definição clássica de probabilidade só se aplica a espaços amostrais onde 
os pontos amostrais são igualmente possíveis. Este é o caso da maioria das aplicações das 
probabilidades aos jogos de azar, área que, precisamente, suscitou os primeiros problemas práticos pela 
teoria das probabilidades. Estes mesmos jogos, entretanto, repetidos inúmeras vezes em condições 
idênticas, levaram a considerar a probabilidade de um evento como a freqüência relativa. Se A é um 
evento de interesse, a probabilidade de A é dada por: 
oexperimentdorepetiçõesdetotalNúmero
ocorreuAquevezesdeNúmero
)A(P
. 
Exemplo: 
Numa produção de 660 placas de vídeo, o controle de qualidade detectou 140 placas de vídeo fora dos 
padrões. Determine a probabilidade de se obter uma placa de vídeo fora dos padrões. 
A={evento de obter uma placa de vídeo fora dos padrões} 
%,
Número
deNúmero
)A(P 2121
660
140
 vídeode placas de total
padrõesdos fora vídeode placas 

. 
 
3.3 - AXIOMAS E PROPRIEDADES DA PROBABILIDADE 
3.3.1 - AXIOMAS 
Independentemente de como são obtidas, usando a definição clássica ou a frequência relativa, 
as probabilidades atendem a alguns axiomas. Formalmente, seja um experimento aleatório e um espaço 
amostral (S) associado a ele. A cada evento A associa um número real denominado probabilidade de 
ocorrência de A (P(A)), que deve satisfazer aos seguintes axiomas: 
i) 0 P(A)  1 (observe que P(A)  0) 
ii) P(S)=1 “evento certo” 
iii) Se A1, A2, ... , An são eventos mutuamente exclusivos, então 
)A(P...)A(P)A(P)A(P...)A(P)A(P nn  2121
. 
3.3.2 - PROPRIEDADES DA PROBABILIDADE 
 
i) P() = 0 “evento impossível” 
ii) P(A
c 
) = 1 - P(A) 
iii) P(AB) = P(A) + P(B) - P(AB). Se AB = , então, P(AB) = P(A) + P(B). 
 
Exercício 
1. Se P(A)=0,5; P(B)=0,25 e A e B mutuamente exclusivos, determine: 
a) P(A
c
)= 1 - P(A)=0,5 
 
b) P(AB)= P(A) + P(B)= 0,75 
 
c) P(AB)=0 
4 
 
 
 
4 - PROBABILIDADE CONDICIONAL 
A probabilidade de um evento A ocorrer, sabendo que o evento B já ocorreu, é chamada de 
“probabilidade condicional de A dado B”. Essa probabilidade é representada por P(A | B) e calculada 
por: 
)B(P
)BA(P
)A(P

B |
 
 
Exemplo: 
Uma amostra de 6800 pessoas de uma determinada população foi classificada quanto à cor dos olhos e 
à cor dos cabelos conforme tabela a seguir. 
Tabela 5.1 - Distribuição conjunta de frequências da cor dos olhos e dos cabelos. 
 
 
Determine a probabilidade de selecionar uma pessoa que tem olhos azuis sabendo que possui cabelos 
castanhos. 
%,
)(P
)O(P
)O(P azuisazuis 6630
2632
807
C
C
C |
castanhos
castanhos
castanhos 


 
 
5 - INDEPENDÊNCIA 
 
Dois eventos são independentes quando a ocorrência de um não interfere na probabilidade de 
ocorrência do outro, ou seja, P(A | B) = P(A) ou P(B | A) = P(B). 
Dois eventos A e B são independentes se e só se P(AB) = P(A).P(B). 
 
Exemplo 
Suponha que o seguinte quadro represente uma possível divisão dos alunos matriculados nos cursos de 
Administração, biologia, matemática e computação. 
Curso 
Sexo 
Total 
Homens (M) Mulheres (F) 
Administração (A) 80 50 130 
Biologia (B) 75 57 132 
Matemática (Ma) 35 21 56 
Computação (C) 90 48 138 
Total 280 176 456 
Determine a probabilidade de selecionar um aluno: 
a) do curso de biologia e do sexo masculino 
P(B  M) = 75/456 = 0,164, logo não são independentes. 
b) do curso de biologia e do curso de computação 
P(B  C) = 0, não tem aluno que faça os dois cursos, logo são independentes. 
c) do curso de biologia ou do sexo masculino 
P(B  M) = P(B)+P(M) - P(B  M) = 132/456 + 280/456 - 75/456 = 337/456=73,90%. 
5 
 
 
 
6 - TEOREMA DE BAYES 
 
Partição do Espaço Amostral 
Os eventos C1, C2, ..., Ck formam uma partição do espaço amostral se eles não tem interseção 
entre si e se sua união e o espaço amostral, ou seja, 
CiCj= para i≠j 
C1C2∙∙∙Cn=S 
 
Teorema de Bayes 
Suponha que os eventos C1, C2, ..., Ck formem uma partição do espaço amostral e que suas 
probabilidades sejam conhecidas. Suponha ainda que para um evento A, se conheçam as 
probabilidades condicionais P(A | Ci) para todo i=1,2,...,k. Então, para qualquer j, 
  


n
j j
i
i
)A(P)C(P
)A(P)C(P
)C(P
1 j
i
C|
C|
A|
 
para todo i=1, 2, 3, ∙∙∙, n 
 
Exemplo 
Um fabricante de sorvetes recebe 20% de todo o leite que utiliza de uma fazenda F1, 30% de outra 
fazenda F2 e 50% da fazenda F3. Houve uma fiscalização e observou-se que 20% do leite produzido 
por F1 está com adição de água, enquanto que para F2 e F3 a proporção era de 5% e 2%. Na indústria 
de sorvetes os galões de leite são armazenados em um refrigerador sem identificação das fazendas. 
Determine a probabilidade de que a amostra adulterada tenha sido obtida do leite fornecido pela 
fazenda F1. 
 
 
)A(P)F(P)A(P)F(P)A(P)F(P
)A(P)F(P
)F(P
332211
11
1
F|F|F|
F|
A|



 
02050050302020
2020
A|1
,,,,,,
,,
)F(P



 
%,
,
,
)F(P 5461
0650
040
A|1 
 
 
 
 
 
 
6 
 
 
 
CAPÍTULO II 
 
1 - VARIÁVEIS ALEATÓRIAS 
 
Muitos experimentos produzem resultados não-numéricos. Antes de analisá-los, é conveniente 
transformar seus resultados em números, o que é feito através da variável aleatória (v.a.), que é uma 
regra de associação de um valor numérico a cada ponto do espaço amostral. 
Exemplo: 
No experimento do lançamento de duas moedas, o espaço amostral é: 
 = {CC, CK, KC, KK}. 
Seja X o número de caras (A). A cada evento do espaço amostral (S) pode-se associar um número, 
conforme abaixo: 
Evento CC CK KC KK 
 X 2 1 1 0 
Poderia também ter sido considerado o número de coroas (K). Os valores de X, na mesma 
ordem, seriam então 0, 1, 1, 2. A variável X é uma variável aleatória (v.a.). 
O passo fundamental para se entender uma v.a. É associar a cada valor a sua probabilidade, 
obtendo o que se chama uma distribuição de probabilidades, que fica caracterizada pelos valores da 
v.a. X e pela regra, ou função que associa a cada valor uma probabilidade. Esta função, chamada 
função de probabilidade, é representada por f(x). No exemplo acima, tem-se: 
X 2 1 0 Total 
f(x) 1/4 1/2 1/4 1 
 
Para estudar e tomar decisões em situações onde está presente a incerteza, temos basicamente 
de identificar a v.a. de interesse e obter sua distribuição de probabilidades {ex. Normal, Poisson, 
Binomial. Exponencial}a partir daí obter os elementos necessários para a tomada de decisão. 
Para melhor entender a abrangência do conceito de v.a., é necessário proceder por etapas. 
Assim, nas próximas seções, será estudar características gerais das distribuições das v. a. e a seguir será 
visto as distribuições mais importantes, que descrevem um grande número de fenômenos aleatórios. 
 
2 - DISTRIBUIÇÃO DISCRETA DE PROBABILIDADE 
Definição: Uma distribuição discreta de probabilidades de uma v.a. X é uma relação, ou 
função dos distintos valores xi de X juntamente com as probabilidades associadas p(xi). 
 Para que uma função p(x) seja uma distribuição de probabilidade, é necessário que: 
1) p(x)  0 
2)  p(x) =1 (somatório para todos os valores de x do domínio de X) 
 
Exemplo 
1. Considere a soma dos pontos que aparecem no lançamento de dois dados. Os valores possíveis da 
soma X, com suas probabilidades associadas p(x)=P(X=x) são: 
X 2 3 4 5 6 7 8 9 10 11 12 
p(x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 
Determine a probabilidade de: 
a) P(X5) = P(X=2)+ P(X=3)+ P(X=4)+ P(X=5)= 1/36+2/36+3/36+4/36 =10/46 
b) P(X>8) = P(X=9)+ P(X=10)+ P(X=11)+ P(X=12) = 4/36+3/36+2/36+1/36 = 10/36 
c) P(6X8) = P(X=6)+ P(X=7)+ P(X=8)= 5/36+6/36+5/36 = 16/36. 
 
7 
 
 
 
2.1 - MÉDIA OU ESPERANÇA MATEMÁTICA 
As distribuições de probabilidade são modelos teóricos onde as probabilidades dos valores 
assumidos pela v.a. podem ser interpretados como freqüências relativas em um número sempre 
crescente de provas, ou seja, como limites de frequências relativas. 
Pode-se, pois, definir, para as distribuições de probabilidade, as mesmas MEDIDAS DE 
TENDÊNCIA CENTRAL E DE DISPERSÃO utilizadas nas distribuições de frequência. 
Assim como foi definido a média de uma distribuição de freqüências como a soma dos 
produtos dos diversos valores observados pelas respectivas freqüências relativas, é natural definir 
agora a média de uma v. a, ou de sua distribuição de probabilidades, como a soma dos produtos dos 
diversosvalores de xi da v. a. pelas respectivas probabilidades p(xi). 
 A MÉDIA de uma v.a. X é também chamada VALOR ESPERADO, ou ESPERANÇA 
MATEMÁTICA, ou simplesmente ESPERANÇA DE X. É representada por E(X) e se define como: 
E(X) = xip(xi) 
estendendo-se o somatório a todos os valores possíveis de X. É uma média ponderada dos xi, em que 
os pesos são as probabilidades associadas. 
Exemplo 
Determine a esperança matemática da distribuição de probabilidade da soma dos pontos que aparecem 
no lançamento de dois dados. 
X 2 3 4 5 6 7 8 9 10 11 12 
p(x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 
 
E(X) =
36
1
12
36
2
11
36
3
10
36
4
9
36
5
8
36
6
7
36
5
.6
36
4
.5
36
3
.4
36
2
.3
36
1
.2 
 
= 7,00. 
 
2.1.1 - PROPRIEDADES DA ESPERANÇA MATEMÁTICA 
Se a e b são constantes e X uma v. a., então: 
i) E(a) = a 
2i) E(bX) = b E(X) 
3i) E(X + a) = E(X) + a 
4i) E(a + bX) = a + b E(X) 
 
Exemplo 
Um pronto socorro mantém registros dos atendimentos de acidentados diários de certa cidade e 
determinaram a probabilidade acontecer acidente na semana. O quadro a seguir dá o número X de 
acidentes em uma semana e a respectiva probabilidade p(x): 
Número X 0 1 2 3 4 5 
Probabilidade f(x) 0,1 0,1 0,2 0,3 0,2 0,1 
 
a) determine o número esperado dos acidentes de uma semana. 
O número esperado de acidentes em uma semana é: 
E(X) = (0).(0,1) + (1)(0,1) + (2)(0,2) + (3)(0,3) + (4)(0,2) + (5)(0,1) = 2,70. 
b) suponha que o registro do pronto socorro esteja errado e o número de acidentes correto é o dobro 
para cada valor descrito no quadro acima. Então, determine média. 
Para calcular a média utilizar a propriedade E(bX) = b E(X), isto é E(2X) = 2 E(X)=2∙2,7=5,4 
Ou calcule a média novamente 
 E(X) = (0).(0,1) + (2)(0,1) + (4)(0,2) + (6)(0,3) + (8)(0,2) + (10)(0,1) = 5,40 
 
 
8 
 
 
 
2.2 - VARIÂNCIA 
Assim como a média é uma medida de centro de uma v. a., é natural que procure-se por uma 
medida da dispersão dessa variável em relação à média. Essa medida é a variância, a ser 
representada por 2 e definida por: 
2 = Var(X) = E[(X-)2] 
no entanto, expressão abaixo é mais simples para calcular a variância: 
Var(X) = E(X
2
) - [E(X)]
2 
em que 
E(X
2
) = x2ip(xi) 
E(X) = xip(xi) 
 
O desvio padrão () é a raiz quadrada positiva da variância. Tem sobre esta última a vantagem 
de exprimir a dispersão na mesma unidade de medida da v.a. 
 
2.2.1 - PROPRIEDADES DA VARIÂNCIA 
Para a e b constantes, tem-se: 
i) Var(X) ≥ 0 
ii) Var(X + a) = Var(X) 
iii) Var(bX) = b
2
Var(X) 
iv) Var(a + bX) = b
2
Var(X) 
 
2.2.2 - PROPRIEDADES DO DESVIO-PADRÃO 
Para a e b constantes, tem-se: 
i’) dp(X) ≥ 0 
ii’) dp(X + a) = dp(X) 
iii’) dp(bX) = bdp(X) 
iv’) dp(a + bX) = bdp(X) 
 
Exemplo 
Um pronto socorro mantém registros dos atendimentos de acidentados diários de certa cidade e 
determinaram a probabilidade acontecer acidente na semana. O quadro a seguir dá o número X de 
acidentes em uma semana e a respectiva probabilidade p(x): 
Número X 0 1 2 3 4 5 
Probabilidade f(x) 0,1 0,1 0,2 0,3 0,2 0,1 
 
a) determine a variância do número de acidentes de uma semana. 
Fazendo 
E(X
2
) = (0
2
).(0,1) + (1
2
)(0,1) + (2
2
)(0,2) + (3
2
)(0,3) + (4
2
)(0,2) + (5
2
)(0,1) = 9,30 
 E(X) = (0).(0,1) + (1)(0,1) + (2)(0,2) + (3)(0,3) + (4)(0,2) + (5)(0,1) = 2,70 
então 
Var(X) = E(X
2
) - [E(X)]
2
=9,3 - (2,7)
2
= 2,01 
 
b) suponha que o registro do pronto socorro esteja errado e o número de acidentes correto é o dobro 
para cada valor descrito no quadro acima. Então, determine a variância. 
Basta utilizar a propriedade Var(bX) = b
2
Var(X)= 2
2∙2,01= 8,04 
 
Ou calcule a variância novamente 
 E(X
2
) = (0).(0,1) + (2
2
)(0,1) + (4
2
)(0,2) + (6
2
)(0,3) + (8
2
)(0,2) + (10
2
)(0,1) = 37,2 
E(X) = (0).(0,1) + (2)(0,1) + (4)(0,2) + (6)(0,3) + (8)(0,2) + (10)(0,1) = 5,40 
Var(X) = E(X
2
) - [E(X)]
2
=37,2 - (5,4)
2
= 8,04 
9 
 
 
 
2.3 - MODELOS PROBABILÍSTICOS PARA VARIÁVEIS DISCRETA 
Para se utilizar a teoria das probabilidades no estudo de um fenômeno concreto, é necessário 
encontrar um modelo probabilístico adequado para tal fenômeno. 
Por modelo probabilístico entende-se uma forma específica de função de distribuição de 
probabilidade, que reflita o comportamento de uma variável aleatória X. 
 
2.3.1 - DISTRIBUIÇÃO BINOMIAL 
 
A distribuição de probabilidade da variável aleatória X é chamada distribuição binomial 
com n experimentos e probabilidade p de sucesso. Designa-se por X~B(n;p), em que n e p são os 
parâmetros da distribuição. Assim, os valores possíveis da variável aleatória X são os inteiros 0, 
1, 2, ... n. 
Como cada experimento só comporta dois resultados distintos - sucesso ou falha - 
mutuamente exclusivos, a ocorrência de k sucessos em n experimento deve ser acompanhada de (n - 
k) falhas. Sendo: 
p a probabilidade de sucesso e 
1-p = q a probabilidade de falha, tem-se que a probabilidade de ocorrência de k sucessos e (n - k) 
falhas, numa dada ordem, é, pelo principio fundamental da contagem, p
x 
q
n-x
 . 
A probabilidade de tal sequência é p
k
q
n-k
, devido a independência dos ensaios. Mas qualquer 
sequência com k sucessos e n-k fracassos terá a mesma probabilidade. Portanto, é preciso determinar 
quantas sequências com k sucessos e n-k fracassos é possível de se formar, obtida pela combinação de 
n experimentos e k sucessos. Assim, a função de probabilidade de X é dada por 
P(X=k)= 






k
n
 p
k
q
n-k 
, k = 0, 1, ..., n. 
 
MÉDIA E VARIÂNCIA DE UMA VARIÁVEL BINOMIAL 
 
Se X é uma variável aleatória com Distribuição de Binomial e parâmetros n e p, então a média 
é obtida por: 
npqp
x
n
x)x(fx)X(E xnx 











  
 
A variância é dada por: 
npq)]X(E[)X(E)X(Var  22
 
E o desvio padrão é obtido por: 
npq)X(DP 
 
 
Exemplo 
1. Determine a probabilidade de acertar no máximo três questões em 10, do tipo verdadeiro ou falso. 
 
 
Neste caso, a probabilidade de acertar (sucesso) é igual à probabilidade de falha é de 50%, ou 
seja p=0,5 e q=0,5. 
0,5) ; (10 B ~X
 
A probabilidade de acertar no máximo 3 questões, isto é, P(X≤3) é obtida por: 
)X(P)X(P)X(P)X(P)X(P 32103 
 
0009805050
0
10
0 0100 ,,,)X(P 





 
 
10 
 
 
 
0097705050
1
10
1 1101 ,,,)X(P 





 
 
0439305050
2
10
2 2102 ,,,)X(P 





 
 
1171905050
3
10
3 3103 ,,,)X(P 





 
 
17,19%=0,1718732103  )X(P)X(P)X(P)X(P)X(P
 
 
2. Quinze peças são escolhidas ao acaso em uma produção. O controle de qualidade sabe que 6% das 
peças são defeituosas. Determine: 
a) a probabilidade de encontrar duas peças defeituosas. 
Neste caso a ocorrência é encontrar peças defeituosas, logo p=0,06 e q=0,94. 
0,06) ; (15 B ~X
 
%,,,,)X(P 911616910940060
2
15
2 2152 





 
 
b) a média, variância e desvio padrão de peças defeituosas, se o controle de qualidade avaliar 150 
peças. 
Média: 
 9060150  ,np)X(E
peças defeituosas 
Variância: 
468940060150 ,,,npq)X(Var 
 (peças defeituosas)
2
 
Desvio padrão: 
912468 ,,npq)X(DP 
 peças defeituosas 
 
 
 
2.4 - DISTRIBUIÇÃO DE POISSON 
 
A distribuição de Poisson é empregada quando sequer contar o número de ocorrências de um 
evento em um determinado intervalo de tempo ou espaço ( superfície, volume ), etc. Por exemplo: 
 Número de pessoas que entram em um banco durante um intervalo de tempo em determinado dia; 
 Número de chamadas telefônicas recebidas em uma central telefônica no período da manhã. 
 Número de falhas de um computador em um dia de operação; 
 Número de bactérias em um litro de água não purificada, etc. 
Nota-se que essas variáveis tomam os valores 0, 1, 2, 3, ..., n. Seu comportamento pode ser 
descrito pela Distribuição de Poisson , cuja função de distribuição é dada por: 
p(x) = P(X=x) = 
!
.
x
e x x = 0, 1, 2 ,..., n 
em que 
: é o parâmetro da distribuição, ou seja, indica a taxa de ocorrência por unidade de medida 
x: número de ocorrências 
 
A distribuição é denotada por: 
)( Po ~X
 
11 
 
 
 
MÉDIA, VARIÂNCIA E DESVIO PADRÃO 
 
Se X é uma variável aleatória com Distribuição de Poisson e parâmetro , então a média é 
obtida por: 
)X(E
 
A variância é dada por: 
)X(Var
 
E o desvio padrão é obtido por: 
)X(DP
 
 
Exemplo 
1. Nos sinais de um transmissor ocorrem distorções aleatórias com média de 3 distorções por hora. 
Determine a probabilidade de encontrar 5 distorções nos sinais transmitidos em 30 minutos. 
 
Tem-se um número de ocorrência em um intervalo de tempo, como a média é 
 3)X(E
, logo 
esses dados tem distribuição 
(3) Po ~X
. Então 
3 ─ 60 min 
λ ─ 30 min 
λ =1,5 distorção por min 
 
%,
!
,e
)X(P
,
411
5
51
5
551



 
Portanto a probabilidade de encontrar cinco distorções nos sinais transmitidos em 30 minutos é de 
1,44%. 
 
2. Um PABX recebe em média 5 chamadas por minuto. Supondo que as chamadas que chegam 
constituem uma distribuição de Poisson. Determine: 
a) o número esperado de chamadas por minuto 
(5) Po ~X
 
E(X) = 5 chamadas por minuto, ou seja, espera-se que ocorra em média 5 chamadas por minuto. 
 
b) o número esperado e desvio padrão de chamadas em 4 minutos. 
5 ─ 1 min 
λ ─ 4 min 
λ =20 chamadas por 4 min 
 
E(X) = 20 chamadas a cada 4 minutos, ou seja, espera-se que ocorra em média 20 chamadas a cada 4 
minutos. 
47420 ,)X(DP 
 chamadas a cada 4 minutos. 
 
12 
 
 
 
3 - DISTRIBUIÇÃO CONTÍNUA DE PROBABILIDADE 
 
As distribuições discretas de probabilidade tratam de situações em que o espaço amostral 
contém um número finito, ou infinito, porém contável de pontos. Se o espaço amostral contém um 
número infinito não-contável de pontos, tem-se de trabalhar com distribuições contínuas de 
probabilidade. 
Considere, pois, uma v. a. que pode tomar todos os valores de um dado intervalo. Pertencem a 
este tipo as mensurações de altura, temperatura, precipitação pluviométrica, tempo de espera numa fila 
etc. Na prática, tais variáveis são registradas com aproximações de inteiro, ou décimo, ou centésimo, 
..., conforme o caso, porém a natureza subjacente da v. a. é essencialmente contínua. 
A distribuição de uma v. a. contínua pode ser encarada como um refinamento de uma 
distribuição discreta. É como se as mensurações tivessem sido feitas em uma escala bastante grosseira. 
À mediada que aumenta a precisão das medidas, pode-se trabalhar com um número cada vez maior de 
classes até que, no limite, tem-se uma curva contínua. É a função de densidade de probabilidade, 
usualmente designada por f(x). 
 
3.1. PROPRIEDADES 
Para que uma função f(x) seja uma função densidade de probabilidade (f.d.p.) é necessário 
que: 
 i) f(x)  0. 
2i) A área total sob a função de densidade é 1, isto é 
1 


dx)x(f
. 
 
Numa distribuição contínua, só faz sentido falar da probabilidade de uma v. a. X estar em um 
intervalo. Na prática, isto poderia parecer contraditório. Então a probabilidade de um indivíduo ter 
exatamente 1,75m de altura é zero? É impossível existir um indivíduo com essa altura? 
Para resolver isto, devemos admitir que a precisão dos instrumentos de medida é limitada; na 
prática, 1,75 não se distingue de qualquer outro valor no intervalo, digamos, [1,745; 1,755] ou [1,7495; 
1,7505]. O que interessa é, na realidade, a probabilidade da v.a. estar em um intervalo, por pequeno 
que seja, e a probabilidade correspondente então já não é mais zero. 
Em consequência disso - e ao contrário do que ocorre com as v.a. discretas - é indiferente 
considerar, ou não, os extremos quando especificamos um intervalo de uma v. a. contínua: 
P(a<X<b) = P(aX<b) = P(a<Xb) = P(aXb). 
Valem, para as distribuições contínuas, os conceitos de média e variância estabelecidos para 
as variáveis aleatórias discretas. Sua determinação, entretanto, depende aqui dos métodos de cálculo 
infinitesimal. 
 
3.2 - MÉDIA OU ESPERANÇA 
 
A esperança pode ser entendida como um centro de distribuição de probabilidade, obtida por 



 dx)x(fx)X(E 
 
 
3.3 - VARIÂNCIA E DESVIO PADRÃO 
 
Medida utilizada para caracterizar a variabilidade da distribuição, obtida por 



 dx)x(f])x[(E)X(Var 2
 
A forma mais prática para calcular é 
2=Var(X)=E(X2)-[E(X)]2 
sendo 
13 
 
 
 



 dx)x(fx])X[(E 22
 
Considerando a raiz quadrada da variância, denominado desvio padrão tem a vantagem de ter 
a mesma dimensão da própria variável. 
=DP(X)= 2 . 
 
Exemplo 
1. O tempo de corrosão, em anos, de certa peça metálica é dada pela função: 









1 xse 0 
,1 x0 se2x 
)x(f
 
Determine: 
a) verifique se f(x) é uma função de densidade de probabilidade. 
i) verificando se f(x) é maior ou igual a zero 
f(x)=f(0)=2x=2∙0=0 
 f(0,5)=2∙0,5=1 
 f(1)=2∙1=2 
 f(2)=∙0 
 f(3)=0 
logo, f(x) é maior ou igual a zero. 
 
2i) verificando se a área total vale 1 
102
1
1
0
 

dxdxx
 
logo, a área total é 1. 
 
Portanto, a função f(x) é uma função de densidade de probabilidade por satisfazerem f(x)  0 e 
1 


dx)x(f
. 
 
b) a probabilidade do tempo de corrosão ser menor que 6 meses. 
%dxx)X(P 25221
21
0
 
 
 
c) o tempo médio de corrosão da peça. 
anos 670 0 2
1
1
0
,dxxdxxx)X(E  

 
 
d) a variância e o desvio padrão da corrosão da peça. 
anos 50 0 2
1
21
0
22 ,dxxdxxx])X[(E  

 
Var(X)=E(X
2
)-[E(X)]
2
=0,5-(0,67)
2
=0,051 
DP(X)= 
2261,0051,0 2 
. 
 
14 
 
 
 
3.4 - MODELO PROBABILÍSTICO PARA VARIÁVEL CONTÍNUA 
 
3.4.1 - DISTRIBUIÇÃO NORMAL 
De modo geral pode-se dizer que as v. a. cujos valores resultam de algum processo de 
mensuração, são v. a. contínuas. Alguns exemplos de v. a. contínuas são: 
a) os pesos ou alturas de pessoas; 
b) o tempo de vida de uma lâmpada; 
c) erros de medidas em geral, resultantes de experimentos em laboratórios. 
Dada uma v. a. X contínua, interessa saber qual a sua função de distribuição de 
probabilidade. Um dos modelos mais importantes das distribuições contínuas de probabilidade é o 
modelo de distribuição normal. Este modelo teve sua origem associada aos erros de mensuração. 
 
3.4.1.1. PROPRIEDADES DA DISTRIBUIÇÃO NORMAL 
 
A distribuição normal tem sua função de densidade de probabilidade dada por: 













 


2
 
2
1
e
π2σ
1
 

x
)x(f 
 em  e  são os parâmetros da distribuição. 
A distribuição Normal é denotada por: 
) ; ( N 2~X
 
 
A figura abaixo ilustra uma curva normal típica: 
 
Figura 1- Curva da Normal 
As principais características da distribuiçãonormal são: 
1) A média da distribuição é ; 
2) O desvio padrão ; 
3) A moda ocorre em x=; 
4) A curva é simétrica a um eixo vertical passando por x=; 
5) A curva tem inflexões nos pontos x=  ; 
6) A curva normal é assintótica ao eixo horizontal em ambas as direções; 
7) A área total sob a curva normal e acima do eixo horizontal é 1 (o eixo horizontal é o eixo 
dos valores da variável aleatória X, normal); 
A variável aleatória normal X com média  e desvio padrão  denota-se por N(. 
A probabilidade da variável aleatória normal X estar entre a e b é igual a área sob a curva do 
segmento horizontal {a; b} conforme figura 2: 
 
15 
 
 
 
 
Figura 2 - Área de a até b sob a curva normal 
 
3.4.1.2. - VARIÁVEL NORMAL REDUZIDA 
 O cálculo de probabilidade da v.a. X estar entre a e b envolvendo a distribuição normal implica 
em resolver a seguinte integral: 
 P(a  X  b) = 
1
2 2
2
2 

a
b x
dx

exp
( )
. 
 Para obter a solução é necessário utilizar recursos de cálculo infinitesimal, desta forma não é 
um processo elementar. Por isso, as probabilidades para os valores da variável aleatória X foram 
tabeladas, o que permite obter diretamente o valor da probabilidade desejada. 
 Para que as probabilidades da variável aleatória normal pudessem ser tabeladas foi necessário 
fazer uma mudança, transformando a v. a. X em uma v. a. Z assim definida: 
 Z = 

-X
 
 Observe que esta nova variável e a variável padronizada, já estudada, e será denominada 
variável normal pradronizada ou reduzida. Sua média é zero e seu desvio-padrão, 1. 
 Esta transformação é ilustrada pela Figura 3. 
z 
 -2 -  + +2 
 -2 -1 0 1 2 
 Figura 3. A v. a. normal X e a v. a. reduzida Z correspondente 
 Vê-se que: 
a) a nova origem é zero; b) o desvio-padrão é a unidade de medida. 
 Essa transformação não altera a forma da distribuição; apenas refere-a uma nova escala. 
 
3.4.1.3 - TABELA DA DISTRIBUIÇÃO NORMAL 
 A tabela da distribuição normal fornece a probabilidade de Z tomar um valor não superior a z0 : 
P(Zz0). Costuma-se denotar essa probabilidade por ( z0). Tal probabilidade é a área hachurada na 
Figura 4. 
 
 z0 z 
 Figura 4. Probabilidade P(Z  z0) 
 
16 
 
 
 
Exemplo 
 
1. Determinar a área sob a curva normal padronizada à esquerda de -3,46. 
Consultando a tabela, deve ir à linha -3,4 e em relação a segunda casa decimal deve ir à coluna 
0,06. Então, encontrará que Z= -3,46 corresponde a área (probabilidade) 0,00027, ou seja, 
P(Z  -3,46) = 0,00027. 
2. Determinar a área sob a curva normal padronizada à esquerda de 1,72. 
 Consultando a tabela, deve ir à linha 1,7 e em relação a segunda casa decimal deve ir à coluna 
0,02. Então, encontrará que Z= 1,72 corresponde a área (probabilidade) 0,95728 ou 
 P(Z  1,72) = 0,95728. 
3. Determinar a área sob a curva normal padronizada abaixo de Z = -0,53. 
 Na tabela, a Z= -0,53 corresponde a área 0,29806, ou 
 P(Z  -0,53) = 0,29806. 
4. Determinar a probabilidade da v.a. padronizada Z estar entre z0=0,70 e z1=1,35. 
 A área (probabilidade) é a diferença entre a área à esquerda de 1,35 e a área à esquerda de 0,70: 
 P(0,70  Z  1,35) = P(Z  1,35) - P(Z  0,70) = 0,9115 - 0,758 = 0,1535. 
5. Determinar a prob. da v.a. padronizada Z tomar valores maiores do que 1,80. 
 Por simetria, a área acima de 1,80 é igual a área à esquerda de -1,80. 
 P(Z  1,80) = P(Z  -1,80) = 0,0359. 
 
6. A taxa de hemoglobina no sangue de pessoas que gozam de boa saúde segue uma distribuição 
normal com média 12 e desvio-padrão 1. Determine a probabilidade de se encontrar uma pessoa 
normal com taxa de hemoglobina superior a 15. 
)1 ; (12 N 2~X
 
 Neste caso, a variável aleatória precisa ser padronizada: 
 
X = 15  Z = 
x-

 = 
15-12
1
 = 3 
P(X > 15 ) = P(Z > 3) = P(Z < -3) = 0,00135.

Continue navegando