Buscar

ESTATISTICA: Modelos probabilísticos para variáveis aleatórias discretas

Prévia do material em texto

20 
 
Modelos probabilísticos para variáveis aleatórias discretas 
 
 As observações geradas por diferentes experimentos podem, por vezes, apresentar o 
mesmo tipo geral de comportamento. As variáveis aleatórias associadas a esses experimentos 
podem então ser descritas pela mesma distribuição de probabilidade, ou representadas por uma 
única fórmula. Para descrever o comportamento de muitas das variáveis aleatórias, existem 
importantes distribuições de probabilidade, também chamadas de modelos probabilísticos. 
 Alguns dos principais modelos probabilísticos discretos são: Distribuição de Bernoulli; - 
Distribuição Binomial; Distribuição Poisson; 
 
 
1. Distribuição de Bernoulli 
 
 Considere uma única realização de um experimento aleatório, no qual se pode obter 
sucesso, com probabilidade p ou fracasso com probabilidade q, sendo p + q = 1. Seja a v.a. X igual 
ao número de sucessos em uma única tentativa. Então: 
 
O, fracasso com P(X 0) q
X
1, sucesso com P(X 1) p
 
 
 
 
Nessas condições a v. a. X tem distribuição de Bernoulli e sua função de probabilidade é dada por: 
 
x 1 xP(X x) p q   ; sendo q = 1- p. 
Os parâmetros da distribuição de Bernoulli são: 
1
0
( ) ( ) 0 1 ( )

     
x
E X xP X x q p E X p e ( ) (1 )  Var X p p pq 
 
Exemplos de variáveis de Bernoulli: 
Em uma linha de montagem, uma peça selecionada pode ser defeituosa (sucesso) ou não 
defeituosa (fracasso). 
No lançamento de uma moeda, cara (sucesso) ou coroa (fracasso). 
Uma semente avaliada pode germinar (sucesso) ou não germinar (fracasso). 
 
Exemplo: 1) Considere um experimento que consiste no lançamento de um dado e verifique a 
ocorrência da face 5 (sucesso) ou não. Determine a função de probabilidade e a distribuição 
acumulada. 
 
 
 
2. Distribuição Binomial 
 
É uma generalização da distribuição de Bernoulli. É a mais importante das distribuições teóricas 
de probabilidade para variáveis discretas. São realizados n ensaios independentes de Bernoulli. A 
probabilidade de sucesso em cada ensaio é constante. Como as probabilidades p de sucesso se 
mantêm constantes em cada ensaio, a distribuição binomial é indicada para os casos em que a 
amostragem é feita com reposição. 
 
21 
 
Definição: Seja a variável aleatória X que conta o número total de sucessos obtidos numa 
seqüência de n ensaios independentes de Bernoulli. A variável X segue uma distribuição binomial 
com parâmetros n e p, denotada por X ~ b(x; n, p), e tem função de probabilidade: 
 
n x n x x x n x
x nb(x;n, p) P(X x) ( )p q C p q , x = 0, 1, 2, ..., n
     
 
n é o nº de repetições do experimento; 
x é o nº desejado de sucessos; 
n - x é o nº esperado de fracassos; 
p é a probabilidade de sucesso num ensaio individual; 
1 – p é a probabilidade de fracasso num ensaio individual; 
 
Os parâmetros da distribuição Binomial são: 
( ) E X np e 2 ( ) Var X npq 
 
 
Exemplos: 
1. Sabe-se que, em certa região, 60% dos domicílios possuem computadores. Cinco domicílios são 
selecionados ao acaso nesta região. 
a) Verifique se este experimento se caracteriza como binomial 
b) Calcule a probabilidade de que exatamente 3 domicílios tenham computador ; 
c) Calcule a probabilidade de que no máximo um domicílio tenha computador 
d) Determinar o número esperado de domicílios com computador e o desvio padrão. 
 
b) 
 
c) 
 
 
d) µ = n p = 5 x 0,60 = 3 domicílios; 
 
 
 
2. Sabe-se que 20% de frangos expostos a um particular agente infeccioso adquirem certa doença. 
Considere um grupo de 4 frangos com igual exposição ao agente infeccioso. Qual a probabilidade 
de que: 
a) Nenhum frango adoeça; 
b) Todos os frangos adoeçam; 
c) Ao menos um frango adoeça; 
d) Supondo que o proprietário tenha um custo de R$300 para tratar cada frango doente. Qual será 
o gasto esperado com esse tratamento, se o medicamento for recomendado a 30 frangos? 
 
 
3) A probabilidade de que certo tipo de componente sobreviva a um teste de choque é de ¾. 
Determine a probabilidade de que dos próximos quatro componentes testados, 
a) exatamente 2 sobrevivam. 
b) pelo menos 2 sobrevivam. 
c) no máximo 2 sobrevivam. 
 
   3 5 353( 3) 0,6 0, 4 0,3456P X C

  
5 0 5 5 1 4
0 1( 1) ( 0) ( 1) 0,6 0,4 0,6 0,4 0,01024 0,0768 0,08704P X P X P X C C         
5 0,60 0,40 = 1,09    
22 
 
3. Distribuição Poisson 
 
A distribuição Poisson ocorre quando se deseja contar o número de eventos de um certo 
tipo, verificados em um intervalo de tempo, de superfície (área) ou volume. Uma variável aleatória 
X com distribuição Poisson pode assumir infinitos valores no conjunto dos inteiros positivos (v.a. 
discreta). 
Exemplos de variáveis de Poisson: 
- Número de telefonemas recebidos por hora em um escritório. 
- Número de bactérias por unidade de área em uma lâmina. 
- Número de erros de digitação por página. 
- Numero de falhas de um computador em um dia de operação. 
 
 Uma variável aleatória X com distribuição Poisson tem: 
 
 função de probabilidade: 
xef (x; ) P(X x)
x!
 
    
 
parâmetros: x E(X) Var(X)      
 
 A distribuição Poisson tem aplicação também nos casos em que os parâmetros n e p da 
distribuição binomial dificultam o cálculo por esta distribuição (eventos raros). Nesses casos, a 
Poisson é usada como aproximação da binomial, sendo a aproximação considerada adequada 
quando n é “grande” e p é “pequeno” n 50 e p 0,10  . Neste caso a media da Poisson será:  = 
 = n.p. 
 
Exemplos. 
1) Durante um experimento de laboratório, o número médio de partículas que passam por um 
contador em um milésimo de segundo é quatro. 
a) Qual é a probabilidade de que seis partículas entrem em um dado contador, em um específico 
milésimo de segundo? R: 0,1042 
b) Qual é a probabilidade de que 10 partículas entrem no contador, em 5 milésimos de segundo? 
c) Qual é a probabilidade de que no mínimo uma partícula entre em um dado contador, em dois 
milésimos de segundo? 
 
 
 
2) Um corpo de bombeiro atende em média 5 chamadas por dia. Qual a probabilidade de, num 
determinado dia atender 0, 1, 3, 6 e 10 chamadas? 
 
 
 
 
3) Sabe-se que uma raça bovina apresenta uma doença virótica em 2% dos animais . Realizando-
se uma amostra de 100 animais dessa raça, calcule as probabilidades. 
a) de nenhum animal doente nessa amostra. R. 0,1326 
b) de no máximo 2 animais doentes nessa amostra. R. 0,6767 
d) Use a aproximação pela distribuição Poisson para calcular as mesmas probabilidades. 
 
 
 
23 
 
Modelos probabilísticos para variáveis aleatórias contínuas 
 
 
 Distribuição normal 
 
A distribuição normal ou de Gauss ou Gaussiana é uma das mais importantes 
distribuições da estatística. Além de descrever uma série de fenômenos físicos, naturais, 
financeiros, nas indústrias e nas pesquisas em geral, possui grande uso na estatística inferencial. É 
inteiramente descrita por seus parâmetros média m e desvio padrão s, ou seja, conhecendo-se estes 
é possível determinar qualquer probabilidade em uma distribuição Normal. 
 
- Seu gráfico tem a forma campanular (sino) 
 
 - É uma distribuição simétrica em relação à média 
 
- É duplamente assintótica em relação ao eixo das abscissas 
 
- Tem dois pontos de inflexão que correspondem à media ± desvio padrão. 
 
Uma variável aleatória contínua X tem uma distribuição normal ou gaussiana se a função 
densidade de probabilidade for dada por: 
2
2
(x )
21f (x) e
2




 para - < x <  , - <  <  e 2 > 0 
 
Notação: X~N( , 2): X tem distribuição normal com média  =E(X) e variância Var(X) = 2. 
 
 
Probabilidades (áreas) especiais: 
 ( ) 0,68    P x x   ; ( 2 2 ) 0,95    P x x   ; ( 3 3 ) 0,99    P x x  
 
 
 
Função de distribuição acumulada: 
x
F(x) P(X x) f (x)dx

    
 
Cálculo de probabilidades: Suponha a v.a. X~N( , 2) 
 
2
2
(x )b b
2
a a
1P(a x b) f (x)dx e dx
2


   
  
A integral não pode ser resolvida analiticamente. 
 
 
Distribuição normal padrão (normal padronizada ou reduzida) 
 
Seja 2~ ( , )X N   . Subtraímos de x a média, dividimos pelo desvio padrão e obtemos a variável 
Z, que tem média zero e variância 1, sendo chamada de distribuição normal padronizada; 
~ (0,1)Z N cuja fdp é 
( ) 1f x dx



24 
 
2(Z)
21f (Z) e
2



 ; sendo 


XZ 
 . 
 
Com esta densidade, é possível resolver a integral e calcular probabilidades de intervalos, que 
podem ser tabelados para a variável Z. A variável X é transformada na variável Z, já que a 
transformação preserva a área abaixo da curva, ou seja, 1 2 1 2P(x x x ) P(z Z z )     , 
sendo 11
XZ 


 e 22
XZ 


 . 
 
 
A tabela de probabilidade Z, e o gráfico. 
 
 
 (0 ) P Z z 
 
 
Exemplo de uso da tabela: P(0 < Z < 1,64)= 0,4495 
 
Calcular as seguintes probabilidades: 
a) P(0 < Z < 1,28) b) P(Z>1,96) 
c) P(Z< 2,57) d) P(Z< - 1,33) 
e) P(Z> -1,00) f) P( -1,00 < Z < 1,45) 
g) P( 1,00< Z < 1,96) 
 
Determinar os valores de k para: 
a) P(Z> k) = 0,0505 b) P( Z < k) = 0,9949 
c) P( Z < k) = 0,0505 d) P(Z> K) = 0,8997 
e) P(-1,00 < Z < k) = 0,6826 
 
 
 
 
Exemplo1. Os registros indicam que o tempo médio para se fazer um teste é aproximadamente 
normal, com média de 50 min e variância 20 min2. Nestas condições, determinar: 
a) a porcentagem de candidatos que levam menos de 45 min. 
b) se o tempo concedido é de 1h, que porcentagem não conseguirá terminar o teste. 
c) qual a probabilidade de um candidato demorar entre 45 e 55 minutos? 
d) qual a probabilidade de um candidato demorar menos que 50 minutos? 
 
 
a)  
45 50[ 45] 1.12 0,1314
20
XP X P P Z

  
       
 
 
13,14% levam menos que 45 min para terminar o teste 
 
25 
 
b)  
60 50[ 60] 2,24 0,0125
20
XP X P P Z

  
      
 
 
1,25% dos candidatos não terminará o teste a tempo. 
 
c) 
 45 50 55 50[45 55] 1,12 1,12 1 2 (0,1314) 0,7372
20 20
XP X P P Z

   
             
 
 
 
 
 
Exemplo 2. Em um processo industrial, as especificações exigem que o diâmetro de um rolamento 
tenha medida de 3 0,01 cm . Sabe-se que a medida do diâmetro tem distribuição normal com 
média 3cm e desvio padrão de 0,005. Qual a porcentagem de peças que será inutilizada por estar 
fora das especificações? R: 0,0456 
 
 
 
 
 
 
 
 
 
 
 
 
Exemplo 3. A produção de leite de animais de uma fazenda tem distribuição normal com média de 
12 litros e desvio padrão de 3 litros. Um animal é selecionado aleatoriamente. 
a) Qual a probabilidade de ele produzir mais de 17 litros? 
b) Qual a probabilidade de ele produzir entre 7 e 15 litros? 
c) Qual a probabilidade de ele produzir pelo menos 14 litros? 
d) O produtor decide utilizar o seguinte critério: 10% dos animais com as menores produções e 
15% dos animais com as maiores produções serão separados dos demais para tratamento especial. 
Utilizando as informações da distribuição normal, quais serão os limites para a separação? 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
26 
 
Distribuições amostrais 
 
Distribuição amostral da média – Teorema do limite central (TLC) 
 
Se a v.a. X tem uma distribuição qualquer, com média X e variância 
2
X , então a média 
amostral x , baseada em uma amostra de tamanho n, terá distribuição normal aproximada, com 
média   XXE X    e variância 
2
2 X
X n

  . 
 
Assim, a variável Z definida a seguir tem distribuição aproximadamente normal padrão, ou seja, 
 
 0,1X X a
X
X XZ N
n
 

 
  
. 
 
A aproximação é adequada para amostras maiores ou iguais a 30  n 30 . Quanto maior o 
tamanho da amostra, melhor será a aproximação. 
 
Para amostragem sem reposição, em população finita, fazer a correção a seguir, 
 
  XE X    e 1X
N n
Nn





. 
 
Se a v.a. X tem distribuição normal tem-se, 
 2, XXX N    
2
2, XXXX N n

  
 
   
 
 
 0,1XXZ N
n



 
 
 
 
 
 
Distribuição t de Student – Distribuição amostral da média em pequenas amostras (n < 30) 
 
Se a v.a. X tem uma distribuição qualquer, com média X e variância 
2
X , então a média 
amostral x , baseada em uma amostra de tamanho n < 30, terá distribuição aproximada t de 
Student, ou seja, 
2
2, XXX
SX t S
n
 
 
  
 
 ; 
X X
X
X Xt SS
n
  
 
, em que S é o desvio padrão amostral. 
 O valor de t associado às probabilidades pode ser obtido na tabela t de Student, em função 
do número de graus de liberdade v, sendo v = n – 1gl. 
 
 
Exemplo de uso da tabela. 
a) se v = 10,  P t 1,093  
b) se n = 16,  P 1,34 t 2,131   
27 
 
c) se v = 20,  P t 2,086   
d) se n = 17,  P 1,071 t 1,071    
 
 
Exemplo 2. Encontre os valores de to: 
a) P(t > t0) = 0,10; com v = 13 
b) P( t < t0) = 0,95 ; com v = 15 
c) P( t0 < t < - 1,761) = 0,045; com n = 15 
 
 
 
 
Distribuição amostral da variância – Distribuição qui-quadrado  2 
 
Se 2S é a variância de uma amostra aleatória (aa) de tamanho n, retirada de uma população 
normal, com variância 2 então a estatística 2 tem distribuição qui-quadrado com v = n-1 graus 
de liberdade (gl), sendo, 
 
2
2
2
(n 1)S


 

 e  2 2P      . 
 
A distribuição 2 não é simétrica e parte sempre da origem. 
 
Exemplo de uso da tabela. 
a) se n = 12,  2P 17, 275   
b) se v = 3,  2P 11,345   
 
Exemplo: Uma máquina está regulada para empacotar um produto com média de 500g e desvio 
padrão de 10g. Em uma amostra de 16 pacotes, qual a probabilidade da variância ser, 
 
a) maior que 48,407? 
 
 
 
b) menor que 121,63? 
 
 
 
 
Distribuição amostral de duas variâncias – Distribuição F – Snedecor. 
 
Se 21S e 
2
1S são variâncias de amostras aleatórias independentes, de tamanhos 1n e 2n , 
retiradas de populações normais, com variâncias 21 e 
2
2 , então a estatística F tem distribuição F 
– Snedecor, com 1 1 1v n  e 2 2 1v n  graus de liberdade, sendo, 
 
28 
 
2
1
2 2 2
1 1 2
2 2 2
2 1 2
2
2
S
SF
S S
 
 


 e  1 2P F F (v , v )   (área acima) 
 
Se 1 2F (v , v ) é o valor de F com 1v e 2v gl, (valor que deixa uma área acima dele), então, 
 
1 1 2
2 1
1F (v , v )
F (v , v ) 
 ( valor que deixa uma área (1  ) acima dele). 
 
 
A distribuição F não é simétrica e parte sempre da origem. Para cada probabilidade  
existe uma tabela. 
 
 
Exemplo de uso da tabela. 
a) sendo 1 9v  e 2 15v   P F 3,12 0,025  
b) sendo 1 13n  e 2 7n     P F 4,0 1 P F 4,0 1 0,05 0,95       
 
Exemplo. Se 21S e 
2
1S representam variâncias de amostras aleatórias de tamanhos 1 21n  e 2 31n  , 
cujas populações têm variâncias 21 35  e 
2
2 25  , encontre. 
a) 
2
1
2
2
SP 2,702
S
 
  
 
 
 
 
b) 
2
1
2
2
SP 0,594 3,094
S
 
   
 Aproximação da distribuição Binomial pela distribuição normal 
 
 
Se X é uma variável aleatória binomial com média np  e variância 2 npq  , então a 
variável Z tem distribuição aproximadamente normal padrão; 
 
 0,1x npZ N
npq

  . 
 
Correção de continuidade:    1 2 1 20,5 0,5P x X x P x X x       . 
 
29 
 
 
 
Aproximação da distribuição Poisson pela distribuição normal 
 
Se Y é uma variável aleatória Poisson com média 2    então a variável Z tem 
distribuição aproximadamente normal padrão; 
 
 0,1xZ N


  . 
 
 
 
 
Exemplos: 
1) Em um canal digital de comunicação, suponha que o número de bits recebidos com erro possa 
ser modelado por uma variável binomial e que a probabilidade de erro seja 51 10 . Se 16 milhões 
de bits são transmitidos, qual será a probabilidade de se ter 150 ou menos erros? Use a 
aproximação normal com correção de continuidade. 
 
 
 
 
2: Se a ocorrência de falhas em um tecido é uma v.a. Poisson com média de 0,2 falhas por metro 
quadrado, qual a probabilidade de o número de falhas, em 5000 2m , de tecido estar entre 975 e 
1025? E de ser superior a 980? Use a aproximação normal. 
 
 
 
3) No horário de maior movimento, um sistema de banco de dados recebe, em média, 100 
requisições por minuto. Qual é a probabilidade de que no próximo minuto ocorram mais de 120 
requisições? R: 0,0202 
 
 
 
 
4) A cada 5 automóveis vendidos em uma concessionária, 1 é da cor preta. Em uma análise de 50 
automóveis vendidos, qual a probabilidade de se vender: 
a) Exatamente 10 pretos? B) Pelo menos 10 pretos?

Continue navegando