Buscar

Aula 6 - Bioestatística

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

Aula 6
Modelos de Variáveis Aleatórias
Objetivo: Conhecer e compreender os principais modelos de variáveis aleatórias
discretas e contínuas para posterior uso na Inferência Estatística.
Nesta aula exporemos os conceitos e os principais modelos de variáveis aleatórias
discretas e contínuas, que desempenham um papel fundamental na Inferência Es-
tatística. Há muitos outros modelos de probabilidade, mas nos ateremos apenas
àqueles que desempenharão um papel fundamental na parte inferencial.
1 A Distribuição Binomial
Seja a realização de n ensaios experimentais independentes, cada um tendo a mesma
probabilidade p de sucesso e q = 1� p de fracasso. Seja X a variável aleatória que
conta o número de sucessos nas n realizações. A variável aleatória X é dita ter
distribuição Binomial com parâmetros n e p, denotado por X � B(n; p), e sua
função de probabilidade é dada por
P (X = k) =
�
n
k
�
pkqn�k, k = 0; 1; 2; 3; :::; n.
onde �
n
k
�
=
n!
k! (n� k)! e n! = 1:2:3:::n.
Vejamos com um exemplo a justi…cativa da fórmula acima.
Exemplo 1 Seja uma prova com 5 questões, com cada questão tendo 4 alternativas
de respostas, onde somente uma é a correta. Determine a probabilidade de um aluno
acertar exatamente três questões chutando.
Solução: Como a probabilidade do aluno acertar cada questão é igual a 1
4
podemos interpretar que cada questão é um ensaio experimental onde sucesso ocorre
se o aluno acerta a dada questão e fracasso ocorre, caso contrário. Como temos 5
questões, temos a realização de 5 ensaios e desejamos contar o número de acertos
do aluno. No presente problema desejamos X = 3 onde X representa o número de
acertos do aluno. Chamando S de sucesso e F de fracasso, então temos
(X = 3) = (FFSSS) [ (FSFSS) [ (FSSFS) [ (SFSSF ) [ (FSSSF ) [
(SSSFF ) [ (SSFSF ) [ (SSFFS) [ (SFFSS) [ (SFSFS)
1
Assim
P (X = 3) = P (FFSSS) + P (FSFSS) + P (FSSFS) + P (SFSSF ) +
P (FSSSF ) + P (SSSFF ) + P (SSFSF ) + P (SSFFS) +
P (SFFSS) + P (SFSFS)
Mas, por exemplo,
P (SSSFF ) = (0; 25)(0; 25)(0; 25)(0; 75)(0; 75) = (0; 25)3(0; 75)2 = 0; 08789
pois os ensaios são independentes. Além disso, não importa a ordem com que houve
três sucessos e dois fracassos, a probabilidade é sempre (0; 25)3(0; 75)2. Assim, temos
P (X = 3) = 10� (0; 25)3(0; 75)2.
Esse resultado é equivalente à função
P (X = k) =
�
5
k
�
(0; 25)k (0; 75)5�k , k = 0; 1; 2; 3; 4; 5.
quando k = 3, pois
P (X = 3) =
�
5
3
�
(0; 25)3 (0; 75)5�3
=
5!
3!2!
(0; 25)3 (0; 75)2
=
5:4:3:2:1
3:2:1:2:1
(0; 25)3 (0; 75)2
= 10� (0; 25)3 (0; 75)2
= 0; 08789,
que é o resultado anteriormente obtido pela descrição das diversas possibilidades de
se obter 3 sucessos e 2 fracassos. Se desejássemos obter a probabilidade para outros
valores de X, teríamos:
P (X = 0) =
�
5
0
�
(0; 25)0 (0; 75)5�0 =
5!
0!5!
(0; 25)0 (0; 75)5 �= 0; 237
P (X = 1) =
�
5
1
�
(0; 25)1 (0; 75)5�1 =
5!
1!4!
(0; 25)1 (0; 75)4 �= 0; 396
P (X = 2) =
�
5
2
�
(0; 25)2 (0; 75)5�2 =
5!
2!3!
(0; 25)2 (0; 75)3 �= 0; 264
P (X = 3) =
�
5
3
�
(0; 25)3 (0; 75)5�3 =
5!
3!2!
(0; 25)3 (0; 75)2 �= 0; 088
P (X = 4) =
�
5
4
�
(0; 25)4 (0; 75)5�4 =
5!
4!1!
(0; 25)4 (0; 75)1 �= 0; 015
P (X = 5) =
�
5
5
�
(0; 25)5 (0; 75)5�5 =
5!
5!0!
(0; 25)5 (0; 75)0 �= 0; 001
Assim, temos o seguinte histograma para a variável aleatória X:
2
Observação: Se X � B(n; p), então a média de sucessos (chamada de Esper-
ança Matemática) é E(X) = np, a variância do número de sucessos é V ar(X) = npq
e o desvio-padrão do número de sucessos nas n realizações é DP (X) =
p
npq.
Observe que o resultado da esperança da Binomial faz sentido, pois se temos,
por exemplo, uma probabilidade de 0,25 de sucesso em cada experimento, então se
realizarmos 20 experimentos esperaríamos uma média de 1
4
� 20 = 5 sucessos.
Exemplo 2 Um certo sistema eletrônico contém 10 componentes. Suponha que a
probabilidade de falha de qualquer componente individual seja de 20% e que eles
falhem independentemente uns dos outros. Seja X a variável aleatória que denota o
número de componentes que falham no sistema. Pede-se:
(a) O modelo de probabilidade da variável aleatória X, justi…cando.
(b) A esperança e a variância do número de componentes que falham no sistema.
(c) Dado que pelo menos um dos componentes falhou, qual a probabilidade de
que pelo menos dois falharam?
Solução: (a) Como a probabilidade de falha (sucesso) é sempre constante e igual
a 20% e como temos 10 ensaios independentes, temos que X, denotando o número
de componentes que falham no sistema, tem distribuição Binomial com n = 10 e
p = 0; 2, isto é, X � B(10; 0; 2). Assim
P (X = k) =
�
10
k
�
(0; 2)k (0; 8)10�k , k = 0; 1; 2; :::; 10.
(b)
E(X) = np = 10� 0; 2 = 2.
V ar(X) = npq = 10� 0; 2� 0; 8 = 1; 6.
DP (X) =
p
npq =
p
1; 6 �= 1; 2649.
3
(c) Desejamos
P (X � 2jX � 1) = P ((X � 2) \ (X � 1))
P (X � 1) =
P (X � 2)
P (X � 1)
=
1� P (X < 2)
1� P (X < 1)
Mas
P (X < 2) = P (X = 0) + P (X = 1)
=
�
10
0
�
(0; 2)0 (0; 8)10 +
�
10
1
�
(0; 2)1 (0; 8)9
= (0; 8)10 + 10� 0; 2� (0; 8)9
�= 0; 3758
P (X < 1) = P (X = 0) =
�
10
0
�
(0; 2)0 (0; 8)10
= (0; 8)10 �= 0; 1074
Assim
P (X � 2jX � 1) = 1� P (X < 2)
1� P (X < 1) =
1� 0; 3758
1� 0; 1074 =
0; 6242
0; 8926
= 0; 6993
P (X � 2jX � 1) = 69; 93%.
2 A Distribuição Normal Padrão
Diz-se que uma variável aleatória Z tem distribuição normal (ou Gaussiana) padrão
com média zero e variância 1, denotado por Z � N (0; 1), se a função de densidade
de probabilidade de Z é dada por
fZ(z) =
1p
2�
e�
z2
2 , �1 < z <1.
Sua forma é de um sino simétrico em torno de 0 como na …gura abaixo:
4
Assim, pode-se mostrar que se Z � N (0; 1), então
E(Z) = 0 e V ar(Z) = 1.
As distribuições normais serão usadas para modelar dados cujos histogramas
sejam aproximadamente simétricos.
De…na
�(z) = P (Z � z) =
Z z
�1
fZ(u)du =
Z z
�1
1p
2�
e�
u2
2 du
a chamada função de distribuição da variável aleatória Z. Como �(z) não pode ser
obtida analiticamente, o valor de �(z) é dado por integração numérica e seus valores
são tabelados (veja a tabela anexada). Vejamos como obter as probabilidades.
Observe que a variável Z vai de �3; 49 a 3; 49 na tabela, sendo a primeira co-
luna referente à parte inteira até a primeira casa decimal de z e as outras colunas
referentes à segunda casa decimal de z. Vemos já com isso, que, embora Z esteja
de…nida em toda a reta real, a probabilidade é praticamente nula de um resultado
experimental modelado pela normal padrão sair do intervalo [�3; 49; 3; 49]. Isto se
dá porque sua função de densidade de probabilidade tem decaimento exponencial no
quadrado de z. Observe também que, como Z é variável aleatória contínua, temos
�(z) = P (Z � z) = P (Z < z), ou seja, podemos intercambiar os sinais de < ou �,
já que a probabilidade num ponto é nula. Vejamos então alguns exemplos abaixo:
Exemplo 3 Seja Z � N (0; 1). Calcule:
(a) P (Z � �1; 36)
(b) P (Z � 0; 38)
(c) P (0; 31 � Z < 2; 72)
(d) P (�1; 32 � Z � 0; 3)
Solução: A tabela nos oferece �(z) = P (Z � z) = R z�1 fZ(u)du, ou seja, a área
abaixo da curva à esquerda de z. Para os valores que nos interessam temos:
5
:
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
-3.4 0:0003 0:0003 0:0003 0:0003 0:0003 0:0003 0:0003 0:0003 0:0003 0:0002
...
...
...
...
...
...
...
...
...
...
...
-1.3 0:0968 0:0951 0:0934 0:0918 0:0901 0:0885 0:0869 0:0853 0:0838 0:0823
...
...
...
...
...
...
...
...
...
...
...
0.3 0:6179 0:6217 0:6255 0:6293 0:6331 0:6368 0:6406 0:6443 0:6480 0:6517
...
...
...
...
...
...
...
...
...
...
...
2.7 0:9965 0:9966 0:9967 0:9968 0:99690:9970 0:9971 0:9972 0:9973 0:9974
...
...
...
...
...
...
...
...
...
...
...
3.4 0:9997 0:9997 0:9997 0:9997 0:9997 0:9997 0:9997 0:9997 0:9997 0:9998
(a) P (Z � �1; 36) = 0:0869 = 8; 69% (obtido pelo cruzamento da linha �1; 3
com a coluna 0; 06).
(b) P (Z � 0; 38) = 1� P (Z � 0; 38) = 1� 0:6480 = 0; 352 = 35; 2%.
(c) P (0; 31 � Z < 2; 72) = P (Z � 2; 72) � P (Z � 0; 31) = 0:9967 � 0:6217 =
0; 375 = 37; 5%.
(d) P (�1; 32 � Z � 0; 3) = P (Z � 0; 3) � P (Z � �1; 32) = 0:6179 � 0:0934 =
0; 5245 = 52; 45%.
Mais importante, na verdade, é a distribuição Normal com média � e variância
�2, pois ela de…ne uma uma classe de in…nitas curvas que podem se ajustar a dados
aproximadamente simétricos com média amostral �Xn e variância amostral S2, se o
ajuste for validado. Vamos a ela então!
3 A Distribuição Normal com média � e variância
�2
Diz-se que uma variável aleatória X tem distribuição normal (ou Gaussiana) com
média � e variância �2, denotado por X � N (�; �2), se a função de densidade de
probabilidade de X é dada por
fX(x) =
1
�
p
2�
e�
(x��)2
2�2 , �1 < x <1.
Vemos que aqui também a forma da função de densidade deX é um sino simétrico
em torno da média �, conforme o grá…co abaixo:
6
Como toda distribuição simétrica, a média, a mediana e moda da dis-
tribuição Normal são iguais, e pode-se mostrar que a área abaixo da curva normal
é unitária. Além disso, pode-se mostrar que se X � N (�; �2), então
E(X) = �
V ar(X) = �2
DP (X) = �.
De…nindo a função de distribuição da variável aleatória X, como
�X(x) = P (X � x) =
Z x
�1
fX(u)du =
Z x
�1
1
�
p
2�
e�
(u��)2
2�2 du
temos também aqui o fato de que �X(x) não pode ser obtida analiticamente. No
entanto, pode-se mostrar que se X � N (�; �2), então
Z =
X � �
�
� N (0; 1),
o que nos permite utilizar a tabela da Normal Padrão para os cálculos de
probabilidade de Normais com média � e variância �2. Vejamos com exemplos
como fazer isso.
7
Exemplo 4 Sabe-se por estudos, que os escores de QI são normalmente distribuí-
dos, com uma média de 100 e um desvio-padrão de 15. Determine a probabilidade
de que uma pessoa selecionada aleatoriamente tenha uma pontuação de QI inferior
a 115.
Solução: Seja X a variável aleatória que denota o QI de uma pessoa. Então
sabemos que
X � N (�; �2)
onde � = 100 e � = 15. Assim, temos X � N (100; 225). Sabemos também que
Z =
X � �
�
=
X � 100
15
� N (0; 1).
Desejamos P (X < 115), ou seja, a área à esquerda de 115 sob a curva
1
15
p
2�
e�
(x�100)2
450 .
Mas
P (X < 115) = P (X � 100 < 115� 100)
= P
�
X � 100
15
<
115� 100
15
�
= P
�
Z <
115� 100
15
�
= P (Z < 1)
Assim
P (X < 115) = P (Z < 1) = 0; 8413,
obtido através da normal-padrão. Temos assim a seguinte estrutura equivalente:
8
Exemplo 5 As contas mensais de serviços públicos em determinada cidade são
normalmente distribuídas, com média de R$ 100:000 e desvio padrão de R$ 12:000.
Uma conta é escolhida aleatoriamente. Determine a probabilidade de ela estar entre
R$ 80:000 e R$ 115:000.
Solução: Seja X a variável aleatória que denota o valor da conta. Então sabemos
que
X � N (�; �2)
onde � = 100:000 e � = 12:000. Assim, temos X � N (100:000; (12:000)2). Sabemos
também que
Z =
X � �
�
=
X � 100:000
12:000
� N (0; 1).
Desejamos P (80:000 � X � 115:000). Mas
P (80:000 � X � 115:000)
= P (80:000� 100:000 � X � 100:000 � 115:000� 100:000)
= P
�
80:000� 100:000
12:000
� X � 100:000
12:000
� 115:000� 100:000
12:000
�
= P (�1; 67 � Z � 1; 25)
= P (Z � 1; 25)� P (Z � �1; 67)
= 0; 8944� 0; 0475
= 0; 8469
Assim
P (80:000 � X � 115:000) = 84; 69%.
9
Observação 1: Se X � N (�; �2) então
P (�� � � X � �+ �)
= P (�� � � � � X � � � �+ � � �)
= P (�� � X � � � �)
= P
���
�
� X � �
�
� �
�
�
= P (�1 � Z � 1)
= P (Z � 1)� P (Z � �1)
= 0; 8413� 0; 1587
P (�� � � X � �+ �) = 0; 6826 = 68; 26%:
Da mesma forma, temos
P (�� 2� � X � �+ 2�)
= P (�� 2� � � � X � � � �+ 2� � �)
= P (�2� � X � � � 2�)
= P
��2�
�
� X � �
�
� 2�
�
�
= P (�2 � Z � 2)
= P (Z � 2)� P (Z � �2)
= 0; 9772� 0; 0228
P (�� 2� � X � �+ 2�) = 0; 9544 = 95; 44%:
e …nalmente
P (�� 3� � X � �+ 3�)
= P (�� 3� � � � X � � � �+ 3� � �)
= P (�3� � X � � � 3�)
= P
��3�
�
� X � �
�
� 3�
�
�
= P (�3 � Z � 3)
= P (Z � 3)� P (Z � �3)
= 0; 9987� 0; 0013
P (�� 3� � X � �+ 3�) = 0; 9974 = 99; 74%:
Assim temos a seguinte representação:
10
Observação 2: Se Xi � N (�; �2) para i = 1; 2; :::; n são variáveis aleatórias
independentes e se Sn = X1 +X2 + :::+Xn, então
Sn � N (n�; n�2).
Observação 3: Se Xi � N (�; �2) para i = 1; 2; :::; n são variáveis aleatórias
independentes e se �Xn =
X1 +X2 + :::+Xn
n
, então
�Xn � N (�; �
2
n
).
Exemplo 6 As durações de gravidez têm distribuição aproximadamente normal com
média de 268 dias e desvio-padrão de 15 dias.
(a) Selecionada aleatoriamente uma mulher grávida, determine a probabilidade
de que a duração de sua gravidez seja inferior a 260 dias.
(b) Se 25 mulheres escolhidas aleatoriamente são submetidas a uma dieta es-
pecial a partir do dia em que engravidam, determine a probabilidade de os prazos
de duração de suas gravidezes terem média inferior a 260 dias (admitindo-se que a
dieta não produza efeito).
(c) Se as 25 mulheres têm realmente média inferior a 260 dias, há razão de
preocupação para os médicos de pré-natal? Justi…que adequadamente.
Solução: (a) Seja X a v.a. que denota a duração (em dias) de gravidez de uma
dada mulher. Então sabemos que X � N (268; 225). Sabemos também que
Z =
X � �
�
=
X � 268
15
� N (0; 1).
11
Desejamos
P (X < 260) = P
�
X � 268
15
<
260� 268
15
�
= P (Z < �0; 53)
= 0; 2981
Assim
P (X < 260) = 29; 81%.
(b) Seja Xi a v.a. que denota a duração (em dias) de gravidez da i-ésima mulher
(i = 1; 2; :::25). Então sabemos que Xi � N (268; 225). Sabemos também que
�Xn � N (�; �
2
n
).
Mas � = 268 e
�2
n
=
225
25
= 9. Assim
�X25 � N (268; 9).
Sabemos também que
Z =
�X25 � 268
3
� N (0; 1).
Desejamos
P
�
�X25 < 260
�
= P
� �X25 � 268
3
<
260� 268
3
�
= P (Z < �2; 67)
= 0; 0038
P
�
�X25 < 260
�
= 0; 38%.
(c) Pelo item (b), sob a hipótese de que a dieta não tem efeito, temos uma
chance ín…ma de 0; 38% de obtermos uma média de tempos de gravidezes abaixo de
260, portanto um evento raro. Como isso de fato ocorreu, temos evidência de que
na verdade a dieta alterou o tempo de gravidez das mulheres, fazendo-o diminuir, o
que é preocupante do ponto de vista médico, já que abaixo de 260 dias a dieta estaria
induzindo a partos prematuros.
Exemplo 7 O peso de uma determinada fruta é uma variável aleatória com dis-
tribuição normal com média de 200 gramas e desvio-padrão de 50 gramas. Determine
a probabilidade de um lote contendo 100 unidades dessa fruta pesar mais que 21 kg.
Solução: Seja Xi a v.a. que denota o peso (em gramas) da i-ésima fruta do
lote, i = 1; 2; :::; 100. Sabemos que Xi � N (200; 502). Sabemos também que o peso
total do lote é dado pela variável aleatória
S100 = X1 +X2 + :::+X100 � N (100�; 100�2),
com � = 200 e �2 = 502. Assim
S100 � N (20:000; 5002)
12
Assim
Z =
S100 � 20:000
500
� N (0; 1).
Desejamos
P (S100 > 21:000) = P
�
S100 � 20:000
500
>
21:000� 20:000
500
�
= P (Z > 2)
= 1� P (Z � 2)
= 1� 0; 9772
= 0; 0228
P (S100 > 21:000) = 2; 28%.
4 Teorema Central do Limite
Vimos anteriormente que seXi � N (�; �2) para i = 1; 2; :::; n são variáveis aleatórias
independentes e se �Xn =
X1 +X2 + :::+Xn
n
, então
�Xn � N (�; �
2
n
).
No entanto, independentemente da distribuição das variáveis Xi, se estas forem
independentes e identicamentedistribuídas com média � e variância �2, teremos
sempre que
E
�
�Xn
�
= � e V ar
�
�Xn
�
=
�2
n
.
Com isso, observamos que, quando n cresce, a variabilidade da variável aleatória
�Xn decresce, tendendo a zero, conforme n tende a in…nito. Isso signi…ca que quanto
maior o número de elementos da amostra, menor será a variabilidade dos valores da
média amostral, indicando uma alta concentração dos valores das médias, obtidas de
várias amostras. Qual a consequência a se esperar disso? Nossa intuição nos diria que
se …zéssemos um histograma de vários valores de médias amostrais, este histograma
tenderia a ter uma forma simétrica e cada vez mais leptocúrtico conforme o tamanho
da amostra crescesse. E é isso de fato o que nos informa o Teorema Central do Limite
abaixo.
Teorema 1 (Teorema Central do Limite) SejaX1; X2; :::; Xn uma seqüência de
variáveis aleatórias independentes e identicamente distribuídas com média � e va-
riância �2. De…na as variáveis aleatórias
Sn = X1 +X2 + :::+Xn
Xn =
X1 +X2 + :::+Xn
n
então pode-se mostrar que, para n su…cientemente grande, qualquer que seja a dis-
tribuição de probabilidade dos Xi, temos
13
Sn � N (n�; n�2) e �Xn � N (�; �2n ).
Consequentemente, temos
Sn � n�
�
p
n
� N (0; 1)
e
Xn � �
�p
n
� N (0; 1).
A questão que se coloca é: o que é n su…cientemente grande? Se a dis-
tribuição das variáveis aleatórias já for aproximadamente simétrica, então até para
amostras de tamanho pequeno o Teorema Central do Limite já garantirá uma ótima
aproximação da distribuição real da soma das variáveis e da média das variáveis.
No entanto, no pior cenário, considera-se n � 30, como su…cientemente grande para
valer o Teorema Central do Limite.
Exemplo 8 A média de altura dos alunos da UFRJ é 1; 75 m com desvio-padrão de
0; 1 m. Se uma amostra aleatória de 40 estudantes da UFRJ for selecionada, qual é
a probabilidade de que a média de altura na amostra seja superior a 1; 78 m?
14
Solução: Seja Xi a v.a. que denota o altura (em cm) do i-ésimo aluno da
amostra, i = 1; 2; :::; 40. Sabemos que
� = E (Xi) = 175 e � = 10.
Embora não saibamos qual a distribuição das alturas, como o tamanho da amostra
é grande (n = 40), podemos nos valer do Teorema Central do Limite para a…rmar
que
�X40 � N (�; �
2
40
).
Assim
�X40 � N (175; 100
40
)
e
Z =
X40 � 175
10p
40
� N (0; 1).
Desejamos
P
�
�X40 > 178
� �= P
0BB@X40 � 17510p
40
>
178� 175
10p
40
1CCA
= P (Z > 1; 90)
P
�
�X40 > 178
� �= 1� P (Z � 1; 90)
= 1� 0; 9713
= 0; 0287
P
�
�X40 > 178
� �= 2; 87%.
4.1 Aproximação Normal à Binomial
SejaX � B(n; p). Assim, pode-se provar, pelo Teorema Central do Limite, que, para
n su…cientemente grande, X pode ser aproximada por uma distribuição normal, com
X � N (np; npq).
ou, equivalentemente,
X � npp
npq
� N (0; 1).
Suponha X � B(n; 1
4
). Então para n = 5, 20 e 50, temos as seguintes aproxi-
mações da curva Normal à Binomial:
15
Observe pelo grá…co acima, que para aproximar a probabilidade de X = k na Bi-
nomial é necessário integrar a curva Normal no intervalo
�
k � 1
2
; k + 1
2
�
, denominado
de correção de continuidade. Vejamos como fazer isso a partir de um exemplo.
Exemplo 9 Um par de dados é lançado 180 vezes por hora (aproximadamente).
(a) Qual a probabilidade aproximada de que 25 ou mais lançamentos tenham tido
soma 7 na primeira hora? (b) Qual a probabilidade aproximada de que entre 700 e
750 lançamentos tenham tido soma 7 durante 24 horas?
Solução: (a) Seja X a variável aleatória que conta o número de vezes em que
houve soma 7 na primeira hora. Como há 180 realizações na primeira hora e como
a probabilidade de soma 7 em um par de dados é 1
6
, temos que a distribuição exata
de X é Binomial com n = 180 e p = 1
6
. Assim
P (X = k) =
�
180
k
��
1
6
�k �
5
6
�180�k
, k = 0; 1; 2; 3; :::; 180.
Como n é grande, temos que X � N (np; npq). Mas np = 180 � 1
6
= 30 e npq =
180� 1
6
� 5
6
= 25. Assim
X � N (30; 25)
Com isso, temos
Z =
X � 30
5
� N (0; 1).
Desejamos
P (X � 25) = 1� P (X < 25)
= 1�
24X
k=0
�
180
k
��
1
6
�k �
5
6
�180�k
,
16
cálculo esse ingrato de ser feito. Pela aproximação da Normal com a correção de
continuidade, temos
P (X � 24; 5) = P
�
X � 30
5
� 24; 5� 30
5
�
= P (Z � �1; 1)
= 1� P (Z � �1; 1)
= 1� 0; 1357
= 0; 8643
P (X � 25) �= 86; 43%.
(b) Seja Y a variável aleatória que conta o número de vezes em que houve soma
7 durante 24 horas. Como há 4:320 (180 � 24) realizações em 24 horas e como a
probabilidade de soma 7 em um par de dados é 1
6
, temos que a distribuição exata de
X é Binomial com n = 4:320 e p = 1
6
. Assim
P (Y = k) =
�
4:320
k
��
1
6
�k �
5
6
�4:320�k
, k = 0; 1; 2; 3; :::; 4:320.
Como n é grande temos que Y � N (np; npq). Mas np = 4:320 � 1
6
= 720 e
npq = 4:320� 1
6
� 5
6
= 600. Assim
Y � N (720; 600)
Com isso, temos
Z =
Y � 720p
600
� N (0; 1).
Desejamos
P (700 � Y � 750) =
750X
k=700
�
4:320
k
��
1
6
�k �
5
6
�4:320�k
,
cálculo esse extremamente ingrato de ser feito. Pela aproximação da Normal com a
correção de continuidade, temos
P (699; 5 � Y � 750; 5) = P
�
699; 5� 720p
600
� Y � 720p
600
� 750; 5� 720p
600
�
= P (�0; 84 � Z � 1; 24)
= P (Z � 1; 24)� P (Z � �0; 84)
= 0; 8925� 0:2005
= 0; 692
P (700 � Y � 750) �= 69; 2%.
Exercício 1 Um fabricante de peças de automóveis garante que uma caixa de suas
peças conterá, no máximo, duas defeituosas. Se a caixa contém 18 peças, e a expe-
riência tem mostrado que esse processo de fabricação produz 5% de peças defeituosas,
qual a probabilidade de que uma caixa satisfaça a garantia?
17
Exercício 2 Um homem dispara 12 tiros independentes num alvo. Se a probabili-
dade de acerto do atirador é de 90%, qual a probabilidade de que o alvo seja atingido
pelo menos duas vezes, sabendo-se que o mesmo foi atingido pelo menos uma vez?
Exercício 3 Uma moeda viciada onde a probabilidade de cara é 0,6 é lançada nove
vezes. Calcule a probabilidade de ocorrer um número par de caras.
Exercício 4 O comprimento X de um determinado peixe adulto capturado na Baía
de Monterey é uma variável aleatória normal com média de 30 polegadas e desvio-
padrão de 2 polegadas. (a) Se uma pessoa pega um desses peixes, qual a probabilidade
de que ele tenha no mínimo 31 polegadas de comprimento? (b) De que ele não tenha
mais do que 32 polegadas de comprimento? (c) De que ele tenha comprimento entre
24 e 28 polegadas?
Exercício 5 Um elevador pode suportar uma carga de 10 pessoas ou um peso total
de 1750 libras. Assumindo que apenas homens tomam o elevador e que seus pesos
são normalmente distribuídos com média 165 libras e desvio-padrão de 10 libras,
qual a probabilidade de que o peso limite seja excedido para um grupo de 10 homens
escolhidos aleatoriamente?
Exercício 6 Numa população, os conteúdos de glicose no sangue de pessoas nor-
mais têm distribuição normal com média 120mg/100ml e desvio padrão de 8mg/100ml.
(a) Dentre as pessoas normais que apresentam conteúdos de glicose entre 90mg/
100ml e 110mg/100ml, qual a porcentagem de pessoas com mais de 100mg/100ml
de glicose no sangue?
(b) Se uma amostra de cem pessoas normais for observada, qual a probabilidade
de que o conteúdo de médio de glicose nessa amostra seja superior a 121,4mg/100ml?
Exercício 7 Segundo um levantamento entre os usuários da internet, 75% são a
favor de que o governo regulamente o ‘lixo eletrônico’. Se 200 internautas forem
selecionados aleatoriamente, determine a probabilidade aproximada de que menos
de 140 sejam a favor da regulação governamental. Expresse a resposta exata da
probabilidade pedida.
18

Outros materiais