A Distribuição Normal

Estatística para Experimentalistas

•
UFES

Victor Pereira da Silva
29/11/2023
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 30 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 30 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 30 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Estatística para Experimentalistas

45 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
1 
 
Capítulo 3 – A Distribuição Normal 
3.1 - Introdução 
Experimentos compostos pela repetição, sucessiva e independente de um mesmo experimento básico geram 
sequências de variáveis aleatórias X1, X2, X3, … independentes entre si, mas identicamente distribuídas. Tal é o caso, 
por exemplo, da repetição de um mesmo experimento binário Bp, ou do nosso conhecido D5, o arremesso de um dado 
não viciado de cinco lados. Uma questão que surge naturalmente, nesses casos, se refere à distribuição de 
probabilidades da soma Sn, dos n primeiros valores observados: o número de sucessos em n repetições de Ep, ou a 
pontuação total acumulada em n arremessos sucessivos e independentes de um dado. 
No primeiro caso, já temos a resposta formal rigorosa. O número de sucessos em n repetições independentes e 
sucessivas de Ep, o experimento composto Epn, tem distribuição binomial com parâmetros n e p, que representamos 
por Sn~b(n, p), com 
���� = �� = ��	 ∙ �	 ∙ �1 − �����	� 
Como, nesse caso, E(Xi)=p e V(Xi)=p(1-p), esperança e variância de Sn são determinadas diretamente das propriedades 
básicas: E(Sn)=np e V(Sn)=np(1-p). A figura 
ao lado é uma representação gráfica da 
b(100, 0,2), na faixa de 0 a 40, cuja 
probabilidade total é 0,9999987. Para 
valores de n muito elevados, os cálculos 
exatos podem ser complicados, mesmo 
com o uso de computador. 
Nos casos como o D6, ou mais gerais, como 
Dm, de um dado hipotético de m lados, os 
cálculos diretos de probabilidade de Sn, a 
soma dos primeiros n resultados 
individuais em repetições sucessivas 
do experimento aleatório elementar 
ainda podem ser feitas com o auxílio 
do algoritmo o apresentado no 
Capítulo 2 para ��� , embora, para m e 
n grandes os valores envolvidos para a 
cardinalidade de eventos como {Sn=s} 
se agigantem muito rapidamente. No 
caso de �����, por exemplo, existem 
exatamente 152.370.928.583.799 
×1062 maneiras diferentes de se obter S100=350. A divisão deste número por 6100 dá 0,0233226, que é P{S100=350}. A 
figura ao lado representa P{S50=s} para �����. Como na figura acima, a representação se restringiu à faixa de 110 a 
190, cuja probabilidade é 0,999961. 
 
0,00
0,02
0,04
0,06
0,08
0,10
0 2 4 6 8 1
0
1
2
1
4
1
6
1
8
2
0
2
2
2
4
2
6
2
8
3
0
3
2
3
4
3
6
3
8
4
0
 
0,00
0,01
0,02
0,03
0,04
1
1
0
1
1
5
1
2
0
1
2
5
1
3
0
1
3
5
1
4
0
1
4
5
1
5
0
1
5
5
1
6
0
1
6
5
1
7
0
1
7
5
1
8
0
1
8
5
1
9
0
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
2 
 
A semelhança de forma geral das duas figuras não é acidental, mas se constitui na manifestação de uma das 
propriedades mais interessantes de toda a Matemática e, certamente, um dos resultados mais importantes da Teoria 
da Probabilidade: O Teorema Central do Limite. Este teorema, em uma de suas versões mais simples, assegura que 
se uma variável aleatória, como Sn, é a soma de um número n de observações sucessivas e independentes de uma 
variável aleatória X, com esperança µ e variância σ2, então, na medida em que n cresce, a sua distribuição se aproxima 
cada vez mais da distribuição normal (ou gaussiana), de esperança nµ e variância nσ2. Assim, no primeiro caso, com 
o número de sucessos em 100 repetições de um mesmo Ep com p=0,2, devemos esperar uma distribuição 
aproximadamente igual a uma normal, de esperança 20 e variância 16. No segundo caso, de 100 repetições de D6, o 
resultado acumulado deve ter distribuição aproximadamente Normal, com esperança 350 e variância 291,666.... 
 
3.2 - A Distribuição Normal 
Uma variável aleatória contínua X é dita ter distribuição Normal, com esperança µ e variância σ2, o que se representa 
por X~N(µ, σ2), se sua f.d.p. for 
���� = 1√2�� ��
��� �!" #$ �&'& − ∞ < � < ∞ 
Uma variável aleatória com distribuição N(0, 1) é dita ter distribuição normal padrão, e é geralmente representada 
por Z. Sua função de densidade de probabilidades, 
representada por φ(z), é �√�* e�,$$ , para z real, e é 
representa na figura ao lado. Como se vê, a normal padrão 
concentra praticamente toda a probabilidade no intervalo 
(-3, 3). A tabela abaixo 
dá a probabilidade de 
eventos do tipo {-
i<Z<i}, para i=1, 2, 3, 4 
e 5. 
Ao final deste capítulo uma tabela mais completa traz a distribuição acumulada 
da normal padrão 
Φ�.� = ��/ < .� = 0 1���2�3
�4
 
 
Evento probabilidade
{−1 <Z < 1} 0,68268949
{−2< Z < 2} 0,95449974
{−3< Z < 3} 0,99730020
{−4< Z < 4} 0,99993666
{-5 < Z < 5} 0,99999943
 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
3 
 
para z=0 até z=3,99, a passos de 0,01. A figura abaixo representa Φ(z), a função de distribuição acumulada de uma 
variável aleatória com distribuição normal padrão. 
A transformação / = 5�67 reduz uma variável aleatória 
X~N(µ, σ2) à sua forma padrão Z~N(0, 1). Assim, a 
probabilidade de eventos como {X<a} pode ser extraída da 
tabela para a normal padrão, pois 
P�X < �� = P :X − μσ < x − μσ > = P ?Z < x − μσ A 
Exemplo 3.2.1 – Uma variável aleatória X tem 
distribuição Normal, com esperança 100 e variância 100, portanto desvio 
padrão 10. Calcule: 
a- P{X<100} 
Como a normal é simétrica em torno da esperança, então P{X<100}=P{X>100}=0,5. 
b- P{X<110} e P{X<90} 
Ora, o valor 110 está exatamente a um desvio padrão acima da 
esperança, logo 
P�X > 110� = P :X − 10010 > 110 − 10010 > = P�Z > 1� = 1 − P�Z < 1� = 1 − Φ�1� 
Da tabela tiramos Φ(1)=0,84134, portanto P{X>110)=0,1587, e, por simetria P{X<90)=0,1587. 
c- P{90<X<110} 
Transformando para a normal padrão, temos: 
 
��90 < E < 110� = ��90 − 100 < E − 100 < 110 − 100� = P :−1010 < X − 10010 < 1010>= P�−1,0 < / < 1,0� = P�Z < 1,0� − P�Z < −1,0� = Φ�1� − Φ�−1� 
Como, por simetria, Φ�−1� = 1 − Φ�1� temos: 
��85 < E < 115� = 2Φ�1� − 1 = 2 × 0,84138 − 1 = 0,6827 
Aplicação do Teorema Central do Limite, na versão apresentada, para soma de variáveis aleatórias independentes e 
identicamente distribuídas, nos permite resolver, de forma muito simples, uma variedade surpreendente de 
problemas práticos antes intratáveis. Vejamos alguns exemplos: 
 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
4 
 
Exemplo 3.2.2 – Seja Ep, um experimento aleatório binário, com P{s}=p, o qual é repetido sucessiva e 
independentemente, gerando resultados parciais X1, X2, X3, …, variáveis aleatórias independentes e 
identicamente distribuídas, com distribuição binária de P{X=1}=p. Vamos definir SO = ∑ XQOQR� e XSO = �O ∑ XQOQR� =�O SO, respectivamente a soma e a média aritmética dos n primeiros valores observados. Neste caso particular, Sn 
é o número total de sucessos obtidos e XSO a freqüência de sucessos, nas n primeiras repetições. Vamos 
considerar valores grandes de n. 
a- Seja p=0,50 (como no arremesso de uma moeda) e n=10000. Calcule P{4.900<Sn<5.100}. 
A variável aleatória X, correspondente ao resultado parcial em cada repetição, tem distribuição B(0,5), portanto 
E(X)=0,5 e V(X)=0,25. Sendo a soma de 10 mil observações independentes de X, Sn tem esperança 5000 e 
variância 2500, logo: 
P�4900 < SO < 5100� = P :4900 − 500050 < SO − 5000100 < 5100 − 5000100 > ≈ P�−2 < / < 2� 
Portanto 
P�4900 < SO < 5100� ≈ Φ�2� − Φ�−2� = 2Φ�2� − 1 = 0,9545 
Como se pode ver, a faixa de valores realmente possíveis para o número total de Caras em dez mil arremessos 
de uma moeda é surpreendentemente estreito e se situa em torno do valor médio esperado, 5000. 
A propósito, através de sequência análoga de operações, obtém-se P{4850<Sn<5150} ≈ 0,9973. 
b- Seja p=0,20 (como na obtenção de um 5 em D5) e n=1000. Calcule ��0,18 < XSO < 0,22�. 
Neste caso, X tem esperança0,2 e variância 0,16, logo Sn tem esperança 200 e variância 160. Sendo a soma de 
mil resultados parciais, a distribuição de Sn , uma b(1000, 0,2) é bem próxima da normal de mesma esperança e 
mesma variância. Ora, se Sn~N(200, 160), então XSOsendo igual a Sn dividido por n, tem também distribuição 
aproximadamente normal, com esperança e variância iguais a 0,2 e 0,00016, respectivamente. Assim, 
 ��0,18 < XSO < 0,22� = P U0,18 − 0,20√0,00016 < X
SO − 0,20√0,00016 < 0,22 − 0,20√0,00016 V ≈ P�−1,58 < / < 1,58� 
Portanto, ��0,18 < XSO < 0,22� = 2Φ�1,58� − 1 = 0,8859 � 
Exemplo 3.2.3 – Consideremos agora sequências de repetições independentes de D5, com X1, X2, X3, …, Sn e XSO 
definidos da forma usual. Agora, E(X)=3 e V(X)=2, portanto E(Sn)=3n e V(Sn)=2n. Lembrando que XSO = �O SO , 
temos W�XSO� = 3 e X�XSO� = �O. Com n não muito pequeno podemos aproximar as distribuições, tanto de Sn 
como de XSO, à Normal, com esperanças e variâncias correspondentes. Assim, com n=100, E(Sn)=300, V(Sn)=200, W�XSO� = 3 e X�XSO� = 0,02. Desta forma, embora o conjunto de valores possíveis para S100 seja o dos inteiros 
de 100 a 500, a probabilidade de S100 cair no intervalo fechado de 270 a 330 é superior a 0,95. O cálculo mental 
rápido segue o roteiro: (1) O desvio padrão de Sn é raiz de 200, ou 14,1; (2) portanto o intervalo considerado, 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
5 
 
[270, 330] se estende, simetricamente em torno de E(Sn), por mais que dois desvios padrões de Sn de cada lado; 
(3) sendo a soma de 100 resultados intermediários, igualmente distribuídos e independentes, a distribuição de 
Sn pode ser considerada aproximadamente Normal; (4) logo um intervalo de dois desvios padrões em torno de 
E(Sn) terá probabilidade um pouco acima de 0,95. Um cálculo mais cuidadoso, extraindo resultados da tabela, 
nos leva a P{270≤Sn ≤330}=0,965994. Um refinamento ainda usando a aproximação pela normal, conforme 
discutiremos adiante, resulta P{270≤Sn ≤330} = 0,967847. O valor exato, calculado através do algoritmo 
desenvolvido no Capítulo 2, estendido até n=100, é 0,969155739. O melhor resultado obtido através da 
aproximação pela distribuição Normal apresentou, portanto, uma subavaliação relativa de 0,019%, desprezível 
para a maioria dos fins. A propósito, existem exatamente 764.529.073.299.384x1055 maneiras diferentes – cada 
uma com a mesma probabilidade, 5-100 – de se obter a soma dos 100 resultados parciais no intervalo [270, 330]. 
Vejamos outras questões. 
a- Calcule P{S1000>3100}. 
Com n=1000, E(Sn)=3000 e V(Sn)=2000. Assumindo a aproximação Normal para a distribuição de S1000, temos: 
P�S���� > 3100� = P :S���� − 3000√2000 > 3100 − 3000√2000 > ≈ P�Z > 2,23� = 1 − 0,9871 = 0,0129 
Como se vê, em 1000 arremessos de um dado não viciado de cinco lados, o total esperado é 3000, e a 
probabilidade do total superar 3100 é de apenas 1,29%. 
b- Se o dado for ligeiramente tendencioso, (ver tabela), calcule 
P(S1000)>3100 
A distorção nas probabilidades altera a esperança e a variância de X. Agora, E(X)=3,04 e V(X)=1,9984, portanto, 
P�S���� > 3100� = P :S���� − 3040√1998,4 > 3100 − 3040√1998,4 > ≈ P�Z > 1,34� = 1 − 0,9099 = 0,0901 
A distorção no dado, favorecendo ligeiramente o resultado 5 em detrimento do 1, aumenta a esperança de S1000, 
elevando a probabilidade de um valor superior a 3100 de 1,29% para 9,01%. 
 
c- De volta ao D5 não tendencioso e n=1000, determine um inteiro m, tal que P{3000–m≤Sn≤3000+m}=0,99. 
O intervalo em questão é, portanto, simétrico em torno de E(Sn), com meia amplitude igual a m. Numa normal, 
o intervalo simétrico em torno da esperança de probabilidade 0,99, tem meia largura igual a 2,58 desvios padrões 
(da tabela, Φ(2,58)=0,995), logo 2,58 desvios padrões de S1000 é igual a m, portanto Y = 2,58√2000 ≈ 116. 
 
d- Dois amigos, A e B disputam uma corrida de dados (para maior agilidade do processo, vamos supor que o 
jogo é feito com dados simulados no computador). Em rodadas sucessivas, eles vão arremessando seus 
dados e acumulando os resultados: 
A→ X1, X2, X3, … , Sn e XSO 
1 2 3 4 5 
0,19 0,20 0,20 0,20 0,21 
 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
6 
 
B→ Y1, Y2, Y3, … , Tn e YSO 
Qual a probabilidade de que, após 100 rodadas, B esteja liderando a corrida por mais que 10 pontos? 
A solução é simples e começa com a definição de Dn = Tn – Sn, a vantagem de B sobre A após n rodadas. 
Como E(Sn)=E(Tn), E(Dn)=0 enquanto que V(Dn)=V(Sn)+V(Tn)=4n. Admitindo-se que Sn e Tn tem distribuição 
Normal, conclui-se que Dn~N(0, 4n) e, portanto, D100~N(0, 400); logo: 
P�D��� > 10� = P : D���√400 > 10√400> ≈ P�Z > 0,5� = 1 − 0,6915 = 0,3085 
Por simetria, esta é também a probabilidade de que, após 100 rodadas, A esteja liderando por mais que 10 
pontos. 
e- Na corrida acima, vamos agora supor que os dados sejam ligeiramente distorcidos em favor do jogador B, 
como mostra a tabela ao lado. Qual a probabilidade de B 
ganhar uma corrida de 1000 rodadas? 
Agora E(Sn)=2,96 e E(Tn)=3,04, enquanto as duas variância 
são iguais a 1,9984, portanto E(Dn)=0,08 e V(Dn)=3,9968n. Com 1000 rodadas, teremos E(D1000)=80 e 
V(D1000)=3996,8 e 
P�D���� > 0� = P :D��� − 80√3996,8 > −80√3996,8> ≈ P�Z > −1,265� = P�Z < 1,265� = Φ�1,265� = 0,897 P�B vence a corrida de 1000 rodadas� = P�D���� > 0� = Φ�1,265� = 0,897 
 
Como se vê, a ligeira distorção dá a B enorme vantagem em uma corrida prolongada. Nessas condições 
vantajosas, sua probabilidade de vencer uma corrida de dez mil rodadas é Φ(4,00)=0,999968. 
� 
A qualidade da aproximação da distribuição de probabilidades de Sn associadas a D5n por N(3n, 2n) pode ser bem 
apreciada através da figura abaixo. Nela as barras verticais representam os valores exatos de ������ = ��, para 
valores de s na região relevante, de 250 a 350, calculados através do algoritmo já apresentado, são sobrepostos por 
uma linha envoltória contínua corresponde à f.d.p. da normal com esperança 300 e variância 200. A quase perfeita 
coincidência entre valores exatos e aproximados pode ser apreciada. A tabela abaixo apresenta os dois grupos de 
valores da probabilidade – exato e aproximado – para um conjunto selecionado de valores de d. 
 1 2 3 4 5 
A 0,21 0,20 0,20 0,20 0,19 
B 0,19 0,20 0,20 0,20 0,21 
 
 
0,000
0,005
0,010
0,015
0,020
0,025
0,030
2
5
0
2
5
3
2
5
6
2
5
9
2
6
2
2
6
5
2
6
8
2
7
1
2
7
4
2
7
7
2
8
0
2
8
3
2
8
6
2
8
9
2
9
2
2
9
5
2
9
8
3
0
1
3
0
4
3
0
7
3
1
0
3
1
3
3
1
6
3
1
9
3
2
2
3
2
5
3
2
8
3
3
1
3
3
4
3
3
7
3
4
0
3
4
3
3
4
6
3
4
9
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
7 
 
P{S100=s} 
s 
250 260 270 280 290 300 
Valor exato 5,1960E-05 5,1129E-04 2,9794E-03 1,0406E-02 2,1967E-02 2,8164E-02 
Aproximação Normal 5,4457E-05 5,1667E-04 2,9733E-03 1,0378E-02 2,1970E-02 2,8209E-02 
Erro percentual 4,81 1,05 -0,20 -0,27 0,01 0,16 
 
Exemplo 3.2.4 – As ideias acima são agora aplicadas ao problema geral de amostragem em populações 
muito grandes. Quer-se estimar a taxa de ocorrência (p) de determinada característica genética em uma 
população de dezenas de milhões de indivíduos. O teste é preciso, mas caro e intrusivo, portanto a amostra 
deve ser a menor possível. Sabe-se que p deve estar na faixa de 10 a 25%. Uma amostra de 1200 indivíduos 
é inicialmente considerada. 
Considerando-se o pior caso em termos da variância, qual seria a probabilidade de um erro superior a 2 
pontos percentuais na estimativa de p? 
Primeiro vamos definir como Xi o resultado relativo ao i-ésimo indivíduo sorteado: Xi=1 se o indivíduo 
apresenta a característicagenética estudada, e Xi=0, caso contrário. Assim, Xi~B(p), e E(Xi)=p e V(Xi)=p(1-p), 
onde p é a fração de indivíduos com a característica genética estudada, na população. 
Com uma amostra aleatória de tamanho n, teremos X1, X2, …, Xn, independentes e com a mesma distribuição 
B(p), a distribuição binária ou de Bernoulli. A soma Sn tem, então, distribuição binomial com parâmetros n 
e p: Sn~b(n, p). A esperança e a variância de Sn são, respectivamente, np e np(1-p). 
Pelo teorema central do limite, podemos aproximar S1200~N(1200p, 1200p(1-p)), logo 
pg = S����1200 ~N jp, p�1 − p�1200 k 
Portanto, 
P�|pg − p| > 0,02� = 1 − P�0,02 < pg − p < 0,02� = 1 − P
mn
o 0,02
pp�1 − p�1200
< pg − ppp�1 − p�1200
< 0,02pp�1 − p�1200 qr
s
 
P�|pg − p| > 0,02� ≈ 1 − P
mn
o 0,02
pp�1 − p�1200
< / < 0,02pp�1 − p�1200 qr
s
 
O pior caso (com maior probabilidade de erro superior a 2 pontos percentuais), ocorre quando a variância 
é máxima. A variância depende de p e, como se sabe que p está no intervalo (0,10, 0,25), o pior caso, em 
termos de variância ocorre em p=0,25, com V(X)=0,1875. Então 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
8 
 
P�|pg − p| > 0,02� ≤ 1 − P
mn
o −0,02
p0,18751200
< / < 0,02p0,18751200 qr
s = 1 − P : −0,020,0125 < / < 0,020,0125> 
P�|pg − p| > 0,02� ≤ 1 − P�−1,6 < / < 1,6� = 2t1 − Φ�1,6�u = 0,1096 
Portanto, nas condições e hipóteses do exercício, com uma amostra de tamanho n=1200, e sabendo a priori 
que p se situa entre 10 e 25%, a probabilidade de um erro de estimativa superior a 2 pontos percentuais é, 
no máximo, 10,96%. Com amostra duas vezes maior este limite superior cai – você pode fazer as contas – 
para 2,36%. No outro extremo, a menor variância possível, correspondente a p=0,10, é V(X)=0,09 e 
V(S1200)=75×10-6. Neste caso, com n=1200, P�|pg − p| > 0,02� ≈ 0,0209 ou 2,09%; com n=2400 essa 
probabilidade cai para 0,1%. Fazer todas essas contas é um bom exercício. � 
 
Alguns exercícios elementares com a Distribuição Normal 
1. Seja Z~N(0, 1). Calcule 
a. P{Z<a} para a = −4,0 − 1,2, 0,8, 2,2, 6,0 
b. P{Z>b} para b = −3,85 − 1,27, 0,09, 1,235, 5,8 
c. P{a<Z<b} para �a, b� = �−1,27, −0,25�, �−0,67, 1,25�, �0,60, 0,95� 
 
2. Seja X~N(100, 25). Calcule: 
a. P{X<a} para a = 86, 104 
b. P{a<X<b} para �a, b� = �85, 120�, �90, 98�, �92, 106� 
 
3. Sejam X1, X2, …, Xn i. i. d. N(10, 4), e 
E��� = Yxy�E�, E�, Ez, ⋯ , E�� , E��� = Y&��E�, E�, Ez, ⋯ , E��, | = ∑ E}�}R� � E~ = �� |. 
Calcule 
a. P{T>120} quando n=10 
b. P{9,90<XS<10,10} para n=100 e n=400 
c. P{X(1)<4} para n=1, 10, 100 e 1000 
d. P{X(n)>19} para n=1, 10, 100 e 1000 
 
4. Nas condições do exercício anterior, determine o valor de n para que: 
a. P{9,99<XS<10,01}=0,95 
b. P{X(1) < 2} = 0,99 
c. P{X(n) > 18} = 0,99 
 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
9 
 
Exercício 3.2.5 – Diversos aspectos importantes relativos às condições gerais de uma grande população 
podem ser monitoradas com precisão e objetividade através de pesquisas nas quais apenas uma fração 
ínfima dos indivíduos da população – selecionados por sorteio 
aleatório – precisam ser avaliados. Este exemplo, com dados 
simulados, mostra como a escolaridade média de jovens 
brasileiros de 15 anos de idade, pode ser estimada de forma 
rápida, econômica e muito precisa. Suponhamos inicialmente 
a subpopulação de jovens de 15 anos, distribuída, por anos de 
escolaridade formal completados com sucesso, como na tabela 
ao lado. Nela, a escolaridade média é: x~ = �� ∑ x ∙ N� ���R� =8,30 anos, onde Nx é o número de indivíduos na subpopulação 
estudada, com x anos de escolaridade, e N é o tamanho total 
da subpopulação. Nesse exemplo, com dados fictícios (mas não 
de todo dessemelhantes da situação real) N = ∑ N����R� = 2.216.842. O desvio 
quadrático médio de X na subpopulação, definido como S5� = �� ∑ �xQ − x~���QR� , pode ser, neste caso, 
reescrito como S5� = �� ∑ N��x − x~�����R� , é igual a 2,745, e mede o quão espalhados os indivíduos estão, 
em termos de escolaridade, em torno da escolaridade média, 8,30. 
 Suponha agora um experimento aleatório: sorteio aleatório de um dos indivíduos daquele grupo. Por 
sorteio aleatório, aqui, nos referimos ao sorteio no qual cada um dos indivíduos da população amostrada 
tem a mesma chance de vir a ser o escolhido. Seja X, agora, a variável aleatória correspondente ao número 
de anos de escolaridade do jovem selecionado. A distribuição deS probabilidades de X pode então ser 
derivada da tabela à esquerda, com p� = ��� . A esperança de X pode então ser calculada: E�X� =
∑ x ∙ P�X = x����R� = ∑ x ∙ ������R� = �� ∑ x ∙ N� = x~���R� . A esperança de X é igual à média populacional de x, e 
isto decorre do sorteio aleatório, que dá a cada indivíduo na população a mesma chance se ser sorteado. 
De forma análoga pode-se mostrar que V�X� = S5�. 
Estes dois resultados são importantes e abrem o caminho para a estimativa de x~, a média populacional de 
x. Para isto vamos repetir o experimento acima, n vezes. Os resultados parciais são X1, X2, …, Xn, 
independentes e identicamente distribuídos, com esperança x~ = 8,30 e variância S5� = 2,745. 
Fazendo XSO = �O ∑ XQOQR� temos E�XSO� = x~ = 8,30, V�XSO� = �O S5� = �,���O e, se n não for muito pequeno, XS 
terá distribuição aproximadamente normal. Seja, por exemplo, uma amostra de n=275 indivíduos. Nesse 
caso, V�XSO� = ���� S5� = 0,01 e XSON(8,30, 0,01), portanto o desvio padrão de XSOé 0,10 e, ao realizar a 
amostra, a média amostral cairá a menos de 0,2 ano de distância do alvo, a média populacional x~ =
8,30anos, com probabilidade 0,95. 
Este exemplo ilustra o poder da amostragem aleatória: com uma amostra de apenas 275 indivíduos, a média 
de x em uma população de mais de três milhões de jovens pode ser estimada com grande precisão. Com 
uma amostra quatro vezes maior, n-1100, o desvio padrão de XS cairia à metade, e o intervalo em torno de 
Anos de 
escola 
População 
0 5.147 
1 13.511 
2 21.875 
3 32.812 
4 46.644 
5 261.208 
6 38.280 
7 76.560 
8 513.233 
9 1.924.812 
10 256.061 
11 26.056 
12 643 
Total 3.216.842 
 
x P{X=x} 
0 0,0016 
1 0,0042 
2 0,0068 
3 0,0102 
4 0,0145 
5 0,0812 
6 0,0119 
7 0,0238 
8 0,1595 
9 0,5984 
10 0,0796 
11 0,0081 
12 0,0002 
 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
10 
 
x~ com probabilidade 0,95 seria teria largura total de apenas 2 décimos de ano, ou �x~ − 0,1, x~ + 0,1�. Não 
é um mau resultado, considerando que a população estudada tem mais que três milhões e duzentos mil 
indivíduos. � 
Exemplo 3.2.5 – Considere o D���, experimento composto, formado por 50 arremessos sucessivos e 
independentes de um dado comum de 6 lados. Sejam X1, X2, …, X50 os cinquenta resultados parciais 
independentes e o resultado acumulado é dado por 
T = � XQ��QR� 
Como E(X)=3,5 e V(X)= 2,916667, temos V(T)=175 e V(T)=145,83333. As probabilidades de P{T=t} foram calculadas usando 
algoritmo já descrito, para t de 0 a 300. Para P{T=175}, por exemplo primeiro determinamos o número de maneiras 
diferentes existem de se obter 175 pontos em 50 arremessos de um dado. Esse número é 
26.617.249.029.052.500.000.000.000.000.000.000.000, o qual, dividido por 650 resulta em P{T=175}=0,032930676. O 
valor da f.d.p. da normal correspondente, em t=175 é 0,033035559, uma diferença de 0,32%. Este erro relativo tende a 
crescer em direção às caudas da distribuição, na medida em que se afasta da esperança.Essa distribuição de probabilidades está representada na figura abaixo. 
 
 
Para comparação, o gráfico acima e a curva correspondente à função de densidade de probabilidades da normal 
correspondente, N(175, 145,83333), são sobrepostos na mesma figura abaixo. A quase perfeita sobreposição das duas 
distribuições de probabilidades atesta a convergência do total de n arremessos de um dado à normal correspondente 
(de mesma esperança e mesma variância), quando n é grande. 
 
0,000
0,005
0,010
0,015
0,020
0,025
0,030
0,035
1
2
0
1
2
5
1
3
0
1
3
5
1
4
0
1
4
5
1
5
0
1
5
5
1
6
0
1
6
5
1
7
0
1
7
5
1
8
0
1
8
5
1
9
0
1
9
5
2
0
0
2
0
5
2
1
0
2
1
5
2
2
0
2
2
5
2
3
0
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
11 
 
 
Cálculos precisos podem ser feitos para probabilidades como P{T<180}, usando-se, em lugar dos cálculos exatos (mas 
numericamente laboriosos), a aproximação normal: 
P{T<180}≈P{Y<179,5} com Y~N(175, 145,83333). Para este caso, temos o valor exato P{T<180}=0,644909, que bem 
aproximado por P{Y<179,5}=0,64529, com um erro relativo de apenas 0,059% 
� 
Exercício 3.2.6 – Na figura abaixo está representada a função de distribuição de probabilidades da 
pontuação total em 100 arremessos de um dado comum de 6 lados. Mostre com argumentos numéricos 
que essa distribuição pode ser aproximada com grande precisão da normal correspondente. 
 
 
0,000
0,005
0,010
0,015
0,020
0,025
0,030
0,035
1
2
0
1
2
5
1
3
0
1
3
5
1
4
0
1
4
5
1
5
0
1
5
5
1
6
0
1
6
5
1
7
0
1
7
5
1
8
0
1
8
5
1
9
0
1
9
5
2
0
0
2
0
5
2
1
0
2
1
5
2
2
0
2
2
5
2
3
0
0,000
0,005
0,010
0,015
0,020
0,025
2
9
0
2
9
5
3
0
0
3
0
5
3
1
0
3
1
5
3
2
0
3
2
5
3
3
0
3
3
5
3
4
0
3
4
5
3
5
0
3
5
5
3
6
0
3
6
5
3
7
0
3
7
5
3
8
0
3
8
5
3
9
0
3
9
5
4
0
0
4
0
5
4
1
0
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
12 
 
3.4 – Construindo intervalos de confiança para a esperança de X 
Seja X uma variável aleatória de esperança µ, desconhecida. Considere o problema de construir um intervalo de 
confiança para µ, com base em n observações independentes de X. Primeiro vamos considerar a situação mais 
favorável em que a variância, σ2, é conhecida. De X1, X2, X3, …, Xn tiramos XSO = �O ∑ XOQR� Q = �O SO. Vamos admitir que 
n é grande o suficiente para que a distribuição de XSO possa, com segurança, ser aproximada pela Normal de esperança 
m e variância 
�O σ�. Sabemos então que 
P :μ − 1,96 σ√n < XSO < � + 1,96 σ√n> = 0,95 
Portanto 
P : XSO − 1,96 σ√n < � < XSO + 1,96 σ√n> = 0,95 
Podemos então concluir que, ao realizar as n observações independentes, a probabilidade do intervalo 
� XSO − 1,96 7√O , XSO + 1,96 7√O# incluir o parâmetro µ é 0,95. Uma vez realizadas as n observações e calculado XSO 
poderemos afirmar, com 95% de confiança que, � ∈ � XSO − 1,96 7√O , XSO + 1,96 7√O#. 
Exemplo 3.3.1 – Uma variável aleatória X tem variância conhecida, σ2=12, mas esperança µ desconhecida. Com o 
objetivo de se estimar µ, 300 observações independentes são feitas da variável X. A soma dos 300 valores observados 
resultou em 7725, portanto XS��� = z���z�� = 25,75. A variância de A variância de XSz�� é, portanto, igual a 0,04; seu 
desvio padrão, 0,20. Embora, inicialmente, nada se soubesse de m, podemos agora afirmar, com 95% de confiança, 
que µ é algum valor no intervalo (25,75-1,96×0,20 , 25,75+1,96×0,20) = (25,358 , 26,142). 
Diz-se então que (25,358 , 26,142) é um intervalo de 95% de confiança (resumidamente, um i95%c) para µ. 
 � 
3.4 – Construção de intervalos de confiança com a distribuição t de Student 
Numa classe mais geral de problemas, quer-se fazer inferências sobre a esperança de uma variável aleatória, como 
na seção anterior, mas a variância de X é desconhecida. Assim, intervalos de confiança do tipo �XSO − k 7√O , XSO +
k 7√O # não poderão ser construídos, simplesmente porque o parâmetro σ é desconhecido. 
A saída foi encontrada por W. Gosset, que em um artigo de 1.904, sob o pseudônimo Student, deduziu a expressão 
algébrica da distribuição da estatística 
5S��6" √y. Vamos a este resultado. 
Seja X~N(µ, σ2), e sejam X1, X2, …, Xn, n observações independentes de X, com XSO = �O ∑ XQOQR� . Já sabemos que 5S��67 √n 
tem distribuição N(0, 1) e utilizamos este fato para construir intervalos de confiança para µ em situações em que σ é 
conhecido. 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
13 
 
Com σ desconhecido, lançamos mão de s� = �O�� ∑ �XQ − XSO��OQR� como substituto para σ2. De fato, da mesma forma 
como XSOconverge para µ na medida em que n cresce, s2 converge para σ2. A prova deste resultado não será feita 
neste capítulo. 
A ideia de usar intervalos da forma �XSO − k �√O , XSO + k �√O #, com s no lugar de σ, ocorre naturalmente, mas depara 
com uma dificuldade: a distribuição de 
5S��6� √n não é N(0, 1). Desta forma, não podemos tirar a constante k da tabela 
da normal padrão, como fizemos com k=1,96, para i95%c. 
Student resolveu o problema deduzindo a expressão da 
função de densidade de probabilidades da variável 
aleatória TO = 5S��6� √n. Ela depende de n; sua dedução 
é trabalhosa, mas elegante e relativamente simples. Ela 
demanda alguns conceitos que ainda não foram tratados 
e será apresentada em capítulo mais adiante. A função 
de densidade de probabilidades de Tn é 
fO�t� = ���$#��O���*�����$ # �1 + �
$
O��#�
�$ , para -∞<t<∞ 
A função gama que aparece na expressão acima é 
definida como Γ��� = � t���4� e��dt. Em justa 
homenagem a Gosset, a variável aleatória Tn é dita ter 
distribuição t de Student, com (n-1) graus de liberdade. 
A figura ao lado, representa f.d.p. da t de Student com 5 graus de liberdade, superposta à f.d.p. da normal padrão. As 
semelhanças são óbvias, mas a t tem uma cauda mais pesada. Na medida em que os graus de liberdade vão 
aumentando, a t vai se aproximando da normal padrão, de forma que para 100 ou mais graus de liberdade, as 
diferenças são irrelevantes para a maioria das aplicações práticas. Uma tabela no final deste capítulo dá valores 
críticos para a t de Student, para a construção de intervalos de 90, 95 e 99%, para graus de liberdade indo de 1 a 100. 
Para tamanhos amostrais grandes, usa-se os valores críticos da N(0,1). 
Exemplo 3.4.1 – Numa inspeção regular de rotina, técnicos do IMETRO, percorrendo vários pontos de venda na 
cidade, selecionam uma amostra aleatória de 16 pacotes de determinado detergente, com peso líquido nominal de 
1000 g. Levadas ao laboratório e analisadas, as 
amostras apresentaram os pesos líquidos reais na 
tabela ao lado. Vamos construir um i95%c para o peso 
médio real com que os pacotes estão sendo produzidos pelo fabricante. Temos ∑ E}��}R� =15.928 e 
∑ E}���}R� =15.858.572, logo XS = ��.����� = 995,5g e S� = ��� ∑ �XQ − XS����QR� = ��� �∑ XQ���QR� − 16 ∙ XS�� = 149,87g2. Da 
tabela, tiramos F-1(0,975)=2,131, onde F-1 é a inversa da função acumulada de distribuição de probabilidades de uma 
t de Student com 15 graus de liberdade. Logo, o i95%c para a média é 995,5±2,13145×p���,���� , ou (989,8, 1002,0). 
 
1024 988 985 1000 981 1006 999 986 
992 975 1001 987 1012 995 998 999 
 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
14 
 
Com base na amostra, podemos afirmar, com 95% de confiança, que os pacotes vêm sendo produzidos com peso 
líquido médio no intervalo (989,8, 1002,0). Não dá, portanto, para descartar a hipótese de que a calibração na fábrica 
esteja correta, ou seja, que os pacotes vem sendo produzidos com peso médio igual a 1000 g, como declarado no 
rótulo do pacote.� 
Exemplo 3.4.1 – O tempo de resposta de um motorista de caminhão a determinado estímulo visual é medido, em 
milésimos de segundo, quatorze vezes, independentemente, e em condições bem controladas. Os resultados são 
dados na tabela abaixo, e são representados no diagrama de pontos. 
 
 
Queremos aqui construir um intervalo de confiança para τ, o tempo médio de resposta para o motorista, sob as 
condições gerais do experimento. Sabendo que T = ��̅���� √n tem distribuição t de Student, com n-1 graus de 
liberdade, podemos então afirmar que 
� ?−2,160 < ��̅���� √14 < 2,160A = 0,95 
Logo, 
� ?−2,160 ∙ �√�� < �t̅ − τ� < 2,160 ∙ �√��A = 0,95 
� :−t̅ − 2,160 ∙ s√14 < −  < −t̅ + 2,160 ∙ s√14> = 0,95 
Multiplicando os termos a desigualdade por -1, temos que inverter os sinais de desigualdade. Assim: 
� :t̅ + 2,160 ∙ s√14 >   > t̅ − 2,160 ∙ s√14> = 0,95 
E, portanto 
� :t̅ − 2,160 ∙ s√14 <   < t̅ + 2,160 ∙ s√14> = 0,95 
Sabemos então que a probabilidade do intervalo aleatório �t̅ − 2,160 ∙ �√�� , t̅ + 2,160 ∙ �√��# vir a conter o parâmetro 
desconhecido τ é igual a 0,95. 
Dos valores observados, t1, t2, ..., t14, tiramos: 
t̅ = 114 � tQ
��
QR�
= 186,7 e s� = 113 ��tQ − t̅��
��
QR�
= 109,5 
188 187 210 190 177 192 192 180 173 179 191 187 198 170 
 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
15 
 
Daí, construímos um intervalo de 95% de confiança para τ: 
�186,7 − 2,160 ∙ ��,�√�� , t̅ + 2,160 ∙ ��,�√��#, ou (180,7 , 192,8). 
Afirmamos, então, com 95% de confiança, que – sob as condições gerais definidas para o experimento – o tempo 
médio de respostado motorista, τ, está contido no intervalo (180,7 , 192,7) milissegundos. � 
 
Sobre a questão da divisão por (n-1) 
No cálculo de s2, como no exemplo acima, usamos a expressão s� = �O�� ∑ �xQ − x~��OQR� . A soma de n parcelas e a 
divisão por (n-1), e não por n, sempre causa dúvida e desconforto. Vamos explicar, primeiro no contexto de uma 
população finita. 
Suponha uma população de N indivíduos, aos quais estão associados valores de uma variável quantitativa, X. Sejam 
X1, X2, …, XN os valores de X associados aos indivíduos 1, 2, …, N, respectivamente. 
Definimos agora dois parâmetros populacionais, XS e S�, respectivamente a média e o desvio quadrático médio, 
populacionais, de X: 
XS = 1N � XQ
�
QR�
 e S� = 1N ��XQ − XS��
�
QR�
 
Devemos resistir à tendência de chamar S2 de variância de X, uma vez que esta é um parâmetro associado a uma 
variável aleatória e, até o momento não há nada aleatório no esquema montado: Uma população, uma variável 
quantitativa e dois parâmetros populacionais dessa variável. 
Vamos agora introduzir certo esquema probabilístico: a seleção aleatória de um dos indivíduos da população e a 
determinação do valor de X para esse indivíduo; seja x esse valor. Agora, x é uma variável aleatória. Se o esquema de 
sorteio aleatório adotado foi tal que qualquer dos N indivíduos da população teve a mesma chance 1/N de ser 
sorteado, então 
 
E�x� = � ¡XQ ∙ 1N¢
�
QR�
= 1N � XQ =
�
QR�
XS 
 
V�x� = E�x − XS�� = � £�XQ − XS�� ∙ 1N¤
�
QR�
= 1N ��XQ − XS��
�
QR�
= S� 
Vemos agora a associação entre V(x) e S2: se um indivíduo for selecionado ao acaso, de forma que cada indivíduo na 
população tenha a mesma chance de vir a ser sorteado, e, fazendo x igual ao valor da variável X para aquele 
indivíduo, então V(x)=S2. Vamos então, respeitando a convenção, representar XS e S� por µ e σ2, respectivamente. 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
16 
 
Suponha agora um sorteio se n indivíduos da população, sendo n<N. Aos valores observados de X, denominaremos 
x1, x2, … , xn, e seja x~ = �� ∑ xQOQR� . Para garantir a independência entre os xi’s, podemos adotar o sorteio com 
reposição: cada indivíduo selecionado é reposto na população, podendo inclusive vir a ser selecionado novamente. 
Desta forma, após cada sorteio a população é restaurada à sua integridade, e o novo indivíduo sorteado o será em 
condições exatamente idêntica às do anterior, garantindo a independência entre os resultados. Sabemos, então, 
que 
E�x~� = XS = μ e V�x~� = 1n S� = 1n σ� 
Agora, vejamos o que acontece com o desvio quadrático médio amostral, �O ∑ �xQ − x~��OQR� . Como veremos, sua 
esperança não é σ2, logo, se o utilizarmos como o estimador da variância, teremos um estimador viciado. Vejamos: 
Et�xQ − x~��u = Et�xQ − µ + µ − x~��u = Et�xQ − µ�� + �μ − x~�� + 2�xQ − µ��μ − x~�u 
Separando os termos em colchete: 
 Et�xQ − x~��u = Et�xQ − µ��u + Et�μ − x~��u + 2Et�xQ − µ��μ − x~�u 
Et�xQ − x~��u = V�xQ� + V�x~� + 2tµE�xQ� + µE�x~� − E�xQx~� − µ�u 
Et�xQ − x~��u = σ� + 1n σ� + 2tµ� + µ� − E�xQx~� − µ�u 
Et�xQ − x~��u = n + 1n σ� + 2µ� − 2E�xQx~� 
Precisamos agora determinar E�xQx~�. Ora, 
xQx~ = xQ x� + x� + ⋯ + xQ + ⋯ + xOn = 1y �xQx� + xQx� + ⋯ + xQ� + ⋯ + xQxO� 
Como os xi’s são independentes entre si, então E(xixj) é igual a µ2 para i≠j, e µ2+σ2 para i=j. Logo, 
E�xQx~� = 1n �nμ� + σ�� = μ� + 1n σ� 
Podemos então concluir que 
Et�xQ − x~��u = n + 1n σ� + 2µ� − 2 ¡μ� + 1n σ�¢ = n + 1n σ� − 2n σ� = n − 1n σ� 
 
Portanto, 
E ¥��xQ − x~��OQR� ¦ = �n − 1�σ� 
Ou seja, 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
17 
 
E ¥1n ��xQ − x~��
O
QR�
¦ = �n − 1�n σ� 
Diferente de σ2, portanto. Por outro lado, 
E ¥ 1n − 1 ��xQ − x~��
O
QR�
¦ = σ� 
Usamos, então, 
�O�� ∑ �xQ − x~��OQR� como o estimador mais apropriado (não tendencioso) de σ2. 
Note que E(xi - µ)2=σ2. Portanto, se µ não fosse desconhecido, poderíamos estimar σ2 pelo desvio quadrático amostral 
médio, 
�O ∑ �xQ − μ��OQR� , cuja esperança é exatamente σ2, um estimador não tendencioso, portanto. Por não conhecer 
µ, calculamos os desvios quadráticos das observações, não em torno de µ, mas de seu estimador, x~ = �� ∑ xQOQR� . Isto 
reduz um pouco a soma de quadrados pois, como é simples provar, dado um conjunto de valores reais, x1, x2, … , xn, 
a soma de desvios quadráticos destes valores em torno de um número arbitrário c, ∑ �xQ − c��OQR� é mínima quando 
§ = x~ = �� ∑ xQOQR� . Portanto, �� ∑ �xQ − x~�� ≤OQR� �� ∑ �xQ − μ��OQR� , com a igualdade valendo apenas quando coincidir x~ = μ. Como a esperança da somatória ao lado direito da desigualdade é σ2, a da esquerda tem que ser menor que 
σ2. E é, como vimos: W ©�� ∑ �xQ − x~��OQR� ª = ���� ��. Multiplicando ambos os lados por ���� , restauramos o “equilíbrio”, 
com W © ���� ∑ �xQ − x~��OQR� ª = ��. 
Pronto, está explicado. 
Testando hipóteses simples sobre a esperança de uma variável aleatória X 
Um dos recursos básicos mais poderosos da Estatística com peça central do Método Científico, é a possibilidade que 
ele oferece para se testar (cientificamente) hipóteses sobre a esperança desconhecida de uma variável aleatória. Seja 
a variável aleatória 
X ~ N(µ, σ2) 
e n observações independentes de X: 
X1, X2, … , Xn 
Sejam as estatísticas Z e T definidas como: 
Z = XS − μσ √n e T = XS − μs √n 
onde 
XS = 1n � XQ
�
QR�
 e s� = 1n − 1 ��XQ − XS��
�
QR�
 
A estatística Z tem distribuição N(0, 1) enquanto T tem distribuição t de Student, com n-1 graus de liberdade. 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
18 
 
Considere agora que a esperança µ seja desconhecida, e que se queira testar, contra a hipótese nula 
 H0: µ=µ0 
a hipótese alternativa 
H1: µ>µ0 
Consideremos primeiro o caso em que o desvio padrão σ é conhecido. É claro que um valor de XS grande demais é 
evidência contra H0, e em favor de H1. O questão aqui é, o que é “grande demais”? 
Para um tratamento objetivo deste caso, devemos definir um valor crítico c tal que, se XS for maior que c, 
consideraremos que é grande demais, e rejeitaremos H0 em favor de H1. Por outro lado, seXS não for maior que c, 
consideraremos que os dados experimentais não trouxeram evidência suficiente contra H0, e não rejeitaremos, então 
a hipótese nula. 
Como escolher o valor crítico c? Se escolhermos c grande demais, será quase impossível rejeitar indevidamente a 
hipótese nula quando ela for verdadeira, mas a probabilidade de não rejeitá-la quando ela for falsa poderá ser muito 
elevada. Dizemos que o critério de decisão fica conservador demais. Por outro lado, se escolhermos um valor crítico 
c pequeno, teremos o problema oposto, com elevada probabilidade de rejeitar H0 sendo esta hipótese verdadeira. A 
solução é adotar uma solução de compromisso, balanceando as probabilidades dos dois erros opostos possíveis: 
rejeitar uma hipótese nula verdadeira, ou não rejeitar uma hipótese nula falsa. 
Para isto, vamos fixar um valor suficientemente baixo para a probabilidade de rejeitarmos H0 quando esta hipótese 
for verdadeira, isto é, a esperança de X for, de fato, igual ao valor fixado µ0. Seja α este valor “suficientemente baixo”. 
A constante c é então escolhida para garantir que, se H0 for verdadeira, então 
P�XS > §� = α 
Ora, se H0 for verdadeira, a estatística Z terá distribuição N(0, 1), então 
P�XS > §� = P ?Z > c − μ�σ √n A = α 
Portanto, 
Φ �c − μ�σ √n# = 1 − α e Φ���1 − α� = c − μ�σ √n 
Podemos então extrair o valor crítico c, em função de µ0, σ, n e α: 
c = μ�+ 7√O Φ���1 − α�. 
Fica então completamente definida uma abordagem para o problema de testar a hipótese H0: µ=µ0 , contra a hipótese 
alternativa H1: µ>µ0 : 
1. Escolhe-se α, um valor suficientemente pequeno para a probabilidade de se rejeitar indevidamente a 
hipótese nula H0; 
2. Define-se n, o número de observações a serem feitas da variável aleatória X; 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
19 
 
3. Faz-se as n observações independentes de X; 
4. Calcula-se a estatística T; 
5. Rejeita-se H0 se T for maior do que c. 
Vejamos um exemplo: 
Seja X uma variável aleatória com distribuição Normal, com média µ e desvio padrão σ. A esperança de é desconhecida, mas 
acredita-se que seja igual a 100. Contudo, existe uma corrente de opinião que afirma que afirma que µ é, na verdade, maior 
que 100. O desvio padrão de X, é σ=4, conhecido. Para se testar a hipótese conservadora H0: µ=100, contra a hipótese 
alternativa, H0: µ>100, decide-se pela abordagem experimental: serão feitas n observações independentes de X, rejeitando-
se H0 se XS for muito grande. Como proteção contra a rejeição de H0 quando esta hipótese for verdadeira, arbitrou-se um valor 
α=0,05. 
Neste caso, c = μ�+ 7√O Φ���1 − α� = 100 + �√O × 1,645 Através de experimentos cuidadosamente controlados, 
realiza-se n=30 observações independentes de X, portanto o valor crítico c é igual a 101,2. Os 30 valores observados estão 
listados na tabela abaixo. obtendo-se os valores dados na tabela ao abaixo, cuja 
média é XS = 101,78, que, sendo maior que 
o valor crítico c=101,2, leva à rejeição de H0. 
 
 
Testando hipótese simples sobre uma média 
1. O teste de tempo de resposta a objeto em queda, realizado em sala, as distâncias percorridas pela régua desde 
o repouso até a reação, em 16 medições sucessivas com o mesmo estudante, são dadas abaixo, em cm. 
observação 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 
Distância (cm) 13 17 15 13 15 15 10 13 15 11 16 13 13 11 14 13 
 
Seja τ o tempo médio de resposta do aluno, em milissegundos (ms). Teste 
H0: τ=150 ms versus H1: τ>150 ms ao nível de significância α=0,05. 
Exercícios 
101,7 98,3 94,8 102,1 103,7 99,4 104,0 98,7 101,3 99,9 
106,2 101,5 104,2 107,0 106,0 102,1 102,1 110,2 94,5 102,6 
104,5 103,0 99,5 104,3 91,5 100,3 99,4 103,6 106,7 100,2 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
20 
 
1. Em duas regiões R1 e R2 distintas estão cinco cidades, sendo duas em R1 e três em R2. Em cada cidade existe certo número de 
estudantes concluindo o ensino fundamental. Uma 
prova de três questões será aplicada a esses 
estudantes. Seja N o número de questões que um 
estudante sabe resolver; N pode, então, valer 0, 1, 2 
ou 3. A distribuição dos estudantes, por 
cidade/região e nota é como mostra a Tabela 1. Um 
experimento aleatório consiste em sortear um aluno 
ao acaso, e aplicar-lhe a prova e registrando em X o 
número de questões que soube responder 
corretamente, isto é, fazer X=N. Este experimento é 
repetido sucessiva e independentemente, n vezes, 
gerando X1, X2, X3, … , Xn e, daí, XSO e Sn e conforme 
definidos. 
a. Considerando todos os alunos como um 
único grupo, sem distinção de região e cidade, calcule NS e S2, respectivamente a média e o desvio quadrático 
médio de N. 
b. Calcule E(X) e V(X). 
c. Calcule P{X=0}\C1, isto é, a probabilidade condicional de o aluno tirar 0 dado que é da cidade 1. 
d. Calcule E(X) dado C1. 
e. Calcule E(X) dado R2. 
f. Calcule V(X) dado R1. 
g. Calcule a probabilidade que dos primeiros 20 alunos selecionados, exatamente seis respondam corretamente as 
três questões. 
h. Qual a probabilidade que o trigésimo aluno sorteado seja de C2, dado que ele acertou as três questões? 
i. Qual a probabilidade do oitavo aluno sorteado não ser de C5, dado que ele não acertou as três questões. 
j. Para n=400, calcule a probabilidade de que, usando XSOcomo estimador de NS, se cometa um erro absoluto 
superior a 1% de NS; isto é, que XSO caia fora do intervalo �0,99 ∙ NS, 1,01 ∙ NS� 
k. Nesta amostra de 400 alunos, seja n3 o número de alunos com nota perfeita. Calcule P{n3=150} 
l. Ainda com n=400, construa um intervalo de probabilidade 0,95 para n0. 
m. Qual deveria ser o tamanho amostral n para que P�|XSO − NS| > 0,01NS�=0,05? 
 
2. A tabela contém dados simulados, porém com características semelhantes à situação real. Imagine que para uma prova do 
ENEM, com 180 questões, hajam 4.817.768 alunos inscritos, e que esses alunos, distribuídos por número de questões que 
conseguem resolver corretamente na prova, formam a tabela apresentada abaixo (ela pode ser copiada e colada numa 
planilha Excel; ou pode ser copiada diretamente de EnemSimula no Teleduc). Numa prova frequentemente o aluno não tira a 
nota que merece por errar – por algum descuido – alguma questão que sabe resolver bem, ou, principalmente em provas 
com questões de múltipla escolha, acertar, por sorte no ‘chute’ questões que não sabe resolver. Vamos admitir que com as 
questões sendo corrigidas individualmente, com avaliação completa de todo o desenvolvimento apresentado, esses 
problemas podem ser completamente eliminados. Use computador para os cálculos. 
3. Em média, quantas questões os alunos resolverão na prova? Denomine-a M. 
4. Numa escala de 0 a 100, qual será a nota média geral? Denomine-a NS. 
5. Se um aluno for sorteado ao acaso e submetido à prova, seja X o número de questões que saberá responder corretamente. 
Calcule E(X) e V(X). 
Tabela 1 – Número de alunos por cidade e número de questões que 
consegue resolver corretamente 
Região e 
Cidade 
Número de questões da plrova que o 
aluno sabe responder corretamente 
Total por 
cidade e 
por região 0 1 2 3 
R1 C1 1.200 1.950 2.870 2.220 8.240 
R1 C2 4.200 8.330 2.140 830 15.500 
Total R1 5.400 10.280 5.010 3.050 23.740 
R2 C3 1.260 4.320 6.950 5.370 17.900 
R2 C4 827 2.895 12.840 6.870 23.432 
R2 C5 120 840 5.540 12.640 19.140 
Total R2 2.207 8.055 25.330 24.880 60.472 
Total 7.607 18.335 30.340 27.930 84.212 
 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
21 
 
6. Se uma amostra aleatória de n estudantes for sorteada do universo e submetida à prova, gerando X1, X2, X3, … , Xn e, daí, XSO e 
Sn e conforme definidos, determine E�XSO� e V�XSO�. 
7. Para n=1000,calcule P�|XSO − M| > 2�, a probabilidade que XSO caia a mais que dois pontos (duas questões certas) de 
distância de M. 
8. Para n=1000, calcule P�|XSO − M| > 1�. 
9. Qual deve ser n para que P�|XSO − M| > 1� = 0,05? 
10. E no caso acima, quanto seria P�|XSO − M| > 2�? 
11. Considerando os resultados acima, comente sobre as virtudes de XSO como um estimador barato e preciso de M. 
 
Tabela: Distribuição geral dos alunos por número de questões da prova que sabe resolver 
nota 
número 
de 
alunos 
 
nota 
número 
de 
alunos 
 
nota 
número 
de 
alunos 
 
nota 
número 
de 
alunos 
 
nota 
número 
de 
alunos 
 
nota 
número 
de 
alunos 
0 0 30 48693 60 67899 90 36539 120 7832 150 404 
1 142 31 51362 61 63942 91 33353 121 7692 151 344 
2 522 32 52836 62 67424 92 33603 122 7375 152 306 
3 1188 33 52438 63 62679 93 31162 123 6683 153 251 
4 1944 34 55470 64 61224 94 30006 124 5950 154 214 
5 3010 35 58156 65 60830 95 30163 125 5907 155 168 
6 4021 36 56250 66 64751 96 28851 126 5367 156 140 
7 5643 37 60134 67 60285 97 27193 127 4918 157 122 
8 6799 38 58713 68 59942 98 26928 128 4364 158 97 
9 8880 39 62721 69 56661 99 24009 129 4154 159 75 
10 10423 40 62675 70 56570 100 24010 130 3879 160 58 
11 11765 41 61629 71 56645 101 22722 131 3650 161 46 
12 13530 42 62800 72 54812 102 22432 132 3386 162 37 
13 15949 43 68441 73 55950 103 21826 133 3066 163 28 
14 17305 44 69439 74 52262 104 20278 134 2784 164 21 
15 20079 45 65852 75 53477 105 19179 135 2363 165 16 
16 21631 46 65925 76 49361 106 17448 136 2312 166 11 
17 24971 47 65397 77 52459 107 17540 137 2129 167 7 
18 27549 48 69677 78 47002 108 16609 138 1759 168 5 
19 27425 49 70524 79 49981 109 16004 139 1729 169 3 
20 31799 50 66006 80 45242 110 14834 140 1421 170 2 
21 31519 51 69201 81 45360 111 14014 141 1371 171 1 
22 36194 52 66818 82 43634 112 13770 142 1169 172 1 
23 35284 53 71403 83 45433 113 12435 143 1037 173 0 
24 38375 54 70700 84 43774 114 11564 144 892 174 0 
25 43203 55 70770 85 40566 115 11048 145 838 175 0 
26 42531 56 67419 86 41851 116 11037 146 744 176 0 
27 45963 57 68550 87 37850 117 10408 147 651 177 0 
 
0
10.000
20.000
30.000
40.000
50.000
60.000
70.000
80.000
0
1
0
2
0
3
0
4
0
5
0
6
0
7
0
8
0
9
0
1
0
0
1
1
0
1
2
0
1
3
0
1
4
0
1
5
0
1
6
0
1
7
0
1
8
0
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
22 
 
28 44525 58 67948 88 38946 118 9081 148 516 178 0 
29 49498 59 69660 89 36070 119 8788 149 474 179 0 
 180 0 
12. No Brasil existem cerca de 2,5 milhões de jovens cursando o terceiro ano do ensino médio. Quer-se estimar p, 
a fração desses estudantes que sabe resolver a questão de geometria plana abaixo. 
Suponha que p=0,50. Se 1000 estudantes forem amostrados ao acaso, qual a probabilidade de que a franção 
deles que sabe resolver a questão esteja a menos que 3 pontos percentuais de 0,50? 
 
13. 
O quadrado maior tem 4m2 de área. Qual 
a área do setor sombreado da figura? 
 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
23 
 
Tabelas de probabilidades na Normal Padrão 
Φ(z) = P{ Z < z } , para Z~N(0, 1) 
 
z 0,00 0,01 0,02 0,03 0.04 0,05 0,06 0,07 0,08 0,09 
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586 
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56750 0,57142 0,57535 
0,2 0,57926 0,58317 0,58706 0,59095 0,59484 0,59871 0,60257 0,60642 0,61026 0,61409 
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173 
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67365 0,67724 0,68082 0,68439 0,68793 
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72241 
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490 
0,7 0,75804 0,76115 0,76424 0,76731 0,77035 0,77337 0,77637 0,77935 0,78231 0,78524 
0,8 0,78815 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327 
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891 
1,0 0,84135 0,84375 0,84614 0,84850 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214 
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298 
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90148 
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774 
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92786 0,92922 0,93056 0,93189 
1,5 0,93319 0,93448 0,93575 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408 
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449 
1,7 0,95544 0,95637 0,95728 0,95819 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327 
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062 
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97671 
2,0 0.977250 0,97778 0,97831 0,97882 0,97933 0,97982 0,98030 0,98077 0,98124 0,98169 
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574 
2,2 0,98610 0,98645 0,98679 0,98713 0,98746 0,98778 0,98809 0,98840 0,98870 0,98899 
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158 
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361 
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520 
2,6 0,99534 0,99547 0,99560 0,99573 0,99586 0,99598 0,99609 0,99621 0,99632 0,99643 
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99737 
2,8 0,99745 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807 
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861 
3,0 0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889 0,99893 0,99897 0,99900 
3,1 0,99903 0,99907 0,99910 0,99913 0,99916 0,99918 0,99921 0,99924 0,99926 0,99929 
3,2 0,99931 0,99934 0,99936 0,99938 0,99940 0,99942 0,99944 0,99946 0,99948 0,99950 
3,3 0,99952 0,99953 0,99955 0,99957 0,99958 0,99960 0,99961 0,99962 0,99964 0,99965 
3,4 0,99966 0,99968 0,99969 0,99970 0,99971 0,99972 0,99973 0,99974 0,99975 0,99976 
3,5 0,99977 0,99978 0,99978 0,99979 0,99980 0,99981 0,99982 0,99982 0,99983 0,99984 
3,6 0,99984 0,99985 0,99985 0,99986 0,99986 0,99987 0,99987 0,99988 0,99988 0,99989 
3,7 0,99989 0,99990 0,99990 0,99990 0,99991 0,99991 0,99992 0,99992 0,99992 0,99993 
3,8 0,99993 0,99993 0,99993 0,99994 0,99994 0,99994 0,99994 0,99995 0,99995 0,99995 
3,9 0,99995 0,99995 0,99996 0,99996 0,99996 0,99996 0,99996 0,99996 0,99997 0,99997 
 
 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
24 
 
Tabela Normal Extrema: Valores de P{Z>z}=1-Φ(z) para z de 2,50 a 4,69 em ppm (partes por milhão); de 4,00 a 4,99 
em ppb (partes por bilhão) e de 5,00 a 7,09, em ppt (partes por trilhão) 
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 
2,50 6 210 6 037 5 868 5 703 5 543 5 386 5 234 5 085 4 940 4 799 
2,60 4 661 4 527 4 396 4 269 4 145 4 025 3 907 3 793 3 681 3 573 
2,70 3 467 3 364 3 264 3 167 3 072 2 980 2 890 2 803 2 718 2 635 
2,80 2 555 2 477 2 401 2 327 2 256 2 186 2 118 2 052 1 988 1 926 
2,90 1 866 1 807 1 750 1 695 1 641 1 589 1 538 1 489 1 441 1 395 
3,00 1 350 1 306 1 264 1 223 1 183 1 144 1 107 1 070 1 035 1 001 
3,10 968 935 904 874 845 816 789 762 736 711 
3,20 687 664 641 619 598 577 557 538 519 501 
3,30 483 466 450 434 419 404 390 376 362 349 
3,40 337 325 313 302 291 280 270 260 251 242 
3,50 233 224 216 208 200 193 185 178 172 165 
3,60 159 153 147 142 136 131 126 121 117 112 
3,70 108 104 100 96 92 88 8582 78 75 
3,80 72 69 67 64 62 59 57 54 52 50 
3,90 48 46 44 42 41 39 37 36 34 33 
4,00 32 30 29 28 27 26 25 24 23 22 
4,10 21 20 19 18 17 17 16 15 15 14 
4,20 13 13 12 12 11 11 10 10 9 9 
4,30 9 8 8 7 7 7 7 6 6 6 
4,40 5 5 5 5 4 4 4 4 4 4 
4,50 3 3 3 3 3 3 3 2 2 2 
4,60 2 2 2 2 2 2 2 2 1 1 
 
4,00 31 671 30 359 29 099 27 888 26 726 25 609 24 536 23 507 22 518 21 569 
4,10 20 658 19 783 18 944 18 138 17 365 16 624 15 912 15 230 14 575 13 948 
4,20 13 346 12 769 12 215 11 685 11 176 10 689 10 221 9 774 9 345 8 934 
4,30 8 540 8 163 7 801 7 455 7 124 6 807 6 503 6 212 5 934 5 668 
4,40 5 413 5 169 4 935 4 712 4 498 4 294 4 098 3 911 3 732 3 561 
4,50 3 398 3 241 3 092 2 949 2 813 2 682 2 558 2 439 2 325 2 216 
4,60 2 112 2 013 1 919 1 828 1 742 1 660 1 581 1 506 1 434 1 366 
4,70 1 301 1 239 1 179 1 123 1 069 1 017 968 921 876 834 
4,80 793 755 718 683 649 617 587 558 530 504 
4,90 479 455 433 411 391 371 352 335 318 302 
 
5,00 286 652 272 150 258 357 245 240 232 766 220 905 209 628 198 908 188 717 179 032 
5,10 169 827 161 079 152 768 144 871 137 369 130 243 123 475 117 047 110 943 105 147 
5,20 99 644 94 420 89 462 84 755 80 288 76 050 72 028 68 212 64 592 61 158 
5,30 57 901 54 813 51 884 49 106 46 473 43 977 41 611 39 368 37 243 35 229 
5,40 33 320 31 512 29 800 28 177 26 640 25 185 23 807 22 502 21 266 20 097 
5,50 18 990 17 942 16 950 16 012 15 124 14 283 13 489 12 737 12 026 11 353 
5,60 10 718 10 116 9 548 9 010 8 503 8 022 7 569 7 140 6 735 6 352 
5,70 5 990 5 649 5 326 5 022 4 734 4 462 4 206 3 964 3 735 3 519 
5,80 3 316 3 124 2 942 2 771 2 610 2 458 2 314 2 179 2 051 1 931 
5,90 1 818 1 711 1 610 1 515 1 425 1 341 1 261 1 186 1 116 1 049 
6,00 986,6 927,6 872,1 819,8 770,6 724,2 680,6 639,6 600,9 564,6 
6,10 530,3 498,2 467,9 439,4 412,6 387,4 363,7 341,4 320,5 300,8 
6,20 282,3 264,9 248,6 233,2 218,8 205,2 192,5 180,5 169,3 158,7 
6,30 148,8 139,5 130,8 122,6 114,9 107,7 100,9 94,51 88,54 82,94 
6,40 77,69 72,76 68,14 63,80 59,74 55,93 52,35 49,00 45,86 42,92 
6,50 40,16 37,58 35,15 32,88 30,76 28,77 26,90 25,16 23,52 21,99 
6,60 20,56 19,22 17,96 16,78 15,68 14,65 13,69 12,79 11,95 11,16 
6,70 10,42 9,731 9,086 8,483 7,919 7,392 6,900 6,439 6,009 5,607 
6,80 5,231 4,880 4,552 4,246 3,960 3,692 3,443 3,210 2,993 2,790 
6,90 2,600 2,423 2,258 2,104 1,960 1,826 1,701 1,585 1,476 1,374 
7,00 1,280 1,192 1,109 1,033 0,961 0,895 0,833 0,775 0,721 0,671 
 
 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
25 
 
 
 
 
 
 
TABELA COMPLEMENTAR 
Valores Especiais ou Extremos 
z Φ(z) 1-Φ(z) 
0,00000 0,500000000 50% 
0,25335 0,600000000 40% 
0,52440 0,700000000 30% 
0,67449 0,750000000 25% 
0,84162 0,800000000 20% 
1,28155 0,900000000 10% 
1,64485 0,950000000 5% 
1,95996 0,975000000 2.5% 
2,32635 0,990000000 1% 
2,57583 0,995000000 0,5% 
3,09023 0,999000000 0,1% 
3,29053 0,999500000 500 ppm* 
3,71902 0,999900000 100 ppm 
3,89059 0,999950000 50 ppm 
4,26489 0,999990000 10 ppm 
4,41717 0,999995000 5 ppm 
4,75342 0,999999000 1 ppm 
4,89164 0,999999500 500 ppb** 
5,19934 0,999999900 100 ppb 
5,32672 0,999999950 50 ppb 
5,61200 0,999999990 10 ppb 
5,73073 0,999999995 5 ppb 
5,99781 0,999999999 1 ppb 
 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
26 
 
Tabela t de Student 
Valores de t, para P{T<t} iguais a 0,90, 0,95, 09,75 e 0,995, para t de Student com 1 a 140 graus de 
liberdade. Para infinitos graus de liberdade, a t de Student coincide com a N(0, 1). 
 Exemplo de uso da tabela: Numa t de Stutent com 10 graus de liberdade, P{T<2,228}=0,95. 
g.l. 
P{T<t} 
g.l. 
P{T<t} 
0,900 0,950 0,975 0,990 0,995 0,9 0,95 0,975 0,990 0,995 
1 3,078 6,314 12,71 31,821 63,66 31 1,309 1,696 2,040 2,453 2,744 
2 1,886 2,920 4,303 6,965 9,925 32 1,309 1,694 2,037 2,449 2,738 
3 1,638 2,353 3,182 4,541 5,841 33 1,308 1,692 2,035 2,445 2,733 
4 1,533 2,132 2,776 3,747 4,604 34 1,307 1,691 2,032 2,441 2,728 
5 1,476 2,015 2,571 3,365 4,032 35 1,306 1,690 2,030 2,438 2,724 
6 1,440 1,943 2,447 3,143 3,707 36 1,306 1,688 2,028 2,434 2,719 
7 1,415 1,895 2,365 2,998 3,499 37 1,305 1,687 2,026 2,431 2,715 
8 1,397 1,860 2,306 2,896 3,355 38 1,304 1,686 2,024 2,429 2,712 
9 1,383 1,833 2,262 2,821 3,250 39 1,304 1,685 2,023 2,426 2,708 
10 1,372 1,812 2,228 2,764 3,169 40 1,303 1,684 2,021 2,423 2,704 
11 1,363 1,796 2,201 2,718 3,106 50 1,299 1,676 2,009 2,412 2,678 
12 1,356 1,782 2,179 2,681 3,055 55 1,297 1,673 2,004 2,403 2,668 
13 1,350 1,771 2,160 2,650 3,012 60 1,296 1,671 2,000 2,396 2,660 
14 1,345 1,761 2,145 2,624 2,977 65 1,295 1,669 1,997 2,390 2,654 
15 1,341 1,753 2,131 2,602 2,947 70 1,294 1,667 1,994 2,385 2,648 
16 1,337 1,746 2,120 2,583 2,921 75 1,293 1,665 1,992 2,381 2,643 
17 1,333 1,740 2,110 2,567 2,898 80 1,292 1,664 1,990 2,377 2,639 
18 1,330 1,734 2,101 2,552 2,878 85 1,292 1,663 1,988 2,374 2,635 
19 1,328 1,729 2,093 2,539 2,861 90 1,291 1,662 1,987 2,371 2,632 
20 1,325 1,725 2,086 2,528 2,845 95 1,291 1,661 1,985 2,368 2,629 
21 1,323 1,721 2,080 2,518 2,831 100 1,290 1,660 1,984 2,366 2,626 
22 1,321 1,717 2,074 2,508 2,819 105 1,290 1,660 1,983 2,364 2,623 
23 1,319 1,714 2,069 2,500 2,807 110 1,289 1,659 1,982 2,362 2,621 
24 1,318 1,711 2,064 2,492 2,797 115 1,289 1,658 1,981 2,361 2,619 
25 1,316 1,708 2,060 2,485 2,787 120 1,289 1,658 1,980 2,359 2,617 
26 1,315 1,706 2,056 2,479 2,779 125 1,288 1,657 1,979 2,358 2,616 
27 1,314 1,703 2,052 2,473 2,771 130 1,288 1,657 1,978 2,357 2,614 
28 1,313 1,701 2,048 2,467 2,763 135 1,288 1,656 1,978 2,355 2,613 
29 1,311 1,699 2,045 2,462 2,756 140 1,288 1,656 1,977 2,354 2,611 
30 1,310 1,697 2,042 2,457 2,750 ∞ 1,282 1,645 1,960 2,353 2,576 
 
 
 
 
 
 
 
 
 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
27 
 
Processo de Ramificação de Galton-Watson 
Considere o tempo evoluindo discretamente a passos ∆t e, a cada passo uma partícula 
dá origem a N novas partículas e desaparece. N é uma variável aleatória que assume 
valores inteiros não negativos: ΩN= {0, 1, 2, 3, 4, …}, com probabilidades P{N=n}=pn e, 
portanto, ∑ �� = 14�R� . Se N=0, a linhagem de descendência daquela partícula se 
extingue. Se N>0, pelo menos uma partícula é gerada, idêntica à partícula original e o 
processo continua à geração seguinte. Queremos saber qual a probabilidade do 
processo, iniciando no instante t=0 com uma partícula, eventualmente se extinguir. Ou, 
no complemento, continuar existindo para sempre. 
Na figura ao lado, a partícula inicial (geração G0) gerou 2 partículas. Dessas, uma não gerou nenhuma partícula e sua 
linhagem se extinguiu aí em G1, mas a segunda gerou três. Dessas três, a primeira gerou duas, das quais uma não 
gerou nenhuma e se extinguiu aí em G3 e a outra gerou uma, que não gerou nenhuma, se extinguindo em G4; a 
segunda não gerou nenhuma e a terceira gerou uma, que não gerou nenhuma. Assim, a população em cada geração 
foi P0=1, P1=2, P2=3, P3=3, P4=1 e P5=0, ocorrendo então a extinção em G4 da linhagem iniciada em G0. 
Olhando da geração zero, com a partícula inicial, seja θ a probabilidade do processo terminar em extinção em 
alguma geração m<∞. Então θ é igual à probabilidade da partícula original desaparecer sem gerar ninguém (p0), 
mais a probabilidade de gerar uma (p1) e a linhagem desta vir a eventualmente se extinguir (θ); mais a 
probabilidade de gerar duas (p2) e a linhagem de cada uma dessas duas vierem a eventualmente se extinguir (θ×θ); 
mais.... e assim por diante. Então: 
θ = p� + p�. θ + p�. θ� + pz. θz + p�. θ� + … = � �} ∙ θ }4}R� 
Ora, fazendo ¯�θ � = ∑ �} ∙ θ }4}R� é imediato provar que: 
1. g(0)= p0 e g(1)= 1 
2. 
°°± ¯�²� > 0 , °°± ¯�²�³±R� = �� , °°± ¯�²�³±R� = W�´� ≥ �� 
3. 
°$°±$ ¯�²� > 0 �Y t0, 1u , logo g(θ) é convexa neste 
intervalo.A figura ao lado ilustra uma curva g(θ) com suas 
características fundamentais. Note que se E(N)<1, então a 
curva g(θ) chega em 1 por cima da diagonal e a equação 
g(θ)=θ não tem solução em (0, 1) pois g(θ) não cruza a 
diagonal nesse intervalo. 
Vamos brincar um pouco com N seguindo uma distribuição 
de Poisson. A figura abaixo mostra a curva g(θ) para quatro 
versões da distribuição de N: P(0,6), P(1), P(1,4) e P(2). Note que apenas as duas últimas configurações permitem 
probabilidades de extinção menores que 1. 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
28 
 
 
 
Extinção 
Seja Mi a população (o número de partículas) em Gi. Assim, M0=1 e M1=m com probabilidade pm, para m=0, 
1, 2, … . Para os processos com p0>0, existe sempre uma chance não nula do processo vir a, eventualmente, 
se extinguir. 
Dizemos que um processo se extingue em Gi se esta foi sua última geração com população não nula, ou 
seja, Mi>0 e Mi+1=0. Seja Ki , para i=1, 2, 3, …, o evento que corresponde ao processo, iniciando com uma 
partícula em G0, se extinga exatamente na i-ésima geração. Os eventos K1, K2, K3, são disjuntos, e sejam κ0, 
κ1, κ2, κ3, …, suas respectivas probabilidades. 
Seja L0=K0, L1=K0∪K1…, e, genericamente, ¶� = ⋃ }̧�}R� , o evento correspondente à extinção do processo 
antes da geração n+1, ou seja, a probabilidade do processo de ramificação, começando em G0 com uma 
partícula, estar extinto em Gn+1 (ou, se extinguir antes da Gn+1). Então, ¶� = ⋃ }̧ = � MO¹� = 0��}R� . Como 
os eventos Ki são disjuntos, º� = ��¶�� = ∑ �t }̧u�}R� = ∑ »}�}R� . 
Evidentemente, κ0=P[K0]=po. A probabilidade de K1 é igual à somatória para todo n>0 da probabilidade da partícula 
original gerar n partículas e estas não gerarem nenhuma (pn.p0n), então: 
»� = �t �̧u = � �� ∙ ��� 4�R� � º� = �t¶�u = �t �̧u + �t �̧u = �� + � �� ∙ ��� 
4
�R�
= � �� ∙ ��� 4�R� 
Para calcular κ2 = P[K2], vamos calcular λ2 = P[L2], a probabilidade de linhagem iniciada com uma partícula em G0 não 
chegar à terceira geração, isto é, P{M3=0}. Temos: 
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
29 
 
¶� = ¼ }̧�}R� = �̧ ∪ t�K��¿ ∩ �K� ∪ K��u 
Então 
º� = �t¶�u = � �t }̧u�}R� = �t �̧u + �t�K��¿ ∩ �K� ∪ K��u = »� + � ��´ = y� × �º���
4
�R�
= �� + � �� × �º���4�R� 
E, portanto, 
»� = �t �̧u = �t¶�u − �t¶�u = �� + � �� × �º���4�R� − »� − »� = � �� × º��
4
�R�
− � �� × ���4�R� 
Seguindo a mesma linha de raciocínio: 
ºz = �t¶zu = � �t }̧uz}R� = �t �̧u + �t�K��¿ ∩ �K� ∪ K� ∪ Kz�u = »� + � ��´ = y� × �º���
4
�R�
= �� + � �� × �º���4�R� 
E, generalizando 
º� = �t¶�u = � �t }̧u�}R� = �t �̧u + �t�K��¿ ∩ �K� ∪ K� ∪ ⋯ ∪ KÁ�u = »� + � ��´ = y� × �º�����
4
�R�
= �� + � �� × �º�����4�R� 
No caso de �� = ��´ = y� = ÂÃ�! ��Â para n=0, 1, 2, …, com λ=0,8 (portanto E(N)=0,8<1 e extinção ocorrerá com 
probabilidade 1, ou seja λm→1 quando m→∞), temos: 
n 1 2 3 4 5 6 7 8 9 10 
κ 0,44933 0,194 0,1083 0,0680 0,0459 0,0324 0,0236 0,0175 0,0133 0,0102 
 
n 11 12 13 14 15 16 17 18 19 20+ 
κ 0,0079 0,0061 0,0048 0,0038 0,0030 0,0024 0,0019 0,0015 0,0012 0,0009 
A distribuição acima está representada graficamente na figura abaixo 
Departamento de Estatística - IMECC – UNICAMP 
Introdução aos Modelos Probabilísticos 
 Prof. Sebastião de Amorim 
 
30 
 
 
 
Exercícios 
1. Seja um processo de ramificação de Galton-Watson, com P{N=n} dado na tabela abaixo. 
a. Calcule P[K0] a probabilidade que ele se extinga em G0. 
b. Calcule P[K1], a probabilidade que ele se extinga em G2. 
c. Calcule a probabilidade de que ele venha a se extinguir mais cedo ou mais tarde. 
 
 
2. 
 
 
 
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
n 1 2 3 4 5 
pn 0,5 0,25 0,125 0,0625 0,0625