Aula 11 Distribuicao Gaussiana

•

ESTÁCIO

0

FBLO - Fundação Bela Lopes de Oliveira

21/11/2017

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 53 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 53 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 53 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística I

57.377 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Distribuição
Gaussiana
Modelo Probabilístico para
Variáveis Contínuas
Distribuição de Frequências do Peso, em
gramas, de 10000 recém-nascidos
 
 
frequência relativadensidade
tamanho da classe
=
Peso ao nascer
F
r
e
q
u
e
n
c
i
a
1000 2000 3000 4000 5000
0
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
2
5
0
0
3
0
0
0
3
5
0
0
Histograma de 
Densidade
Peso ao nascer
D
e
n
s
i
d
a
d
e
1000 2000 3000 4000 5000
0
e
+
0
0
2
e
-
0
4
4
e
-
0
4
6
e
-
0
4
8
e
-
0
4
P[2500 < X < 3500] =
àrea da barra =densidade x
largura da barra
soma das àreas das barras 
entre 2500 e 3500 g.
àrea da barra =probabilidade de 
X estar entre os limites da barra
Histograma de 
Densidade
Peso ao nascer
D
e
n
s
i
d
a
d
e
1000 2000 3000 4000 5000
0
e
+
0
0
2
e
-
0
4
4
e
-
0
4
6
e
-
0
4
8
e
-
0
4
àrea da barra =probabilidade de 
X estar entre os limites da barra
soma das àreas das barras entre 1000 e 2125P[X < 2125] =
Muitas vezes, as barras do histograma podem
ser aproximadas por uma curva mais suave …
mais classes
Essa curva suave é chamada
função de densidade de X, ou f(x)
f(x)
Como calcular
probabilidades
usando f(x) ?
a b
P[a < X < b ]
P[a < X < b ] é a área
abaixo da curva f(x) entre 
a e b
Propriedades de f(x)
1) f(x) ≥ 0
2) A área abaixo de toda a curva f(x) é igual a 1.
P[X=a] = 0 � P[X < b] = P[X ≤ b]
Como X é uma variável aleatória contínua, então
Algumas variáveis contínuas exibem um comportamento
muito particular quando visualizamos a distribuição de 
frequências de seus valores.
• Concentração de valores em torno de um valor central;
• Simetria em torno do valor central;
• Frequência pequena de valores muito extremos.
F
r
e
q
u
ê
n
c
i
a
Valores
O Modelo Probabilístico Gaussiano 
(ou Normal)
O Modelo Probabilístico Gaussiano
O matemático alemão Karl Gauss
popularizou um modelo proposto para a 
distribuição de probabilidades de variáveis 
do tipo descrito anteriormente.
A curva descrita por este modelo é
conhecida como Curva de Gauss (ou 
também como Curva Normal)
O Modelo Probabilístico Gaussiano
21
21( ) , 
2
x
f x xe
µ
σ
piσ
 
  
 
−
−
= −∞ < < ∞
A função de densidade de X só depende de dois valores: 
a média µ e o desvio-padrão σ
π e e são constantes conhecidas (π ≈ 3,14159… e e ≈ 2.71828…)
A média µ de uma variável aleatória X que siga o modelo 
Gaussiano pode assumir qualquer valor na reta real
O Modelo Probabilístico Gaussiano
µ−∞ < < ∞
O desvio-padrão σ de qualquer variável aleatória X só
pode assumir valores maiores do que zero
0σ >
µ e σ são os parâmetros do Modelo Gaussiano
Dizemos que X ~ Normal (µ,σ)
A curva gaussiana (ou curva Normal) é definida pela 
média µµµµ e pelo desvio-padrão σ.σ.σ.σ.
O Modelo Probabilístico Gaussiano
O parâmetro µ informa onde está centrada a 
curva gaussiana
A forma do sino (mais “achatado” ou mais 
“alongado”) é dada pelo valor do desvio-padrão σ
Para cada combinação de µ e σ, existe uma 
curva gaussiana diferente
A curva gaussiana tem a forma de um sino e é
simétrica em torno da média µ;
Simetria
a a
P(X < 3000-a ) = P(X > 3000+a ) 
3000 + a3000 - a
Propriedades da Distribuição Normal
Área fixa entre intervalos simétricos
Probabilidade de X estar entre x1 e x2: P( x1 < X < x2 )
Cálculo de Probabilidade na Curva Normal
Considere uma variável aleatória X com distribuição 
Normal (µ,σ). Ou seja, X ~ Normal(µ,σ)
P( x1 < X < x2 )P( x1 < X < x2 )
Área sob a curva
Normal entre x1 e x2.
Cálculo de Probabilidade na Curva Normal
P( x1 < X < x2 )
curvas Normais diferentes � áreas diferentes
Exemplo:
Suponha que X é o peso de bebês ao nascer e que, 
em certa população, X tem distribuição de 
probabilidade que pode ser aproximada pela 
Normal com µ = 3000g e σ = 1000g.
Qual é a porcentagem de bebês que nascem com 
peso abaixo de 1500g ? 
A Distribuição Normal Padrão
Z ~ Normal (µ=0 ; σ=1) 
Como existem infinitas combinações dos valores para µ
e σ, seria inviável tabelar as probabilidades de todas as 
distribuições Normais possíveis.
As probabilidades na curva Normal são calculadas com o 
auxílio de uma tabela.
Sendo assim, uma única variável Normal possui suas
probabilidades tabeladas: a variável Z com média igual a 
0 e desvio-padrão igual a 1.
A variável aleatória Normal com 
média µ=0 e desvio-padrão σ=1 é
chamada de 
Variável Normal Padrão
Z ~ N(0,1) 
P( Z < z ) 
a variável 
aleatória Z
tem distribuição 
de probabilidade 
Normal com 
média=0 e
d.p.=1 
A Tabela Normal Padrão (Tabela Z)
Parte Negativa
P( Z < -0.83 ) 
-0.83
Coluna: Segunda
casa decimal de z
Linha: Parte inteira e 
primeira casa decimal de z
-2.9
-0.8
0.0019 0.0018 0.0017 0.0017
0.2119 0.2090 0.2061 0.2033
P( Z < 1.5 ) 
Coluna: Segunda
casa decimal de z
Linha: Parte inteira e 
primeira casa decimal de z
A Tabela Normal Padrão (Tabela Z)
Parte Positiva
Exemplo: Seja Z uma v.a. normal padronizada. Calcule: 
P( Z < -1.97) = ? P( Z > 1.84) = ? 
P( Z < -1.97 ) = 0.0244, 
obtida direto da tabela. 
P( Z >1.84) = P( Z < -1.84) = 0.0329, 
obtida direto da tabela 
e por simetria. 
P( -1.97 < Z < 0.86 ) = P( Z < 0.86 ) - P( Z < -1.97 )
= 0.8051 - 0.0244
= 0.7807
= -
Cálculo de percentis na curva Normal 
Percentil de ordem 2.5
Que valor de Z na tabela Normal Padrão deixa uma área de 
0.0250 abaixo dele ?
0.0250
a=-1.96
Ou seja, quem é a tal que P[Z < a ]=0.0250 ?
a é o percentil 2.5 da curva Normal Padrão
Cálculo de percentis na curva Normal 
Percentil de ordem 97.5
Que valor de Z na tabela Normal Padrão deixa uma área de 
0.9750 abaixo dele ?
Ou seja, quem é b tal que P[Z < b ]=0.9750 ?
b é o percentil 97.5 da curva Normal Padrão
0.9750
b=1.96
0.0250b é o simétrico de a em relação
à média da curva Normal
Cálculo de percentis na curva Normal 
P[Z < b ]=0.9500
b é o percentil 95 da curva
Normal Padrão b=1.645
Percentil de ordem 95
Na tabela Z:
z = 1.65 � área abaixo = 0.9505
z = 1.64 � área abaixo = 0.9495
Escolher o valor mais próximo da probabilidade desejada.
Cálculo de percentis na curva Normal 
P[-b < Z < b ]=0.9800
P[Z< -b ] =0.0100
-b = ?
Percentil de ordem 1
P[Z < b ]=0.0100
b é o percentil 1 da curva Normal Padrão
Na tabela Z:
z = -2.33 � área abaixo = 0.0099
z = -2.32 � área abaixo = 0.0102
b=2.33-b=2.33
0.0100 0.0100
0.9800
Usar o valor de z que
forneça a área mais próxima
do desejada (-2.33)
Como usar a tabela Normal Padrão para
calcular probabilidades em uma curva
Normal qualquer?
Z ~ Normal (µ=0 ; σ=1) 
X ~ Normal (µ=10 ; σ=2) 
Distribuição de
Distribuição de
Podemos transformar uma variável aleatória 
X ~ Normal ( µ , σ ) em uma variável aleatória 
Z ~ Normal ( 0, 1) usando a expressão:
XZ µ
σ
−
=
Padronização de uma variável aleatória Normal
X ~ Normal (µ ,σ ) Z ~ Normal (0,1) 
1
1
x
z
µ
σ
−
=
2
2
x
z
µ
σ
−
=
Calculando probabilidades de X utilizandoa tabela Z
[ 9]P X < = 9XP µ µ
σ σ
− − 
< =  
10 9 10
2 2
XP − − <  
[ 0.5] 0.3085P Z= < − =
[ 13]P X > = 10 13 10[ ]2 2
XP − −> = [ 1.5]P Z >
[ 1.5] 0.0668P Z= < − =
Exemplo 1: Se X tem distribuição Normal com µ = 40 e 
σ = 6, encontre o valor de x tal que P[X < x] =0.45. 
então P( Z < (x-40)/6 ) = 0.45. 
Mas P( Z < -0.13 ) = 0.45 (da tabela);
Se P[X < x] =0.45. 
Logo (x-40)/6 = -0.13 
���� x = 40 + (-0.13)6 
= 40 - 0.78
= 39.22. 
Ou seja, 39.22 é o percentil 45 
da distribuição de X. 
então P( Z < (x-40)/6 ) = 0.86. 
Mas P( Z > 1.08) = P( Z < -1.08) 
= 0.14 (da tabela);
Se P[X < x] = 0.86 
Logo (x-40)/6 = 1.08 
���� x = 40 + (1.08)6 
= 46.48 
Ou seja, 46.48 é o percentil 86 da 
distribuição de X.
Exemplo 2: Se X tem distribuição Normal com µ = 40 e 
σ = 6, encontre o valor de x tal que P[X > x] =0.14. 
Cálculo do Percentil de ordem 100α
da distribuição Normal
100 (1 )P zα αµ σ−= + ⋅
α
z(1-α)
1-α
onde α é a ordem do percentil (0 < α < 1) e 
z(1-α) é o valor na tabela Z que deixa uma área de (1-α) acima dele. 
45 (1 0.4500)
(0.5500)
0.45
40 6
 40 6 
 40 0.13 6 
P z
z
α
−
=
= + ×
= + ×
= − ×
86 (1 0.8600)
(0.1400)
0.86
40 6
 40 6 
 40 1.08 6 
P z
z
α
−
=
= + ×
= + ×
= + ×
Conferindo os dois exemplos anteriores, onde µ = 40 e σ= 6 :
Cálculo do Percentil de ordem 100α da 
distribuição Normal
Exemplo 
Inicial:
Suponha que X é o peso de bebês ao nascer e 
que, em certa população, X tem distribuição 
que pode ser aproximada pela Normal com 
µ = 3000g e σ = 1000g.
Qual é a porcentagem de bebês que nascem com peso abaixo 
de 1500g ? 
[ ]
3000 1500 3000[ 1500]
1000 1000
 1.5 0.0068
XP X P
P Z
− − 
< = <  
= < − =
0.68% dos bebês 
têm peso inferior 
a 1500g.
Qual é a porcentagem de bebês que nascem com peso acima 
de 4000g ? 
[ ] [ ]
4000 3000[ 4000]
1000
 1.0 1.0 0.1587
P X P Z
P Z P Z
− 
> = >  
= > = < − =
[2500 3500] [ 3500] [ 2500]P X P X P X< < = < − <
Qual é a porcentagem de 
bebês que nascem com 
peso entre 2500 e 3500g ? 
3500 3000 2500 3000
 
1000 1000
P Z P Z− −   = < − <      
[ ] [ ] 0.5 0.5P Z P Z= < − < −
 0.6915 0.3085 0.3830= − =
38.30% dos bebês
Qual valor de peso dos bebês 
separa os 10% mais leves?
1720 gramas
10 (1 0.1000)
(0.9000)
0.10
3000 1000
 3000 1000 
 3000 ( 1.28) 1000 
 3000 1280 1720
P z
z
α
−
=
= + ×
= + ×
= + − ×
= − =
0.10
P10 3000
Qual valor de peso dos bebês 
separa os 10% mais pesados?
4280 gramas
10 (1 0.9000)
(0.1000)
0.90
3000 1000
 3000 1000 
 3000 1.28 1000 
 3000 1280 4280
P z
z
α
−
=
= + ×
= + ×
= + ×
= + =
0.10
P903000
Aplicações do Modelo Gaussiano: 
Cálculo de Faixas de Referência
Faixas de Referência são formadas por dois percentis
Exemplo: uma faixa de referência de 90% é
formada pelos percentis 5 e 95
P95P5
5% 5%
90%
Cálculo de Faixas de Referência utilizando o 
modelo Gaussiano
Seja X a variável aleatória que representa a característica
para a qual queremos construir uma faixa de referência.
Exemplo: X é o peso de recém-nascidos
Se X ~ Normal (µ,σ), então uma faixa de referência 
de (1-α)100% é formada pelos percentis
P(α/2)100 e P(1-α/2)100
Exemplo: uma faixa de referência de 90% 
(α=0.10) é formada pelos percentis P5 e P95
Cálculo de Faixas de Referência utilizando o 
modelo Gaussiano
No exemplo do peso dos recém-nascidos (X), se 
pudermos supor que X ~ Normal (µ=3000 ; σ=1000), 
uma faixa de referência de 80% seria dada pelos 
percentis P10= 1720 e P90 = 4280 (já calculados 
anteriormente)
Faixa de Referência de 80% para o peso 
de recém-nascidos
1720 gramas a 4280 gramas
Cálculo de Faixas de Referência utilizando o 
modelo Gaussiano
Relembrando o cálculo de percentis com o modelo
gaussiano e a definição de faixa de referência, 
uma faixa de referência de (1-α)100% é dada pela expressão
(1 / 2) ( / 2)[ ; ]z zα αµ σ µ σ−+ ⋅ + ⋅
( / 2) ( / 2)[ ; ]z zα αµ σ µ σ− ⋅ + ⋅
(1 / 2) ( / 2) (por simetria) z zα α− = −
Para aprender (I)…
Para o exemplo do peso dos recém-nascidos, calcule
as seguintes faixas de referência:
� 90%
� 95%
Antes de calcular essas faixas, responda:
qual delas você espera que seja a mais larga? 
Justifique.
Para aprender (II)…
Exercícios da Seção 7 (Modelo Probabilístico
Gaussiano)