Buscar

Alguns slides sobre distribuicao Normal

Prévia do material em texto

18/09/2014
1
Curso de Análise Estatística - Ângela T. Paes 
Existem várias formas de distribuições de freqüências.
Muitas variáveis quantitativas contínuas apresentam distribuições nas 
quais os valores centrais são mais freqüentes e os valores extremos são 
menos freqüentes.Além disso, os valores acima ou abaixo do centro 
ocorrem na mesma proporção. Exemplo: hemoglobina
Se desenharmos uma linha contínua representando esta tendência, temos 
uma curva em forma de sino.
A forma dessa curva sino é conhecida como curva Normal e pode ser A forma dessa curva sino é conhecida como curva Normal e pode ser 
expressa matematicamente em termos de dois conceitos estatísticos já expressa matematicamente em termos de dois conceitos estatísticos já 
discutidos discutidos –– média (média (µµµµ) e e desvio padrão (desvio padrão (σσσσ)..
4,0 6,0 8,0 10,0 12,0
Hemoglobina (g/100mL)
0
5
10
15
20
Fr
e
qu
en
ci
a
 
ab
s
o
lu
ta
Distribuição NormalDistribuição Normal
Curso de Análise Estatística - Ângela T. Paes 
Propriedades da Distribuição NormalPropriedades da Distribuição Normal
�Média (µµµµ ) = Mediana (Md), ou seja, a curva de freqüência 
é simétrica em torno de µµµµ.
A distância entre a média e mediana pode dar uma indicação sobre a 
simetria da distribuição. Se a média e mediana são muito distantes 
provavelmente existem valores extremos que distorcem a média para cima 
ou para baixo. 
O coeficiente de assimetria mede o grau de desvio ou afastamento da 
simetria da distribuição. Na distribuição normal o coeficiente de 
assimetria é 0. Na análise dos dados, podemos ser mais tolerantes e 
considerar valores entre -2 e +2.
� O achatamento é padrão.
O coeficiente de curtose mede o achatamento da distribuição. Na 
distribuição Normal o valor da curtose é 3 (alguns programas centralizam 
a curtose em 0).Na análise de dados consideramos que o achatamento é 
aproximadamente normal se o coeficiente de curtose estiver entre 1 e 5 
ou, caso esteja centrado em 0, se estiver entre -2 e +2.
Curso de Análise Estatística - Ângela T. Paes 
� 68% dos valores individuais estão entre µµµµ - σσσσ e µµµµ + σσσσ
� 80% dos valores individuais estão entre µµµµ - 1,28σσσσ e µµµµ + 1,28σσσσ
� 90% dos valores individuais estão entre µµµµ - 1,64σσσσ e µµµµ + 1,64σσσσ
� 95% dos valores individuais estão entre µµµµ - 1,96σσσσ e µµµµ + 1,96σσσσ
� 98% dos valores individuais estão entre µµµµ - 2,33σσσσ e µµµµ + 2,33σσσσ
� 99% dos valores individuais estão entre µµµµ - 2,58σσσσ e µµµµ + 2,58σσσσ
� 99,7% dos valores individuais estão entre µµµµ - 3σσσσ e µµµµ + 3σσσσ
Distribuição Normal com média Distribuição Normal com média µ e µ e desviodesvio padrãopadrão σσ
interpretação para “intervalos de normalidade”
68,3% dos valores individuais estão entre ( µ - σ ) e ( µ + σ ) 
95,4% dos valores individuais estão entre ( µ - 2σ ) e ( µ + 2σ )
99,7% dos valores individuais estão entre ( µ - 3σ ) e ( µ + 3σ )
Distribuição Normal com média Distribuição Normal com média µ e µ e desviodesvio padrãopadrão σσ
Fonte: http://www.portalaction.com.br/content/62-distribuição-normal
Distribuição Normal Distribuição Normal PadrãoPadrão
Fonte: Modelos probabilísticos contínuos - Modelo Normal – Carine
Savalli e Lilian Natis. Curso de verão IME-USP, 2004
Fonte: Modelos probabilísticos contínuos - Modelo Normal – Carine
Savalli e Lilian Natis. Curso de verão IME-USP, 2004
Mudança de escala após padronizaçãoMudança de escala após padronização
18/09/2014
2
Gráfico Normal de Probabilidades Gráfico Normal de Probabilidades –– Normal Normal PlotPlot
Contrasta os valores observados na amostra com os valores esperados 
caso a distribuição seja Normal. O que se espera são pontos em torno 
de uma reta.
Mesmo que os dados originais não tenham distribuição Normal, a distribuição das 
médias amostrais irá se aproximando da distribuição Normal conforme o tamanho da 
amostra vai aumentando. 
Visualização do Teorema do Limite CentralVisualização do Teorema do Limite Central
A
 “
v
e
lo
ci
d
a
d
e
 d
e
 c
o
n
v
e
rg
ê
n
ci
a
” 
d
e
p
e
n
d
e
 
d
a
 d
is
tr
ib
u
iç
ã
o
 o
ri
g
in
a
l.
Curso de Análise Estatística - Ângela T. Paes
Bilirrubina serica
D
e
n
si
da
de
 
de
 
fre
qu
e
n
ci
a
0 50 100 150 200 250 300 350 400 450 500 550 600
0.
0
0.
00
5
0.
01
0
0.
01
5
Bilirrubina serica (log)
D
en
si
da
de
 
de
 
fre
qu
e
n
ci
a
1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5
0.
0
0.
1
0.
2
0.
3
0.
4
0.
5
Transformação de variávelTransformação de variável
Às vezes a distribuição de uma variável é assimétrica. Isto 
acontece com freqüência em dosagens de laboratório, nas quais 
há muita variabilidade, mas uma grande concentração nos 
valores próximos a zero. Nesse caso, podemos utilizar uma 
transformação logarítimica para “normalizar” a distribuição.

Continue navegando