Buscar

Normalidade, DN Erro, IC, Dimensionamento V02

Prévia do material em texto

TESTES DE NORMALIDADE 
DOS DADOS
DISTRIBUIÇÃO NORMAL
TESTES DE NORMALIDADE
ERRO
INTERVALO DE CONFIANÇA
DIMENSIONAMENTO DE AMOSTRAS
INTRODUÇÃO
UMA DISTRIBUIÇÃO DE PROBABILIDADE É UM MODELO MATEMÁTICO QUE 
RELACIONA UM CERTO VALOR DA VARIÁVEL EM ESTUDO COM A SUA 
PROBABILIDADE DE OCORRÊNCIA.
HÁ DOIS TIPOS DE DISTRIBUIÇÃO DE PROBABILIDADE:
• DISTRIBUIÇÕES CONTÍNUAS: QUANDO A VARIÁVEL QUE ESTÁ SENDO 
MEDIDA É EXPRESSA EM UMA ESCALA CONTÍNUA, COMO NO CASO DE 
UMA CARACTERÍSTICA DIMENSIONAL.
• DISTRIBUIÇÕES DISCRETAS: QUANDO A VARIÁVEL QUE ESTÁ SENDO 
MEDIDA SÓ PODE ASSUMIR CERTOS VALORES, COMO POR EXEMPLO OS 
VALORES INTEIROS: 0, 1, 2, ...
DISTRIBUIÇÃO NORMAL
A DISTRIBUIÇÃO NORMAL É A MAIS IMPORTANTE DAS DISTRIBUIÇÕES 
ESTATÍSTICAS:
• REPRESENTA A DISTRIBUIÇÃO DE FREQUÊNCIA DE MUITOS FENÔMENOS 
NATURAIS;
• AS MÉDIAS E AS PROPORÇÕES DE GRANDES AMOSTRAS SEGUEM A 
DISTRIBUIÇÃO NORMAL (TEOREMA DO LIMITE CENTRAL);
• TEM FORMA DE SINO, SIMÉTRICA EM RELAÇÃO À SUA MÉDIA E TENDE 
CADA VEZ MAIS AO EIXO HORIZONTAL À MEDIDA QUE SE AFASTA DA 
MÉDIA, OU SEJA, TEORICAMENTE OS VALORES DA VARIÁVEL ALEATÓRIA 
PODEM VARIAR DE  A +.
• A ÁREA ABAIXO DA CURVA NORMAL REPRESENTA 100% DE 
PROBABILIDADE ASSOCIADA A UMA VARIÁVEL. 
• A PROBABILIDADE DE UMA VARIÁVEL ALEATÓRIA TOMAR UM VALOR 
ENTRE DOIS PONTOS QUAISQUER É IGUAL À ÁREA COMPREENDIDA 
ENTRE ESSES DOIS PONTOS.
DISTRIBUIÇÃO NORMAL
Desvio-padrão
populacional

Média populacional

Fr
e q
u ê
n c
ia
 f(
x)
Variável x
Área Total
1 ou 100%
100% DA ÁREA EM [; +] = 1
𝑓 𝑥 =
1
2𝜋𝜎
𝑒−
1
2
𝑥−𝜇
𝜎
2
DISTRIBUIÇÃO NORMAL
68,26%
da área
+3+2+
Fr
e q
u ê
n c
ia
 f(
x)
Variável x
--2-3
68,26% COMPREENDIDO ENTRE 1 DESVIO-PADRÃO
DISTRIBUIÇÃO NORMAL
95,44% COMPREENDIDO ENTRE 2 DESVIOS-PADRÃO
95,44%
da área
+3+2+
Fr
e q
u ê
n c
ia
 f(
x)
Variável x
--2-3
DISTRIBUIÇÃO NORMAL
99,73% COMPREENDIDO ENTRE 3 DESVIOS-PADRÃO
99,73%
da área
+3+2+
Fr
e q
u ê
n c
ia
 f(
x)
Variável x
--2-3
EXEMPLO 1 DE HISTOGRAMA
TAMANHOS DE 1000 PÉS FEMININOS
32 33 34 35 36 37 38 39 40 41 42 43
0
50
100
150
200
250
300
Fr
e q
u ê
n c
ia
 f(
x)
x (tamanho do pé)
EXEMPLO 1 DE HISTOGRAMA
TAMANHOS DE 1000 PÉS FEMININOS
32 33 34 35 36 37 38 39 40 41 42 43
0
50
100
150
200
250
300  = 37,144
 = 1,4482
Fr
e q
u ê
n c
ia
 f(
x)
x (tamanho do pé)
EXEMPLO 2 DE HISTOGRAMA
VELOCIDADES MEDIDAS DE 9018 CARROS
40 60 80 100 120 140 160 180
0
50
100
150
200
Fr
e q
u ê
n c
ia
 f(
x)
x (velocidade)
EXEMPLO 2 DE HISTOGRAMA
VELOCIDADES MEDIDAS DE 9018 CARROS
40 60 80 100 120 140 160 180
0
50
100
150
200
 = 108,17
 = 25,173
Fr
e q
u ê
n c
ia
 f(
x)
x (velocidade)
C
BA
Fr
eq
u ê
nc
ia
 f(
x)
Variável xDISTRIBUIÇÕES NORMAIS COMPARADAS• DA DISTRIBUIÇÃO A PARA B MUDA A TENDÊNCIA CENTRAL, MAS A VARIABILIDADE É CONSTANTE;• DA DISTRIBUIÇÃO A PARA C MUDA A VARIABILIDADE, MAS A TENDÊNCIA CENTRAL É CONSTANTE;
• DA DISTRIBUIÇÃO B PARA C 
MUDA A TENDÊNCIA CENTRAL 
E A VARIABILIDADE.
SEGUE UMA DISTRIBUIÇÃO NORMAL?
PERFIL DE DADOS ASSIMÉTRICO EM RELAÇÃO À MÉDIA
30 40 50 60 70 80 90 100
0
100
200
300
400
 = 68,2029
n = 10050
 = 13,5672
Fr
e q
u ê
n c
ia
 f(
x)
x
SEGUE UMA DISTRIBUIÇÃO NORMAL?
PEQUENO NÚMERO DE AMOSTRAS
32 33 34 35 36 37 38 39 40 41 42 43
0
1
2
 = 37,6
n = 5
 = 1,6248
Fr
eq
uê
nc
ia
 f(
x)
x
TESTES DE NORMALIDADE
• TESTE GRÁFICO
• Papel da Probabilidade com R2 > 0,95
• Comparação com valores esperados de uma normal (χ²-Pearson)
• TESTES ESTATÍSTICOS
• Anderson-Darling (n ≥ 8)
• Cramer-von Mises (n ≥ 4)
• Shapiro-Wilk (4 ≤ n ≤ 50)
• Ryan-Joiner (n ≥ 4)
• Kolmogorov-Smirnov (4 ≤ n ≤ 50)
• χ²-Pearson (n ≥ 20)
• Lilliefors (4 ≤ n ≤ 50)
• Jarque-Bera (n ≥ 20)
• Lilliefors-van Soest (4 ≤ n ≤ 50)
• D'Agostino-Pearson K² (n ≥ 20)
TESTES GRÁFICOS
Distribuição NÃO Normal
μ = 3,4085 σ = 3,4129
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
μ-4σ μ-3σ μ-2σ μ-σ μ μ+σ μ+2σ μ+3σ μ+4σ
Contagens em 7 classes
Conts Obs Conts Exp
-3
-2
-1
0
1
2
3
4
0 5 10 15 20
PAPEL DA 
PROBABILIDADE
R²=0,63856 ajuste
Distribuição Normal
μ = 9,6687 σ = 0,7354
0
1
2
3
4
5
μ-4σ μ-3σ μ-2σ μ-σ μ μ+σ μ+2σ μ+3σ μ+4σ
Contagens em 7 classes
Conts Obs Conts Exp
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
29 31 33 35 37 39 41
PAPEL DA 
PROBABILIDADE
R²=0,97822 ajuste
PAPEL DA PROBABILIDADE
É UMA TÉCNICA GRÁFICA UTILIZADA PARA VERIFICAR A ADEQUAÇÃO DE UM
DETERMINADO MODELO ESTATÍSTICO AOS DADOS, NO CASO O MODELO 
NORMAL.
SERÁ TRAÇADO O GRÁFICO “QUANTIS DA NORMAL PADRÃO X DADOS”.
ALGORITMO:
• ORDENAR OS DADOS
• CALCULAR OS VALORES D, DA FORMA Di = (i-0,3)/(n+0,4)
• CALCULAR OS VALORES INVERSOS DA NORMAL PADRONIZADA DE Di
• PLOTAR O GRÁFICO
PAPEL DA PROBABILIDADE
EXEMPLO: DADOS 36, 35, 36, 37, 32, 30, 33, 35, 40, 38 (n = 10).
Dados 
Originais
Dados 
Ordenados
i Di
Inverso Normal 
Padronizada
36 30 1 0,067308 -1,496146876
35 32 2 0,163462 -0,980330352
36 33 3 0,259615 -0,644531606
37 35 4 0,355769 -0,369790678
32 35 5 0,451923 -0,120804162
30 36 6 0,548077 0,120804162
33 36 7 0,644231 0,369790678
35 37 8 0,740385 0,644531606
40 38 9 0,836538 0,980330352
38 40 10 0,932692 1,496146876
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
29 31 33 35 37 39 41
PAPEL DA PROBABILIDADE
R²=0,97822 ajuste
𝐷𝑖 =
𝑖 − 0,3
0,4 + 𝑛
Φ−1 = INV.NORMP.N(Di)
𝑅2 = RQUAD(Di; Dados Ordenados)
χ²-PEARSON 7 CLASSES (N ≥ 20)
COMPARA AS FREQUÊNCIAS OBSERVADAS E AS FREQUÊNCIAS ESPERADAS EM 7 CLASSES 
(BLOCOS) COM A DISTRIBUIÇÃO χ².
ALGORITMO
• CALCULAR 𝑥, 𝑠 E 𝑛.
• CRIAR AS BORDAS 𝑥 − 5𝑠
2
, 𝑥 −
3𝑠
2
, 𝑥 −
𝑠
2
, 𝑥 +
𝑠
2
, 𝑥 +
3𝑠
2
, 𝑥 +
5𝑠
2
.
• CONTAR O NÚMERO DE ELEMENTOS OBSERVADOS EM CADA CLASSE.
• CALCULAR O NÚMERO DE ELEMENTOS ESPERADOS EM UMA DISTRIBUIÇÃO NORMAL 
COM OS PARÂMETROS 𝑥, 𝑠 E 𝑛 EM CADA CLASSE.
• TRAÇAR O GRÁFICO DE BARRAS PARA OS ELEMENTOS OBSERVADOS E DE LINHA 
SUAVIZADA PARA OS ELEMENTOS ESPERADOS.
• CALCULAR 𝜒2 = 𝑂𝑏𝑠−𝐸𝑠𝑝
2
𝐸𝑠𝑝
E COMPARAR COM 𝜒𝑐𝑟𝑖𝑡
2 = INV.QUIQUA(1 − 𝛼; 7 − 3)
• SE 𝜒2 < 𝜒𝑐𝑟𝑖𝑡
2 ENTÃO OS DADOS SEGUEM UMA DISTRIBUIÇÃO NORMAL.
• O VALOR DE 𝑝 = 1− DIST.QUIQUA(𝜒2; 7 − 3; VERDADEIRO)
χ²-PEARSON 7 CLASSES (N ≥ 20)
EXEMPLO: DADOS ABAIXO (n = 20)
0
1
2
3
4
5
6
7
8
9
10
μ-4σ μ-3σ μ-2σ μ-σ μ μ+σ μ+2σ μ+3σ μ+4σ
Contagens em 7 classes
Conts Obs Conts Exp
Dados média 35,275
36 desv-p 2,980087
35 n 20
36 Bordas Classes Cont. Obs Cont. Esp. (O-E)2/E
37 27,82478 1 0 0,124193 0,124193
32 30,80487 2 2 1,211951 0,512415
30 33,78496 3 4 4,834607 0,14408
33 36,76504 4 9 7,658498 0,234984
35 39,74513 5 3 4,834607 0,696185
40 42,72522 6 2 1,211951 0,512415
38 7 0 0,124193 0,124193
36,5 QUI2 2,348466
34,5 QUI2CRIT 9,487729
35,5 p 0,67196
36,5
33,5
29,5
32,5
35,5
41
38,5
TESTE DE SHAPIRO-WILK (4 ≤ N ≤ 50)
ALGORITMO
• ORDENAR OS ELEMENTOS EM ORDEM CRESCENTE
• CALCULAR A MÉDIA 𝑥
• CALCULAR A SOMA 𝑎 = 𝑥𝑖 − 𝑥 2
• ORDENAR OS NÚMEROS DOS ELEMENTOS EM DUAS COLUNAS ATÉ 𝑛
2
SE PAR OU 
ATÉ 
𝑛+1
2
SE ÍMPAR. A PRIMEIRA COLUNA CRESCENTE E A SEGUNDA DECRESCENTE
• UTILIZAR A TABELA DE SHAPIRO-WILK PARA O NÚMERO DE ELEMENTOS (TABELA)• ORDENAR OS ELEMENTOS EM DUAS COLUNAS, CONFORME AS COLOCAÇÕES 
DAS DUAS COLUNAS DOS NÚMEROS DOS ELEMENTOS
• CALCULAR A SOMA 𝑏 = 𝑡𝑎𝑏𝑒𝑙𝑎 ∙ 𝑥𝑛−𝑖+1 − 𝑥𝑖
• CALCULAR 𝑊 = 𝑏
2
𝑎
E COMPARAR COM 𝑊𝑐𝑟𝑖𝑡
• SE 𝑊 <𝑊𝑐𝑟𝑖𝑡 ENTÃO OS DADOS SEGUEM UMA DISTRIBUIÇÃO NORMAL.
TESTE DE SHAPIRO-WILK (4 ≤ N ≤ 50)
EXEMPLO: DADOS 36, 35, 36, 37, 32, 30, 33, 35, 40, 38 (n = 10).
PAR a = 77,6 i n-i+1 tabela x(n-i+1) x(i) tab*(x-x) b 8,7323
30 27,04 1 10 0,5739 40 30 5,739W 0,982643
32 10,24 2 9 0,3291 38 32 1,9746W crit 0,842
33 4,84 3 8 0,2141 37 33 0,8564p p>0,05
35 0,04 4 7 0,1224 36 35 0,1224 DN
35 0,04 5 6 0,0399 36 35 0,0399
36 0,64
36 0,64
37 3,24
38 7,84
40 23,04
i\n 2 3 4 5 6 7 8 9 10 11 12
1 0,7071 0,7071 0,6872 0,6646 0,6431 0,6233 0,6062 0,5888 0,5739 0,5601 0,5475
2 0 0,1677 0,2413 0,2806 0,3031 0,3164 0,3244 0,3291 0,3315 0,3325
3 0 0,0875 0,1401 0,1743 0,1976 0,2141 0,226 0,2347
4 0 0,0561 0,0947 0,1224 0,1429 0,1586
5 0 0,0399 0,0695 0,0922
6 0 0,0303
7
Tabela S-W 5%
N W
3 0,767
4 0,748
5 0,762
6 0,788
7 0,803
8 0,818
9 0,829
10 0,842
11 0,85
12 0,859
CONFIANÇA VERSUS INCERTEZA
A CONFIANÇA DE UM EXPERIMENTO É A EXPECTATIVA DE REPETIBILIDADE DO 
MESMO.
INCERTEZA É O VALOR COMPLEMENTAR A 100% DA CONFIANÇA.
INCERTEZA = 𝛼
CONFIANÇA = 1 − 𝛼
COM O VALOR DE CONFIANÇA, PODE-SE CALCULAR A VARIÁVEL NORMAL 
PADRONIZADA 𝑍𝑐 (DA TABELA NORMAL) CORRESPONDENTE.
EXEMPLOS:
• confiança de 95% resulta em 𝑍𝑐 = 1,96
• confiança de 90% resulta em 𝑍𝑐 = 1,645
• confiança de 99% resulta em 𝑍𝑐 = 2,58
NO EXCEL, 𝑍𝑐 = INV.NORMP.N(0,5+CONFIANÇA%/2)
DISTRIBUIÇÃO NORMAL - ERRO
• CASO OS DADOS SIGAM UMA DISTRIBUIÇÃO NORMAL, É POSSÍVEL 
CALCULAR O ERRO ESTATÍSTICO ENVOLVIDO NA VARIABILIDADE DOS 
DADOS COM DETERMINADA CONFIANÇA (OU INCERTEZA)
𝑒 =
𝑍𝑐 ∙ 𝜎
𝑛
• COM O ERRO, É POSSÍVEL CALCULAR O INTERVALO DE CONFIANÇA, 
COMO O INTERVALO DENTRO DO QUAL SE TEM O NÍVEL DE CONFIANÇA 
DE QUE A MÉDIA POPULACIONAL ESTEJA CONTIDO.
𝐼𝐶1−𝛼 = 𝑥 − 𝑒; 𝑥 + 𝑒
DIMENSIONAMENTO DE AMOSTRAS
• CASO OS DADOS SIGAM UMA DISTRIBUIÇÃO NORMAL, É POSSÍVEL 
CALCULAR O NÚMERO DE AMOSTRAS QUE UM EXPERIMENTO DEVE TER, 
EM FUNÇÃO DE UM NOVO ERRO 𝑒𝑁 (MÁXIMO A SER COMETIDO), UMA 
CONFIANÇA DESEJADA, E O DESVIO-PADRÃO 𝜎 OBSERVADO NO 
EXPERIMENTO PILOTO:
𝑛𝑁 =
𝑍𝑐 ∙ 𝜎
𝑒𝑁
2

Continue navegando