Baixe o app para aproveitar ainda mais
Prévia do material em texto
TESTES DE NORMALIDADE DOS DADOS DISTRIBUIÇÃO NORMAL TESTES DE NORMALIDADE ERRO INTERVALO DE CONFIANÇA DIMENSIONAMENTO DE AMOSTRAS INTRODUÇÃO UMA DISTRIBUIÇÃO DE PROBABILIDADE É UM MODELO MATEMÁTICO QUE RELACIONA UM CERTO VALOR DA VARIÁVEL EM ESTUDO COM A SUA PROBABILIDADE DE OCORRÊNCIA. HÁ DOIS TIPOS DE DISTRIBUIÇÃO DE PROBABILIDADE: • DISTRIBUIÇÕES CONTÍNUAS: QUANDO A VARIÁVEL QUE ESTÁ SENDO MEDIDA É EXPRESSA EM UMA ESCALA CONTÍNUA, COMO NO CASO DE UMA CARACTERÍSTICA DIMENSIONAL. • DISTRIBUIÇÕES DISCRETAS: QUANDO A VARIÁVEL QUE ESTÁ SENDO MEDIDA SÓ PODE ASSUMIR CERTOS VALORES, COMO POR EXEMPLO OS VALORES INTEIROS: 0, 1, 2, ... DISTRIBUIÇÃO NORMAL A DISTRIBUIÇÃO NORMAL É A MAIS IMPORTANTE DAS DISTRIBUIÇÕES ESTATÍSTICAS: • REPRESENTA A DISTRIBUIÇÃO DE FREQUÊNCIA DE MUITOS FENÔMENOS NATURAIS; • AS MÉDIAS E AS PROPORÇÕES DE GRANDES AMOSTRAS SEGUEM A DISTRIBUIÇÃO NORMAL (TEOREMA DO LIMITE CENTRAL); • TEM FORMA DE SINO, SIMÉTRICA EM RELAÇÃO À SUA MÉDIA E TENDE CADA VEZ MAIS AO EIXO HORIZONTAL À MEDIDA QUE SE AFASTA DA MÉDIA, OU SEJA, TEORICAMENTE OS VALORES DA VARIÁVEL ALEATÓRIA PODEM VARIAR DE A +. • A ÁREA ABAIXO DA CURVA NORMAL REPRESENTA 100% DE PROBABILIDADE ASSOCIADA A UMA VARIÁVEL. • A PROBABILIDADE DE UMA VARIÁVEL ALEATÓRIA TOMAR UM VALOR ENTRE DOIS PONTOS QUAISQUER É IGUAL À ÁREA COMPREENDIDA ENTRE ESSES DOIS PONTOS. DISTRIBUIÇÃO NORMAL Desvio-padrão populacional Média populacional Fr e q u ê n c ia f( x) Variável x Área Total 1 ou 100% 100% DA ÁREA EM [; +] = 1 𝑓 𝑥 = 1 2𝜋𝜎 𝑒− 1 2 𝑥−𝜇 𝜎 2 DISTRIBUIÇÃO NORMAL 68,26% da área +3+2+ Fr e q u ê n c ia f( x) Variável x --2-3 68,26% COMPREENDIDO ENTRE 1 DESVIO-PADRÃO DISTRIBUIÇÃO NORMAL 95,44% COMPREENDIDO ENTRE 2 DESVIOS-PADRÃO 95,44% da área +3+2+ Fr e q u ê n c ia f( x) Variável x --2-3 DISTRIBUIÇÃO NORMAL 99,73% COMPREENDIDO ENTRE 3 DESVIOS-PADRÃO 99,73% da área +3+2+ Fr e q u ê n c ia f( x) Variável x --2-3 EXEMPLO 1 DE HISTOGRAMA TAMANHOS DE 1000 PÉS FEMININOS 32 33 34 35 36 37 38 39 40 41 42 43 0 50 100 150 200 250 300 Fr e q u ê n c ia f( x) x (tamanho do pé) EXEMPLO 1 DE HISTOGRAMA TAMANHOS DE 1000 PÉS FEMININOS 32 33 34 35 36 37 38 39 40 41 42 43 0 50 100 150 200 250 300 = 37,144 = 1,4482 Fr e q u ê n c ia f( x) x (tamanho do pé) EXEMPLO 2 DE HISTOGRAMA VELOCIDADES MEDIDAS DE 9018 CARROS 40 60 80 100 120 140 160 180 0 50 100 150 200 Fr e q u ê n c ia f( x) x (velocidade) EXEMPLO 2 DE HISTOGRAMA VELOCIDADES MEDIDAS DE 9018 CARROS 40 60 80 100 120 140 160 180 0 50 100 150 200 = 108,17 = 25,173 Fr e q u ê n c ia f( x) x (velocidade) C BA Fr eq u ê nc ia f( x) Variável xDISTRIBUIÇÕES NORMAIS COMPARADAS• DA DISTRIBUIÇÃO A PARA B MUDA A TENDÊNCIA CENTRAL, MAS A VARIABILIDADE É CONSTANTE;• DA DISTRIBUIÇÃO A PARA C MUDA A VARIABILIDADE, MAS A TENDÊNCIA CENTRAL É CONSTANTE; • DA DISTRIBUIÇÃO B PARA C MUDA A TENDÊNCIA CENTRAL E A VARIABILIDADE. SEGUE UMA DISTRIBUIÇÃO NORMAL? PERFIL DE DADOS ASSIMÉTRICO EM RELAÇÃO À MÉDIA 30 40 50 60 70 80 90 100 0 100 200 300 400 = 68,2029 n = 10050 = 13,5672 Fr e q u ê n c ia f( x) x SEGUE UMA DISTRIBUIÇÃO NORMAL? PEQUENO NÚMERO DE AMOSTRAS 32 33 34 35 36 37 38 39 40 41 42 43 0 1 2 = 37,6 n = 5 = 1,6248 Fr eq uê nc ia f( x) x TESTES DE NORMALIDADE • TESTE GRÁFICO • Papel da Probabilidade com R2 > 0,95 • Comparação com valores esperados de uma normal (χ²-Pearson) • TESTES ESTATÍSTICOS • Anderson-Darling (n ≥ 8) • Cramer-von Mises (n ≥ 4) • Shapiro-Wilk (4 ≤ n ≤ 50) • Ryan-Joiner (n ≥ 4) • Kolmogorov-Smirnov (4 ≤ n ≤ 50) • χ²-Pearson (n ≥ 20) • Lilliefors (4 ≤ n ≤ 50) • Jarque-Bera (n ≥ 20) • Lilliefors-van Soest (4 ≤ n ≤ 50) • D'Agostino-Pearson K² (n ≥ 20) TESTES GRÁFICOS Distribuição NÃO Normal μ = 3,4085 σ = 3,4129 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 μ-4σ μ-3σ μ-2σ μ-σ μ μ+σ μ+2σ μ+3σ μ+4σ Contagens em 7 classes Conts Obs Conts Exp -3 -2 -1 0 1 2 3 4 0 5 10 15 20 PAPEL DA PROBABILIDADE R²=0,63856 ajuste Distribuição Normal μ = 9,6687 σ = 0,7354 0 1 2 3 4 5 μ-4σ μ-3σ μ-2σ μ-σ μ μ+σ μ+2σ μ+3σ μ+4σ Contagens em 7 classes Conts Obs Conts Exp -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 29 31 33 35 37 39 41 PAPEL DA PROBABILIDADE R²=0,97822 ajuste PAPEL DA PROBABILIDADE É UMA TÉCNICA GRÁFICA UTILIZADA PARA VERIFICAR A ADEQUAÇÃO DE UM DETERMINADO MODELO ESTATÍSTICO AOS DADOS, NO CASO O MODELO NORMAL. SERÁ TRAÇADO O GRÁFICO “QUANTIS DA NORMAL PADRÃO X DADOS”. ALGORITMO: • ORDENAR OS DADOS • CALCULAR OS VALORES D, DA FORMA Di = (i-0,3)/(n+0,4) • CALCULAR OS VALORES INVERSOS DA NORMAL PADRONIZADA DE Di • PLOTAR O GRÁFICO PAPEL DA PROBABILIDADE EXEMPLO: DADOS 36, 35, 36, 37, 32, 30, 33, 35, 40, 38 (n = 10). Dados Originais Dados Ordenados i Di Inverso Normal Padronizada 36 30 1 0,067308 -1,496146876 35 32 2 0,163462 -0,980330352 36 33 3 0,259615 -0,644531606 37 35 4 0,355769 -0,369790678 32 35 5 0,451923 -0,120804162 30 36 6 0,548077 0,120804162 33 36 7 0,644231 0,369790678 35 37 8 0,740385 0,644531606 40 38 9 0,836538 0,980330352 38 40 10 0,932692 1,496146876 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 29 31 33 35 37 39 41 PAPEL DA PROBABILIDADE R²=0,97822 ajuste 𝐷𝑖 = 𝑖 − 0,3 0,4 + 𝑛 Φ−1 = INV.NORMP.N(Di) 𝑅2 = RQUAD(Di; Dados Ordenados) χ²-PEARSON 7 CLASSES (N ≥ 20) COMPARA AS FREQUÊNCIAS OBSERVADAS E AS FREQUÊNCIAS ESPERADAS EM 7 CLASSES (BLOCOS) COM A DISTRIBUIÇÃO χ². ALGORITMO • CALCULAR 𝑥, 𝑠 E 𝑛. • CRIAR AS BORDAS 𝑥 − 5𝑠 2 , 𝑥 − 3𝑠 2 , 𝑥 − 𝑠 2 , 𝑥 + 𝑠 2 , 𝑥 + 3𝑠 2 , 𝑥 + 5𝑠 2 . • CONTAR O NÚMERO DE ELEMENTOS OBSERVADOS EM CADA CLASSE. • CALCULAR O NÚMERO DE ELEMENTOS ESPERADOS EM UMA DISTRIBUIÇÃO NORMAL COM OS PARÂMETROS 𝑥, 𝑠 E 𝑛 EM CADA CLASSE. • TRAÇAR O GRÁFICO DE BARRAS PARA OS ELEMENTOS OBSERVADOS E DE LINHA SUAVIZADA PARA OS ELEMENTOS ESPERADOS. • CALCULAR 𝜒2 = 𝑂𝑏𝑠−𝐸𝑠𝑝 2 𝐸𝑠𝑝 E COMPARAR COM 𝜒𝑐𝑟𝑖𝑡 2 = INV.QUIQUA(1 − 𝛼; 7 − 3) • SE 𝜒2 < 𝜒𝑐𝑟𝑖𝑡 2 ENTÃO OS DADOS SEGUEM UMA DISTRIBUIÇÃO NORMAL. • O VALOR DE 𝑝 = 1− DIST.QUIQUA(𝜒2; 7 − 3; VERDADEIRO) χ²-PEARSON 7 CLASSES (N ≥ 20) EXEMPLO: DADOS ABAIXO (n = 20) 0 1 2 3 4 5 6 7 8 9 10 μ-4σ μ-3σ μ-2σ μ-σ μ μ+σ μ+2σ μ+3σ μ+4σ Contagens em 7 classes Conts Obs Conts Exp Dados média 35,275 36 desv-p 2,980087 35 n 20 36 Bordas Classes Cont. Obs Cont. Esp. (O-E)2/E 37 27,82478 1 0 0,124193 0,124193 32 30,80487 2 2 1,211951 0,512415 30 33,78496 3 4 4,834607 0,14408 33 36,76504 4 9 7,658498 0,234984 35 39,74513 5 3 4,834607 0,696185 40 42,72522 6 2 1,211951 0,512415 38 7 0 0,124193 0,124193 36,5 QUI2 2,348466 34,5 QUI2CRIT 9,487729 35,5 p 0,67196 36,5 33,5 29,5 32,5 35,5 41 38,5 TESTE DE SHAPIRO-WILK (4 ≤ N ≤ 50) ALGORITMO • ORDENAR OS ELEMENTOS EM ORDEM CRESCENTE • CALCULAR A MÉDIA 𝑥 • CALCULAR A SOMA 𝑎 = 𝑥𝑖 − 𝑥 2 • ORDENAR OS NÚMEROS DOS ELEMENTOS EM DUAS COLUNAS ATÉ 𝑛 2 SE PAR OU ATÉ 𝑛+1 2 SE ÍMPAR. A PRIMEIRA COLUNA CRESCENTE E A SEGUNDA DECRESCENTE • UTILIZAR A TABELA DE SHAPIRO-WILK PARA O NÚMERO DE ELEMENTOS (TABELA)• ORDENAR OS ELEMENTOS EM DUAS COLUNAS, CONFORME AS COLOCAÇÕES DAS DUAS COLUNAS DOS NÚMEROS DOS ELEMENTOS • CALCULAR A SOMA 𝑏 = 𝑡𝑎𝑏𝑒𝑙𝑎 ∙ 𝑥𝑛−𝑖+1 − 𝑥𝑖 • CALCULAR 𝑊 = 𝑏 2 𝑎 E COMPARAR COM 𝑊𝑐𝑟𝑖𝑡 • SE 𝑊 <𝑊𝑐𝑟𝑖𝑡 ENTÃO OS DADOS SEGUEM UMA DISTRIBUIÇÃO NORMAL. TESTE DE SHAPIRO-WILK (4 ≤ N ≤ 50) EXEMPLO: DADOS 36, 35, 36, 37, 32, 30, 33, 35, 40, 38 (n = 10). PAR a = 77,6 i n-i+1 tabela x(n-i+1) x(i) tab*(x-x) b 8,7323 30 27,04 1 10 0,5739 40 30 5,739W 0,982643 32 10,24 2 9 0,3291 38 32 1,9746W crit 0,842 33 4,84 3 8 0,2141 37 33 0,8564p p>0,05 35 0,04 4 7 0,1224 36 35 0,1224 DN 35 0,04 5 6 0,0399 36 35 0,0399 36 0,64 36 0,64 37 3,24 38 7,84 40 23,04 i\n 2 3 4 5 6 7 8 9 10 11 12 1 0,7071 0,7071 0,6872 0,6646 0,6431 0,6233 0,6062 0,5888 0,5739 0,5601 0,5475 2 0 0,1677 0,2413 0,2806 0,3031 0,3164 0,3244 0,3291 0,3315 0,3325 3 0 0,0875 0,1401 0,1743 0,1976 0,2141 0,226 0,2347 4 0 0,0561 0,0947 0,1224 0,1429 0,1586 5 0 0,0399 0,0695 0,0922 6 0 0,0303 7 Tabela S-W 5% N W 3 0,767 4 0,748 5 0,762 6 0,788 7 0,803 8 0,818 9 0,829 10 0,842 11 0,85 12 0,859 CONFIANÇA VERSUS INCERTEZA A CONFIANÇA DE UM EXPERIMENTO É A EXPECTATIVA DE REPETIBILIDADE DO MESMO. INCERTEZA É O VALOR COMPLEMENTAR A 100% DA CONFIANÇA. INCERTEZA = 𝛼 CONFIANÇA = 1 − 𝛼 COM O VALOR DE CONFIANÇA, PODE-SE CALCULAR A VARIÁVEL NORMAL PADRONIZADA 𝑍𝑐 (DA TABELA NORMAL) CORRESPONDENTE. EXEMPLOS: • confiança de 95% resulta em 𝑍𝑐 = 1,96 • confiança de 90% resulta em 𝑍𝑐 = 1,645 • confiança de 99% resulta em 𝑍𝑐 = 2,58 NO EXCEL, 𝑍𝑐 = INV.NORMP.N(0,5+CONFIANÇA%/2) DISTRIBUIÇÃO NORMAL - ERRO • CASO OS DADOS SIGAM UMA DISTRIBUIÇÃO NORMAL, É POSSÍVEL CALCULAR O ERRO ESTATÍSTICO ENVOLVIDO NA VARIABILIDADE DOS DADOS COM DETERMINADA CONFIANÇA (OU INCERTEZA) 𝑒 = 𝑍𝑐 ∙ 𝜎 𝑛 • COM O ERRO, É POSSÍVEL CALCULAR O INTERVALO DE CONFIANÇA, COMO O INTERVALO DENTRO DO QUAL SE TEM O NÍVEL DE CONFIANÇA DE QUE A MÉDIA POPULACIONAL ESTEJA CONTIDO. 𝐼𝐶1−𝛼 = 𝑥 − 𝑒; 𝑥 + 𝑒 DIMENSIONAMENTO DE AMOSTRAS • CASO OS DADOS SIGAM UMA DISTRIBUIÇÃO NORMAL, É POSSÍVEL CALCULAR O NÚMERO DE AMOSTRAS QUE UM EXPERIMENTO DEVE TER, EM FUNÇÃO DE UM NOVO ERRO 𝑒𝑁 (MÁXIMO A SER COMETIDO), UMA CONFIANÇA DESEJADA, E O DESVIO-PADRÃO 𝜎 OBSERVADO NO EXPERIMENTO PILOTO: 𝑛𝑁 = 𝑍𝑐 ∙ 𝜎 𝑒𝑁 2
Compartilhar