Baixe o app para aproveitar ainda mais
Prévia do material em texto
-Histograma -Teste de aderência Professora Marina S. Almeida Depois de coletar os dados, avaliar outliers e verificar se os valores são independentes e identicamente distribuídos, podemos partir para a inferência: Identificar uma distribuição de probabilidades que represente o fenômeno; É um gráfico em colunas, formado por um conjunto de retângulos justapostos, cujas bases se situam sobre o eixo das abscissas. Divisão dos “n” valores observados em classes. O número de classes é dado por “K”: K=raiz(n) ou K=1,33*log(n) O tamanho de cada classe será dado por: h=amplitude da amostra/K Os dados são distribuídos nessas classes, formando uma tabela de frequências. Vamos construir um histograma para representar os dados abaixo: Regra de Sturges A partir da construção de uma tabela de frequências de observações por classe, obtém-se um histograma. n=199 observações K=1+3,3*log(n) K=8,58 Arredondar para o próximo valor inteiro: K = 9 classes h=43/9=4,8 minutos CLASSE >MIN <=MÁX Freq. 1 0 4,8 96 2 4,8 9,6 55 3 9,6 14,4 25 4 14,4 19,2 13 5 19,2 24 5 6 24 28,8 4 7 28,8 33,6 0 8 33,6 38,4 0 9 38,4 43,2 1 0 20 40 60 80 100 120 1 2 3 4 5 6 7 8 9 F re q u ê n c ia Classe A distribuição dos dados é semelhante a uma curva de distribuição exponencial decrescente, cuja função densidade de probabilidade é dada por: f(x) = λ*exp(-λ*x) 1/λ = média dos dados = 6,83 f(x) = 0,146*exp(-0,146*x) Os dados se ajustam à distribuição escolhida? Teste de aderência testa a validade da hipótese nula em confronto com a hipótese alternativa. ◦ H0: modelo é adequado para representar a distribuição dos dados; ◦ Ha: modelo não é adequado para representar os dados. Os testes de aderência mais usados são o qui- quadrado e o teste de Kolmogorov-Smirnov. Baseia-se no cálculo dos desvios entre as frequências acumuladas observadas em cada classe e as frequências teóricas, obtidas usando-se o modelo de distribuição escolhido. 2 Usa família de distribuição de probabilidades conhecida como QUI-QUADRADO (²). O formato da curva da distribuição qui- quadrado depende do número de graus de liberdade (gl). 2 2 para 1 ou 2 gl 2 para 3 ou mais gl 2 2 0 0 gl=graus de liberdade 0 5 10 15 20 25 2 1 gl 4 gl 10 gl 20 gl 2 As distribuições qui-quadrado são assimétricas à direita. Quanto maior o número de graus de liberdade, mais simétrica será a curva. Os valores de qui-quadrado são sempre maiores que zero: 02 2 . C2(a,gl): valor crítico da distribuição qui- quadrado com grau de liberdade “gl” e “a” área para a direita. 0 ),(2 gla 2 a Equivale à probabilidade de rejeitarmos a hipótese nula (H0), dado que ela está correta. Ou seja, equivale a probabilidade de cometermos um erro “tipo I”. Ronald Fisher Exemplo: 2(16, 0.05) = ? 0 )05.0,16(2 2 05.0 Na Tabela qui-quadrado Área à direita gl 0.05 16 26.3 2(16, 0.05) = 26.3 Exemplo: 2(10, 0.99) = ?. 0 )99.0,10(2 2 Área à direita gl 0.99 10 2.56 Na Tabela 2(10, 0.99) = 2.56 A soma dos quadrados dos desvios das frequências observadas e esperadas (teóricas), divididos pela frequência esperada (teórica): Resulta no valor de qui-quadrado do teste, cuja distribuição tem o formato da função qui- quadrado com k-1-p graus de liberdade. “p” é o número de parâmetros, estimados a partir da amostra coletada, usados para definir a curva de distribuição teórica. Comparação dos resultados experimentais com os resultados reais permite verificar se os dados seguem a distribuição escolhida. O: frequência observada em cada classe E: frequência esperada (teórica) em cada classe i: número da classe 1) Escolher um nível de significância (α) 2) Determinar gl=K-p-1 O valor crítico ( ) é obtido a partir da tabela da distribuição do qui-quadrado. Se , rejeita-se a hipótese de que a amostra observada provém de uma população com a distribuição teórica adotada. Rejeita-se H0 crítico 2 críticocalculado 22 CLASSE >MIN <=MÁX Freq. OBSERVADA 1 0 4,8 96 2 4,8 9,6 55 3 9,6 14,4 25 4 14,4 19,2 13 5 19,2 24 5 6 24 28,8 4 7 28,8 33,6 0 8 33,6 38,4 0 9 38,4 43,2 1 A probabilidade de ocorrência de valores na classe K, definida no intervalo [a,b] é obtida pela integral da função densidade de probabilidade: As frequências teóricas de cada classe K são calculadas multiplicando-se as probabilidades de ocorrência de cada classe pelo total de observações. dxxp b a K )exp( Ki psobservaçõeE O teste do qui-quadrado pode ser realizado satisfatoriamente com uma condição: todas as classes devem ter frequência maior ou igual a 5. Caso alguma classe tenha frequência inferior a 5, ela deve ser agrupada para que a condição acima seja satisfeita. O agrupamento implica na diminuição dos graus de liberdade, devido à diminuição no número de classes (gl=K-p-1). CLASSE >MIN <=MÁX P E 1 0 4,8 0,5022 100 2 4,8 9,6 0,2500 50 3 9,6 14,4 0,1244 25 4 14,4 19,2 0,0620 12 5 19,2 24 0,0308 6 6 24 28,8 0,0154 3 7 28,8 33,6 0,0076 2 8 33,6 38,4 0,0038 1 9 38,4 43,2 0,0038 1 As classes 6, 7, 8 e 9 apresentam frequências teóricas menores do que 5, portanto devem ser agrupadas com a quinta classe. CLASSE >MIN <=MÁX FREQ. OBSERVADA (Oi) FREQ. TEÓRICA (Ei) Xi 1 0 4,8 96 100 0,16 2 4,8 9,6 55 50 0,55 3 9,6 14,4 25 25 0,00 4 14,4 19,2 13 12 0,04 5 19,2 24 5 6 0,21 6 24 28,8 4 3 0,29 7 28,8 33,6 0 2 1,51 8 33,6 38,4 0 1 0,76 9 38,4 43,2 1 1 0,08 CLASSE >MIN <=MÁX FREQ. OBSERVADA (Oi) FREQ. TEÓRICA (Ei) Xi 1 0 4,8 96 100 0,16 2 4,8 9,6 55 50 0,55 3 9,6 14,4 25 25 0,00 4 14,4 19,2 13 12 0,04 5 19,2 43,2 10 13 0,69 A distribuiçãoexponencial adere aos dados observados. críticocalculado 22 44,12 calculado 8147,7)3;05,0(2 glcrítico a Foram coletados os tempos de viagem de um caminhão entre a fábrica e o centro de distribuição: Utilizando o teste do qui-quadrado, verifique se os dados aderem a um modelo de distribuição uniforme no intervalo [332;408] minutos. Intervalo de tempo em minutos 356 408 333 405 389 400 343 393 10 354 390 362 384 399 374 403 2 366 332 360 4134 353 344 336 334 Teste de aderência de Kolmogorov-Smirnov Fim da revisão de estatística!
Compartilhar