Buscar

Aula 3.4 - Histograma e teste de aderência

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 32 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

-Histograma 
-Teste de aderência 
Professora Marina S. Almeida 
 Depois de coletar os dados, avaliar outliers e 
verificar se os valores são independentes e 
identicamente distribuídos, podemos partir 
para a inferência: 
 
 Identificar uma distribuição de probabilidades 
que represente o fenômeno; 
 
 
 É um gráfico em colunas, formado por um 
conjunto de retângulos justapostos, cujas 
bases se situam sobre o eixo das abscissas. 
 
 
 
 
 Divisão dos “n” valores observados em classes. 
O número de classes é dado por “K”: 
 
K=raiz(n) ou K=1,33*log(n) 
 
 O tamanho de cada classe será dado por: 
 
 h=amplitude da amostra/K 
 
 Os dados são distribuídos nessas classes, 
formando uma tabela de frequências. 
 
 Vamos construir um histograma para 
representar os dados abaixo: 
 
 
Regra de Sturges 
 A partir da construção de uma tabela de 
frequências de observações por classe, obtém-se 
um histograma. 
 
 
 n=199 observações 
 K=1+3,3*log(n) 
 K=8,58 
 Arredondar para o próximo 
valor inteiro: 
 K = 9 classes 
 h=43/9=4,8 minutos 
 
CLASSE >MIN <=MÁX Freq. 
1 0 4,8 96 
2 4,8 9,6 55 
3 9,6 14,4 25 
4 14,4 19,2 13 
5 19,2 24 5 
6 24 28,8 4 
7 28,8 33,6 0 
8 33,6 38,4 0 
9 38,4 43,2 1 
0 
20 
40 
60 
80 
100 
120 
1 2 3 4 5 6 7 8 9 
F
re
q
u
ê
n
c
ia
 
Classe 
 A distribuição dos dados é semelhante a uma 
curva de distribuição exponencial 
decrescente, cuja função densidade de 
probabilidade é dada por: 
 
f(x) = λ*exp(-λ*x) 
 
 1/λ = média dos dados = 6,83 
 
 
f(x) = 0,146*exp(-0,146*x) 
 
 
 
 
 Os dados se ajustam à distribuição escolhida? 
 Teste de aderência testa a validade da hipótese 
nula em confronto com a hipótese alternativa. 
 
◦ H0: modelo é adequado para representar a distribuição 
dos dados; 
◦ Ha: modelo não é adequado para representar os dados. 
 
 Os testes de aderência mais usados são o qui-
quadrado e o teste de Kolmogorov-Smirnov. 
 Baseia-se no cálculo dos desvios entre as 
frequências acumuladas observadas em cada 
classe e as frequências teóricas, obtidas 
usando-se o modelo de distribuição 
escolhido. 
2
 Usa família de distribuição de probabilidades 
conhecida como QUI-QUADRADO (²). 
 O formato da curva da distribuição qui-
quadrado depende do número de graus de 
liberdade (gl). 
2
2 para 1 ou 2 gl 2 para 3 ou mais gl 
 2  2 
0 0 
 gl=graus de liberdade 
0 5 10 15 20 25
2
1 gl 
4 gl
10 gl
20 gl
2
 As distribuições qui-quadrado são 
assimétricas à direita. 
 Quanto maior o número de graus de 
liberdade, mais simétrica será a curva. 
 Os valores de qui-quadrado são sempre 
maiores que zero: 
 
 
02 
2
. C2(a,gl): valor crítico da distribuição qui-
quadrado com grau de liberdade “gl” e “a” área 
para a direita. 
0
),(2 gla
2
a
 Equivale à probabilidade de rejeitarmos a 
hipótese nula (H0), dado que ela está correta. 
Ou seja, equivale a probabilidade de 
cometermos um erro “tipo I”. 
Ronald Fisher 
Exemplo: 2(16, 0.05) = ? 
 
0 )05.0,16(2 2
05.0
Na Tabela qui-quadrado 
Área à direita
gl 0.05
16 26.3
2(16, 0.05) = 26.3 
 


Exemplo: 2(10, 0.99) = ?. 
 
0 )99.0,10(2 2
Área à direita
gl 0.99
10 2.56
Na Tabela 
 


2(10, 0.99) = 2.56 
 
 A soma dos quadrados dos desvios das 
frequências observadas e esperadas (teóricas), 
divididos pela frequência esperada (teórica): 
 
 
 
 Resulta no valor de qui-quadrado do teste, cuja 
distribuição tem o formato da função qui-
quadrado com k-1-p graus de liberdade. 
 “p” é o número de parâmetros, estimados a partir 
da amostra coletada, usados para definir a curva 
de distribuição teórica. 
 Comparação dos resultados experimentais 
com os resultados reais permite verificar se os 
dados seguem a distribuição escolhida. 
 
 
 
 
 O: frequência observada em cada classe 
 E: frequência esperada (teórica) em cada classe 
 i: número da classe 
 
 1) Escolher um nível de significância (α) 
 2) Determinar gl=K-p-1 
 
 O valor crítico ( ) é obtido a partir da 
tabela da distribuição do qui-quadrado. 
 
 Se , rejeita-se a 
hipótese de que a amostra observada provém 
de uma população com a distribuição teórica 
adotada. Rejeita-se H0 
crítico
2
críticocalculado
22  
 
CLASSE >MIN <=MÁX 
Freq. 
OBSERVADA 
1 0 4,8 96 
2 4,8 9,6 55 
3 9,6 14,4 25 
4 14,4 19,2 13 
5 19,2 24 5 
6 24 28,8 4 
7 28,8 33,6 0 
8 33,6 38,4 0 
9 38,4 43,2 1 
 A probabilidade de ocorrência de valores na 
classe K, definida no intervalo [a,b] é obtida 
pela integral da função densidade de 
probabilidade: 
 
 
 
 As frequências teóricas de cada classe K são 
calculadas multiplicando-se as 
probabilidades de ocorrência de cada classe 
pelo total de observações. 
 
dxxp
b
a
K )exp(   
Ki psobservaçõeE 
 O teste do qui-quadrado pode ser realizado 
satisfatoriamente com uma condição: todas 
as classes devem ter frequência maior ou 
igual a 5. 
 Caso alguma classe tenha frequência inferior 
a 5, ela deve ser agrupada para que a 
condição acima seja satisfeita. 
 O agrupamento implica na diminuição dos 
graus de liberdade, devido à diminuição no 
número de classes (gl=K-p-1). 
CLASSE >MIN <=MÁX P E 
1 0 4,8 0,5022 100 
2 4,8 9,6 0,2500 50 
3 9,6 14,4 0,1244 25 
4 14,4 19,2 0,0620 12 
5 19,2 24 0,0308 6 
6 24 28,8 0,0154 3 
7 28,8 33,6 0,0076 2 
8 33,6 38,4 0,0038 1 
9 38,4 43,2 0,0038 1 
 As classes 6, 7, 8 e 9 apresentam 
frequências teóricas menores do que 5, 
portanto devem ser agrupadas com a quinta 
classe. 
CLASSE >MIN <=MÁX 
FREQ. OBSERVADA 
(Oi) 
FREQ. TEÓRICA 
(Ei) Xi 
1 0 4,8 96 100 0,16 
2 4,8 9,6 55 50 0,55 
3 9,6 14,4 25 25 0,00 
4 14,4 19,2 13 12 0,04 
5 19,2 24 5 6 0,21 
6 24 28,8 4 3 0,29 
7 28,8 33,6 0 2 1,51 
8 33,6 38,4 0 1 0,76 
9 38,4 43,2 1 1 0,08 
CLASSE >MIN <=MÁX 
FREQ. OBSERVADA 
(Oi) 
FREQ. TEÓRICA 
(Ei) Xi 
1 0 4,8 96 100 0,16 
2 4,8 9,6 55 50 0,55 
3 9,6 14,4 25 25 0,00 
4 14,4 19,2 13 12 0,04 
5 19,2 43,2 10 13 0,69 
A distribuiçãoexponencial adere aos dados observados. 
críticocalculado
22  
44,12 calculado
8147,7)3;05,0(2  glcrítico a
 Foram coletados os tempos de viagem de um 
caminhão entre a fábrica e o centro de 
distribuição: 
 
 
 
 
 
 Utilizando o teste do qui-quadrado, verifique se 
os dados aderem a um modelo de distribuição 
uniforme no intervalo [332;408] minutos. 
Intervalo de tempo em minutos 
356 408 333 405 389 
400 343 393 10 354 
390 362 384 399 374 
403 2 366 332 360 
4134 353 344 336 334 
 Teste de aderência de Kolmogorov-Smirnov 
 Fim da revisão de estatística!

Outros materiais