Baixe o app para aproveitar ainda mais
Prévia do material em texto
04/03/2013 1 Alexandre Navarro “Discutir como um fenômeno aleatório observado no sistema real pode ser representado no modelo de simulação”. 2 Tempo de atendimento: variável aleatória Previsão do comportamento probabilístico a partir da observação 04/03/2013 2 Ou seja: “Obter modelos probabilísticos que permitam inferir as propriedades de um dado fenômeno aleatório” 3 Coleta: processo de amostragem Tratamento: descrição dos dados levantados Inferência: testes de aderência para inferir qual o comportamento da população a partir da amostra o Resultado: modelo probabilístico (distribuição de probabilidades) 4 04/03/2013 3 Escolha adequada das variáveis de entrada do sistema O tamanho da amostra deve estar entre 150 e 200 observações. oAmostras com menos de 150 observações podem comprometer a identificação do melhor modelo probabilístico, e amostras com mais de 200 observações não trazem ganhos significativos ao estudo; 5 6 Coletar e anotar as observações na mesma ordem em que o fenômeno está ocorrendo, para permitir a análise de correlação ; Se existe alguma suspeita de que os dados mudam em função do horário ou do dia da coleta, a coleta deve ser refeita para outros horários e dias. oNa modelagem de dados, vale a regra: toda suspeita deve ser comprovada ou descartada estatisticamente. 04/03/2013 4 Um gerente de supermercado está preocupado com as filas formadas nos caixas de pagamento durante um dos turnos de operação. Quais seriam as variáveis de estudo para coleta de dados? (S - Sim) ou (N - Não). 7 1.( ) O número de clientes que entram no supermercado 2.( ) Os tempos de atendimento nos caixas 3.( ) O número de clientes em fila 4.( ) O tempo de permanência dos clientes no supermercado 5.( ) Os tempos entre chegadas sucessivas de clientes nos caixas de pagamento N S N N S Análise de Outlier: Pontos fora da curva Análise de correlação: Tendência das observações; Testes de Aderência: Identificar a distribuição de probabilidade 8 04/03/2013 5 11 5 2 0 9 9 1 5 5 1 1 3 3 3 7 4 12 8 7 5 5 2 6 1 11 1 2 4 4 2 2 1 3 9 0 10 3 3 4 5 1 5 18 4 22 8 3 0 4 4 8 9 2 3 12 1 3 1 11 9 7 5 14 7 7 28 1 3 3 4 2 11 13 2 0 1 6 12 8 12 15 0 6 7 19 1 1 9 12 4 1 5 3 17 10 15 43 2 9 11 6 1 13 13 19 10 9 20 17 24 19 2 27 5 20 5 10 8 728 8 2 3 1 1 4 3 6 13 12 12 10 9 1 1 3 9 9 4 6 3 0 3 6 3 27 3 18 4 4 7 6 0 2 2 8 4 5 1 3 1 4 18 1 0 16 20 2 2 9 3 2 12 28 0 7 3 18 12 2 1 3 2 8 3 19 12 5 4 0 3 6 0 5 0 3 7 0 8 5 8 9 Intervalo entre chegadas (seg) de pessoas nos caixas do supermercado (200 medidas). Medidas de posi ão M dia 10,44 Mediana 5 Moda 3 M nimo 0 M ximo 728 Medidas de dispersão Amplitude 728 Desvio padrão 51,42 Variância da amostra 2.643,81 Coeficiente de Varia ão 493% Coeficiente Assimetria 13,80 10 04/03/2013 6 11 5 2 0 9 9 1 5 5 1 1 3 3 3 7 4 12 8 7 5 5 2 6 1 11 1 2 4 4 2 2 1 3 9 0 10 3 3 4 5 1 5 18 4 22 8 3 0 4 4 8 9 2 3 12 1 3 1 11 9 7 5 14 7 7 28 1 3 3 4 2 11 13 2 0 1 6 12 8 12 15 0 6 7 19 1 1 9 12 4 1 5 3 17 10 15 43 2 9 11 6 1 13 13 19 10 9 20 17 24 19 2 27 5 20 5 10 8 728 8 2 3 1 1 4 3 6 13 12 12 10 9 1 1 3 9 9 4 6 3 0 3 6 3 27 3 18 4 4 7 6 0 2 2 8 4 5 1 3 1 4 18 1 0 16 20 2 2 9 3 2 12 28 0 7 3 18 12 2 1 3 2 8 3 19 12 5 4 0 3 6 0 5 0 3 7 0 8 5 8 11 Intervalo entre chegadas (seg) de pessoas nos caixas do supermercado (200 medidas). Dados Com o outlier Sem o outlier M dia 10,44 6,83 Mediana 5 5 Desvio Padrão Variância da amostra 51,41 2.643,81 6,60 43,60 12 04/03/2013 7 Análise de Box-Plot 13 0 5 10 15 20 A B C Séries Valores mediana outlier Q 1 Q 3 Q3+1,5(Q3-Q1) Q1-1,5(Q3-Q1) outlier 14 04/03/2013 8 10 12 14 16 18 20 10 20 30 40 50 60 Observação k Observação k+1 Diagrama de dispersão de um exemplo hipotético em que entre os dados que compõem a amostra. 15 Resposta Obs. ])(.].[)(.[ ... 2222 , iiii iiii YX YYnXXn YXYXn r 0 10 20 30 40 50 0 10 20 30 40 50 Observação k Observação k +1 Diagrama de dispersão de um exemplo hipotético em que entre os dados que compõem a amostra. 16 Resposta Obs. 04/03/2013 9 0 20 40 60 80 100 120 4.8 14.3 23.9 33.4 43 Bloco Freqüência 17 )(log3,31 10 nK nK O é utilizado para identificar qual a distribuição a ser ajustada aos dados coletados K Amplitude h 18 (n>30) (30<n<250) 04/03/2013 10 o modelo para representar a distribuição da população. o modelo para representar a distribuição da população. Se a um dado nível de significância rejeitarmos H 0 , o modelo testado para representar a distribuição da população. O nível de significância equivale à probabilidade de rejeitarmos a hipótese nula H 0 , dado que ela está correta. Testes usuais: oQui - quadrado oKolmogorov-Sminov 19 0 4.8 0.5022 100 96 0.16 4.8 9.6 0.2500 50 55 0.55 9.6 14.3 0.1244 25 25 0.00 14.3 19.1 0.0620 12 13 0.04 19.1 1.0E+10 0.0614 12 10 0.40 5% 3 a hipótese de que os dados aderem ao modelo exponencial 20 04/03/2013 11 Critério Indicação p-value<0,01 Evidência forte contra a hip tese de aderência 0,01p-value<0,05 Evidência moderada contra a hip tese de aderência 0,05p-value<0,10 Evidência potencial contra a hip tese de aderência 0,10p-value Evidência fraca ou inexistente contra a hip tese de aderência Indica a probabilidade do valor encontrado ser ao acaso. Parâmetro usual nos softwares de estatística. Para o teste do qui-quadrado no Excel, utilizar: c 21 22 𝐷𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 1,07 𝑛 1,36 𝑛 1,63 𝑛 α=0,10 α=0,05 α=0,01 • • • 04/03/2013 12 Utilização de séries históricas oEx.: simulação de um terminal portuário (o tempo para coleta de dados seria muito grande, tornando-se muitas vezes inviável) 23 Modelagem quando não se dispõe de dados reais oSistemas que ainda não existem oCusto de coleta de dados alto ou inviável tecnicamente oCliente não fornece dados 24 04/03/2013 13 Distribui ão Parâmetros Caracter sticas Aplicabilidade Exponencial M dia •Variância alta •Cauda para direita •Grande variabilidade dos valores •Independência entre um valor e outro •Muitos valores baixos e poucos valores altos •Utilizada para representar o tempo entre chegadas sucessivas e o tempo entre falhas sucessivas Triangular Menor valor, moda e maior valor •Sim trica ou não •Quando se conhece ou se tem um bom chute sobre a moda (valor que mais ocorre), o menor valor e o maior valor que podem ocorrer Normal M dia e desvio- padrão •Sim trica •Forma de sino •Variabilidade controlada pelo desvio- padrão •Quando a probabilidade de ocorrência de valores acima da m dia a mesma que valores abaixo da m dia •Quando o tempo de um processo pode ser considerado a soma de diversos tempos de sub-processos •Processos manuais Uniforme Maior valor e menor valor •Todos os valores no intervalo são igualmente prov veis de ocorrer •Quando não se tem nenhuma informa ão sobre o processo ou apenas os valores limites (simula ão do pior caso) Discreta Valores e probabilidade de ocorrência destes valores •Apenas assume os valores fornecidos pelo analista •Utilizada para a escolha de parâmetros das entidades (por exemplo: em uma certa loja, 30% dos clientes realizam suas compras no balcão e 70% nas prateleiras) •Quando se conhecem apenas valores intermedi rios da distribui ão ou a porcentagem de ocorrência de alguns valores discretos 25 x f ( x ) pnBINOM , npxE )1( pnpxV 04/03/2013 14 x f (x ) POIS xE 0 0,5 1 x f ( x ) α =2 β =1 α =3 β =2 α =4 β =4 α =2β =3 α =1,5 β =5 α =6 β =2 α =2 β =1 ,BETA xE 12 xV 04/03/2013 15 x f ( x ) λ =0,5 k= 3 λ =0,5 λ =0,2 k= 10 kERLA , k xE 2 k xV x f ( x ) α =0, α =1 α =2 ,GAMA xE 2xV 04/03/2013 16 x f ( x ) µ =1 σ =1 µ =1 σ =0,5 2,LOGN 2 2 exE 1222 eexV x f ( x ) α =0,5 β =1 α =1 β =1 α =2 β =1 α =3 β =1 α =3 β =2 ,WEIB 1 xE 22 112 2 xV 1 0 1 dxex x
Compartilhar