Buscar

Aula 02 Livro Simulação

Prévia do material em texto

1
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 1
Prof. Afonso C. MedinaProf. Leonardo Chwif
Coleta e Modelagem dos Dados de Entrada
Capítulo 2
Páginas 24-52
Este material é disponibilizado para uso exclusivo de docentes que adotam o livro Modelagem e Simulação de Eventos Discretos em suas disciplinas. O material pode (e deve) ser editado pelo professor. 
Pedimos apenas que seja sempre citada a fonte original de consulta.
Versão 0.2 30/09/06
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 2
 Consideremos um operário que realiza uma mesma tarefa 100 vezes durante um certo tempo. Mesmo após esta longa observação, não podemos garantir de antemão, exatamente quanto tempo levará na execução da próxima tarefa.
 Portanto o tempo gasto pelo operador é dito uma variável aleatória. 
 Apesar de não sabermos o tempo exato, podemos prever o seu comportamento probabilístico, para que possa vir a ser utilizado em um modelo de simulação.
Variáveis Aleatórias
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 3
 É uma das etapas mais importantes no estudo dos modelos de simulação.
 Chamamos de modelos de entrada os modelos probabilísticos responsáveis por representar a natureza aleatória de um dado fenômeno e de Modelagem de dados o processo de escolha da melhor representação deste fenômeno.
Modelagem dos Dados de Entrada
2
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 4
 A modelagem é um processo facilitado quando asseguintes condições são válidas [Yamnitsky,1997]:
Pode ser representado por um conjunto de variáveisaleatórias independentes e identicamente distribuídas -i.i.d. (ex.: Dado);
A distribuição de probabilidade pode ser aproximadapor um modelo probabilístico conhecido (Poisson,Exponencial, Normal, Gama, Triangular, etc...);
Os dados estão disponíveis de modo que seusparâmetros possam ser estimados.
Modelagem dos Dados de Entrada
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 5
 Coleta
Processo de amostragem
Geralmente é feito sobre uma Amostragem ao invés de toda uma população.
 Tratamento
Melhorar o conhecimento sobre os dados.Verificar possíveis falhas.
 InferênciaAplica-se o conhecimento dos cálculos de probabilidade.
Três Etapas
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 6
1. Escolha adequada da variável de estudo
Diferenciar Dados de Entrada de Dados de Saída
2. O tamanho da amostra deve estar entre100 e 200 observações. Amostras commenos de 100 observações podemcomprometer a identificação do melhormodelo probabilístico, e amostras commais de 200 observações não trazemganhos significativos ao estudo;
Coleta dos Dados
3
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 7
3. Coletar e anotar as observações na mesma ordem em que o fenômeno está ocorrendo, para permitir a análise de correlação ;
4. Se existe alguma suspeita de que os dados mudam em função do horário ou do dia da coleta, a coleta deve ser refeita para outros horários e dias. Na modelagem de dados, vale a regra: toda suspeita deve ser comprovada ou descartada estatisticamente.
Coleta dos Dados
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 8
Exemplo 2.1: Filas nos Caixas do Supermercado
Um gerente de supermercado está preocupado com as filas formadas nos caixas de pagamento durante um dos turnos de operação. Quais seriam as variáveis de estudo para coleta de dados? (S) ou (N).
( ) O número de prateleiras no supermercado
( ) Os tempos de atendimento nos caixas
( ) O número de clientes em fila
( ) O tempo de permanência dos clientes no supermercado
( ) Os tempos entre chegadas sucessivas de clientes nos caixas de pagamento
É resultado!!
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 9
Exemplo 2.1: Filas nos Caixas do Supermercado
Um gerente de supermercado está preocupado com as filas formadas nos caixas de pagamento durante um dos turnos de operação. Quais seriam as variáveis de estudo para coleta de dados? (S) ou (N).
( ) O número de prateleiras no supermercado
( ) Os tempos de atendimento nos caixas
( ) O número de clientes em fila
( ) O tempo de permanência dos clientes no supermercado
( ) Os tempos entre chegadas sucessivas de clientes nos caixas de pagamento
N
S
N
N
S
É resultado!!
4
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 10
Exemplo 2.1: Coleta de Dados
Intervalo entre chegadas de pessoas nos caixas do supermercado (100 medidas). Tempos em minutos:
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 11
Exemplo 2.1: Medidas de Posição e Dispersão 
Medidas de posição
Média 10,44
Mediana 5
Moda 3
Mínimo 0
Máximo 728
Medidas de dispersão
Amplitude 728
Desvio padrão 51,42
Variância da amostra 2.643,81
Coeficiente de Variação 493%
Coeficiente Assimetria 13,80
O 728 é um outlier?
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 12
Exemplo 2.1: Outlier “Pontos fora da Curva”
Intervalo entre chegadas de pessoas nos caixas do supermercado (100 medidas). Tempos em minutos:
5
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 13
Outliers ou Valores Discrepantes
 Erro na coleta de dados. Este tipo de outlier é o mais comum, principalmente quando o levantamento de dados é feito por meio manual.
 Eventos Raros. Nada impede que situações totalmente atípicas ocorram na nossa coleta de dados. Alguns exemplos:
 Um dia de temperatura negativa no verão da cidade do Rio de Janeiro;
 Um tempo de execução de um operador ser muito curto em relação aos melhores desempenhos obtidos naquela tarefa;
 Um tempo de viagem de um caminhão de entregas na cidade de São Paulo, durante o horário de rush, ser muito menor do que fora deste horário.
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 14
Exemplo 2.1: Outlier (valor discrepante)
Dados
com o outlier sem o outlier
Média 10,44 6,83
Mediana 5 5
Variância da amostra 2.643,81 43,60
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 15
Identificação de Outliers: Box-plot
0
5
10
15
20
A B C Séries
Valores
mediana
outlier
Q1
Q3
Q1-1,5( Q 3- Q 1)
Q 3+1,5(Q 3- Q 1)
6
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 16
Análise de Correlação
Diagrama de dispersão dos tempos de atendimento do exemplo de supermercado, mostrando que não há correlação entre as observações da amostra. 
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 17
Análise de Correlação
Diagrama de dispersão de um exemplo hipotético em que existe correlação entre os dados que compõem a amostra.
Exemplo: Gráfico Excel
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 18
Exemplo 2.1: Construção do Histograma
1. Definir o número de classes:
O histograma é utilizado para identificar qual a distribuição a ser ajustada aos dados coletados ou é utilizado diretamente dentro do modelo de simulação.
2. Definir o tamanho do intervalo:
3. Construir a tabela de freqüências
4. Construir o histograma
7
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 19
Exemplo 2.1: Histograma
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 20
Exemplo 2.1: Inferência
Qual o melhor modelo probabilístico ou distribuição estatística que pode representar a amostra coletada?
x
f (x )
1/λ
x
f (x )
µ
x
f (x)
a bm
x
f(x )
µ =1 σ=1
µ=1 σ=0,5
Exponencial?
Normal? Triangular?
Lognormal?
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 21
Testes de Aderência (não paramétricos)
Testa a validade ou não da hipótesede aderência (ou hipótese nula) em confronto com a hipótese alternativa:
 H0: o modelo é adequado para representar a distribuição da população.
 Ha: o modelo não é adequado para representar a distribuição da população.
Se a um dado nível de significância (100)% rejeitarmos H0, o modelo testado não é adequado para representar a distribuição da população. O nível de significância  equivale à probabilidade de rejeitarmos a hipótese nula H0, dado que ela está correta. Testes usuais:
Qui quadrado
Kolmogorov-Sminov
8
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 22
Teste do Qui-quadrado
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 23
P-value
Valor Critério
p-value<0,01 Evidência forte contra a hipótese de aderência
0,01p-value<0,05 Evidência moderada contra a hipótese de aderência
0,05p-value<0,10 Evidência potencial contra a hipótese de aderência
0,10p-value Evidência fraca ou inexistente contra a hipótese de aderência
Parâmetro usual nos softwares de estatística. Para o teste do qui-quadrado no Excel, utilizar:
=DIST.QUI (valor de E; graus de liberdade)
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 24
Distribuições discretas: Binomial
x
f ( x )
9
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 25
Distribuições discretas: Poisson
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 26
Distribuições contínuas: Beta
0 0,5 1 x
f (x )
α =2 β=1α =3 β=2
α =4 β=4
α=2 β=3
α =1,5 β=5 α =6 β=2
α =2 β=1
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 27
Distribuições contínuas: Erlang
x
f (x )
λ =0,5 k= 3
λ =0,5 
λ =0,2 k= 10
10
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 28
Distribuições contínuas: Exponencial
x
f (x )
1/λ
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 29
Distribuições contínuas: Gama
x
f (x )
α =0,
α =1
α =2
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 30
Distribuições contínuas: Lognormal
x
f (x )
µ =1 σ=1
µ=1 σ=0,5
11
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 31
Distribuições contínuas: Normal
f (x )
µ
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 32
Distribuições contínuas: Uniforme
ba
1/ (b-a)
x
f (x )
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 33
Distribuições contínuas: Triangular
x
f (x )
a bm
12
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 34
Distribuições contínuas: Weibull
x
f (x )
α=0,5 β =1
α=1 β =1 α=2 β =1
α=3 β=1
α=3 β=2
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 35
Modelagem de dados... Sem dados!
Distribuição Parâmetros Características Aplicabilidade
Exponencial Média Variância altaCauda para direita
Grande variabilidade dos valores
Independência entre um valor e outro
Muitos valores baixos e poucos valores altos
Utilizada para representar o tempo entre chegadas sucessivas e o tempo entre falhas sucessivas
Triangular Menor valor, moda e maior valor Simétrica ou não
Quando se conhece ou se tem um bom “chute” sobre a moda (valor que mais ocorre), o menor valor e o maior valor que podem ocorrer
Normal Média e desvio-padrão
Simétrica
Forma de sino
Variabilidade controlada pelo desvio-padrão
Quando a probabilidade de ocorrência de valores acima da média é a mesma que valores abaixo da média
Quando o tempo de um processo pode ser considerado a soma de diversos tempos de sub-processos
Processos manuais
Uniforme Maior valor e menor valor
Todos os valores no intervalo são igualmente prováveis de ocorrer
Quando não se tem nenhuma informação sobre o processo ou apenas os valores limites (simulação do pior caso)
Discreta
Valores e probabilidade de ocorrência destes valores
Apenas assume os valores fornecidos pelo analista
Utilizada para a escolha de parâmetros das entidades (por exemplo: em uma certa loja, 30% dos clientes realizam suas compras no balcão e 70% nas prateleiras) 
Quando se conhecem apenas “valores intermediários” da distribuição ou a porcentagem de ocorrência de alguns valores discretos
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 36
Leitura do PAPER:
“ SIMULATION OPTIMIZATION WITH THE LINEAR MOVEAND EXCHANGE MOVE OPTIMIZATION ALGORITHM ”
 Marcos Ribeiro Pereira Barretto, Leonardo ChwifMechatronics Lab University of São Paulo
 Tillal Eldabi, Ray J. Paul
Centre For Applied Simulation ModellingDepartment Of Information Systems And ComputingBrunel University
Exercícios - I
13
Modelagem e Simulação de Eventos Discretos – Chwif e Medina (2006) Slide 37
Escolher uma base de dados no Repositório:
 UCI Machine Learning Repository_ Data Sets.html
Fazer uma análise Estatística dos Dados – Contendo no Mínimo:
 Média
 Desvio Padrão
 Análise de Correlação
 Gráficos
 Identificação de Outliers
 Conclusão sobre os dados
Data de Entrega: Na AV1 (Vai ser uma questão da Prova)
Exercícios - II

Continue navegando