Baixe o app para aproveitar ainda mais
Prévia do material em texto
13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 1/45 Simulação e otimização Prof. Mauro Rezende Filho Descrição A simulação de Monte Carlo, o número de simulações e a análise de sensibilidade, a validação de dados de saída e os testes estatísticos, bem como as aplicações de simulação de Monte Carlo em engenharia. Propósito Conhecer o modelo de otimização e simulação de Monte Carlo e suas aplicações na engenharia. Preparação Antes de iniciar seus estudos, certifique-se que você tenha, à sua disposição, papel e lápis, computador com o software Excel, de modo que possa replicar o conteúdo e exercício que serão apresentados. Objetivos Módulo 1 Simulação de Monte Carlo Reconhecer o método estatístico denominado simulação de Monte Carlo. Módulo 2 Número de simulações e análise de sensibilidade 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 2/45 Reconhecer os conceitos de número de simulações e de análise de sensibilidade. Módulo 3 Validação de dados de saída do modelo de simulação e de seus testes estatísticos Descrever a validação dos dados de saída do modelo de simulação e de seus testes estatísticos. Módulo 4 Aplicações de simulação de Monte Carlo em engenharia Aplicar a simulação de Monte Carlo com o auxílio do Microsoft Excel. Introdução Olá! Antes de começarmos, assista ao vídeo e entenda os conceitos de simulação e otimização: 1 - Simulação de Monte Carlo Ao �nal deste módulo, você será capaz de reconhecer o método estatístico denominado simulação de Monte Carlo. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 3/45 Vamos começar! O método estatístico denominado simulação de Monte Carlo Entenda agora como funciona o método de Monte Carlo: O que é simulação de Monte Carlo? A simulação de Monte Carlo é um método estatístico aplicado em modelagem, cuja probabilidade de resultados diferentes em um problema não pode ser simplesmente resolvido devido à interferência de uma variável aleatória. A simulação baseia-se na repetição de amostras aleatórias para obter resultados numéricos. Esse método pode ser usado para entender o efeito da incerteza e aleatoriedade nos modelos de previsão. A simulação de Monte Carlo foi desenvolvida, pela primeira vez, por Stanislaw Ulam na década de 1940. Ulam era um matemático que trabalhou no Projeto Manhattan. Inicialmente, o método foi derivado para resolver o problema de determinar a distância média que os nêutrons percorreriam através de vários materiais e recebeu o nome do Monte Carlo Casino, em Mônaco, pois a aleatoriedade dos resultados, crucial para jogos como roleta ou dados, é essencial para as simulações de Monte Carlo. Em essência, a simulação de Monte Carlo pode ser usada em quase todos os problemas probabilísticos. Isso explica por que ela pode ser usada em diferentes campos, incluindo estatística, finanças, engenharia e ciência. As principais ideias por trás da simulação de Monte Carlo são: A amostragem aleatória repetida de entradas da variável aleatória A agregação dos resultadosA variável de natureza probabilística recebe um valor aleatório, com base no qual o modelo é, então, calculado. O resultado do modelo é registrado, e o processo é repetido. Normalmente, essa repetição ocorre centenas ou milhares de vezes. Quando a simulação estiver completa, os resultados podem ser calculados para determinar o valor estimado. Sempre que você precisar fazer uma estimativa, previsão ou decisão em que haja incerteza significativa, seria aconselhável considerar a simulação de Monte Carlo – caso contrário, suas estimativas ou previsões podem estar muito erradas, com consequências adversas para suas decisões. A maioria das atividades, planos e processos de negócios são complexos demais para uma solução analítica. Mas você pode construir um modelo de planilha que permite avaliar seu plano numericamente – alterar os números, perguntar 'e se?' e ver os resultados. Isso é simples se você tiver apenas um ou dois parâmetros para explorar. Mas diversas situações de negócios envolvem incerteza em muitas dimensões. Exemplo Demanda variável do mercado, planos desconhecidos de concorrentes, incerteza nos custos e muitas outras. Se sua situação soa assim, provavelmente o método de Monte Carlo será surpreendentemente eficaz para você também. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 4/45 Para usar a simulação de Monte Carlo, você deve ser capaz de: Primeiro Construir um modelo quantitativo de sua atividade, plano ou processo de negócios. Uma das maneiras mais fáceis e populares de fazer isso é criar um modelo de planilha usando o Microsoft Excel, e usar o Analytic Solver Simulation (que pode ser baixado gratuitamente no site da Frontline Systems) como uma ferramenta de simulação. Outras maneiras incluem escrever o código em uma linguagem de programação, como Visual Basic, C++, C#, Java etc., ou usar uma linguagem de modelagem de simulação de propósito especial. Segundo Aprender (ou revisar) noções básicas de probabilidade e estatística. Para lidar com incertezas em seu modelo, você substituirá certos números fixos – por exemplo, em células de planilhas – por funções que extraem amostras aleatórias de distribuições de probabilidade. E para analisar os resultados de uma simulação, você usará estatísticas como média, desvio-padrão e percentis, bem como tabelas e gráficos. Felizmente, existem ótimas ferramentas de software para ajudá-lo a fazer isso, apoiadas por suporte e assistência técnica. Ao contrário de um modelo de previsão normal, a simulação de Monte Carlo prevê um conjunto de resultados com base em um intervalo de valores estimados em relação a um conjunto de valores de entrada fixos. Em outras palavras, uma simulação de Monte Carlo cria um modelo de resultados possíveis, usando uma distribuição de probabilidade, como uma distribuição uniforme ou normal, para qualquer variável que tenha incerteza inerente. Ele então recalculará os resultados sucessivamente, cada vez usando um conjunto diferente de números aleatórios entre os valores mínimo e máximo. Em um teste típico de Monte Carlo, esse exercício pode ser repetido milhares de vezes para produzir um grande número de resultados prováveis. As simulações de Monte Carlo também são usadas para previsões de longo prazo, devido à sua precisão. À medida que o número de informações aumenta, o número de previsões também cresce, permitindo que você projete resultados com mais tempo e precisão. Quando uma simulação de Monte Carlo é concluída, ela produz vários resultados possíveis com a probabilidade de cada resultado ocorrer. Independentemente de qual ferramenta você usa, as técnicas de Monte Carlo envolvem três etapas básicas, cujas ações estão descritas a seguir: 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 5/45 Exemplos de simulação Planejamento de negócios Uma empresa está estudando a possibilidade de lançar um novo produto; entretanto, como existem incertezas associadas a ele com relação à demanda, ao preço e aos custos variáveis, ela pretende ter uma ideia da distribuição de probalilidade do lucro líquido, que é calculado da seguinte forma: lucro líquido = quantidade vendida x (preço de venda – custo variável) – custos fixos Rotacione a tela. Os custos fixos, nesse caso, representam os gastos com despesas gerais, publicidade etc., que somam $150.000,00 e não tenham nenhuma incerteza associada. Os demais dados têm alguma incerteza associada, a saber: Quantidade vendida Repesenta uma incerteza devido à variação da demanda. Primeira etapa Configure o modelo preditivo, identificando a variável dependente a ser prevista e as variáveis independentes (também conhecidas como variáveis de entrada, risco ou preditivas) que conduzirãoa previsão. Segunda etapa Especifique as distribuições de probabilidade das variáveis independentes. Use dados históricos e/ou julgamento subjetivo do analista para definir um intervalo de valores possíveis e atribuir pesos de probabilidade a cada um. Terceira etapa Execute simulações repetidamente, gerando valores aleatórios das variáveis independentes. Faça isso até obter resultados suficientes para compor uma amostra representativa do número quase infinito de combinações possíveis. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 6/45 Preço de venda Depende da quantidade vendida e da ação dos concorrentes. Custo unitário Depende do valor ofertado pelos fornecedores e da eficência do processo produtivo. Variáveis incertas Para podermos analisar os riscos e modelar as incertezas, faz-se necessário identificar as incertezas associadas aos dados que interferem no valor do lucro líquido, o que chamamos, normalmente, de variáveis de decisão, ou seja, aquelas cuja variação interfere no valor do lucro apurado. Vamos analisá-las. Vendas e preço O gerente de marketing, baseando-se em pesquisa de mercado, acredita que existem chances iguais do mercado ser fraco (F), normal (N) e aquecido (A). A tabela a seguir apresenta os dados dessas hipóteses. Cenários das vendas Volume Preço Mercado aquecido 120.000 12,00 Mercado normal 90.000 10,00 Mercado fraco 55.000 8,50 Tabela: Dados de venda e preço. Mauro Rezende Filho. Custo unitário O gerente de produção junto com o gerente de compras, em função dos valores oferecidos pelos fornecedores bem como da produtividade em função da quantidade vendida, estimam as possíveis variações dos custos operacionais unitários: Cenários de custo Unitário Mínimo 6,50 Mais provável 7,00 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 7/45 Cenários de custo Unitário Máximo 8,00 Tabela: Dados de custo unitário. Mauro Rezende Filho. Funções incertas Lucro líquido Como podemos observar, existem incertezas associadas à quantidade vendida, ao preço de venda e aos custos operacionais, que, como consequência, impactarão no lucro líquido, o qual iremos analisar. O modelo de análise Antes de analisarmos o impacto dessas incertezas, vamos calcular o lucro líquido com base nos valores médios, considerando-os como determinísticos, do seguinte modo: Introduzindo a incerteza em um modelo Vamos, agora, introduzir em nosso modelo determinístico as incertezas associadas aos valores, para podemos analisar o impacto no lucro líquido. Vendas e preço Como há chances iguais de que o mercado seja fraco, normal ou aquecido, queremos criar uma variável incerta que selecione entre essas três possibilidades, gerando um número aleatório com igual probabilidade. Podemos gerar esses números facilmente no Excel, usando uma distribuição de probabilidade uniforme inteira. Em seguida, basearemos o volume de vendas e o preço de venda no valor dessa variável incerta. Legenda Observe a planilha montada: 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 8/45 Agora, podemos analisar o cenário da simulação. Observe, na planilha anterior, a distribuição do lucro líquido: obtemos um valor médio do lucro líquido de $140.919, abaixo da projeção determinística de $150.000. Os gráficos, a seguir, mostram a sua amplitude, indicando que poderá haver um lucro máximo de $355.610 e também um prejuízo de 85.058, devido à associação combinada das incertezas. Máximo 355.610 Mínimo –85.058 Amplitude 440.668 Podemos, então, analisar a sua distribuição de probabilidades. Gráfico: Distribuição do Lucro Líquido. Gráfico: Distribuição % do Lucro Líquido. Observe que nenhum valor se destaca, ou seja, com excessão da cauda direita da curva, existe a probabilidade de quaisquer valores poderem ocorrer, sendo que a hipótese determinística é de apenas 1,7%. Exemplo 2 Planejamento de produção 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 9/45 Suponha o processo produtivo a seguir: Pensando de forma determinística, o tempo de produção será de 77s (36 + 18 + 23). Entretanto, sabemos que, como esses tempos representam a média de valores cronometrados, não representarão a realidade do processo produtivo. Inserindo a incerteza Vamos supor as seguintes hipóteses: Máquina A Tempo, conforme uma distribuição nomal de média, de 36 segundos e desvio-padrão de 0,45s. Máquina B Tempo, conforme uma distribuição uniforme, com valores entre 17s e 19s. Máquina C Tempo, conforme uma distribuição de Poisson, com média de 23s. Vamos, então, gerar 1.000 valores aleatórios e estudar o resultado. Podemos observar que o tempo médio da simulação foi de 76,8s, sendo, portanto, muito próximo do tempo determinístico de 77s. Entretanto, isso pode nos levar a tirar conclusões erradas. Observe a distribuição de probabilidades no gráfico seguinte: Maquina A 36s Maquina B 18s Maquina C 23s 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 10/45 Gráfico: Tempo de Processo. Gráfico: Tempo de processo. Analisando a distribuição de probabilidades mostrada nos gráficos, vemos que o tempo determinístico tem uma chance entre 2 e 3% de ocorrer. Esse é, portanto, o grande problema de processos produtivos quando utilizamos as médias dos tempos. Sempre temos a incerteza do tempo de produção. Falta pouco para atingir seus objetivos. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 11/45 Vamos praticar alguns conceitos? Parabéns! A alternativa E está correta. %0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%3Cp%20class%3D'c- paragraph'%3EUma%20vari%C3%A1vel%20de%20decis%C3%A3o%20%C3%A9%20uma%20inc%C3%B3gnita%20em%20um%20problema%20de%20oti Parabéns! A alternativa E está correta. %0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%3Cp%20class%3D'c- paragraph'%3EPara%20tratar%20as%20incertezas%20de%20um%20processo%20a%20ser%20simulado%2C%20o%20primeiro%20passo%20%C3%A9 Questão 1 O tipo de variável da simulação Monte Carlo que pode ser controlada pelo analista é conhecido como A uma variável incontrolável. B um número aleatório. C uma variável dependente. D uma variável de decisão. E uma variável aleatória. Questão 2 O primeiro passo no processo de simulação de Monte Carlo é A gerar números aleatórios. B configurar distribuições de probabilidade cumulativa. C estabelecer intervalos de números aleatórios. D simular ensaios. E configurar distribuições de probabilidade. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 12/45 2 - Número de simulações e análise de sensibilidade Ao �nal deste módulo, você será capaz de reconhecer os conceitos de número de simulações e análise de sensibilidade. Vamos começar! Os conceitos de número de simulações e análise de sensibilidade de simulação Fique agora com uma explicação mais detalhada sobre os números de simulações e a análise de sensibilidade que deve ser atribuída à simulação, bem como sua importância. Número de simulações As estatísticas são estimativas dos parâmetros de uma população. Os resultados são estatísticas baseadas em uma amostra (o número de simulações executadas) de uma população infinita (o número de simulações que podem ser executadas). Como uma estatística é uma estimativa, o intervalo de confiança é usado para determinar quão boa é a estimativa. O intervalo de confiança é calculado a partir do tamanho da amostra e do desvio-padrão e do nível de confiança escolhido (normalmente 90%, 95% ou 99%). Após a execução de uma simulação, o usuário pode observar o intervalo de confiança para determinar se amostras suficientes foram executadas. Exemplo 13/03/2023 14:49 Simulaçãoe otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 13/45 Uma medida pode ter um desvio-padrão de 1mm após a execução de 5.000 simulações. O intervalo de confiança de 95% será de 0,981 a 1,020mm. Portanto, supondo que os resultados da medida sejam normalmente distribuídos, um usuário tem 95% de probabilidade de gerar um desvio-padrão entre 0,981 e 1,020mm se deixar o modelo rodar indefinidamente. Como o intervalo de confiança está linearmente relacionado ao desvio-padrão, um desviopadrão de teria um intervalo de confiança de 95% de 1,962 a , e qualquer simulação de 5.000 amostras e um desvio-padrão de teria um intervalo de confiança de 95%, ou de 0,981 x ( ) a 1,020 x ( ). Sendo assim, o usuário estaria confiante de que os resultados estão com 2% do desvio-padrão da população. Para ter mais confiança, são necessárias mais amostras. Para ter certeza de que os resultados estão com 1% do desvio-padrão da população, são necessárias 20.000 simulações. Executar mais amostras reduzirá ainda mais o intervalo de confiança, mas, como muitos outros fatores afetam a precisão do modelo, executar mais de 20.000 amostras, geralmente, não fornecerá ao usuário resultados mais precisos. Comentário Os valores de média, desvio-padrão, alta percentual de saída e baixa percentual de saída se aplicam a determinados resultados de simulação definidos. Se a semente inicial, o número de execuções ou o modelo forem alterados, os valores dessas estatísticas serão alterados. Se uma simulação tivesse um número infinito de execuções, os valores de média, desvio-padrão e o percentual alto e baixo de saída convergiriam para valores fixos. Como os valores incluem todas as execuções possíveis, eles agora são chamados de parâmetros, e o número infinito de execuções é a população. Observe os gráficos a seguir, nos quais estamos utilizando uma distribuição normal de média 36 e desvio-padrão igual a 0,45, com várias simulações: Grá�co 1 Grá�co 2 2 mm 2, 040 mm x mm x mm x mm 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 14/45 Grá�co 3 Grá�co 4 Na teoria da probabilidade, o teorema do limite central (CLT) estabelece que, em muitas situações, quando as variáveis aleatórias independentes são somadas, sua soma devidamente normalizada tende a uma distribuição normal, mesmo que as próprias variáveis originais não sejam normalmente distribuídas. Podemos observar que houve uma convergência para a média conforme o número de simulações foi aumentando. Análise de sensibilidade de simulação A análise de sensibilidade é um dos objetivos da simulação de Monte Carlo. Um modelo genérico para simulação de Monte Carlo é uma caixa preta com uma ou mais entradas, resultando em uma ou mais saídas. A simulação de Monte Carlo para na geração das saídas, mas seria inútil se não analisássemos o efeito das mudanças em uma variável de entrada em uma variável de saída. A análise de sensibilidade faz a pergunta: como uma mudança na entrada A afeta a saída G, ou como a saída G responde a mudanças na entrada A? As diferentes técnicas para realizar a análise de sensibilidade que podemos usar na simulação de Monte Carlo são: 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 15/45 É o que temos desenvolvido até agora. Geralmente, consiste em uma tabela de frequência com sua contraparte cumulativa, um gráfico de ambas as tabelas e estatísticas descritivas. Esses elementos representam um tipo de análise de sensibilidade e mostram, principalmente, o efeito de variáveis de entrada, selecionadas aleatoriamente em uma ou mais variáveis de saída. Embora essas folhas desenvolvam a saída a partir da entrada, elas não fornecem ao analista o "comportamento" da sensibilidade, o "como" das mudanças. Podemos preparar nossa própria análise de sensibilidade manual, que resulta em um Gráfico de Tornado mostrando o efeito de cada variável de entrada em uma variável de saída em que estamos interessados. A maior variação corresponderia à variável de entrada, que tem o maior efeito nessa variável de saída. Não há gráfico de tornado no Excel. Temos que configurá-lo manualmente. Podemos configurar uma simulação adicional que conterá dois valores para cada. Os valores serão o mínimo e o máximo. Dessa forma, podemos configurar o gráfico de tornado. Vamos ver uma técnica que se baseia na seguinte abordagem: suponha que tenhamos quatro variáveis de entrada – A, B, C e D. Fixe B, C e D. As entradas fixas recebem estimativas pontuais que você pode inserir no modelo. Você então varia a variável de entrada A restante. Como A varia de um limite para outro, a variável de saída varia de acordo. O resultado é composto por dois valores. Proceda fixando A, C e D e variando B. Recolha as duas saídas resultantes dessa simulação. Faça o mesmo para as outras variáveis. O resultado é composto de que, posteriormente, podem ser plotadas como um gráfico de tornado. Temos dois problemas para resolver: Primeira questão Quais são os limites das variáveis de entrada? Como as variáveis de entrada, provavelmente, serão amostras das distribuições que discutimos (e mais por vir), podemos seguir estas práticas: Para distribuições uniformes, podemos usar os limites inferior e superior reais. Para distribuições normais, o limite inferior é 2 desvios-padrão abaixo da média. O limite superior é de 2 desvios-padrão acima da média. As fórmulas a seguir fornecem esse valor para uma distribuição normal padrão que tem 0 como média e 1 como desvio-padrão: Limite superior DISTNORM (2,0,1,TRUE) = 0,97725. As planilhas de resultados O gráfico de tornado e sensibilidade Tabelas what if Variável de entrada em relação a uma das variáveis de saída 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 16/45 Limite inferior DISTNORM (-2,0,1,TRUE) = 0,02275. Limite superior - Limite inferior 0,97725 - 002275 = 0,9545. Vejamos no gráfico: Gráfico: Limites das variáveis de entrada. Podemos calcular o intervalo usando o gráfico acima com os parâmetros reais (média e desvio-padrão) definidos nas funções do Excel: Limite inferior INV.NORM.N (0,02275, média, desvio-padrão). Limite superior INV.NORM.N (0,97725, média, desvio-padrão). E, então, seguir com as próximas etapas: Para distribuições discretas de variáveis aleatórias, como não existe uma forma fechada para essa distribuição, temos que calcular nossos limites inferior e superior manualmente. Temos um intervalo com probabilidades para cada valor da variável de entrada. Simplesmente identifique o valor da variável de entrada que reside nos colchetes de 2,275% e 97,725% que se aproximam do intervalo de confiança acima. Para distribuições triangulares, novamente, como temos uma função inversa (seja através de fórmulas VBA ou Excel), podemos obter os valores através das probabilidades. Segunda questão O que usamos para o ponto único ou os valores fixos de uma variável de entrada quando outra está sendo levada ao extremo? Esse é um problema mais simples de resolver que o primeiro. Considere o tipo de distribuição que está sendo mostrado. Exemplo Digamos que estamos mostrando uma distribuição normal. Seria lógico usar a média como a estimativa de ponto único. Se estivermos usando uma distribuição BetaPERT, a moda seria o valor lógico para ser usada como a estimativa de ponto único. Para outras distribuições simétricas, a mediana pode ser usada. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 17/45 Exemplo de projeção orçamentária com análise de sensibilidade Considere um modelo com 8 variáveis de entrada e analise a sensibilidade da saída a mudanças em cada uma das variáveis de entrada, para as quais, dois valores serão usados: um limite inferior (geralmente em 0,02275 de probabilidade) e um limite superior (em 0,97725). Vamospreparar o modelo para que possamos usá-lo como base de procedimentos genéricos de análise de sensibilidade: Gráfico de Tornado e diferentes modos de análise de regressão. Vejamos a declaração do problema: Uma projeção da demonstração de resultados do ano passado, ao longo de quatro anos, exige que usemos oito fatores de crescimento. Sem a simulação de Monte Carlo, essas estimativas teriam que ser de um único ponto e resultariam em um valor: o lucro líquido (ou prejuízo) no final do ano 4. Vamos, primeiramente, simular esse modelo usando as técnicas de amostragem que temos usado até agora. Na fase de "análise de sensibilidade", usaremos as tabelas what if do Excel para encontrar o intervalo de valores em uma única variável de saída em resposta a alterações nas 8 variáveis de entrada. Vamos revisar, brevemente, a formulação na folha Modelo. É uma demonstração de resultados simplificada: Observe que: A coluna C contém as 8 taxas de crescimento (ou fatores de projeção de multiplicação). Essas são as variáveis de entrada que vamos randomizar. A coluna D contém os valores reais do ano anterior. As colunas de E a H projetam o ano anterior para os próximos 4 anos, usando as taxas de crescimento indicadas na coluna C. As constantes foram configuradas da seguinte forma: Na coluna C, na folha Modelo, inserimos as fórmulas de amostragem para as 8 taxas de crescimento. As fórmulas usam as constantes disponíveis na planilha Constantes: C3 = INV.NORM.N(ALEATÓRIO();Constantes!$D$3;Constantes!$F$3) Problema 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 18/45 C4 = INV.NORM.N(ALEATÓRIO();Constantes!$D$4;Constantes!$F$4) C8 = ALEATÓRIO() * (Constantes!$D$7-Constantes!$F$7)+Constantes!$F$7 C9 = INV.NORM.N(ALEATÓRIO();Constantes!$D$8;Constantes!$F$8)) C13 = ÍNDICE(Constantes!$D$13:$D$16; SENÃODISP(CORRESP(ALEATÓRIO(); Constantes!$C$13:$C$16;1); 0) + 1)) C14 = ALEATÓRIO() * (Constantes!D19-Constantes!$F$19)+Constantes!$F$19 C15 = INV.NORM.N(ALEATÓRIO();Constantes!$D$20;Constantes!$F$20) C16 = ALEATÓRIO() * (Constantes!$D$21-Constantes!$F$21)+Constantes!$F$21 Lembre-se que o primeiro intervalo D13:D16 é onde se encontram os valores que você precisa na simulação, a taxa de crescimento da folha de pagamento. A segunda matriz é o intervalo que contém a % cumulativa C13:C16. Ambos os intervalos estão na planilha Constantes. As linhas inferiores da planilha Modelo mostram o lucro líquido antes dos impostos, o lucro acumulado e a porcentagem de lucro e o prejuízo nas vendas. Nos interessa a projeção desses 3 valores financeiros para o ano corrente + 4 que estão em azul (objetivos): Na folha Simulações, insira o rótulo "Simulação ID" em A1. Em B1, C1 e D1, copie os valores do último ano da planilha Modelo: Eles serão usados como a parte superior da tabela de análise what if. Use o recurso de preenchimento automático do Excel para gerar a sequência 1, 2... 4000 no intervalo A2:A4000. Para aplicar a tabela what if da análise de sensibilidade, siga o procedimento-padrão: Selecione o intervalo B2:D4001; Selecione o item de menu DADOS FERRAMENTAS DE DADOS E SE ANÁLISE / TABELA DE DADOS; Clique dentro do campo "Célula de entrada da coluna" e depois clique em qualquer célula da planilha e pressione OK. O Excel usará o procedimento de tabela what if para copiar as células B2:D2 até a linha 4001. Essa é uma tabela ou uma matriz do Excel. As células não podem ser editadas. B1 Modelo!H19 C1 Modelo!H20 D1 Modelo!H21 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 19/45 Agora podemos analisar as 3 células (H19, H20 e H21) na planilha Resultados. Vamos apenas preparar os resultados para a primeira célula: lucro líquido antes dos impostos. Os demais seguem procedimentos semelhantes. Em A1 na folha de Resultados, insira o rótulo "Run ID". Nas células B1, C1 e D1 insira os rótulos "Lucro Líquido", "Lucro Acum" e "% Bruto". (Também é possível usar o operador = para copiá-los do intervalo A19, A20 e A21 na folha de modelo). Copie o intervalo A2:D4001 como valores da folha Modelo para o mesmo intervalo na folha Resultados. Começando em F1, prepare a análise bin para as 3 colunas B, C e D. Digite o seguinte no intervalo K1:M2. Tendo escolhido 25 como tamanho do compartimento, prepare os compartimentos começando com o valor –1000 (que está logo abaixo de –986) e incrementando os compartimentos em 25 até atingir o valor 100. Use a função COUNT.SE() para preparar a contagem de frequência dos valores no intervalo L2:L47. Esta é a fórmula para inserir: =COUNT.SE($B$2:$B$4001,">"&K2,$B$2:$B$4001,"<="&K3). Prepare a probabilidade cumulativa no intervalo M3:M47. A fórmula em M3=SOMA($L$3:L3)/SOMA($L$3:$L$47). Insira um diagrama de dispersão para o intervalo K2:M47 para obter o gráfico seguinte. Intervalo K1:M2 Gráfico: Lucro acumulado. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 20/45 Falta pouco para atingir seus objetivos. Vamos praticar alguns conceitos? Parabéns! A alternativa C está correta. %0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%3Cp%20class%3D'c- paragraph'%3EO%20conceito%20central%20por%20tr%C3%A1s%20da%20simula%C3%A7%C3%A3o%20de%20Monte%20Carlo%20%C3%A9%20uma% Questão 1 A simulação de Monte Carlo é uma técnica que trabalha com A coleta de dados. B formulação do modelo. C atribuição de números aleatórios. D análise. E modelagem. Questão 2 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 21/45 Parabéns! A alternativa B está correta. %0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%3Cp%20class%3D'c- paragraph'%3EN%C3%BAmeros%20aleat%C3%B3rios%20s%C3%A3o%20usados%20para%20descrever%20a%20incerteza%20dos%20valores%20de%2 3 - Validação de dados de saída do modelo de simulação e de seus testes estatísticos Ao �nal deste módulo, você será capaz de descrever a validação dos dados de saída do modelo de simulação e de seus testes estatísticos. Vamos começar! Números aleatórios são usados para A dar resultados aleatórios. B descrever a incerteza dos valores de entrada. C atribuir valores aos parâmetros. D alterar a solução do problema. E representar o mundo real. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 22/45 Como validar os dados de saída de um modelo de simulação e seus testes estatísticos? Descubra agora como validar os dados de saída de um modelo de simulação e seus testes estatísticos. Veri�cação do modelo de simulação Durante a fase de construção do modelo, o profissional, naturalmente, estará interessado em garantir que o modelo de simulação tenha todos os componentes necessários e que o modelo realmente funcione. Na realidade, estamos interessados em fazer com que o modelo não apenas funcione, mas funcione da maneira que queremos. Em outras palavras, estamos interessados em garantir que o modelo funcione como pretendido. Esse processo é conhecido como verificação de modelo. Outra maneira de analisar os processos de verificação é considerá-los como descreveremos na sequência. Construindo o modelo corretamente Por alguma razão, mesmo profissionais muito experientes confundem a verificação com a validação do modelo. Que tal diferenciá-las? Veri�cação É o processo contínuo de assegurar que o modelo funcione conforme pretendido. Validação É o processo de assegurar que o modelo represente a realidade. É inútil, talvez impossível, tentar ver se o modelo representa a realidade, se o modelo não funciona como pretendido. Em outras palavras, você não deve tentar validar um modelo que não foi submetido com sucesso ao processo de verificação. Isso significa que o praticante de simulação tentará criar um modelo que seja uma representação razoável do sistema real. No entanto, por várias razões, mesmo modelosmeticulosamente construídos podem não representar a realidade. Isso significa que não importa o quão bem o profissional pense que depurou e aprimorou o modelo, ele ainda pode não ser adequado para conduzir qualquer tipo de análise. A incapacidade do modelo de representar a realidade pode resultar de certas ações ou omissões por parte do profissional em relação a qualquer uma ou todas as seguintes questões: 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 23/45 Suposições; Simplificações; Supervisões; Limitações. Suposições Periodicamente, o profissional terá que fazer suposições de modelagem, que podem ser feitas por falta de conhecimento. Esses tipos de suposições podem ser comuns quando o profissional está tentando modelar um sistema que não existe ou um processo que não pode ser observado. Certas suposições podem ter de ser feitas em relação aos componentes do sistema, às interações e aos dados de entrada. Mesmo que alguns dados estejam disponíveis a designers ou fornecedores, o profissional terá que assumir que os dados são válidos. Outra área em que o praticante pode ter problemas é com os dados de entrada. Não é incomum deixar de coletar um tipo específico de dados de entrada. Durante a fase de modelagem, o profissional pode, repentinamente, perceber que esses dados de entrada estão faltando. Em vez de atrasar o progresso no desenvolvimento do modelo, é feita uma suposição em relação ao tipo de dados ausentes. A distribuição de dados assumida é inserida no ponto apropriado no modelo. Infelizmente, à medida que os prazos se aproximam, esses dados assumidos podem ser esquecidos. Se o modelo não puder ser validado, a suposição esquecida geralmente é o último lugar que o profissional procurará. Recomendação Cada vez que o profissional faz uma suposição, os detalhes devem ser registrados em uma lista formal de suposições. Embora possa ser necessária alguma disciplina para manter essa lista atualizada, ela tem o potencial de grande benefício para o praticante. Caso o profissional não seja capaz de validar o modelo estatisticamente, a lista de suposições é um lugar natural para se procurar. Essa lista também será incluída na apresentação e no relatório do projeto de simulação. Simpli�cações O profissional, às vezes, fará simplificações deliberadas no modelo do sistema. Algumas dessas simplificações serão necessárias para terminar um projeto de simulação no tempo previsto. Outros serão feitos porque o funcionamento interno detalhado do processo é muito complexo ou considerado insignificante. Evitar simplificações causadas por restrições de tempo não é simples; na verdade, é mais fácil falar do que fazer. Com experiência, o profissional pode fazer melhores estimativas para alocar tempo e outros recursos às etapas do processo de estudo de simulação. Uma observação frequente de equipes de praticantes iniciantes é a falha em desenvolver o modelo em paralelo sob restrições de tempo. Muitos praticantes inexperientes acreditam que, como existe apenas um único modelo, apenas um indivíduo pode trabalhar nele em um determinado momento. Não há absolutamente nenhuma razão para que diferentes indivíduos não possam assumir a responsabilidade por diferentes partes do modelo. Em uma data futura, os submodelos depurados individualmente podem ser combinados e depurados. Obviamente, a equipe do projeto terá que manter um esquema de rastreamento robusto para evitar problemas de versão. Se não for tratado adequadamente, a equipe se verá excluindo o trabalho um do outro com cada novo submodelo desenvolvido individualmente. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 24/45 Supervisões Se houver alguma complexidade no sistema que está sendo modelado, é extremamente provável que o profissional vá ignorar inadvertidamente um ou mais componentes críticos do sistema. Se, de fato, tal componente tiver um impacto significativo nas medidas de desempenho, o modelo não poderá ser validado. Como o profissional não está ciente do problema potencial em primeiro lugar, os problemas de validação decorrentes de descuidos são muito mais difíceis de lidar. Além de conduzir uma orientação o mais detalhada possível, existem poucas defesas contra a omissão acidental de um determinado evento ou processo que possa fazer parte do sistema. Uma coisa que o praticante pode fazer é manter uma lista de verificação cada vez maior das lições aprendidas. Limitações É provável que haja muitas limitações em relação à capacidade de modelar sistemas complexos. O impacto de cada uma dessas limitações na validação do modelo pode variar significativamente. De um modo geral, essas limitações não estarão sob o controle direto do praticante. Assim como as premissas do modelo, o profissional deve manter uma lista de limitações para a apresentação e o relatório do projeto. As limitações podem ser causadas por: Obviamente, não podemos abordar as limitações inerentes ao praticante. Os profissionais que sentem que esse é um problema significativo podem optar por receber treinamento formal adicional de simulação. No entanto, mesmo com treinamento significativo, não é incomum que profissionais experientes reconheçam erros ao revisitar modelos anteriores em suas carreiras de simulação. É teoricamente possível não ser capaz de modelar alguns sistemas devido às limitações no software específico de simulação. Ao manter o nível prático mais baixo de construção de simulação, é possível evitar esse problema em grande medida. Por outro lado, manter as construções de nível mais baixo aumenta a carga de programação. No entanto, ao mesmo tempo, a flexibilidade do modelo também é aumentada. Levado ao extremo, isso significaria que as linguagens de programação de uso geral seriam a melhor ferramenta. No entanto, isso também significaria um período possivelmente inaceitável para programar o modelo. Por outro lado, é principalmente quando os praticantes tentam reutilizar modelos antigos ou de exemplo ou tentam usar modelos enlatados que se torna difícil modelar, adequadamente, mesmo sistemas relativamente simples. É possível que, devido à natureza do sistema, haja algumas limitações na coleta de dados. Um exemplo óbvio de limitação de dados é visto quando pode levar meses ou até anos para coletar a quantidade necessária de dados de entrada para que o sistema faça uma análise estatística robusta. Nesses casos, o praticante simplesmente terá que fazer o melhor que puder sob as circunstâncias. A falta de dados suficientes pode exigir que o profissional aceite o fato de que alguns testes estatísticos não produzirão resultados confiáveis em comparação com situações em que há dados suficientes. Limitações do praticante Limitações do software de modelagem Limitações de dados 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 25/45 Validação estatística do modelo A validação estatística do modelo envolve uma comparação objetiva e quantitativa entre o sistema real e o modelo de simulação. Se não houver diferença estatisticamente significativa entre os conjuntos de dados, o modelo é considerado válido. Por outro lado, se houver uma diferença estatisticamente significativa, o modelo não é válido e precisa de trabalho adicional antes que uma análise mais aprofundada possa ser realizada. Temos então: Coleta de dados de validação A coleta de dados de validação envolve a coleta de dados do sistema real e do modelo de simulação base que é projetado para representar o sistema real. Os dados de validação podem ser baseados em: Observações individuais O profissional realizará a análise usando dados de medidas de desempenho de entidades individuais. Estatísticas resumidas Baseia-se na análise de dados médios de vários conjuntos de observações de medidas de desempenho de entidades individuais. São necessários, significativamente,menos dados para o método de observação individual do que para o método de resumo. A abordagem de observação individual mais simples e executada mais rapidamente é, provavelmente, mais útil para o praticante. Coleta de dados de validação do sistema A coleta de dados de validação do sistema varia, significativamente, dos processos de coleta de dados de entrada. Na coleta de dados de validação do sistema, a principal preocupação é coletar dados que reflitam o desempenho geral do sistema. Um método comum é coletar o sistema ou o tempo de fluxo. Este é o tempo que uma entidade leva para ser processada ou fluir por todo o sistema em estudo. Nesse ponto, o praticante pode optar por usar: Dados de entidades individuais; Todo o sistema e dados de execução do modelo. A coleta de dados de validação do modelo consiste em registrar o mesmo tipo de dados de saída que foram coletados no processo de coleta de dados de validação do sistema. Para coletar esses dados adequadamente, o profissional deve carregar o modelo da mesma forma que foi observado quando os dados de validação do sistema foram coletados. Isso significa, em particular, que quaisquer filas que continham entidades existentes anteriormente devem ser pré-carregadas antes que os dados de validação do modelo de simulação sejam coletados. Isso também significa que o profissional deve descartar quaisquer dados gerados pelas entidades anteriormente existentes. Assim, se o praticante observou dez clientes esperando em fila e dois clientes sendo atendidos, os dados do modelo de validação dos 12 primeiros clientes devem ser descartados. Os profissionais são aconselhados a utilizar o mesmo número de observações do modelo que o número de observações obtidas do sistema real. O uso do mesmo número de pontos de dados simplifica os cálculos estatísticos subsequentes. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 26/45 Saiba mais O processo de análise de dados de validação consiste em, primeiramente, determinar a comparação estatística apropriada do teste de médias a ser executado. Isso é realizado determinando se um ou os dois conjuntos de dados de validação são normais. Se ambos forem normais, uma versão de um teste t será executada. Se apenas um ou nenhum dos conjuntos de dados for normal, um teste não paramétrico é realizado. Examinando os dados de validação para normalidade Tanto os dados de validação do sistema quanto os dados de validação do modelo devem ser verificados quanto à normalidade. Isso, geralmente, é realizado executando-se um teste de em cada um dos dois conjuntos de dados individualmente em um determinado nível de significância estatística. Embora o profissional possa selecionar qualquer nível razoável de significância, normalmente, é usado um valor de de 0,05. Dica Para realizar com sucesso o teste do , o profissional deve garantir que um mínimo de 20 pontos de dados esteja em cada conjunto de dados. Se menos de 20 pontos de dados estiverem disponíveis, um teste qui-quadrado não pode ser usado para determinar a normalidade dos conjuntos de dados. Nesse caso, o profissional será forçado a utilizar um teste de soma de classificação não paramétrico para a comparação de médias entre o sistema e os conjuntos de dados do modelo. O teste pode ser implementado manualmente em um aplicativo de planilha eletrônica como o Microsoft Excel ou realizado automaticamente em um pacote estatístico como o ARENA Input Analyzer ou AutoStat. Procedimento qui-quadrado para teste de normalidade Para testar a normalidade de um conjunto de dados, os dados devem primeiro ser divididos em um conjunto de células semelhante a um histograma. O teste do compara, em cada célula, o número real de observações com o número esperado de observações, se os dados seguirem uma distribuição normal. O profissional deve determinar o número de células e os valores de limite de cada uma delas. O número de células que devem ser usadas no teste do qui-quadrado segue as orientações a seguir: O número de células deve ser o número máximo, não devendo exceder 100; Cada célula deve ter, pelo menos, cinco observações esperadas; Se houver 30 pontos de dados, deve haver seis células. Observe que, como deve haver pelo menos 20 pontos de dados, o teste qui-quadrado nunca pode ter menos de quatro células. É melhor utilizar uma abordagem equiprovável para determinar os limites das células. Isso significa que os limites de cada célula são ajustados para que uma porcentagem igual do número total de observações seja encontrada em cada célula. Como a distribuição normal é em forma de sino em vez de uniforme, o cálculo dos limites das células envolve alguma matemática e estatística básica. O próximo passo no teste do qui-quadrado é contar o número de observações que correspondem a cada uma das células equiprováveis. Se os dados tiverem distribuição aproximadamente normal, o número de observações será o mesmo que o número de observações esperadas. Na maioria dos casos, no entanto, haverá algumas diferenças, e o número de observações não será igual ao número esperado de cinco observações em cada célula. Agora, precisamos calcular o que é conhecido como estatística do teste . Esse valor representa a diferença entre o conjunto de dados e como ele seria se fosse distribuído normalmente. A estatística de teste é uma soma da diferença quadrada entre as observações reais e as esperadas, divididas pelo número de observações esperadas para cada célula. Atenção! χ2 α χ2 χ2 χ2 χ2 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 27/45 A estatística do teste , previamente calculada, deve ser comparada com um valor crítico, que é determinado consultando uma tabela de distribuição ou pode ser calculado com a função CHIINV no Excel. O valor crítico do é determinado por meio de uma tabela de distribuição do correspondente ao nível de significância previamente estabelecido. Tabelas de para α de 0,05 estão disponíveis em qualquer livro de estatística. Para encontrar o valor crítico real, também é necessário determinar o número de graus de liberdade para o teste do . Isso é calculado pelo número de células menos os parâmetros usados para determinar os limites da célula menos 1. Em nosso exemplo, tínhamos quatro células e usamos os parâmetros de média e desvio-padrão do conjunto de dados. Isso significa que o número de graus de liberdade em nosso exemplo seria 1. O valor crítico correspondente para um de 0,05 e 1 grau de liberdade é 3,84. Obviamente, o valor crítico mudará dependendo do número de células no teste . O último passo no teste do é comparar a estatística de teste calculada com o valor crítico da tabela de distribuição do . Sendo assim, nos termos do profissional: Estatística menor que valor crítico Se a estatística de teste calculada for menor que o valor crítico, o conjunto de dados pode ser considerado aproximadamente normal. Estatística maior que valor crítico Se a estatística de teste exceder o valor crítico, os dados não podem ser considerados aproximadamente distribuídos normalmente. Em termos estatísticos, se a estatística de teste fosse menor que o valor crítico, não poderíamos rejeitar a hipótese nula de os dados terem distribuição aproximadamente normal. Da mesma forma, se a estatística de teste fosse maior que o valor crítico, então, poderíamos sim rejeitar essa mesma hipótese nula. Ocasionalmente, a primeira tentativa do praticante, em um modelo de simulação, não pode ser estatisticamente validada. Isso é totalmente possível, mesmo que o modelo tenha sido validado com sucesso. Quaisquer conclusões tiradas de um modelo estatisticamente inválido são automaticamente suspeitas. Assim, é imperativo investigar as causas por trás da incapacidade de validar o modelo. Há uma série de razões possíveis para a incapacidade do modelo de ser estatisticamente validado, que incluem, mas não se limitam a:Sistema não estacionário; Dados de entrada ruins; Suposições inválidas; Modelagem ruim. Se os conjuntos de dados de validação do sistema e do modelo forem considerados normais, em seguida, precisamos estabelecer se os dados do sistema e do modelo são estatisticamente semelhantes com um teste de hipótese. Os testes de hipóteses envolvem o estabelecimento de uma hipótese nula de que as médias dos conjuntos de dados são estatisticamente semelhantes. Essa hipótese nula, em termos práticos, é aceita ou rejeitada: se for aceita, então o modelo de simulação é válido; se for rejeitada, o modelo é inválido. Nesse caso, o desenvolvimento adicional do modelo será necessário. Para determinar isso, devemos revisitar o teste do ou fazer uma suposição de que os dados são normalmente distribuídos, ou não. No caso de um ou ambos os conjuntos de dados não serem normalmente distribuídos, ou de assumirmos que um ou ambos os conjuntos de dados não são normalmente distribuídos, o teste apropriado é um teste U não paramétrico de soma de classificação. Se os dados forem naturalmente emparelhados, devemos realizar um teste t. Se os dados não estiverem emparelhados naturalmente, devemos determinar se a variância é ou não semelhante. Podemos realizar esse processo com um teste F. Se a variância entre os dois conjuntos de dados for semelhante, usamos um teste t independente. Se a variância não for semelhante, executamos um teste de Smith-Satterthwaite. χ2 χ2 χ2 χ2 χ2 χ2 χ2 α χ2 χ2 χ2 χ2 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 28/45 Falta pouco para atingir seus objetivos. Vamos praticar alguns conceitos? Questão 1 Qual destas distribuições é usada para um teste de hipótese? A Distribuição normal. B Distribuição qui-quadrado. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 29/45 Parabéns! A alternativa B está correta. %0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%3Cp%20class%3D'c- paragraph'%3EA%20distribui%C3%A7%C3%A3o%20qui- quadrado%20%C3%A9%20usada%20para%20testar%20hip%C3%B3teses.%20O%20valor%20de%20%5C(%5Cchi%5E2%5C)%20decide%20se%20a%20 Parabéns! A alternativa A está correta. %0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%3Cp%20class%3D'c- paragraph'%3EEm%20um%20teste%2C%20o%20n%C3%BAmero%20de%20amostras%20individuais%20%C3%A9%20chamado%20de%20graus%20de% 1.%3C%2Fp%3E%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20 C Distribuição gama. D Distribuição de poisson. E Distribuição de weibull. Questão 2 Os valores independentes em um conjunto de valores de um teste são chamados de A graus de liberdade. B estatística de teste. C nível de significância. D nível de confiança. E nível de rastreabilidade. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 30/45 4 - Aplicações de simulação de Monte Carlo em engenharia Ao �nal deste módulo, você será capaz de aplicar a simulação de Monte Carlo com o auxílio do Microsoft Excel. Vamos começar! Aplicação de simulação de Monte Carlo em engenharia usando o Excel Veja agora um exemplo de aplicação de simulação de Monte Carlo em engenharia utilizando o Excel: Uso do Excel para simulação Os engenheiros são, constantemente, desafiados a resolver uma ampla gama de problemas analíticos e computacionais complexos em suas áreas de especialidade. Esses problemas envolvem metodologias de análise e gerenciamento de dados. A aplicação de computadores permite que cálculos repetitivos, demorados e, muitas vezes, tediosos sejam realizados de forma rápida, eficiente e menos propensa a erros. A aplicação de ferramentas de computador também permite que os resultados e as saídas de tais análises de engenharia sejam prontamente transferidos e incorporados em relatórios e em outros documentos de engenharia. Uma vantagem ainda maior, em termos de produtividade e eficiência, é obtida quando esses cálculos e resultados são replicados em vários projetos. A competência em habilidades de informática predispõe os engenheiros a buscar e desenvolver soluções mais criativas e inovadoras para os problemas do que de outra forma. O Microsoft Excel vem sendo cada vez mais usado como uma ferramenta para auxiliar engenheiros na condução e replicação de cálculos e análises complexas, projetando sistemas complexos e gerenciando grandes conjuntos de dados. O Microsoft Excel é um programa de planilha eletrônica desenvolvido pela Microsoft Company e parte do conjunto de produtos Microsoft Office. Uma planilha é uma grade que organiza dados e cálculos 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 31/45 em colunas e linhas. A interseção de uma coluna e uma linha é chamada de célula. Uma planilha eletrônica permite que os usuários armazenem, organizem, manipulem e analisem dados nas células da planilha. Para exemplificar uma aplicação, vamos considerar um pequeno empreiteiro local contratado para preparar um lugar onde uma empresa deverá entrar e construir um complexo de apartamentos de luxo. As atividades do empreiteiro e seus itens de trabalho, incluem a limpeza do local e a instalação de trailers para escritórios no local e em outras instalações. O contratante divide o projeto nas seguintes tarefas discretas em ordem sequencial e seus tempos de conclusão estimados, da seguinte maneira: Limpando e removendo Tempo: 10 dias Limpar o local da vegetação, puxar os tocos das árvores e remover todos os detritos. Fornecer e instalar trailers Tempo: 5 dias Fornecer trailers e todos os trabalhos auxiliares para completar a instalação. Conectar serviços Tempo: 7 dias Conectar energia, serviços públicos e serviços de telecomunicações. Mobilhar e instalar comodidades Tempo: 4 dias Instalar banheiros, equipamentos de cozinha, móveis de escritório, dispositivos de segurança. Limpeza �nal Tempo: 2 dias Realizar limpeza final do interior e exterior. Finalização do projeto Tempo: 28 dias C l i ti id d 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 32/45 Os prazos de conclusão são baseados na experiência recente do empreiteiro com projetos, clientes e fornecedores semelhantes. Nesta abordagem, ele considera que esses tempos são definidos e fixados para gerar o tempo total de conclusão do projeto. Isso é chamado de abordagem determinística. Antes de qualquer conhecimento ou experiência em métodos de Monte Carlo, a abordagem determinística seria a abordagem intuitiva para lidar com esse tipo de problema. O fato de a abordagem determinística considerar os tempos de conclusão dos itens de trabalho a serem definidos e fixados é uma grande fraqueza da abordagem. Praticamente, todos os tempos de conclusão dos itens de trabalho são, inerentemente, aleatórios em graus variados. Exemplo de aplicação de simulação usando o Excel Por exemplo, a conclusão da limpeza e remoção está sujeita à aleatoriedade (ou incerteza) devido a fatores como clima, confiabilidade do equipamento, disponibilidade e pontualidade tanto dos equipamentos de terraplenagem quanto dos operadores etc. O item de trabalho a fornecer e instalar os trailers estão sujeitos à aleatoriedade devido às condições de tráfego, à disponibilidade ou ao horário dos veículos de escolta necessários para acompanhar os caminhões que trazem os trailers ao local, bem como a aleatoriedade associada à obtenção das licenças dos órgãos governamentais para transportar cargas superdimensionadas nas estradas estaduais. Uma vez que os trailers chegam ao local, mais incertezas podem ocorrer, devido às condições do solo que podem retardar (ou acelerar) o seu processo de fixação. Há também aleatoriedade associada à qualidade da obra, ou à falta dela, que pode exigir retrabalho ou inspeções adicionais antes da aprovação. A incerteza associada a cada item de trabalho contribuipara a incerteza associada ao tempo geral de conclusão do projeto. O grau de incerteza é chamado de risco e expõe o empreiteiro local a possíveis resultados desfavoráveis, principalmente perdas financeiras. Usando distribuições de probabilidade assumidas, os tempos de conclusão dos itens de trabalho para esse projeto podem ser descritos probabilisticamente da seguinte forma: Concluir atividades. Limpando e removendo Parâmetros de distribuição normal Média e Desvio-padrão (μ) = 10 (σ) = 3 Fornecer e instalar trailers Parâmetros de distribuição uniforme e α = 3 β = 7 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 33/45 Implementação em Excel O projeto de limpeza do local descrito deve ser implementado em um modelo de simulação de Monte Carlo, em Microsoft Excel, seguindo o quadro acima. Os detalhes das atividades do projeto e suas descrições e parâmetros estatísticos são mostrados na figura a seguir. Abra uma nova sessão do Excel e siga as próximas etapas: Etapa 1 Configure os seguintes cabeçalhos para o primeiro item de trabalho, Atividade 1: Limpeza e remoção. Conectar serviços Parâmetros de distribuição normal Média e Desvio-padrão (μ) = 7 (σ) = 1, 5 Mobilhar e instalar comodidades Parâmetros de distribuição uniforme e α = 2 β = 6 Limpeza �nal Parâmetros de distribuição uniforme e α = 1 β = 3 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 34/45 Etapa 2 Chame a função geradora de números aleatórios do Excel RAND da seguinte maneira, para realizar uma simulação dessa atividade. Etapa 3 Feche os parênteses. Pressione “Enter” no teclado. A função é implementada na célula atual e um valor aleatório é gerado. Devido à natureza aleatória da saída gerada pela função RAND, pode-se obter um valor completamente diferente do que foi mostrado nessa demonstração. Além disso, você notará que o valor aleatório muda de forma intermitente, automaticamente, sempre que alguma outra operação é realizada em outro lugar na planilha. Por enquanto, ambos os itens acima são normais e não são um problema. Não se assuste. O foco por enquanto está no procedimento e implementação do modo de simulação. A próxima tarefa é chamar a função de densidade cumulativa inversa (também conhecida como função de ponto percentual ou função de quantil) da distribuição que descreve o comportamento aleatório da atividade, para calcular o valor “x” (tempo de conclusão da atividade) correspondente ao valor de probabilidade aleatório “F” gerado anteriormente. Essa primeira atividade é descrita pela distribuição normal. Para isso, siga as etapas: Etapa 1 Coloque o cursor na célula de valor “x”, comece a digitar “NORMAL” para ativar uma lista de candidatos de funções relevantes. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 35/45 Etapa 2 Clique “OK” para obter o valor: Etapa 3 Coloque, agora, os parâmetros que serão fixos (média e desvio-padrão) entre o símbolo “$” (para travar a célula). Etapa 4 Clique e segure o clique, com o sinal de adição mais fino no canto inferior direito da seleção. Arraste o cursor para baixo algumas linhas, conforme demsontrado na imagem. Etapa 5 Configure os cabeçalhos para a Atividade 2: Fornecer e instalar trailers. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 36/45 Etapa 6 Preencha, portanto, para um valor de probabilidade cumulativa pseudoaleatória: “F”, . Etapa 7 Verifique se os resultados parecem ser normais e razoáveis, conforme exemplo. Etapa 8 A atividade 3 é descrita por uma distribuição normal. Portanto, para economizar esforço, podemos copiar a Atividade 1 e atualizar os parâmetros estatísticos e outros dados de entrada. Etapa 9 Utileze o mesmo procedimento para as demais atividades, conforme apresentado no exemplo. x = α + F(β − α) 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 37/45 O próximo passo é calcular o tempo total de conclusão do projeto para uma simulação e, em seguida, replicar esse cálculo para as múltiplas simulações realizadas, para sintetizar um conjunto de dados dos tempos de conclusão do projeto simulados que serão analisados estatisticamente para chegar às conclusões, recomendações e decisões de o estudo de simulação. Então, vejamos: O tempo total de conclusão do projeto para a primeira simulação é calculado: Gostaríamos agora de executar 2.000 simulações desse sistema. Em outras palavras, investigaremos 2.000 cenários possíveis desse projeto, levando em consideração os resultados aleatórios das atividades constituintes do projeto. Para isso, selecione a linha inteira da última simulação: Vamos montar o dataset para a análise da simulação. Para tanto, vamos marcar os valores da coluna “M” e copiar como valores para a coluna “N”: O próximo passo é computar medidas estatísticas que servirão como medidas de desempenho para esse estudo de simulação. Para efeitos deste exercício, serão calculadas as seguintes medidas estatísticas: Média; Desvio-padrão; Mediana; 3º quartil; Percentil 95%. Adicione uma tabela de resumo à planilha da seguinte maneira: 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 38/45 O próximo passo é a análise dos resultados, para tirar conclusões, recomendações ou tomadas de decisão. Muitos campos da engenharia adotaram várias medidas estatísticas, analogamente às demonstradas acima, como critérios para chegar a conclusões e tomar decisões. Exemplo No campo da engenharia de tráfego, o limite de velocidade postado em uma rodovia é baseado no 85º percentil de velocidade. Outro exemplo da engenharia de tráfego é o comprimento de uma faixa de conversão à esquerda em uma interseção controlada por um semáforo. Geralmente, o comprimento da pista de conversão é baseado no comprimento da fila de veículos do percentil 95, obtido a partir de um modelo de simulação. Para o exemplo do canteiro de obras, em uma abordagem determinística usando a duração média estimada de cada item de trabalho constituinte, a conclusão foi que o projeto será concluído em 28 dias. No entanto, usando uma abordagem probabilística, modelando a incerteza associada a cada atividade constituinte por alguma distribuição de probabilidade conhecida e realizando 2.000 simulações, o tempo médio de conclusão do projeto é de 35 dias e, além disso, há uma probabilidade de 95% de que o projeto seja concluído em não mais do que aproximadamente 43 dias. Selecionando distribuições para simulação Na simulação do projeto do canteiro de obras, cada atividade constituinte do projeto foi descrita, ou modelada, por alguma distribuição estatística conhecida, como a distribuição normal, a uniforme, a log-normal etc.. Em outras palavras, temos como saber qual distribuição escolher, ou como confirmar ou não que uma determinada distribuição teórica é adequada para descrever a atividade, com base nos seus dados. Um método superficial de selecionar uma distribuição ou confirmar uma suposição de distribuição para uma atividade é observar a forma do histograma ou polígono de frequência dos dados para a atividade e compará-la à forma da função de densidade de probabilidade da distribuição teórica candidata. Por exemplo, considere os dados a seguir para uma atividade, para a qual o engenheiro de simulação faz um palpite para seguir a distribuição Normal. Lembre-se de que a função de distribuição (dos dados) terá uma forma de sino se for de fato descrita por uma distribuição normal (teórica), como: O histograma (e o polígono de frequência sobreposto) dos dados resulta da seguinte forma. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 39/45 O histograma (ou o polígono de frequência) mostra umatendência de subida e descida em uma forma de sino um tanto simétrica. Assim, a distribuição normal é uma boa distribuição candidata para descrever esses dados. De fato, outras distribuições em forma de sino também podem ser adequadas, por exemplo, a distribuição beta. Grá�co de probabilidade Um gráfico de probabilidade, também conhecido como gráfico de quantil ou gráfico Q, é um método gráfico para verificar se um conjunto de dados segue uma determinada distribuição teórica ou não. O método envolve o uso dos valores de probabilidade cumulativa observados nos dados para calcular variáveis teóricas (valores ) da função quantílica da distribuição teórica candidata. Os valores teóricos versus os valores reais (dados) correspondentes são plotados. Se o gráfico parece ser uma linha reta passando pela origem em um ângulo de 45 graus com a horizontal, pode-se concluir que os dados, de fato, seguem essa distribuição teórica candidata, ou pode-se dizer que os dados vêm da distribuição de candidatos. Geralmente, um conjunto de dados de pelo menos 15 a 20 observações é necessário para que as conclusões da técnica do gráfico de probabilidade sejam sustentáveis. Esse gráfico de probabilidade pode ser construído com base nos seguintes passos: Exemplo Um engenheiro de tráfego constrói um gráfico de probabilidade a partir de 50 medições de velocidade de veículos (em milhas por hora) para verificar se os dados de velocidade seguem uma distribuição normal. Os dados são os seguintes: x Passo 1 Organize os dados do menor para o maior. Passo 2 Divida a área da distribuição (os dados) em subáreas iguais de área, onde é o número de observações nos dados.1/(n + 1) nn Passo 3 Calcule a variável teórica da função quantil da distribuição candidata para cada observação ordenada, onde a probabilidade cumulativa de uma observação ordenada é dada por ii ∑ik=1 1 n+1 Passo 4 Plote a ª observação ordenada versus a ª variável teórica.i i 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 40/45 Passo 1 Colocar os dados em ordem crescente: selecione os dados; clique em Dados; clique em Classificar e Filtrar; clique em Classificar do menor para o maior. Conforme imagem: Após essas ações, obteremos: Passo 2 Dividir a área sob a distribuição (os dados) em (50 + 1) subáreas iguais de área 1/51 = 0,0196. Graficamente: Em formato tabular na planilha, digite a fórmula da seguinte forma = 1/51, e complete toda a planilha para baixo: Calcule as áreas cumulativas (probabilidades cumulativas) como segue. A probabilidade acumulada de um valor ordenado é a soma das probabilidades dos valores até aquele valor. Portanto, a probabilidade cumulativa do segundo valor é a área para o segundo valor mais a probabilidade cumulativa do valor anterior (o primeiro valor) e assim por diante. Replique a seguinte fórmula: 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 41/45 Passo 3 Nesse passo, a variável teórica deve ser calculada a partir da função quantílica da distribuição candidata e a distribuição candidata é normal. Para o caso especial desse tipo de distribuição, se o exercício fosse feito à mão, seria calculada a variável normal padrão (comumente chamada de pontuação ) e, depois, convertida para a variável normal ( ’’’’). Calcule a variável normal padrão como segue. Digite “NORM.S.INV” para procurar e selecionar a função de quantil de distribuição normal padrão do Excel: Observe o resultado: Calcule a média e o desvio-padrão dos dados da seguinte forma: A variável teórica ( ) pode ser calculada a partir da variável normal padrão ( -pontuação) pela relação: Rotacione a tela. Ou pela função Excel NORM.INV. Comece a digitar “NORM.INV” para abrir a função Excel NORM.INV. Z x (μ) (σ) x z z = x − μ σ 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 42/45 Então, complete a planilha. Passo 4 Plote os dados observados ordenados; nesse caso, os dados de velocidade ordenados versus a variável teórica. Este é o gráfico de probabilidade: Os pontos plotados parecem seguir uma linha reta através da origem em um ângulo de 45 graus com a horizontal. Pode-se, portanto, concluir que os dados provêm da distribuição candidata, nesse caso, a distribuição normal. O gráfico acima é um gráfico de probabilidade normal. O gráfico de probabilidade para qualquer outra distribuição será construído de maneira semelhante, sendo a única diferença o uso da função quantil da distribuição candidata para calcular os valores teóricos das variáveis. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 43/45 Falta pouco para atingir seus objetivos. Vamos praticar alguns conceitos? Parabéns! A alternativa C está correta. %0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%3Cp%20class%3D'c- paragraph'%3EOs%20histogramas%20s%C3%A3o%20usados%20para%20exibir%20vari%C3%A1veis%20de%20intervalo%2Fpropor%C3%A7%C3%A3o% Questão 1 Você está utilizando um software para analisar os dados de uma amostra experimental e precisa saber qual é a diferença entre um gráfico de barras e um histograma. Marque a opção que apresenta essa diferença corretamente. A Um histograma não mostra todo o intervalo de pontuações em uma distribuição. B Os gráficos de barras são circulares, enquanto os histogramas são quadrados. C Não há lacunas entre as barras em um histograma. D Os gráficos de barras representam números, enquanto os histogramas representam porcentagens. E Um histograma mostra parcialmente o intervalo de pontuações em uma distribuição. Questão 2 Uma tabela com todos os valores possíveis de uma variável aleatória e suas probabilidades correspondentes é chamada A função de massa de probabilidade. B função de densidade de probabilidade. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 44/45 Parabéns! A alternativa D está correta. %0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%3Cp%20class%3D'c- paragraph'%3EA%20afirma%C3%A7%C3%A3o%20dada%20%C3%A9%20a%20defini%C3%A7%C3%A3o%20de%20uma%20distribui%C3%A7%C3%A3o% Considerações �nais Apresentamos uma visão geral da técnica de simulação de Monte Carlo e de como ela pode ser implementada no Excel. Começamos com um exemplo introdutório ilustrativo de um problema de simulação encontrado por um engenheiro praticante. Em seguida, trouxemos uma apresentação dos fundamentos da estrutura geral do método de simulação de Monte Carlo e fizemos uma demonstração da implementação dos elementos de um modelo de simulação de Monte Carlo em uma planilha do Excel. Além disso, abordamos como os resultados de uma simulação de Monte Carlo podem ser analisados, interpretados e aplicados na tomada de decisões. A parte final deste curso apresentou técnicas usadas para selecionar e validar distribuições estatísticas que são usadas para modelar os componentes ou atividades constituintes do sistema ou processo que está sendo simulado e como essas técnicas podem ser conduzidas no Excel. Esperamos, que vocês, alunos, adquiram habilidades em distribuições estatísticas e simulação de Monte Carlo, tornando-se capazes de aplicar essas habilidades na simulação e modelagem de sistemas reais de engenharia. Os profissionais são fortemente encorajados a procurar situações em seus domínios de especialização em que a simulação e a modelagem de sistemas sejam aplicáveis e benéficas para seu produto de trabalho e para sua organização. Podcast Para encerrar, ouça um resumo dos principais aspectos estudados. C função de distribuição cumulativa. D distribuição de probabilidade. E distribuição randômica. 13/03/2023 14:49 Simulação e otimização https://stecine.azureedge.net/repositorio/00212en/04499/index.html# 45/45
Compartilhar