Prévia do material em texto
Mestre em Engenharia - Análise de Big Data 2020 Dissertação de Mestrado Mikko Alutoin Förnamn Efternamn Um estudo de caso sobre portas de elevador usando modelos prognósticos Agendamento de manutenção preventiva Machine Translated by Google Data de aceitação: Título: O resultado foi obtido por meio de um estudo de caso prático usando um conjunto de dados da vida real contendo dados de mais de 20 mil elevadores por um período de dois anos. A maior parte do trabalho foi formar esse conjunto de dados a partir de dados brutos (parcialmente incompletos) que consistiam em vários registros de manutenção e dados de monitoramento de condições em portas de elevadores. Os modelos testados foram o conhecido modelo de Riscos Proporcionais de Cox e um modelo de rede neural recorrente mais recente chamado Weibull Time to Event RNN (WTTE-RNN). 53 Mikko Alutoin Métodos de análise de sobrevivência foram usados para extrair informações de observações parciais. Inglês Programação de manutenção preventiva utilizando modelos prognósticos - Um estudo de caso em portas de elevadores Antes de treinar os modelos, curvas de sobrevivência estratificadas foram obtidas via estimador de Kaplan-Meier para dois grupos: todos os elevadores e elevadores recém-mantidos. A diferença nessas curvas quantifica a diferença que a visita de manutenção preventiva geralmente produz. 25.2.2020 DISSERTAÇÃO DE MESTRADO Supervisor (Arcada): Em seguida, modelos prognósticos foram usados para produzir previsões diárias da curva de sobrevivência para cada elevador. Os elevadores foram classificados usando essas previsões e com base em quanto sua condição parecia ter piorado ao longo do tempo (pois isso é pensado para capturar seu potencial de se beneficiar da manutenção). Finalmente, uma comparação entre elevadores altamente classificados em todos os elevadores é fornecida para demonstrar a habilidade dos modelos. Arcada Encomendado por: Palavras-chave: Programa de Graduação: Dr. Leonardo Espinosa Kone, ciência de dados, rede neural, prognóstico, empresas de manutenção, portas deslizantes Análise de Big Data Dr. Olli Mali (KONE Oyj) Número de páginas: Número de identificação: Resumo: Linguagem: Autor: O objetivo desta tese é pesquisar como o processo de manutenção de portas de elevadores pode ser otimizado. Para isso, uma meta de negócios é definida. É diminuir a quantidade de visitas de manutenção não planejadas causadas por mau funcionamento de portas. Uma meta analítica correspondente é definida, que é usada para classificar elevadores que seriam os melhores candidatos para manutenção a esse respeito. A tese mostra que o agendamento de visitas de manutenção preventiva usando modelos prognósticos seria benéfico para reduzir a taxa de visitas de manutenção não planejadas. Machine Translated by Google 2 Trabalho relacionado ...................................................................................................... 13 Introdução..............................................................................................................71 4 Resultados ................................................................................................................... 37 3 Metodologia de pesquisa ..................................................................................... 34 CONTEÚDO Validação da hipótese de pesquisa ......................................................................... 47 Objetivo de negócios ................................................................................................................ 7 3.1 Funções de sobrevivência paramétricas ...................................................................................... 20 3.3 Esboço ......................................................................................................................... 13 Verossimilhança paramétrica ........................................................................................... 25 Razão de risco ......................................................................................................... 18 2.4.2 1.4 Questões de pesquisa e hipóteses de pesquisa ............................................................. 12 3.2 4.3.2 2.2 4.1.1 2.6.1 Funções de sobrevivência ........................................................................................................ 15 Efeito de uma visita de manutenção preventiva...................................................................... 37 Redes neurais............................................................................................................... 26 4.3 Probabilidade parcial .............................................................................................. 19 1.1 Desempenho................................................................................................................ 36 2.4.3 Redes neurais para análise de sobrevivência .............................................................. 28 2.3.1 Desempenho do modelo Cox PH ............................................................................. 42 Distribuição Weibull .............................................................................................. 21 1.3 Objetivo da tese .......................................................................................................... 11 Elevadores do modelo WTTE-RNN................................................................................... 50 Rotulagem .............................................................................................................. 36 2.6 2.1 4.2.2 Desempenho do modelo WTTE-RNN ......................................................................... 46 Multimodalidade dos dados ............................................................................................. 32 4.1 2.3.2 1.6 2.6.2 2.3 Modelo de riscos proporcionais de Cox ............................................................................. 17 4.2 Validação do modelo........................................................................................................... 42 Objetivo de análise ................................................................................................................ 9 2.4.1 Elevadores do modelo Cox PH................................................................................... 47 3.1.1 1.2 Conjunto de dados ................................................................................................................ 35 2.4 4.3.1 2.5 Índice de concordância...................................................................................................... 26 4.2.1 2.7 Treinamento e validação cruzada ...................................................................................... 36 Diagrama de Weibull .......................................................................................................... 24 1.5 Método proposto ............................................................................................................ 13 Estimador de Kaplan-Meier ................................................................................................... 16 Advento das redes neurais ................................................................................... 27 Análise Weibull................................................................................................... 38 Machine Translated byde pacientes médicos. Um estudo de caso com diferentes bancos de dados médicos é realizado camadas, número de neurônios em cada camada de feed-forward e tamanho do estado LSTM. modelo. Para um conjunto de dados, o modelo tem melhor desempenho do que especialistas clínicos humanos. C-index valor observado. L2 fornece contribuições pareadas das observações para a função de perda. intervalos. função de perda como uma combinação de duas funções separadas. A primeira é uma função cruzada modificada a ANN (lembrando que duas perdas não são comparáveis). As funções de perda são com- gera uma matriz de tuplas (Si, ri) onde cada tupla contém estimativas no final do o índice C negativo (Raykar 2008). camada de saída onde os dropouts são adicionados para lidar com o overfitting. O número de camadas é um pa- fórmula, como a log-verossimilhança paramétrica geral para observações censuradas à direita Machine Translated by Google 2.7 Multimodalidade dos dados tipo de tor. Esses dados são armazenados em uma matriz de recursos estáticos bidimensionais. Agora, os dados em A fatia representa uma janela de histórico que consiste em valores consecutivos de medidas 32 etapa de observação. Esses dados podem ser organizados em uma matriz tridimensional, onde as linhas corres- características. proporcional ao número de recursos dinâmicos e ao tamanho da janela do histórico. Assim, vezes. A terceira dimensão é o número de características, pois cada item na matriz contém todos funciona, são destinados a serem usados com dados unimodais. Normalmente, isso significa que todas as covariáveis outra abordagem é resumir a matriz de recursos dinâmicos (ou uma parte dela) por meio da curadoria el. Recursos selecionados podem então ser inseridos no modelo em vez de dados completos da janela de histórico. matriz de características dinâmicas, pois contém as medições temporais como características dinâmicas. modelos com características dinâmicas. Uma abordagem comum é suplementar características estáticas ob- tical. No caso de um elevador, tais características estáticas podem ser a marca e o modelo do elevador ou o movimento da porta. obter uma amostra. Conjunto completo de amostras é formado pela iteração sobre tempos de inspeção. (Christ 2018) onde o pacote python chamado tsfresh é documentado. Em Leontjeva (2016) medições desde o início da janela do histórico. O número de recursos vistos pelo modelo é Os dados de monitoramento de condições são dados sequenciais onde as medições são feitas em cada elevador é considerado multimodal, o que significa que é uma coleção de elementos dinâmicos e estáticos correspondem a fontes de dados (por exemplo, um elevador individual) e as colunas correspondem à inspeção Modelos tradicionais de aprendizagem de máquina, como árvores de decisão ou redes neurais de feedforward esta abordagem sofre da maldição da dimensionalidade. Para lidar com este problema, um- são assumidos como estáticos. No entanto, isso não impediu que os pesquisadores usassem o valores de medição de um elevador no momento da inspeção. Vamos nos referir a esta matriz como dy- cada característica dinâmica usando estatísticas, modelo estocástico ou modelo de aprendizagem de máquina conjunto de treinamento é O(n2 ), sendo n o número de observações. Isso pode ser impraticável Agora, também existem recursos estáticos que permanecem constantes durante todas as etapas da inspeção. obtido a partir da matriz de características estáticas com uma fatia da matriz de características dinâmicas para Uma dessas abordagens para extrair características de séries temporais multivariadas é fornecida em Machine Translated by Google Figura 5. Um pipeline que pode usar RNN para transformação de recursos (Leontjeva 2016). per é um classificador Random Forest. Em outras palavras, o modelo final é um pipeline que consiste dados da série. Em outras palavras, os itens da matriz de características dinâmicas devem ser complementados com os valores de recursos estáticos. O mesmo conjunto de covariáveis estáticas agora são concatenados para do transformador de características baseado em RNN e do classificador baseado em RF. Para ser mais preciso, predic- As informações da RNN são o erro quadrático médio de uma amostra para cada classe, em vez do autores descrevem outra abordagem onde um modelo, como RNN, é usado para produzir previsão binária real. Neste aspecto, a abordagem assemelha-se à chamada transformação valores de medição dinâmicos em cada momento de inspeção, o que leva ao crescimento do terceiro dimensão da matriz de características dinâmicas pelo número de características estáticas. O suplemento os recursos selecionados a partir de recursos dinâmicos, conforme ilustrado na Figura 5. aprendizagem onde apenas a última camada de neurônios de um modelo treinado é treinada novamente usando um sec- A matriz mentada é então usada pelo modelo, conforme mostrado na Figura 6. conjunto de dados secundário. 33 A ideia é que o modelo do primeiro estágio seja treinado primeiro usando a primeira metade do conjunto de treinamento. Isto modelo pode ser um modelo de Markov oculto ou RNN. Então as previsões do Redes neurais recorrentes, por outro lado, assumem que as características são dinâmicas. Elas são inerentemente buscando interações temporais entre amostras consecutivas. Portanto, RNN o primeiro modelo é usado como um novo conjunto de recursos pelo modelo de segundo estágio, que no pa- não é capaz de considerar quaisquer características estáticas, a menos que sejam transformadas em um tempo fictício Machine Translated by Google 3 METODOLOGIA DE PESQUISA Figura 6. Combinando recursos estáticos e dinâmicos criando uma série temporal fictícia a partir de recursos estáticos. as observações são deixadas de fora. A proporção entre observações censuradas e não censuradas é de aproximadamente a suposição de riscos proporcionais é válida. 34 aproximadamente 1:30. O processo de censura é considerado não informativo, o que significa que funções, visitas preventivas e tempos de censura são considerados independentes uns dos outros outro. Primeiro, o estimador de Kaplan-Meier é usado para visualizar o efeito geral de uma medida preventiva visita de manutenção com relação ao tempo de sobrevivência. As amostras são estratificadas com base em se As questões de pesquisa são analisadas por uma série de exercícios de análise de sobrevivência. Vida real dados de monitoramento de condições em mais de 20 mil elevadores são usados. Período de tempo do os dados são de aproximadamente 2 anos. Os dados da máquina são combinados com os dados da visita ao local, para formar um la- elas são para elevadores recém-mantidos ou não e as curvas de sobrevivência obtidas são plotadas. Em seguida, são traçados gráficos de Weibull das estimativas de Kaplan-Meier, a fim de avaliar se conjunto de dados com sinos. O conjunto de dados resultante se concentra em mau funcionamento de portas, outros tipos de mau funcionamento A distribuição de Weibullpode ser usada para estimar os tempos de sobrevivência e para ver quão bem Machine Translated by Google 3.1 Conjunto de dados O conjunto de dados, que foi criado para alimentar os modelos, consiste em uma matriz de recursos dinâmicos inferido para obter previsões de risco diárias usando dados históricos do conjunto de treinamento. Cox para o conjunto de dados. Os dias faltantes (ou seja, etapas de inspeção) foram preenchidos usando a política de preenchimento antecipado. 35 curvas que também podem ser classificadas fixando um horizonte de tempo. Os elevadores são atribuídos diariamente trix é um conjunto de dados multi-indexado, contendo 10 agregados diários de monitoramento de condições passado e no futuro as próximas visitas preventivas ou não planejadas ocorreram. Esta informação período de serviço. Finalmente, os elevadores de alta classificação são comparados a todos os elevadores para exame conjunto de dados corresponde a elevadores e colunas correspondem a dias. A preparação de dados é ceNão planejado. Finalmente, os recursos estáticos foram mesclados pelo elevador para formar três co-estáticos característica górica, que ainda estava one-hot-ended antes de treinar os modelos). Dimensionamento final de uma visita de manutenção preventiva não é diferente dentro do grupo de alto escalão do que o número total de aberturas de portas foi uma das covariáveis de monitoramento de condição que foi são plotados usando o índice C como métrica de desempenho para comparação. Os modelos podem ser pelo menos 90% dos dias em que os agregados de monitoramento diário de condições estavam disponíveis foram aceitos varia. Em seguida, o conjunto de dados obtido foi mesclado com registros de manutenção para indicar onde no O modelo PH produz taxas de risco diretamente, enquanto o WTTE-RNN produz a sobrevivência de Weibull combinado com a matriz de características estáticas, conforme ilustrado na Figura 6. A matriz de características combinadas portões para diferentes elevadores e 3 recursos estáticos como séries temporais fictícias. Linhas do classifica com base em quanto o risco previsto foi aumentado durante a observação em andamento A informação deu origem a mais duas covariáveis chamadas DaysSincePreventive e DaysSin- começou formando agregados de monitoramento de condições diárias, por elevador. Por exemplo, ine a magnitude do efeito de manutenção em retrospecto. A hipótese nula é que o efeito variáveis, chamadas NumberOfFloors, NumberOfLandingDoors e BuildingType (uma categoria Dois modelos prognósticos são ajustados com o conjunto de dados e curvas de aprendizagem correspondentes está em toda a população de elevadores. agregados por dia de calendário (ver Tabela 1 para outras covariáveis). Apenas elevadores para os quais As menções do conjunto de dados vistas pelos modelos foram 20.465 linhas, 670 colunas e 27 colunas. Machine Translated by Google 3.2 Treinamento e validação cruzada 3.3 Desempenho foi feito antes que qualquer mau funcionamento da porta tenha ocorrido. Supõe-se que as portas são então calculado por fração do conjunto de treinamento e a média dessas observações formam cada um dos o número de observações é truncado para 100 000 por escolha aleatória sem substituição quando o índice C é calculado. O índice C não está muito bem vinculado à hipótese de pesquisa. pontos na curva de aprendizado. O mesmo elevador nunca aparece em conjuntos de treinamento e teste. fixado em condições tão boas quanto novas, o que conclui o período de observação em andamento e Portanto, métricas adicionais são usadas para quantificar o efeito da visita de manutenção preventiva dentro de um grupo de elevadores (por exemplo, elevadores de alto risco). Primeiro, vamos definir uma métrica chamada inicia um novo. Normalmente, as avarias são reparadas imediatamente no mesmo dia 3.1.1 Rotulagem quando foram relatados. Em um caso raro em que o mau funcionamento permanece ativo por mais de um Este método foi selecionado para garantir que os resultados representarão o verdadeiro poder de previsão do modelo em dados não vistos. A validação da hipótese de pesquisa é feita usando o Em um dia, todos os dias ativos são marcados como mortes. Cada amostra na matriz de características dinâmicas representa uma observação que é uma tupla (t, mesmo método e com conjunto de dados completo. Em outras palavras, as curvas de elevação representam uma média 36 de 9 rodadas diferentes de validação cruzada. d) onde t denota o número de dias até a próxima observação e d denota o tipo de observação. vação (1 para morte, 0 para perda). Neste caso, a morte corresponde a uma avaria na porta reportada função. A perda pode ocorrer por dois motivos. Pode ser que não haja dados disponíveis após As curvas de aprendizagem são produzidas usando validação cruzada de 3 vezes em grupo repetidas 3 vezes onde as divisões são feitas em base de elevador para evitar vazamento de informações entre censurando o tempo. Outra razão para uma perda pode ser que a visita de manutenção preventiva tenha entre o conjunto de teste e o conjunto de treinamento. Isso significa que, no total, 9 pontuações diferentes do índice C são Os modelos são ajustados e comparados pelo C-index como a pontuação, uma vez que ele é projetado para ser usado com dados censurados. A desvantagem do C-index é sua complexidade O(n2 ). Portanto, Machine Translated by Google 4 RESULTADOS 4.1 Efeito de uma visita de manutenção preventiva menor a razão de risco, maior o aumento. A hipótese de pesquisa agora pode ser definida para- Na Seção 1.3, foram colocadas uma série de questões de pesquisa e uma hipótese de pesquisa foi dado. A seguir, as questões de pesquisa são respondidas alavancando a con- normalmente, como uma expectativa de que para a maioria dos intervalos t, LiftA(t) > Lift(t), onde LiftA é calculado projetado para elevadores de alto risco e Lift(t) para todos os elevadores. levante e defina-o como uma razão de riscos cumulativos de duas curvas de sobrevivência. Vamos denotar Finalmente, uma métrica chamada ganho é definida como a razão de LiftA(t) para Lift(t). Vamos denotar conjunto de dados da vida real estruturado. Este capítulo é concluído com o exame da pesquisa hi- hipótese via estudo de caso. Ganho(t) := LiftA(t) / Lift(t). O ganho é interpretado como o benefício de usar o modelo baseado Lij(t) := Hj(t) / Hi(t). O lift pode ser interpretado como o inverso da razão de risco para um intervalo agendamento em vez de agendamento aleatório. Ele produz a redução esperada no número de t de duas populações de elevadores. Por exemplo, considere duas curvas de sobrevivência i e j que corres- Vamos examinar como uma visita de manutenção afeta as curvas de sobrevivência. Veja a Figura 7 para dois curvas de sobrevivência. responder a duas populações distintas de elevadores. Agora, se Hi(t)não programadas em função dos dias decorridos após a manutenção, o que é relevante métrica considerando o objetivo do negócio que é diminuir a taxa de visitas não planejadas. comparado ao grupo j (ou seja, ao comparar suas probabilidades de sobreviver até o tempo t). 37 Machine Translated by Google Figura 7. Curva de sobrevivência média e curva de sobrevivência após manutenção preventiva. 4.1.1 Análise Weibull Em seguida, foi utilizada a técnica do gráfico de Weibull, descrita na Seção 2.4.2, para validar se os tempos de sobrevivência podem ser assumidos como seguindo a distribuição Weibull. Figura 8 mostra o gráfico da curva de sobrevivência média e da curva de sobrevivência basal. a curva foi produzida considerando todas as observações no conjunto de dados enquanto a segunda curva no dia anterior. foi obtido filtrando observações onde a visita de manutenção planejada foi feita As duas curvas foram obtidas aplicando o estimador de Kaplan-Meier. Sobrevida média 38 Machine Translated by Google Figura 8. Gráfico de Weibull das curvas de sobrevivência de Kaplan-Meier. segue razoavelmente bem também, então pode-se concluir que faz sentido tentar Técnicas de análise de sobrevivência baseadas em Weibull. Linhas de tendência correspondentes que foram ajustadas já que o gráfico implica uma relação linear entre os eixos x e y. A curva de sobrevivência da linha de base Especialmente a curva de sobrevivência média parece seguir bem a distribuição de Weibull, usando o método dos mínimos quadrados são mostrados na Figura 9. 39 Machine Translated by Google Figura 9. Linhas de tendência para curvas de sobrevivência de Kaplan-Meier traçadas por Weibull. as linhas devem ser constantes, ln(HR). Agora parece que a taxa de risco da vida real não é con- constante, mas proporcional ao tempo. Em seguida, foi feito um ajuste de Weibull com as observações corres- resultados mais precisos. Para que a suposição de Cox PH seja válida, a diferença da tendência- As linhas de tendência não são paralelas, o que implica que o modelo Cox PH pode não produzir o correspondendo às duas curvas de sobrevivência usando Lifelines (2019). A Figura 10 mostra diferentes Visualizações de Weibull para as duas populações. 40 Machine Translated by Google mau funcionamento da porta, e que o efeito é bastante permanente. Subtraindo os meios do duas distribuições Weibull produzem 98 dias. No entanto, a curva de elevação inferior direita codifica informações ainda mais interessantes. Assumindo um período de observação ininterrupto t, “Como o valor de uma visita de manutenção preventiva se desenvolve ao longo do tempo?”. O Elevador taxa?”. Isto é melhor resumido pelo gráfico superior direito onde as funções de risco são representadas graficamente para as duas populações de elevadores. Isso mostra que a manutenção diminui claramente a taxa de que é “Quanto uma visita de manutenção preventiva melhora o mau funcionamento da porta Agora que as estimativas de Weibull são conhecidas, vamos tentar responder à questão de pesquisa 1, elevador mantido. Em outras palavras, Lift(t) quantifica, em média, o benefício futuro do per- será aproveitado também mais tarde, quando a hipótese de pesquisa for examinada. 41 Lift(t) produz a razão entre as taxas de visitas não planejadas de um elevador médio e um elevador recém-manutido. formando manutenção preventiva e, portanto, responde à questão de pesquisa 2, que é Figura 10. Distribuições de Weibull baseadas nas curvas de sobrevivência de Kaplan-Meier. Machine Translated by Google 1.0 Modelo WTTE-RNN. O índice C pode ser usado para avaliar seu desempenho. Avaliações 1.0 e CPU Intel core i5-6300U (2,40 GHz). 1.0 Razão de risco (por unidade) NBR_DOOR_REOP_POR_MOTIVO_DESCONHECIDO O modelo Cox PH foi ajustado com a matriz de covariáveis. Mais precisamente, um modelo Cox PH 1.479 NBR_CORTINA_DE_LUZ_CORTEIO 1.0 Antes de testar a hipótese de pesquisa, vamos primeiro examinar o modelo Cox PH e A Figura 1 mostra as taxas de risco obtidas por unidade para cada covariável. NBR_NUDGING fato de que algumas covariáveis eram altamente correlacionadas entre si. Antes do ajuste, todas as co- NBR_DOOR_REOP_PELO_BOTÃO_ABERTO 1.391 1.0 foram feitos executando notebooks Jupyter baseados em Python em um laptop com 16 GB de RAM Covariável NBR_INÍCIO_ABAIXO 1.161 4.2.1 Desempenho do modelo Cox PH NBR_OPERAÇÕES_DE_PORTA 1.0 NBR_INÍCIOS_UP NBR_DOOR_REOP_BY_LIGHT_CURTAIN_CUTS com penalidade de rede elástica foi usada, pois o modelo Cox PH padrão não é capaz de lidar com a 1.0 42 NBR_DOOR_REOP_BY_SAFETY_EDGE NBR_FOTOCÉLULA_CORTES as variáveis foram dimensionadas para o mesmo intervalo (de 0 a 10). O ajuste real levou 20 minutos. Tabela 4.2 Validação do modelo Tabela 1. Razões de risco do modelo Cox PH por unidade de mudança. Machine Translated by Google NúmeroDePortasDeAterrissagem essas covariáveis estão presentes e nenhuma delas constitui um preditor muito forte. Lembre-se de que efeito de financiamento, devido à suposição de PH estar ligeiramente errada para o conjunto de dados. 43 nenhuma tendência ou interação é fornecida ao modelo. É possível que, por meio da engenharia de recursos, Tipo de edifício 1.047 DiasDesdeNãoPlanejado [0,929,1,126] nering pode-se construir melhores preditores. A Figura 11 mostra um gráfico de caixa de razões de risco com intervalos de confiança de 95%, variância, DiasDesdeManutenção Os preditores de aumento de risco mais fortes são NBR_DOOR_OPERATIONS, e média. A Figura 12 mostra as curvas de sobrevivência correspondentes, onde a média de Kaplan-Meier NBR_DOOR_REOP_BY_LIGHTCURTAIN_CUTS e NumberOfFloors. Mais forte 0,819 a estimativa da Figura 7 é dimensionada pela razão das médias das razões de risco obtidas via Cox Modelo PH. Comparado com estimadores estratificados de Kaplan-Meier e técnicas de ajuste de Weibull 1.063 NúmeroDeAndares O preditor de redução de risco é DaysSinceUnplanned (talvez se o elevador estiver funcionando por um longo período) tempo sem mau funcionamento da porta, é provável que isso aconteça também no futuro). BuildingType ex- 1.321 leva a tantas colunas codificadas one-hot que nos permitem apenas anotar o intervalo que (cf. Figura 7 e Figura 10) o modelo Cox PH subestima significativamente a manutenção Machine Translated by Google 44 Figura 12. Efeito da manutenção preventiva pelo modelo Cox PH. Figura 11. Distribuição das taxas de risco. Machine Translated by Google Figura 13. Curvas de aprendizado para o modelo Cox PH com penalidade líquida elástica. pontos no eixo x. Os gráficos mostram as médias dessas pontuações, bem como o desvio padrão ções em função do tamanho do conjunto de treinamento. Os gráficos indicam que o desempenho converge rapidamente e adicionar mais amostras não índice C máximo de 0,65. A saturação precoce da curva de aprendizagem era esperada, pois validação cruzada de grupo. Portanto, o modelo foi treinado 9 vezes (3 x 3) para cada um dos não ajuda muito após o tamanho do conjunto de treinamento de um milhão de amostrasonde o modelo atinge seu modelo com penalidade de rede elástica. As curvas foram obtidas por meio de 3 vezes repetidas 3 vezes A Figura 13 mostra como o índice C se desenvolve em função do tamanho do conjunto de treinamento para o Cox PH o modelo é tão simples. Por outro lado, o modelo parece estável e o overfitting não é um problema. 45 Machine Translated by Google Figura 14. Curvas de aprendizado para WTTE-RNN. usado para treinar o modelo. O conjunto de treinamento consiste em uma matriz cujas linhas correspondem a elevadores, colunas correspondem a dias e os conteúdos são o monitoramento diário das condições morte e 0 para perda. A Figura 14 mostra as curvas de aprendizado do modelo. Treinamento do camadas, seguidas por uma camada LSTM, uma camada densa e uma camada de saída final, e teve Vamos agora construir um modelo de rede neural baseado em WTTE-RNN (Martinsson 2016). covatiates e tuplas de verdade fundamental (t, d), onde t denota o tempo até o evento e d é 1 para O autor do modelo divulgou o código fonte em Python WTTE-RNN (2019) e foi 4.2.2 Desempenho do modelo WTTE-RNN completamente 46 modelo para o maior tamanho de conjunto de treinamento levou 40 minutos. O modelo consistiu em dois feed-forward Machine Translated by Google 4.3 Validação da hipótese de pesquisa Para validar a hipótese por meio de estudo de caso, vamos representar graficamente as métricas LiftA(t) e Lift(t) para ambos interpretado como potencial para se beneficiar de uma visita de manutenção. Os 15% melhores classificados foram considerado como de alta classificação e o restante como de baixa classificação. Este limite foi selecionado ad hoc, porque modelos. 4.3.1 Elevadores do modelo Cox PH As curvas de aprendizagem mostram que o modelo se beneficia da adição de mais amostras e que o modelo Para calcular a elevação do modelo Cox PH, foi realizada uma validação cruzada de grupo triplo repetida 3 vezes. porque forneceu elevadores suficientes no grupo de alto escalão que havia sido mantido (com- colocar curvas de sobrevivência para um grupo com menos de 20 membros não é confiável e é usado generaliza bem. Em cerca de 10 milhões de amostras, o desempenho no conjunto de teste é igual a realizado no conjunto de dados para rotular amostras como amostras de classificação alta ou baixa. Para pacote matemático deu um aviso sobre isso). O ajuste de Weibull foi feito em todas as rodadas e corre- em cada rodada, o conjunto de trem foi usado para ajustar o modelo Cox PH com penalidade de rede elástica e ajustado do conjunto de treinamento C-index sendo cerca de 0,71, o que é cerca de 6 pontos percentuais maior curvas de sobrevivência e curvas de elevação correspondentes foram calculadas. A Figura 15 mostra a média de as curvas de sobrevivência para elevadores de alto escalão (grupo A) e todos os elevadores. do que o do modelo Cox PH em saturação. modelo foi usado para prever as taxas de risco para as amostras de teste. Então cada previsão foi normalizado subtraindo a razão de risco de base que foi a previsão no primeiro A hipótese de pesquisa foi esculpida no Capítulo 1 e formulada formalmente no Capítulo 3. dia do período de observação. Isso deu a classificação do elevador, que pode ser inter- 47 Machine Translated by Google O eixo y é para os elevadores, enquanto o eixo y direito é para o ganho. 48 mostrado na Figura 16, bem como sua relação referida como Gain(t) := LiftA(t) / Lift(t). Esquerda A hipótese de pesquisa é validada pelo exame dos gráficos LiftA(t) e Lift(t) que são Figura 15. Estimativas da curva de sobrevivência no estudo de caso com modelo Cox PH. Machine Translated by Google A visita de manutenção reduz a taxa de futuras visitas não planejadas por um fator X em todos os grupos de elevadores e fator XA no grupo de classificação alta. Escrevendo X = 1 / Lift e XA = 1 / LiftA, produz Gain = X / XA. O ganho sendo 1,15 em 300 dias significa que a razão entre as taxas esperadas de não- visitas planejadas logo após a manutenção nos dois grupos é XA / X = 1 / 1,15 que é a programação produziria 13% menos visitas não planejadas do que a programação atual (ganho sendo um elevador médio e um elevador recém-conservado. Agora, vamos denotar que um elevador em manutenção 1,15 em 300 dias). Para ver isso, lembre-se de que o aumento produz a proporção de taxas de visitas não planejadas de Fixar o intervalo de manutenção para, por exemplo, 300 dias, o modelo Cox PH baseado no cronograma em torno de 0,87. Em outras palavras, o valor esperado de visitas não planejadas no grupo de alta classificação é 13% menor do que no grupo de todos os elevadores. 49 Figura 16. Elevações e ganhos no estudo de caso (modelo Cox PH). Machine Translated by Google Figura 17. Estimativas da curva de sobrevivência no estudo de caso com modelo WTTE-RNN Exercício semelhante foi feito com o modelo WTTE-RNN. A Figura 17 representa graficamente a média do A Figura 18 mostra os elevadores e ganhos correspondentes para o modelo WTTE-RNN. O ganho para curvas de sobrevivência para os elevadores de alto escalão (grupo A) e todos os elevadores. 4.3.2 Elevadores do modelo WTTE-RNN O intervalo de manutenção de 300 dias é de 1,39 em comparação com 1,15 obtido com o Cox Modelo PH. As reduções respectivas na quantidade de visitas não planejadas são de 28% e 13%. 50 Machine Translated by Google 5 CONCLUSÕES Figura 18. Elevações e ganhos no estudo de caso (modelo WTTE-RNN). cabe na maioria das visitas de manutenção preventiva. registros de manutenção e dados de monitoramento de condições (20 mil elevadores por um período de dois Métodos de análise de sobrevivência foram usados para analisar os dados disponíveis que consistiam em manutenção anos). Os dados de monitoramento de condições foram agregados em um nível diário. Primeiro, os dados de agendando as visitas de manutenção preventiva conforme recomendações do modelo. A ideia é que um modelo prognóstico possa ser usado para filtrar elevadores que se beneficiariam um modelo prognóstico poderia ser usado para diminuir a taxa de mau funcionamento das portas do elevador O objetivo da tese foi estudar como as portas dos elevadores respondem à manutenção e como 51 Machine Translated by Google dados de monitoramento e um modelo semiparamétrico chamado modelo Cox PH foi usado para aproximar inferido para sobrevivência usando dados de monitoramento de condição. O desempenho do modelo foi elevadores contidos. Além disso, a chamada técnica de diagrama de Weibull foi usada para estabelecer inferindo um modelo prognóstico para estimativas de sobrevivência diária de todos os elevadores desde o início de elevadores de classificação. Em seguida, curvas de sobrevivência estratificadas foram calculadas realizando um Weibull ajuste Weibull estratificado para os dois grupos, o que proporcionou uma boa visualização contínua de um modelo de rede neural mais complexo chamado WTTE-RNN foi realizado. Foi estabelecidocondição do elevador. Acredita-se que os elevadores com maior deriva sejam os que mais se beneficiam de uma e como o valor de uma visita de manutenção preventiva se desenvolve ao longo do tempo (questões de pesquisa modelo e o modelo WTTE-RNN respectivamente. Esta análise respondeu à pesquisa as visitas de manutenção seriam baseadas nas recomendações do modelo (ou seja, o desvio), em vez registros de manutenção. Isso foi feito para dois grupos: todos os elevadores e recém-manutenção estimar a sobrevivência. Ao contrário do estimador de Kaplan-Meier, um modelo de Cox treinado pode ser Foi realizado um estudo de caso para validar a hipótese de pesquisa utilizando o método proposto Em seguida, um conjunto de dados da vida real foi construído usando os registros de manutenção e as condições com base em dados de monitoramento de condições?”). programação baseada no monitoramento da condição da manutenção preventiva. O método se baseia em primeiro lugar seus períodos de observação atuais. Essas previsões são então usadas para avaliar a deriva em que os tempos de sobrevivência seguem aproximadamente a distribuição de Weibull. Isso justificou a realização avaliados usando validação cruzada e uma métrica chamada C-index. Uma análise comparativa para No estudo de caso, foram utilizadas recomendações do modelo prognóstico para selecionar altas diárias 52 como uma visita de manutenção geralmente melhora a taxa de mau funcionamento da porta (questão de pesquisa 1), constatou-se que o índice C para os modelos em saturação foi de 0,65 e 0,71 para o Cox PH visita de manutenção preventiva. A hipótese da pesquisa foi que se o agendamento da visita de manutenção preventiva pergunta 3 (“Quão bem certos modelos matemáticos podem prever o risco de mau funcionamento ção 2). do que o agendamento baseado em calendário, a taxa de mau funcionamento das portas diminuiria. Finalmente, foi proposto um método para diminuir a taxa de mau funcionamento das portas por meio de con- com dados históricos. Tanto o modelo Cox PH quanto o WTTE-RNN foram avaliados. As curvas vivais foram obtidas ajustando um estimador não paramétrico de Kaplan-Meier com o Machine Translated by Google conceito denominado Ganho foi utilizado para comparar o efeito de manutenção dentro do alto elevadores de alta elevação ficariam sem carga, deixando o algoritmo de agendamento com uma distribuição bastante homogênea. trabalho adicional para quantificar o benefício real da alavancagem dos métodos discutidos no tese. Uma comparação entre o agendamento baseado no monitoramento de condições proposto e grupo nous de elevadores para selecionar. Outro ponto prático a considerar é que o elevadores de classificação e todos os elevadores. Uma curva de ganho foi obtida pela divisão dos dois elevadores o agendamento baseado em calendário forneceria resultados claramente quantificados sobre a eficácia e aplicabilidade do método proposto. curvas. Da curva de ganho , foi derivado um resultado, que o método de escalonamento proposto adequado para os elevadores recém-mantidos e todos os elevadores. Isso foi feito separadamente para diminuiria a taxa de mau funcionamento da porta em 13% usando o modelo Cox PH e em 28% a função de perda do modelo WTTE-RNN depende do processo de censura não ser informativo. Agora, se as decisões de agendamento fossem baseadas no modelo WTTE-RNN, os elevadores de alto escalão e todos os elevadores (ou seja, quatro curvas de sobrevivência foram obtidas alto- utilizando o modelo WTTE-RNN (quando foi assumido um intervalo de manutenção de 300 dias). então a censura não seria mais estritamente não informativa (como causa de visita preventiva 53 Como o estudo de caso foi feito retrospectivamente, não é possível antecipar o momento exato juntos). Uma função chamada Lift foi definida para capturar o efeito de manutenção como uma função censura). Períodos de observação que terminam devido à visita de manutenção preventiva sendo programado pelo modelo deve, em teoria, ser descartado de futuros conjuntos de treinamento. Isto tempo (ou seja, como uma visita de manutenção preventiva geralmente melhora a sobrevivência dentro o grupo particular de elevadores). Usando as quatro estimativas da curva de sobrevivência, dois elevadores alteração na taxa de mau funcionamento de portas relatadas caso o método proposto seja usado em vida real. No início, o algoritmo poderia ser capaz de selecionar elevadores cujas portas curvas foram formadas para elevadores de alto nível e todos os elevadores, respectivamente. Por fim, uma beneficiaria significativamente da manutenção. No entanto, não está claro quando tal poderia limitar a utilidade do método. Devido a estas razões, estaria sujeito a Machine Translated by Google métodos de suporte para manutenção baseada em condições: Journal of Intelligent Manufacturing, computação 307, pp. 72-77. Cox, DR 1972, Modelos de regressão e tabelas de vida: Journal of the Royal Statistical Vol. 29, No. 6, pp. 1303–1316. Castro, IT et al. 2012, Uma estratégia de manutenção preditiva baseada na vida residual média para sistemas sujeitos a falhas concorrentes devido à degradação e choques: 11º Congresso Internacional Sociedade. Série B (Metodológica), Vol. 34, No. 2, pp. 187–220. Cox, DR 1975, Probabilidade parcial: Biometrika, Vol.62, No. 2, pp. 269–276. Armitage P., Berry G., Matthews JNS 2002, Métodos estatísticos em pesquisa médica, Conferência Nacional de Avaliação e Gestão de Segurança Probabilística e a Conferência Anual De Laurentiis, M., Ravdin, PM, (1994), 'Análise de sobrevivência de dados censurados: Neural Conferência Europeia sobre Segurança e Fiabilidade 2012, PSAM11 ESREL 2012, 1, pp. 375– 4ª ed., Blackwell Publishing, pp. 85-86. análise de rede detecção de interações complexas entre variáveis.', Câncer de Mama Tratamento de Pesquisa 32, pp. 113–118. Bland, JM & Altman, DG 2004, O teste logrank: British Medical Journal, Vol. 328, Edição 7447, p. 1073. 384. Christ, M. & Braun, N. & Neuffer, J. & Kempa-Liehr AW 2018, Série Temporal FeatuRe Bousdekis, A. et al. 2018, Revisão, análise e síntese de decisões baseadas em prognóstico Extração com base em testes de hipóteses escaláveis (tsfresh -- Um pacote Python): Neuro- REFERÊNCIAS Machine Translated by Google modelo recorrente para análise de sobrevivência: Apostilas em Ciência da Computação (incluindo J. da ASA, 73(282), pp. 457–481. Disponível em: Ciência de dados e análise avançada, DSAA 2016, pp. 21–30. https://web.stanford.edu/~lutian/coursepdf/KMpaper.pdf. subsérie Notas de aula em Inteligência Artificial e Notas de aula em Bioinformática), 11141 LNCS, págs. 23–32. Deep-TTF 2018. Disponível em https://github.com/gm-spacagna/deep-ttf/, Acessado Harrell, FE et al 1982, Avaliação do rendimento de testes médicos: JAMA - Journal of the Lee, H. et al. (2010) 'Em direção à gestão ideal da rotatividade: um método de mínimos quadrados parciais (PLS) modelo', 16ª Conferência das Américas sobre Sistemas de Informação 2010, AMCIS 2010, AssociaçãoMédica Americana, Vol. 247, No. 18, pp. 2543–2546. 3.3.2020. 2(julho), pp. 961–971. Disponível em: https://www.scopus.com/inward/record.uri?eid=2- Jing, B. et al. 2019, Um método de análise de sobrevivência profunda baseado em classificação: Inteligência Artificial Dittman, D. e Khoshgoftaar, T. (2014) 'Comparação de abordagens de amostragem de dados s2.0-84870447433&partnerID=40&md5=de6940dc252b840c89af555ff5d049be. Leontjeva, A. & Kuzovkin, I. 2016, Combinando recursos estáticos e dinâmicos para multi- para dados de bioinformática desequilibrados', The Twenty-Seventh …, pp. 268–271. Disponível em: http://www.aaai.org/ocs/index.php/FLAIRS/FLAIRS14/paper/viewFile/7850/7850 inteligência em Medicina, Elsevier, Vol. 98, pp. Kaplan, EL e Meier, P. (1958) 'Estimativa não paramétrica a partir de amostras incompletas- Giunchiglia, E. & Nemchenko, A. & van der Schaar, M. 2018, RNN-SURV: Um profundo por favor', classificação de sequência de variáveis: Anais - 3ª Conferência Internacional IEEE sobre Machine Translated by Google https://github.com/gm-spacagna/deep-ttf/ https://ragulpr.github.io/assets/draft_master_thesis_martinsson_egil_wtte_rnn_2016.pdf Schober, P. & Vetter, TR 2018, Análise de sobrevivência e interpretação do tempo até o evento http://www.stat.washington.edu/fritz/DATAFILES498B2008/WeibullBounds.pdf. 59. dados: A tartaruga e a lebre: Anestesia e Analgesia, Vol. 127, No. 3, pp. 792– Nalchigar, S. & Yu, E. 2018, Análise de dados orientada a negócios: uma modelagem conceitual pág. estrutura: Engenharia de Dados e Conhecimento, Elsevier Ltd, Vol. 117, pp. 359–372. Lifelines. 2019. Disponível em https://lifelines.readthedocs.io/en/latest/ Acessado Nelson, WB 2004, Análise Aplicada de Dados de Vida, John Wiley & Sons, 664 páginas. 798. Scholz, F. (2008) 'Inferência para a distribuição de Weibull', Stat 498B Estatística Industrial- Ohno-Machado, L. 1996, Uso sequencial de redes neurais para predição de sobrevivência em 3.3.2020. tiques, AIDS: Anais de uma conferência da Associação Americana de Informática Médica, Mantel, Nathan. 1966. 'Avaliação de dados de sobrevivência e duas novas estatísticas de ordem de classificação- 632, Disponível tics surgindo em sua consideração.' Relatórios de quimioterapia do câncer 50 (3): 163–70. Martinsson, E. (2016) 'WTTE-RNN: Rede Neural Recorrente de Tempo para Evento Weibull- Simpósio de outono da AMIA, pp. 170–174. Raykar, VC et al. 2008, Sobre classificação na análise de sobrevivência: limites na concordância trabalho Um modelo para predição sequencial de tempo-para-evento no caso'. Disponível em: índice: 20º NIPS, pp. 1209–1216. no: Machine Translated by Google https://lifelines.readthedocs.io/en/latest/ Widrow, B. 2005, Pensando sobre o pensamento: A descoberta do algoritmo LMS: IEEE Revista Signal Processing, Vol. 22, No. 1, pp. 100–103. WTTE-RNN 2019. Disponível em https://github.com/ragulpr/wtte-rnn/ Acessado Scikit-survival. 2019. Disponível em https://github.com/sebp/scikit-survival/ Acessado 3.3.2020. 3.3.2020. Wolstenholme, LC 1999, Modelagem de confiabilidade: uma abordagem estatística, Chapman e Hall/CRC, 256 páginas. Vanderplas et al (2012), 'Introdução ao astroML: Aprendizado de máquina para astrofísica', proc. do CIDU, pp. 47-54. Weibull, W. 1951, Uma função de distribuição estatística de ampla aplicabilidade: ASME Journal- Wu, SJ et al. 2007, Um sistema de suporte à decisão integrado de rede neural para condições política de manutenção preditiva ótima baseada em informações: IEEE Transactions on Systems, Man, final de Mecânica Aplicada, Vol. 18, No. 3, pp. 293–297. e Cibernética Parte A: Sistemas e Humanos, Vol. 37, No. 2, pp. 226–236. Machine Translated by Google https://github.com/ragulpr/wtte-rnn/ https://github.com/sebp/scikit-survival/Google Referências ................................................................................................................ 54 5 Conclusões ....................................................................................................... 51 Machine Translated by Google Figura 6. Combinando recursos estáticos e recursos dinâmicos criando um tempo fictício Figura 14. Curvas de aprendizagem para WTTE-RNN. ................................................................ 46 Figura 15. Estimativas da curva de sobrevivência no estudo de caso com modelo Cox PH................... 48 série de recursos estáticos.............................................................................................. 34 Figura 7. Curva de sobrevivência média e curva de sobrevivência após manutenção preventiva. .... 38 Figura 8. Diagrama de Weibull das curvas de sobrevivência de Kaplan-Meier. ........................................ 39 Figura 16. Elevações e ganhos no estudo de caso (modelo Cox PH). ........................................ 49 Figura 17. Estimativas da curva de sobrevivência no estudo de caso com modelo WTTE-RNN........... 50 Figura 1. Distribuição de Weibull por diferentes parâmetros de forma e escala. ....................... 22 Figura 9. Linhas de tendência para curvas de sobrevivência de Kaplan-Meier traçadas por Weibull. ...................... 40 Figura 18. Elevações e ganhos no estudo de caso (modelo WTTE-RNN). ................................ 51 Figura 10. Distribuições de Weibull baseadas nas curvas de sobrevivência de Kaplan-Meier..................... 41 Figura 2. Taxas de risco de Weibull com diferentes parâmetros de forma e escala. ................... 23 Tabela 1. Razões de risco do modelo Cox PH por unidade de mudança......................................... 42 Figura 3. Curvas de sobrevivência de Weibull.............................................................................. 24 Figura 4. Circuito ADALINE (Widrow 2005)............................................................... 28 Figura 11. Distribuição das taxas de risco. ......................................................................... 44 Figura 12. Efeito da manutenção preventiva pelo modelo Cox PH.................................... 44 Figura 5. Um pipeline que pode usar RNN para transformação de recursos (Leontjeva 2016).... 33 Figura 13. Curvas de aprendizagem para o modelo Cox PH com penalidade líquida elástica. ....................... 45 Tabelas Figuras Machine Translated by Google trabalhar com. Anton Akusok, que me orientou na direção certa no início desta tese trabalho, quando eu lutava para encontrar uma boa abordagem e métodos para o problema de pesquisa. Um agradecimento especial ao meu orientador e professor Dr. Leonardo Espinosa (Arcada), que me manteve firme mesmo quando ficou evidente que a abordagem inicial ao problema não estava funcionando. Seu incentivo e verdadeira curiosidade em relação à minha pesquisa foram surpreendentes. Escrever esta tese me ensinou muito e espero que você ache o tópico útil. esforço. Esta tese foi encomendada pelo meu orientador e superior Dr. Olli Mali (KONE Oyj). Eu ishing. Devo a ele (e a Olli) a revisão e muitas sugestões que tornaram isso Hyvinkää, fevereiro de 2020 tese uma leitura melhor. gostaria de expressar minha gratidão a ele pela ideia, confiança, bom espírito e companheirismo. Mikko Alutoin parceria. Sem seu apoio contínuo a tese nunca teria sido iniciada ainda sozinho concluído. Além disso, sou grato pelos recursos admitidos a mim pela Kone Corpo- Gostaria também de agradecer ao Dr. Magnus Westerlund (Arcada), diretor do programa o programa de mestrado em Big Data Analytics. Meus estudos na Arcada têm ração, e para meus colegas que são o grupo de profissionais mais motivados e divertidos de abriu um novo mundo para mim profissionalmente. Finalmente, também sou grato ao meu professor Dr. PREFÁCIO Machine Translated by Google que ajuda a formular as questões de pesquisa e a limitar o escopo da tese. O os limites lógicos estão sendo empurrados ainda mais pelo aprendizado de máquina. No entanto, esses tipos de processo de negócios de manutenção de um provedor de serviços industriais. O provedor de serviços é oferecendo um serviço de manutenção contínua para elevadores. Os dados de monitoramento de condições são aplicações são apenas a ponta de um iceberg. A maioria dos cientistas de dados hoje estão aplicando A introdução é concluída com um esboço da estrutura da tese. continuamente coletados de elevadores que estão sob contrato de manutenção. Existe também dados sobre todas as visitas de manutenção. O objetivo da tese é pesquisar como a coleção aprendizagem de máquina em um ambiente mais convencional, onde o desenvolvimento pode ser descrito As técnicas de inteligência artificial e de aprendizagem automática estão a aumentar em quase todos os países mais como uma evolução do que uma revolução: os serviços digitais existentes estão a ser optimizados e O tópico desta tese e os problemas de pesquisa abordados são apresentados neste capítulo. indústrias. Embora muitas técnicas de aprendizado de máquina, como redes neurais, tenham automatizado por meio de aprendizado de máquina e análises avançadas. As empresas estão saltando Os dados selecionados podem ser usados para otimizar o processo de manutenção para atingir uma meta comercial. existem há muito tempo, parece que só recentemente ganharam força suficiente Começa discutindo um cenário onde uma empresa oferece manutenção preventiva no vagão e repensando as formas de conduzir seus processos de negócios e serviços Por processo de manutenção nos referimos ao processo no qual os técnicos de manutenção são vícios por meio da coleta e análise de dados e aproveitamento de insights da análise de dados. e manutenção corretiva como um serviço contínuo aos seus clientes. Possibilidades de ma- aprendizagem de máquinas para este processo de manutenção de negócios de automação e otimização são para causar um impacto significativo em nossas vidas diárias. A evidência mais proeminente disso são 7 os produtos totalmente novos que estão sendo introduzidos por algumas das principais empresas de tecnologia descrito e uma meta de negócios é definida. Em seguida, metas analíticas mais detalhadas são consideradas empresas. Por exemplo, os veículos autônomos são um exemplo desta categoria onde a tecnologia Esta tese centra-se no último tipo de aplicação, mais especificamente na automação de 1 INTRODUÇÃO 1.1 Objetivo de negócio Machine Translated by Google Ou o cliente final ou o gerente da instalação contatou o help desk ou ocorreu uma falha. visitas de manutenção. São visitas programadas e recorrentes onde o técnico de manutenção aplicar métodos adequados, como o aprendizado de máquina. Vamos agora prosseguir definindo o 8 como a lubrificação de peças de elevadores. Em muitos países, a frequência de visitas preventivas O técnico deverá visitar o local imediatamente para resolver o problema técnico. O técnico alto. O custo direto decorre da natureza sem precedentes da visita aolocal que causa ineficiência tipo de visita é uma visita de reparo quando certas peças do elevador são substituídas. Gatilho para re- sua ajuda é necessária urgentemente. Aprisionamento de um passageiro dentro do elevador é uma ex- qualidade do serviço de manutenção recebida pelo cliente. A satisfação do cliente está em tempo de atendimento do elevador diminuído. Chegamos à nossa definição de meta de negócio: vida, técnico percebendo a necessidade durante visita de manutenção preventiva, ou cliente tendo maneira apesar da hora. ações. Existem diferentes tipos de visitas. A maioria das visitas são de manutenção preventiva. Essas visitas são necessárias quando ocorre um problema sem precedentes com o elevador. os objetivos de negócios e objetivos analíticos mais específicos foram esclarecidos, é hora de aplicar mau funcionamento da porta. objetivo de negócios. É evidente que o custo associado a uma visita não planejada ao local é muito realiza verificações preventivas nas máquinas e realiza determinadas ações de manutenção, detectado automaticamente (por exemplo, por meio de análise de dados). Neste caso, uma manutenção é regido pela lei, a fim de garantir a operação segura do elevador. Outra precisa cessar quaisquer ações que possa estar realizando no momento e viajar para o local onde eficiência para o processo de outra forma simplificado. O custo indireto está associado ao desempenho amplo do tipo mais urgente de visita não planejada, que deve ser respondida em tempo hábil a colocação pode ter se originado devido à parte ter atingido seu fim predeterminado de risco sempre que uma visita não planejada é necessária, pois muitas vezes isso é acompanhado por despachado para realizar visitas ao local para execução de manutenção preventiva e corretiva ing relatou um problema com o equipamento. Por fim, há as chamadas visitas não planejadas. A otimização de qualquer processo de negócios começa com a definição de objetivos comerciais claros. Somente depois Objetivo do negócio: diminuir a taxa de visitas de manutenção não planejadas causadas por Machine Translated by Google 1.2 Objetivo de análise das visitas de manutenção preventiva podem ser baseadas em recomendações de prognóstico seu. Existem basicamente duas maneiras de abordar a meta de negócios usando análise orientada a dados definindo uma ou mais metas analíticas. A função da meta analítica é fornecer insights de e valores atípicos poderiam ser detectados, o que por sua vez poderia facilitar a localização e resolução de problemas. as visitas de manutenção preventiva podem ser programadas de forma mais otimizada para reduzir a taxa de Capítulo 3. Vamos agora discutir a visão do design analítico e definir a meta analítica a máquina em boas condições ou que o técnico de manutenção seja capaz de detectar mais escrito, conduzido e documentado por meio de três visões complementares chamadas 1) negócios As capacidades de diferentes algoritmos de aprendizagem de máquina podem ser utilizadas para cumprir os objetivos do negócio. Meta de descrição, Meta de prescrição ou Meta de prescrição (Nalchigar 2018a). Por exemplo, não- técnicos de manutenção com insights sobre a causa raiz da falha, para que eles possam separação útil de preocupações e, portanto, é usada também em toda esta tese. Em negócios corrigindo a falha). Esta tese se concentra no primeiro caminho, estudando como o agendamento síveis em portas de elevadores e mau funcionamento de portas representam uma grande parcela de visitas não planejadas e definir requisitos para a visão de design analítico. Os requisitos de negócios levam a Objetivo). No contexto desta tese, a análise poderia ser feita em diferentes viagens de elevador dados a serem usados por vários atores. A visão de preparação de dados será discutida mais adiante em (dado que a taxa de visitas de manutenção preventiva não deve ser aumentada). Por um lado modelos. 9 falhas. A ideia é que as próprias ações de manutenção preventiva podem manter o ma- Os autores em Nalchigar (2018a) apresentam uma estrutura onde um projeto analítico é de- (dado o objetivo de negócio definido na Seção 1.1). visão, 2) visão de design analítico e 3) visão de preparação de dados. Esta estrutura fornece uma oportuna que uma visita de reparo seja necessária. O outro caminho para a melhoria é fornecer objetivo de análise. Isso significa fornecer insights por meio de algum objetivo analítico, como Predic- Esta tese se concentra em mau funcionamento de portas, pois muitos dados de monitoramento de condições estão disponíveis. ser capaz de resolver o problema de forma mais eficiente (por exemplo, evitar múltiplas visitas ao local para visão de negócio, as partes interessadas documentam seus requisitos para o processo de negócios como um todo o aprendizado de máquina supervisionado pode ser usado para fornecer detecção de anomalias (Descrição Machine Translated by Google É a tarefa para o exercício de modelagem na visão de design analítico. Qual modelo não é possível usar aprendizado de máquina supervisionado. A quantidade de dados desempenha um papel nível de serviço obtido com antecedência (Meta de Predição). Por exemplo, uma máquina supervisionada análise de causa. Em vez disso, o objetivo é construir um modelo de aprendizado de máquina supervisionado que possa 10 como a verdade fundamental. Finalmente, um modelo de aprendizado de máquina supervisionado poderia até mesmo fornecer objetivo da análise, ele essencialmente especifica a variável alvo (ou seja, o que deve ser previsto). programado em um elevador específico hoje, qual seria o benefício esperado com a re- mau funcionamento portado (Meta de Prescrição). Isso exigiria uma análise da causa raiz para ções. Nesta tese o objetivo principal da análise é: A justificativa por trás da meta analítica selecionada é que deve existir uma sequência ótima aplicado para prever o surgimento de tais anomalias ou qualquer desvio indesejável do alvo. é aplicável é determinado pelos dados disponíveis. Sem verdades fundamentais, por exemplo, é estima o número de visitas não planejadas causadas por mau funcionamento das portas. Prever probabilidades A meta de análise constitui uma ponte entre a meta de negócios e o modelo de aprendizado de máquina. objetivo de negócios). fornecer um modelo prescritivo para auxiliar os técnicos de manutenção com a raiz ser usado para responder à seguinte pergunta: “Se uma visita de manutenção preventiva fosse a aprendizagem poderia ser treinada para avaliar o risco de mau funcionamento usando registros de manutenção também - mais dados suportam algoritmos mais complexos. Caso o objetivo analítico seja uma previsão objetivo de negócios. Isso ocorre porque certos elevadores podem ser permanentemente mais propensos a técnico de manutenção com uma lista das causas mais prováveis para um problema potencial ou já existente O objetivo do ics deve ser simples e permitir a definição de questões de pesquisa concisas e mensuráveis. respeitoao objetivo comercial de reduzir a taxa de mau funcionamento das portas?” Objetivo analítico: prever o valor de uma visita de manutenção preventiva (com relação ao falhas passadas estariam disponíveis como verdade básica no treinamento. para a realização das visitas de manutenção preventiva. Esta sequência é a que mini- Note que este é um objetivo de previsão pura. Especificamente, não está no escopo desta tese A existência de um mau funcionamento da porta por si só não é a informação mais útil em relação à problemas de forma eficaz. Alternativamente, algoritmos de aprendizagem de máquina supervisionados poderiam ser aplicados Machine Translated by Google 1.3 Objetivo da tese rendimento em comparação com o esforço de implementação. Ou seja, seria simples colocados em um simples calendário baseado em agendamento) e coletar os benefícios com um menor manutenção apenas porque a taxa prevista de mau funcionamento é elevada. Uma abordagem melhor é avaliando a chamada sobrevivência dos elevadores. Essas técnicas extraem informações modelo prognóstico simples é treinado com dados de monitoramento de condições. Agora, este modelo pode esses elevadores provavelmente se beneficiarão de atenção imediata. Um pequeno, mas significativo as operações são uma ocasião rara - a maioria dos períodos de observação não terminam com um mau funcionamento, mas parece duro, pois significa buscar vitórias fáceis e descartar aqueles elevadores que não dados, especialmente com relação à meta analítica definida. Interesse especial está em de- como novo). Neste contexto, a sobrevivência significa que o elevador não desenvolve um defeito na porta. para programar visitas de manutenção preventiva tendo em conta a previsão (conforme opção) em peças de reposição para elevadores, o que significa que não há utilidade em realizar a manutenção preventiva apenas para comparar a sobrevivência de um elevador médio com um recém-mantido objetivo de negócios. Outra justificativa para o objetivo analítico é que ele oferece potencialmente um alto visitas de manutenção baseadas em recomendações de um modelo prognóstico alavancando con- Os métodos de análise de sobrevivência, amplamente utilizados na área médica, são aplicados para a partir de observações parciais (ou seja, os chamados dados censurados). Isso é útil, pois a porta funciona mal para distinguir os elevadores cuja condição é detectada como tendo piorado rapidamente, como mudança no próprio processo de negócios. como a taxa de mau funcionamento da porta geralmente se desenvolve após uma visita de manutenção. Então, um 11 diferença a fazer, o que se reflete na meta analítica. A meta analítica pode O objetivo da tese é extrair insights de registros de manutenção e monitoramento de condições. por uma visita de manutenção preventiva (que se presume restaurar a condição da porta para o estado aumentando a taxa geral de mau funcionamento das portas como um todo, programando ações preventivas beneficiar de visitas de manutenção preventiva. No entanto, é imperativo, dada a função. Um certo estimador estatístico não paramétrico é usado primeiro em rec- dados de monitoramento de condições (em oposição ao agendamento atual baseado em calendário). elevador. Isso dá uma ideia de como a visita de manutenção fornece valor em média, bem como problemas do que outros. Por exemplo, o proprietário do elevador pode estar relutante em investir Machine Translated by Google 1.4 Questões de pesquisa e hipóteses de pesquisa objetivo de negócios) é examinado retrospectivamente usando um conjunto de dados da vida real, modelo por modelo. Além de responder às questões de pesquisa, a tese propõe um método específico para 12 agendamento de visitas de manutenção preventiva com base no benefício previsto em termos Assim, ficou estabelecido que a previsão do valor de uma visita de manutenção preventiva ser inferido para uma estimativa de sobrevivência usando dados de monitoramento de condições. Desempenho de é uma meta analítica útil. Vamos prosseguir definindo as questões de pesquisa mais interessantes de sobrevivência melhorada (ou seja, tempo para mau funcionamento) após a manutenção. Uma hipótese nula é que o método proposto não é mais benéfico no agendamento da manutenção preventiva o modelo é avaliado por meio de validação cruzada e suas deficiências são discutidas. Em seguida, um questões a serem abordadas no restante desta tese: visitas de financiamento como o método atual baseado em calendário. Invertendo isso, a pesquisa hi- 1. Quanto uma visita de manutenção preventiva melhora a taxa de mau funcionamento da porta? um modelo de rede neural mais complexo é treinado com os dados de monitoramento de condições e a hipótese é a seguinte: Hipótese de pesquisa: Método proposto para agendamento de visitas de manutenção preventiva seu desempenho é comparado com o modelo simples. Finalmente, um método é proposto para aproveitando a habilidade de qualquer modelo prognóstico para agendar visitas de manutenção preventiva 2. Como o valor de uma visita de manutenção preventiva se desenvolve ao longo do tempo? 3. Quão bem certos modelos matemáticos podem prever o risco de mau funcionamento da porta com base na condição do elevador. A eficácia do método (para atingir o com base em dados de monitoramento de condições? resultaria em uma taxa menor de mau funcionamento das portas. Machine Translated by Google registrando todos os dias usando informações básicas conhecidas extraídas de registros de manutenção. de mau funcionamento da porta. As conclusões são apresentadas no Capítulo 5. A manutenção baseada em condições (CBM) é discutida em Bousdekis (2018), onde a literatura O conjunto de dados resultante é então usado para treinar o modelo prognóstico. Nesta tese, dois mod- revisão sobre métodos de CBM de última geração é fornecida. Os autores definem manutenção como evitar- Os modelos são treinados e seu desempenho de previsão é avaliado e comparado. As previsões diárias podem ser usadas para avaliar a deriva nas condições do elevador. Elevadores com A tese está organizada da seguinte forma. Primeiro, no Capítulo 2, é feita uma revisão da literatura sobre métodos relevantes ods é fornecido. O foco está em entender que tipo de métodos e metodologias Esta tese apresenta um método para alavancar o aprendizado de máquina no negócio de manutenção. Acredita-se que os maiores desvios beneficiam a maior parte da manutenção preventiva. A cada dia, os elevadores foram usados por outros para responder a perguntas semelhantes. Detalhes da preparação de dados 13 pode ser classificado com base na deriva avaliada. Para examinar a hipótese de pesquisa, uma prática processo de manutenção do prestador de serviços. Mais precisamente, dados históricos sobre manutenção visão são descritos no Capítulo 3, e também a metodologia da pesquisa é descrita. Re- os resultados da pesquisa são apresentados no Capítulo 4, onde o desempenho de dois modelos prognósticos visitas é usado para treinar ummodelo de aprendizado de máquina cujas previsões representam o risco nível de desenvolvimento de mau funcionamento da porta. As previsões são feitas diariamente. Método estudo de caso estatístico é feito (em retrospecto) para quantificar se a manutenção em elevadores classificados tem sido historicamente mais benéfico do que o elevador médio. Caso começa primeiro formando um conjunto de dados reais de monitoramento diário de condições e depois estudo também fornece uma estimativa de quanto o método proposto poderia reduzir a taxa é relatado e a hipótese de pesquisa é examinada por meio de um estudo de caso. Finalmente, 1.6 Esboço 1.5 Método proposto 2 TRABALHOS RELACIONADOS Machine Translated by Google intervalo de tempo fixo. A política de CBM (também conhecida como manutenção preditiva) está aprimorando isso como obtidos por meio de inspeções regulares, denominadas monitoramento de condições. Monitoramento de condições- seguintes três categorias de manutenção: manutenção de avarias, manutenção preventiva baseada no tempo distribuição de vida útil (MRL) usando covariáveis do sistema obtidas por meio do monitoramento de condições. técnicas têm sido usadas principalmente em estudos clínicos para estimar a eficácia de tratamentos médicos manutenção ativa (ou reativa), manutenção preventiva e manutenção preditiva 14 ambos. Uma separação útil de preocupações é feita por autores onde um modelo prognóstico é sistema portuário. Modelos de degradação multi-estado foram propostos onde o suporte à decisão A vantagem é que ele melhora o tempo de serviço do equipamento, eliminando alguns dos para produzir previsões instantâneas. Então, um método de suporte à decisão separado forma o els assumem um processo de degradação contínuo onde o processo de degradação é descrito o intervalo de tempo de manutenção também é afetado pela condição percebida do equipamento termos de produtividade ou eliminação de avarias. Eles sugerem uma taxonomia de Antes de nos aprofundarmos nos modelos específicos do CBM, vamos discutir os modelos mais gerais não levar em consideração a condição do equipamento, pois o equipamento é mantido em tomador de decisões humano em consideração. processo de vários sistemas. O objetivo desses modelos é prever os resíduos marginais do sistema Novas previsões são feitas a cada momento de inspeção para serem consumidas pelo suporte de decisão. manutenção e CBM. Em outras literaturas, categorias semelhantes são chamadas de correções A análise pode ser baseada em inspeções no local ou na coleta on-line de dados de sensores ou métodos para analisar o tempo até a ocorrência de um evento de interesse. Essas técnicas mento com o tempo da morte como o evento de interesse mais comum. Por exemplo, dado um conjunto (Wu 2007). Vantagem da manutenção preventiva baseada no tempo sobre a manutenção de avarias desenvolvido por meio de monitoramento de condições e o modelo é aplicado em fluxos de dados em tempo real método é implementado como processo de decisão de Markov. No entanto, a maioria dos mod- política final do CBM usando uma função de custo personalizada que leva em consideração as preferências e escolhas do avarias de forma proativa. No entanto, a política de manutenção preventiva baseada no tempo não usando, por exemplo, um modelo estocástico como o processo Gamma (Castro 2012). Diferentes modelos prognósticos têm sido utilizados na literatura para modelar o processo de degradação conceitos que vão sob o nome de análise de sobrevivência. A análise de sobrevivência lida com um conjunto de reduzindo a quebra de equipamentos e melhorando o desempenho empresarial, por exemplo, em Machine Translated by Google 2.1 Funções de sobrevivência é dito ser censurado à direita. (Existem também observações censuradas à esquerda, onde o evento A função de sobrevivência S(t) é uma função que fornece a probabilidade de que o evento de interesse (por exemplo, função de densidade de probabilidade para o tempo de vida restante, dado que o sujeito sobreviveu até de interesse ocorreu antes do início do período de observação, como o surgimento da criança morte ou falha) ainda não aconteceu no momento t. Função de sobrevivência, que também é algumas- um momento t0, pode ser escrito agora como segue: primeiro dente.) Agora, no contexto dos elevadores, a grande maioria dos elevadores nunca passa por vezes referida como função de sobrevivência (Armitage 2002) ou como função de confiabilidade (Wol- 15 de pacientes onde alguns recebem um tratamento experimental e outros não, sobrevivência o evento de interesse (por exemplo, mau funcionamento da porta). No entanto, é importante saber que um stenholme 1999), é derivado da função de distribuição cumulativa F(t) usando o seguinte- a análise pode ser usada para determinar (e quantificar) se o tratamento teve efeito estatisticamente o elevador ficou livre de avarias até ao ponto de censura, e a análise de sobrevivência fórmula de ing onde T é uma variável aleatória contínua e f denota sua densidade de probabilidade efeito significativo na vida dos pacientes. O que torna esses métodos particularmente técnicas são projetadas para tirar proveito dessas informações. O processo de censura é função ty: interessante é que eles extraem informações de observações censuradas. Por exemplo, diz-se que não é informativo se os tempos de censura e os tempos dos eventos forem independentes entre si (1) alguns pacientes podem abandonar o estudo clínico ou podem ainda estar vivos quando o estudo for concluído outro, o que significa que a censura não vaza informações sobre a sobrevivência do sujeito. O gráfico de S(t) em relação a t é chamado de curva de sobrevivência. termina. Tal paciente, não vivenciando o evento de interesse durante o período de observação, A função de sobrevivência se presta bem para estimar distribuições de tempo de vida. Por exemplo, Machine Translated by Google 2.2 Estimador de Kaplan-Meier morte em um momento específico no tempo, desde que o sujeito tenha sobrevivido até aquele momento. Vamos prosseguir discutindo as funções de sobrevivência mais relevantes utilizadas no campo da A função de risco h(t) é derivada da função de sobrevivência e da função de densidade de probabilidade análise de sobrevivência. do seguinte modo: (2) (4) O estimador de Kaplan-Meier é um estimador não paramétrico que foi introduzido pela primeira vez em A derivada em relação ao tempo produz a função de densidade de probabilidade do re- Finalmente, uma função de risco cumulativa H(t) é definida como integral da função de risco Kaplan (1958) - um artigo fundamental que foi citado dezenas de milhares de vezes tempo de vida principal em t0: e sua relação com a função de sobrevivência é: 16 (3) (5) Às vezes é conveniente usar a chamada função de risco que fornece a taxa de risco Diferentes funções estatísticas foram usadas para modelar a função de sobrevivência. Estas podem (ou seja, taxa de mortalidade) como uma função do tempo t. A taxade risco fornece a probabilidade de o sujeito podem ser categorizadas como funções de sobrevivência não paramétricas, semiparamétricas e paramétricas. Machine Translated by Google 2.3 Modelo de riscos proporcionais de Cox a sobrevivência do sujeito é multiplicativa em relação à taxa de risco. Em outras palavras, Onde o produto é tomado em todos os intervalos de tempo discretos ti onde pelo menos uma morte ocorreu número de pacientes, é então possível visualizar (e quantificar) o quanto os diferentes a mudança no valor de uma única covariável (outras permanecendo constantes) diminui (ou aumenta) o (incluindo o intervalo de tempo t). di é o número de mortes no intervalo de tempo ti e ni denota o número os genótipos afetam as curvas de sobrevivência correspondentes dos pacientes e se o efeito é taxas de risco com uma quantidade semelhante ao longo do eixo do tempo. A taxa de mudança é de- de indivíduos em risco (indivíduos que ainda não sofreram morte ou perda em estatisticamente significativo. O modelo é, no entanto, limitado na sua capacidade de estimar a sobrevida 17 desde sua introdução há mais de 60 anos. O estimador de Kaplan-Meier é construído a partir de um conjunto timestep ti). Esta fórmula produz uma função de degrau monotonicamente decrescente. O valor vival com base em covariáveis devido à sua não parametricidade. Por exemplo, não pode ser usado para de observações e é usado para estimar a função de sobrevivência das entidades observadas. da função estimadora entre observações amostradas é assumida como constante. Im- prever a sobrevivência de um sujeito individual. Os autores definem o evento de interesse como morte e ocorrência prévia de alguma outra característica importante do estimador de Kaplan-Meier é que ele também alavanca o centro direito evento (ou seja, censura à direita) como perda. O estimador da função de sobrevivência é dado por observações registradas (por meio do número de sobreviventes conhecidos). O modelo de riscos proporcionais (PH) de Cox (Cox 1972) é um modelo semiparamétrico para a seguinte função discreta: Se as covariáveis dos sujeitos observados forem conhecidas, como os genótipos dos pacientes, aproximando a sobrevivência. A principal suposição do modelo é que o efeito de cada covariável para (6) é possível calcular estimadores separados e agrupados para comparação. Com grandes Machine Translated by Google preditor é protetor e promove a sobrevivência. Em outras palavras, sinal do coeficiente função de risco de base. Se uma distribuição conhecida for assumida para a função de risco de base A resolução da equação de regressão linear produz os coeficientes (ou seja, riscos proporcionais). 18 função, então o modelo resultante é chamado de modelo PH paramétrico. Curiosamente, se Cada coeficiente estimado ÿi representa uma mudança esperada do logaritmo da razão de risco A função de risco de Weibull é assumida como a linha de base, então o modelo satisfaz os requisitos por unidade de mudança na covariável Xi correspondente (assumindo que todas as outras covariáveis determinado pelos coeficientes estimados do modelo. Formalmente, a função de risco agora assume elementos de um modelo de tempo de falha acelerado. permanecer constante). Isso pode ser visto facilmente escrevendo: o formulário: 2.3.1 Razão de risco (9) (7) Assim, a razão de risco é a razão entre a função de risco do indivíduo e a linha de base Por exemplo, se a covariável Xi for um preditor dicotômico (por exemplo, fumar vs. não fumar), Onde X é um vetor coluna das covariáveis do sujeito e ÿ é um vetor coluna de função de risco. O modelo tem a propriedade conveniente de que o logaritmo natural do risco então exp(ÿi) produz sua contribuição para a taxa de risco. Se a contribuição for maior os coeficientes correspondentes, e h0(t) é uma função de risco de base que é aplicável a razão HR(X) é uma função linear das covariáveis: do que um, então o preditor aumenta o risco de morte. Se for menor do que um, então o quando todas as covariáveis são definidas como zero. O modelo não faz nenhuma suposição sobre a forma do (8) Machine Translated by Google ao conjunto R ao longo dos tempos de morte. Em cada tempo de morte distinto Xj, a contribuição para Onde S0(t) é a função de sobrevivência de base e HR(X) é a razão de risco. Esta fórmula é usada- estimativas de verossimilhança (MLE) para os coeficientes do modelo. O ajuste é normalmente feito usando um a probabilidade parcial é: completo quando S0(t) está disponível e o modelo Cox PH foi ajustado para calcular HR (X). pacote de software estatístico, como o Lifelines (2019), que também fornece informações de confiança consistente, o que significa que quando funções dos humanos ou tempo de serviço das máquinas, como exponencial, gama e O capô L sobre todos os tempos de morte pode ser escrito como: número de mortes aumenta, as estimativas estão convergindo para os valores reais (Armitage Distribuições Weibull (Wolstenholme 1999). Cada uma dessas distribuições é detalhada (12) (2002). 20 Esta é a probabilidade parcial definida em Cox (1975). Note que não há suposições sobre sub- O modelo de riscos proporcionais de Cox ainda é hoje o modelo mais amplamente utilizado em sobrevivência a distribuição de mentiras é feita quando a função de risco de base foi cancelada. Como- análise. É um método seguro e comprovado de usar, pois não faz suposições sobre a dis- Machine Translated by Google distribuição permitindo que a taxa de risco aumente (ou diminua) ao longo do tempo. Muito mais realista Isto é conhecido como expressão de distribuição Weibull de três parâmetros. Os três pa- hipótese de tique para equipamentos mecânicos, razão pela qual a função de risco Weibull é Os parâmetros são parâmetro de forma (ÿ), parâmetro de escala (ÿ) e parâmetro de localização (ÿ). Quando amplamente utilizado em modelagem prognóstica. Devido à sua importância no campo da confiabilidade en- o parâmetro de localização não é usado, ele é definido como zero e a equação é reduzida ao seu valor máximo multado por seus parâmetros. A distribuição exponencial tem um único parâmetro lambda que engenharia, vamos examinar as propriedades da distribuição Weibull um pouco mais de perto. forma comum de dois parâmetros: é o número de eventos por unidade de tempo (ou seja, taxa de mortalidade no contexto da análise de sobrevivência). 2.4.1 Distribuição Weibull (15) A distribuição exponencial estimaria perfeitamente a função de sobrevivência se a probabilidade A função de densidade de probabilidade de uma variável aleatória distribuída de Weibull em sua forma mais Que na verdade é um produto da função de risco e da função de sobrevivência, sendo elas: da morte seria constante em cada ponto do tempo. Obviamente, isso não é muito aplicável a forma geral é (Weibull 1951): 21 suposição com relação à manutenção baseada na condição, onde a função de sobrevivência é as- (14) supostamente depende das covariáveis do sistema. A distribuição Weibull estende a distribuição exponencial Onde f(t) ÿ 0, ÿ > 0, ÿ > 0, ÿ 1 a função de densidade de probabilidade tem um ponto de inflexão em (e1/ ÿ - 1) / e1/ ÿ. Aumentando o parâmetro de escala, mantendo o parâmetro de forma con- permanecer semelhante. A área sob a curva deve permanecer a mesma e, portanto, o alongamento faz com que o pico da distribuição se mova para baixo. 1, a taxa de risco diminui ao longo do tempo e para ÿ > 1 aumenta ao longo do tempo, como pode ser visto constante, estende a distribuição ainda mais para baixo no eixo do tempo. O formato da distribuição irá distribuição. Isto constitui um ponto de equilíbrio onde a taxa de risco é constante. Para ÿ 2 a função de risco 23 Machine Translated by Google Figura 3. Curvas de sobrevivência de Weibull. 17). Ao utilizar modelos paramétricos, deve-se ter cuidado para que a distribuição utilizada seja representativa. representativo do fenômeno subjacente que deve ser modelado. Uma técnica chamada o gráfico de probabilidade pode ser usado para garantir isso. A ideia é traçar estimativas de acumulação curva vival que pode ser obtida plotando a função de sobrevivência de Weibull (Equação 2.4.2 Diagrama de Weibull função logarítmica. A Figura 3 ilustra como os parâmetros de forma e escala afetam a superfície a ação cresce mais como uma função exponencial e com 1> yi e pj > pode dobrar o risco de uma parada cardíaca, e a pressão alta pode fazer o mesmo. pares ordenados (ou seja, concordantes) para todos os pares comparáveis. O par é comparável se o menor dos pi. O índice C produz a razão de tais pares concordantes para todos os pares comparáveis. Empates (pj = pi) O modelo implicaria apenas um risco quádruplo para um indivíduo com ambas as condições. os tempos de observação são para a morte ou os tempos de observação são iguais e um deles é pode ser assumido como quebrado aleatoriamente. Formalmente, isso pode ser expresso como: 26 (25) para morte e o outro é para perda. Sua interpretação é semelhante à área sob ROC (26) Novamente, os parâmetros da distribuição podem ser estimados aplicando o método MLE. curva (AUC), o que significa que o valor 0,5 indica que o modelo não tem nenhuma habilidade, e o valor 1 Onde C é um conjunto de pares comparáveis e o indicador I retorna 1 para par concordante e 0 indica um modelo perfeito. A métrica é calculada da seguinte forma. Sejam observações um conjunto para par discordante. O índice de concordância de Harrell (índice C) é a métrica mais utilizada na avaliação do desempenho. de tuplas (yi, di) onde yi denota o tempo até o evento de interesse e di denota o tipo do objeto- desempenho de modelos de sobrevivência. Foi desenvolvido para avaliar modelos prognósticos ajustados com sobrevivência (1 para morte 0 para perda). Assuma um modelo prognóstico que pode quantificar a sobrevivência O modelo Cox PH tem suas deficiências. Uma desvantagem é que as interações entre co- dados censurados (Harrell 1982). O índice C mede o quão bem o modelo preserva os dados em pares de covariáveis, e as previsões (denotadas como pi) são comparáveis entre si. 2.5 Índice de concordância 2.6 Redes neurais Machine Translated by Google covariáveis variáveis. Essa desvantagem também precisa ser abordada com engenharia de recursos, muito progresso foi feito nessa área. No entanto, também é um processo trabalhoso e modelo complexo que é capaz de explicar interações de recursos inerentemente. Veja a página 28 em A rede neural artificial (RNA) como conceito é algumas vezes creditada a um artigo publicado reconhecimento de entradas digitais. O treinamento do neurônio foi implementado usando um remediar as deficiências do modelo Cox PH com relação a isso. Mais um incômodo 27 modelos vivos nesta tese. Sabe-se que as redes neurais são capazes de aproximar com- rons, inspirados em como os neurônios no cérebro humano podem funcionar, usando circuitos elétricos. Mesmo é importante saber o nível de risco absoluto. Em terceiro lugar, ao contrário das redes neurais recorrentes, Além disso, as redes neurais, ao contrário dos métodos populares de árvores de decisão, podem modificar inerentemente descreveu o Perceptron, um modelo de como o cérebro humano aprende a reconhecer objetos (Ros- Poder-se-ia aplicar a engenharia de recursos manuais para remediar este problema ou usar uma abordagem mais o que acrescenta complexidade. Não há dúvidas de que a engenharia de recursos é uma disciplina por si só e engenharia elétrica pelo professor Bernard Widrow e seu aluno de pós-graduação Ted Hoff etapas de expectativa, os modelos tradicionais de sobrevivência não têm inerentemente qualquer noção de tempo. A capacidade das redes neurais na análise de sobrevivência foi publicada recentemente. Um conciso 2.6.1 Advento das redes neurais na década de 1940, McCulloch (1943), onde os autores modelaram uma rede simples de neurônios artificiais Martinsson (2016) para uma discussão sobre diferentes abordagens que foram desenvolvidas para às vezes o tempo é essencial. Por estas razões, vamos olhar para além do tradicional sur- ADALINE, para “neurônio linear adaptativo” e implementou um classificador binário para padrões Conjunto 4x4 de interruptores de alternância para alimentar padrões de entrada e um único interruptor de alternância para sinalizar é que o modelo Cox PH só produz taxas de risco para preditores. Geralmente, é mais útil- funções de mapeamento complexas, então por que não também aquela entre covariáveis e curvas de sobrevivência? mais frequentemente, a invenção do conceito é creditada ao psicólogo Frank Rosenblatt, que el também interações temporais por meio da adição de camadas recorrentes. Muitos artigos sobre aplicações que pode extrair relações temporais de dados de monitoramento de condições em diferentes níveis enblatt 1958). No entanto, um trabalho prático fundamental foi introduzido no campo da uma revisão da literatura sobre estes assuntos é fornecida na Subseção 2.6.2. (Widrow 1960) que implementou um circuito de processamento de sinal adaptativo. Foi nomeado ções. Na vida real, o risco pode ser maior, devido aos preditores se amplificarem mutuamente. Machine Translated by Google Figura 4. Circuito ADALINE (Widrow 2005). rede neural feed-forward baseada em circuitos ADALINE. Foi a primeira rede comercial 2.6.2 Redes neurais para análise de sobrevivência Quando se trata de usar redes neurais para análise de sobrevivência, pesquisas foram feitas aplicação de uma rede neural, implementando um filtro adaptativo para cancelamento de eco em linhas telefônicas. Desde então, o número de aplicações de redes neurais aumentou avançaram lentamente, mas ainda assim o reconhecimento de padrões é onde eles se destacam. a saída binária desejada. A adaptação dos pesos foi governada pelo método chamado principalmente na área médica. A seguir, vamos rever alguns dos 28 mais relevantes descida mais íngreme e uma função de perda que mais tarde foi denominada mínimo quadrado médio (LMS). Grande parte da fundação inicial ainda se mantém, enquanto novos conceitos submergiram no anos como retropropagação, descida de gradiente estocástico, redes neurais recorrentes Os pesos correspondem às configurações do potenciômetro que foram ajustadas manualmente. A Figura 4 é de Widrow (2005), onde a Professora Widrow conta casualmente a história 45 anos depois. (RNN). No restante do artigo, o termo rede neural é usado como um termo genérico para se referir a qualquer tipo de algoritmo baseado no conceito de neurônios. Mais específico ADALINE foi seguido por MADALINE, que era um sistema de três camadas totalmente conectado termos, como RNN, são usados para se referir a arquiteturas mais específicas de redes neurais. Machine Translated by Google pela data do diagnóstico. As covariáveis incluem dados demográficos e socioeconômicos Um modelo que consiste em um sistema hierárquico de redes neurais para prever a sobrevivência de indo. (a tabela é obtida usando ANN em um conjunto de dados de validação). Previsões de MRL corrigidas por seis pontos de tempo discretos na curva de sobrevivência (1, 2, 3, 4, 5 e 6 anos), o que significa equilíbrio entre manutenção de avarias e manutenção preventiva). fornecer comparação entre o modelo desenvolvido e um método mais simples onde seis iso- método de suporte para manutenção preditivade equipamentos rotativos (ou seja, elementos rolantes problema de cação com seis horizontes de previsão diferentes. A curva de sobrevivência começa no momento na curva de sobrevivência. Todas as redes são treinadas por retropropagação. Área sob recepção por unidade de tempo operacional. Os autores definem um sinal de degradação com base no monitoramento de condições O modelo de trabalho (ANN) é usado para prever a porcentagem de vida útil do equipamento a partir do grau equivalente a uma rede neural recorrente, onde as covariáveis são estáticas em cada passo de tempo. ser superior em todos os seis horizontes de previsão. Além disso, o número de in- não monotônicos A rede neural é treinada com dados censurados à direita e um tipo de RNN é usado. apenas em covariáveis de base (por exemplo, marcadores biológicos para progressão da doença) obtidos tem potencial para produzir curvas de sobrevivência (discretas) que não sejam monotonicamente decrescentes tabela para correção do erro cometido pela ANN em comparação com as distribuições MRL reais Em Wu (2007) os autores definem um modelo prognóstico baseado em rede neural e um modelo de decisão Pacientes com AIDS é apresentado em Ohno-Machado (1996). O modelo treinado pode ser consultado variáveis explicativas, marcadores biológicos, achados clínicos e medicamentos. Autores são alimentados em uma matriz de custos que sugere tempos de substituição ideais para a maquinaria (ou seja, essencialmente o problema de avaliar a curva de sobrevivência é traduzido para uma classificação binária redes neurais de feed-forward são usadas para obter previsões para os seis pontos de tempo rolamentos). O método de apoio à decisão é uma função de custo que otimiza o custo esperado 29 características operacionais (AUC) é usada como a métrica principal. O método proposto é mostrado para do diagnóstico de AIDS. Dados censurados são descartados no estudo. O sistema é computacionalmente dados de monitoramento de sensores de vibração e definir um limite de falha. Rede neural artificial- artigos. Dadas as características do CBM, o interesse recai particularmente sobre métodos onde Isso ocorre porque nenhum dado de entrada é inserido no modelo anualmente, mas as previsões são baseadas tervals parece ser muito pior com o método mais simples. No entanto, também a abordagem proposta sinal de radiação e tempo de operação em cada momento de inspeção. Em seguida, os autores usam um separado Machine Translated by Google previsões mais bem informadas. O modelo assume que mortes recorrentes são possíveis, mas de- observações registradas. O nome WTTE-RNN significa Weibull time to event RNN. 2.6.2.2 RNN-SOBREVIVÊNCIA curva de sobrevivência média. Como em Ohno-Machado (1996), o problema é traduzido para uma e as colunas correspondem aos intervalos de tempo. Os itens contêm as covariáveis e a verdade fundamental 30 análise al (Deep-ttf 2018). apresentado. O modelo pode ser usado para prever pontuações de risco pessoal e curvas de sobrevivência observa o tipo de evento (1 para morte e 0 para perda). O modelo treinado pode ser inferido torna-os interessantes é a sua solidez matemática. As funções de perda são derivadas sobre modelos concorrentes é relatado usando diferentes conjuntos de dados médicos bem conhecidos. Como o melhoria do porto de até 28,4% em relação aos métodos de última geração. Os autores também fornecem visu- arbitrário. Como saída, o modelo fornece uma matriz cujas linhas e colunas correspondem a servações. Isto significa que, se o processo de censura não for informativo (ou seja, censura respondendo ao passo de tempo. Normalmente, a última coluna é a interessante, pois contém o Em Martinsson (2016), uma RNN é usada para aprender distribuições Weibull do centro direito Distribuição Weibull, então a função de perda usada por este modelo é a ideal. curva de sobrevivência e mostram que as curvas de sobrevivência individuais podem ser muito diferentes das Em Giunchiglia (2018), um modelo de rede neural recorrente profunda chamado RNN-SURV é O conjunto de dados de treinamento é uma matriz contínua de tamanho fixo cujas linhas correspondem aos assuntos trabalhos competitivos já submergiram onde o modelo WTTE-RNN é aplicado para sobrevivência combinação de problemas de classificação binária com diferentes horizontes de tempo. O modelo que é uma tupla (t, d) onde t denota o número de passos de tempo para o próximo evento e d de- O autor deriva funções de perda contínua e discreta para treinar o modelo. O que para pacientes médicos. É descrito um estudo comparativo onde a superioridade do RNN-SURV da fórmula geral de log-verossimilhança paramétrica (Equação 25) para objetos censurados à direita com uma matriz de formato semelhante, onde o número de linhas e o número de colunas podem ser o modelo usa dados censurados, os autores usam o índice C como a principal métrica de desempenho e re- 2.6.2.1 WTTE-RNN a entrada e os itens contêm distribuições Weibull estimadas para cada sujeito na correlação os tempos de sobrevivência são independentes entre si), e os tempos de sobrevivência seguem alização onde as curvas de sobrevivência obtidas são comparadas com a média de Kaplan-Meier Machine Translated by Google Em Jing (2019), uma rede neural de feed-forward profunda é proposta para prever a sobrevivência observa uma pontuação de risco que é calculada como uma combinação linear das estimativas de Si . Todos os co- Os autores definem uma função de perda especialmente projetada para lidar com dados censurados. A perda 31 covariável. Os parâmetros do modelo são o número de camadas de feed-forward, o número de camadas recorrentes e os autores mostram uma superioridade geral sobre outros modelos de sobrevivência, como o Cox PH contribuição para a função, enquanto as perdas contribuem apenas se o valor previsto for menor que o Como a rede prevê tanto a curva de sobrevivência quanto a pontuação de risco, os autores também definem a é usado como métrica e o método bootstrap no conjunto de teste é usado para calcular a confiança A interpretação de L2 é que a diferença de classificação em pares de sujeitos deve ser preservada por completamente heurístico, pois não há prova de onde eles seriam derivados de qualquer conhecido função de entropia que considera dados censurados e a segunda é um limite superior de A ANN RankDeepSurv é uma rede neural feed-forward totalmente conectada, exceto para horizonte de tempo correspondente. Si denota a estimativa da curva de sobrevivência e ri e de- 2.6.2.3 RankDeepSurv parâmetro do modelo e pode ser alterado (por exemplo, para corresponder à quantidade de dados disponíveis). (Equação 25). A prova de convergência é, no entanto, dada. Devido à fórmula L2, o tamanho do função é a soma de dois termos L1 e L2. A interpretação de L1 é que as mortes sempre con- as variáveis são estáticas em cada intervalo de tempo, exceto para o número do intervalo de tempo que é usado como um curvas