Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

Mestre em Engenharia - Análise de Big Data
2020
Dissertação de Mestrado
Mikko Alutoin
Förnamn Efternamn
Um estudo de caso sobre portas de elevador
usando modelos prognósticos
Agendamento de manutenção preventiva
Machine Translated by Google
Data de aceitação:
Título:
O resultado foi obtido por meio de um estudo de caso prático usando um conjunto de dados da vida real 
contendo dados de mais de 20 mil elevadores por um período de dois anos. A maior parte do trabalho foi formar 
esse conjunto de dados a partir de dados brutos (parcialmente incompletos) que consistiam em vários registros 
de manutenção e dados de monitoramento de condições em portas de elevadores. Os modelos testados foram 
o conhecido modelo de Riscos Proporcionais de Cox e um modelo de rede neural recorrente mais recente 
chamado Weibull Time to Event RNN (WTTE-RNN).
53
Mikko Alutoin
Métodos de análise de sobrevivência foram usados para extrair informações de observações parciais.
Inglês
Programação de manutenção preventiva utilizando modelos 
prognósticos - Um estudo de caso em portas de elevadores
Antes de treinar os modelos, curvas de sobrevivência estratificadas foram obtidas via estimador de Kaplan-Meier 
para dois grupos: todos os elevadores e elevadores recém-mantidos. A diferença nessas curvas quantifica a 
diferença que a visita de manutenção preventiva geralmente produz.
25.2.2020
DISSERTAÇÃO DE MESTRADO
Supervisor (Arcada):
Em seguida, modelos prognósticos foram usados para produzir previsões diárias da curva de sobrevivência 
para cada elevador. Os elevadores foram classificados usando essas previsões e com base em quanto sua 
condição parecia ter piorado ao longo do tempo (pois isso é pensado para capturar seu potencial de se beneficiar 
da manutenção). Finalmente, uma comparação entre elevadores altamente classificados em todos os 
elevadores é fornecida para demonstrar a habilidade dos modelos.
Arcada
Encomendado por:
Palavras-chave:
Programa de Graduação:
Dr. Leonardo Espinosa
Kone, ciência de dados, rede neural, prognóstico, empresas de 
manutenção, portas deslizantes
Análise de Big Data
Dr. Olli Mali (KONE Oyj)
Número de páginas:
Número de identificação:
Resumo:
Linguagem:
Autor:
O objetivo desta tese é pesquisar como o processo de manutenção de portas de elevadores pode ser otimizado. Para isso, uma 
meta de negócios é definida. É diminuir a quantidade de visitas de manutenção não planejadas causadas por mau funcionamento 
de portas. Uma meta analítica correspondente é definida, que é usada para classificar elevadores que seriam os melhores 
candidatos para manutenção a esse respeito. A tese mostra que o agendamento de visitas de manutenção preventiva usando 
modelos prognósticos seria benéfico para reduzir a taxa de visitas de manutenção não planejadas.
Machine Translated by Google
2 Trabalho relacionado ...................................................................................................... 13
Introdução..............................................................................................................71
4 Resultados ................................................................................................................... 37
3 Metodologia de pesquisa ..................................................................................... 34
CONTEÚDO
Validação da hipótese de pesquisa ......................................................................... 47
Objetivo de negócios ................................................................................................................ 7
3.1
Funções de sobrevivência paramétricas ...................................................................................... 20
3.3
Esboço ......................................................................................................................... 13
Verossimilhança paramétrica ........................................................................................... 25
Razão de risco ......................................................................................................... 18
2.4.2
1.4 Questões de pesquisa e hipóteses de pesquisa ............................................................. 12
3.2
4.3.2
2.2
4.1.1
2.6.1
Funções de sobrevivência ........................................................................................................ 15
Efeito de uma visita de manutenção preventiva...................................................................... 37
Redes neurais............................................................................................................... 26
4.3
Probabilidade parcial .............................................................................................. 19
1.1
Desempenho................................................................................................................ 36
2.4.3
Redes neurais para análise de sobrevivência .............................................................. 28
2.3.1
Desempenho do modelo Cox PH ............................................................................. 42
Distribuição Weibull .............................................................................................. 21
1.3 Objetivo da tese .......................................................................................................... 11
Elevadores do modelo WTTE-RNN................................................................................... 50
Rotulagem .............................................................................................................. 36
2.6
2.1
4.2.2 Desempenho do modelo WTTE-RNN ......................................................................... 46
Multimodalidade dos dados ............................................................................................. 32
4.1
2.3.2
1.6
2.6.2
2.3 Modelo de riscos proporcionais de Cox ............................................................................. 17
4.2 Validação do modelo........................................................................................................... 42
Objetivo de análise ................................................................................................................ 9
2.4.1
Elevadores do modelo Cox PH................................................................................... 47
3.1.1
1.2
Conjunto de dados ................................................................................................................ 35
2.4
4.3.1
2.5 Índice de concordância...................................................................................................... 26
4.2.1
2.7
Treinamento e validação cruzada ...................................................................................... 36
Diagrama de Weibull .......................................................................................................... 24
1.5 Método proposto ............................................................................................................ 13
Estimador de Kaplan-Meier ................................................................................................... 16
Advento das redes neurais ................................................................................... 27
Análise Weibull................................................................................................... 38
Machine Translated byde pacientes médicos. Um estudo de caso com diferentes bancos de dados médicos é realizado
camadas, número de neurônios em cada camada de feed-forward e tamanho do estado LSTM.
modelo. Para um conjunto de dados, o modelo tem melhor desempenho do que especialistas clínicos humanos. C-index
valor observado. L2 fornece contribuições pareadas das observações para a função de perda.
intervalos.
função de perda como uma combinação de duas funções separadas. A primeira é uma função cruzada modificada
a ANN (lembrando que duas perdas não são comparáveis). As funções de perda são com-
gera uma matriz de tuplas (Si, ri) onde cada tupla contém estimativas no final do
o índice C negativo (Raykar 2008).
camada de saída onde os dropouts são adicionados para lidar com o overfitting. O número de camadas é um pa-
fórmula, como a log-verossimilhança paramétrica geral para observações censuradas à direita
Machine Translated by Google
2.7 Multimodalidade dos dados
tipo de tor. Esses dados são armazenados em uma matriz de recursos estáticos bidimensionais. Agora, os dados em
A fatia representa uma janela de histórico que consiste em valores consecutivos de medidas
32
etapa de observação. Esses dados podem ser organizados em uma matriz tridimensional, onde as linhas corres-
características.
proporcional ao número de recursos dinâmicos e ao tamanho da janela do histórico. Assim,
vezes. A terceira dimensão é o número de características, pois cada item na matriz contém todos
funciona, são destinados a serem usados com dados unimodais. Normalmente, isso significa que todas as covariáveis
outra abordagem é resumir a matriz de recursos dinâmicos (ou uma parte dela) por meio da curadoria
el. Recursos selecionados podem então ser inseridos no modelo em vez de dados completos da janela de histórico.
matriz de características dinâmicas, pois contém as medições temporais como características dinâmicas.
modelos com características dinâmicas. Uma abordagem comum é suplementar características estáticas ob-
tical.
No caso de um elevador, tais características estáticas podem ser a marca e o modelo do elevador ou o movimento da porta.
obter uma amostra. Conjunto completo de amostras é formado pela iteração sobre tempos de inspeção.
(Christ 2018) onde o pacote python chamado tsfresh é documentado. Em Leontjeva (2016)
medições desde o início da janela do histórico. O número de recursos vistos pelo modelo é
Os dados de monitoramento de condições são dados sequenciais onde as medições são feitas em cada
elevador é considerado multimodal, o que significa que é uma coleção de elementos dinâmicos e estáticos
correspondem a fontes de dados (por exemplo, um elevador individual) e as colunas correspondem à inspeção
Modelos tradicionais de aprendizagem de máquina, como árvores de decisão ou redes neurais de feedforward
esta abordagem sofre da maldição da dimensionalidade. Para lidar com este problema, um-
são assumidos como estáticos. No entanto, isso não impediu que os pesquisadores usassem o
valores de medição de um elevador no momento da inspeção. Vamos nos referir a esta matriz como dy-
cada característica dinâmica usando estatísticas, modelo estocástico ou modelo de aprendizagem de máquina
conjunto de treinamento é O(n2 ), sendo n o número de observações. Isso pode ser impraticável
Agora, também existem recursos estáticos que permanecem constantes durante todas as etapas da inspeção.
obtido a partir da matriz de características estáticas com uma fatia da matriz de características dinâmicas para
Uma dessas abordagens para extrair características de séries temporais multivariadas é fornecida em
Machine Translated by Google
Figura 5. Um pipeline que pode usar RNN para transformação de recursos (Leontjeva 2016).
per é um classificador Random Forest. Em outras palavras, o modelo final é um pipeline que consiste
dados da série. Em outras palavras, os itens da matriz de características dinâmicas devem ser complementados
com os valores de recursos estáticos. O mesmo conjunto de covariáveis estáticas agora são concatenados para
do transformador de características baseado em RNN e do classificador baseado em RF. Para ser mais preciso, predic-
As informações da RNN são o erro quadrático médio de uma amostra para cada classe, em vez do
autores descrevem outra abordagem onde um modelo, como RNN, é usado para produzir
previsão binária real. Neste aspecto, a abordagem assemelha-se à chamada transformação
valores de medição dinâmicos em cada momento de inspeção, o que leva ao crescimento do terceiro
dimensão da matriz de características dinâmicas pelo número de características estáticas. O suplemento
os recursos selecionados a partir de recursos dinâmicos, conforme ilustrado na Figura 5.
aprendizagem onde apenas a última camada de neurônios de um modelo treinado é treinada novamente usando um sec-
A matriz mentada é então usada pelo modelo, conforme mostrado na Figura 6.
conjunto de dados secundário.
33
A ideia é que o modelo do primeiro estágio seja treinado primeiro usando a primeira metade do conjunto de treinamento. Isto
modelo pode ser um modelo de Markov oculto ou RNN. Então as previsões do
Redes neurais recorrentes, por outro lado, assumem que as características são dinâmicas. Elas são
inerentemente buscando interações temporais entre amostras consecutivas. Portanto, RNN
o primeiro modelo é usado como um novo conjunto de recursos pelo modelo de segundo estágio, que no pa-
não é capaz de considerar quaisquer características estáticas, a menos que sejam transformadas em um tempo fictício
Machine Translated by Google
3 METODOLOGIA DE PESQUISA
Figura 6. Combinando recursos estáticos e dinâmicos criando uma série temporal fictícia a partir de recursos estáticos.
as observações são deixadas de fora. A proporção entre observações censuradas e não censuradas é de aproximadamente
a suposição de riscos proporcionais é válida.
34
aproximadamente 1:30. O processo de censura é considerado não informativo, o que significa que
funções, visitas preventivas e tempos de censura são considerados independentes uns dos outros
outro.
Primeiro, o estimador de Kaplan-Meier é usado para visualizar o efeito geral de uma medida preventiva
visita de manutenção com relação ao tempo de sobrevivência. As amostras são estratificadas com base em se
As questões de pesquisa são analisadas por uma série de exercícios de análise de sobrevivência. Vida real
dados de monitoramento de condições em mais de 20 mil elevadores são usados. Período de tempo do
os dados são de aproximadamente 2 anos. Os dados da máquina são combinados com os dados da visita ao local, para formar um la-
elas são para elevadores recém-mantidos ou não e as curvas de sobrevivência obtidas são plotadas.
Em seguida, são traçados gráficos de Weibull das estimativas de Kaplan-Meier, a fim de avaliar se
conjunto de dados com sinos. O conjunto de dados resultante se concentra em mau funcionamento de portas, outros tipos de mau funcionamento
A distribuição de Weibullpode ser usada para estimar os tempos de sobrevivência e para ver quão bem
Machine Translated by Google
3.1 Conjunto de dados
O conjunto de dados, que foi criado para alimentar os modelos, consiste em uma matriz de recursos dinâmicos
inferido para obter previsões de risco diárias usando dados históricos do conjunto de treinamento. Cox
para o conjunto de dados. Os dias faltantes (ou seja, etapas de inspeção) foram preenchidos usando a política de preenchimento antecipado.
35
curvas que também podem ser classificadas fixando um horizonte de tempo. Os elevadores são atribuídos diariamente
trix é um conjunto de dados multi-indexado, contendo 10 agregados diários de monitoramento de condições
passado e no futuro as próximas visitas preventivas ou não planejadas ocorreram. Esta informação
período de serviço. Finalmente, os elevadores de alta classificação são comparados a todos os elevadores para exame
conjunto de dados corresponde a elevadores e colunas correspondem a dias. A preparação de dados é
ceNão planejado. Finalmente, os recursos estáticos foram mesclados pelo elevador para formar três co-estáticos
característica górica, que ainda estava one-hot-ended antes de treinar os modelos). Dimensionamento final
de uma visita de manutenção preventiva não é diferente dentro do grupo de alto escalão do que
o número total de aberturas de portas foi uma das covariáveis de monitoramento de condição que foi
são plotados usando o índice C como métrica de desempenho para comparação. Os modelos podem ser
pelo menos 90% dos dias em que os agregados de monitoramento diário de condições estavam disponíveis foram aceitos
varia.
Em seguida, o conjunto de dados obtido foi mesclado com registros de manutenção para indicar onde no
O modelo PH produz taxas de risco diretamente, enquanto o WTTE-RNN produz a sobrevivência de Weibull
combinado com a matriz de características estáticas, conforme ilustrado na Figura 6. A matriz de características combinadas
portões para diferentes elevadores e 3 recursos estáticos como séries temporais fictícias. Linhas do
classifica com base em quanto o risco previsto foi aumentado durante a observação em andamento
A informação deu origem a mais duas covariáveis chamadas DaysSincePreventive e DaysSin-
começou formando agregados de monitoramento de condições diárias, por elevador. Por exemplo,
ine a magnitude do efeito de manutenção em retrospecto. A hipótese nula é que o efeito
variáveis, chamadas NumberOfFloors, NumberOfLandingDoors e BuildingType (uma categoria
Dois modelos prognósticos são ajustados com o conjunto de dados e curvas de aprendizagem correspondentes
está em toda a população de elevadores.
agregados por dia de calendário (ver Tabela 1 para outras covariáveis). Apenas elevadores para os quais
As menções do conjunto de dados vistas pelos modelos foram 20.465 linhas, 670 colunas e 27 colunas.
Machine Translated by Google
3.2 Treinamento e validação cruzada
3.3 Desempenho
foi feito antes que qualquer mau funcionamento da porta tenha ocorrido. Supõe-se que as portas são então
calculado por fração do conjunto de treinamento e a média dessas observações formam cada um dos
o número de observações é truncado para 100 000 por escolha aleatória sem substituição
quando o índice C é calculado. O índice C não está muito bem vinculado à hipótese de pesquisa.
pontos na curva de aprendizado. O mesmo elevador nunca aparece em conjuntos de treinamento e teste.
fixado em condições tão boas quanto novas, o que conclui o período de observação em andamento e
Portanto, métricas adicionais são usadas para quantificar o efeito da visita de manutenção preventiva
dentro de um grupo de elevadores (por exemplo, elevadores de alto risco). Primeiro, vamos definir uma métrica chamada
inicia um novo. Normalmente, as avarias são reparadas imediatamente no mesmo dia
3.1.1 Rotulagem
quando foram relatados. Em um caso raro em que o mau funcionamento permanece ativo por mais de um
Este método foi selecionado para garantir que os resultados representarão o verdadeiro poder de previsão
do modelo em dados não vistos. A validação da hipótese de pesquisa é feita usando o
Em um dia, todos os dias ativos são marcados como mortes.
Cada amostra na matriz de características dinâmicas representa uma observação que é uma tupla (t,
mesmo método e com conjunto de dados completo. Em outras palavras, as curvas de elevação representam uma média
36
de 9 rodadas diferentes de validação cruzada.
d) onde t denota o número de dias até a próxima observação e d denota o tipo de observação.
vação (1 para morte, 0 para perda). Neste caso, a morte corresponde a uma avaria na porta reportada
função. A perda pode ocorrer por dois motivos. Pode ser que não haja dados disponíveis após
As curvas de aprendizagem são produzidas usando validação cruzada de 3 vezes em grupo repetidas 3 vezes
onde as divisões são feitas em base de elevador para evitar vazamento de informações entre
censurando o tempo. Outra razão para uma perda pode ser que a visita de manutenção preventiva tenha
entre o conjunto de teste e o conjunto de treinamento. Isso significa que, no total, 9 pontuações diferentes do índice C são
Os modelos são ajustados e comparados pelo C-index como a pontuação, uma vez que ele é projetado para ser usado 
com dados censurados. A desvantagem do C-index é sua complexidade O(n2 ). Portanto,
Machine Translated by Google
4 RESULTADOS
4.1 Efeito de uma visita de manutenção preventiva
menor a razão de risco, maior o aumento. A hipótese de pesquisa agora pode ser definida para-
Na Seção 1.3, foram colocadas uma série de questões de pesquisa e uma hipótese de pesquisa
foi dado. A seguir, as questões de pesquisa são respondidas alavancando a con-
normalmente, como uma expectativa de que para a maioria dos intervalos t, LiftA(t) > Lift(t), onde LiftA é calculado
projetado para elevadores de alto risco e Lift(t) para todos os elevadores.
levante e defina-o como uma razão de riscos cumulativos de duas curvas de sobrevivência. Vamos denotar
Finalmente, uma métrica chamada ganho é definida como a razão de LiftA(t) para Lift(t). Vamos denotar
conjunto de dados da vida real estruturado. Este capítulo é concluído com o exame da pesquisa hi-
hipótese via estudo de caso.
Ganho(t) := LiftA(t) / Lift(t). O ganho é interpretado como o benefício de usar o modelo baseado
Lij(t) := Hj(t) / Hi(t). O lift pode ser interpretado como o inverso da razão de risco para um intervalo
agendamento em vez de agendamento aleatório. Ele produz a redução esperada no número de
t de duas populações de elevadores. Por exemplo, considere duas curvas de sobrevivência i e j que corres-
Vamos examinar como uma visita de manutenção afeta as curvas de sobrevivência. Veja a Figura 7 para dois
curvas de sobrevivência.
responder a duas populações distintas de elevadores. Agora, se Hi(t)não programadas em função dos dias decorridos após a manutenção, o que é relevante
métrica considerando o objetivo do negócio que é diminuir a taxa de visitas não planejadas.
comparado ao grupo j (ou seja, ao comparar suas probabilidades de sobreviver até o tempo t).
37
Machine Translated by Google
Figura 7. Curva de sobrevivência média e curva de sobrevivência após manutenção preventiva.
4.1.1 Análise Weibull
Em seguida, foi utilizada a técnica do gráfico de Weibull, descrita na Seção 2.4.2, para validar
se os tempos de sobrevivência podem ser assumidos como seguindo a distribuição Weibull. Figura 8
mostra o gráfico da curva de sobrevivência média e da curva de sobrevivência basal.
a curva foi produzida considerando todas as observações no conjunto de dados enquanto a segunda curva
no dia anterior.
foi obtido filtrando observações onde a visita de manutenção planejada foi feita
As duas curvas foram obtidas aplicando o estimador de Kaplan-Meier. Sobrevida média
38
Machine Translated by Google
Figura 8. Gráfico de Weibull das curvas de sobrevivência de Kaplan-Meier.
segue razoavelmente bem também, então pode-se concluir que faz sentido tentar
Técnicas de análise de sobrevivência baseadas em Weibull. Linhas de tendência correspondentes que foram ajustadas
já que o gráfico implica uma relação linear entre os eixos x e y. A curva de sobrevivência da linha de base
Especialmente a curva de sobrevivência média parece seguir bem a distribuição de Weibull,
usando o método dos mínimos quadrados são mostrados na Figura 9.
39
Machine Translated by Google
Figura 9. Linhas de tendência para curvas de sobrevivência de Kaplan-Meier traçadas por Weibull.
as linhas devem ser constantes, ln(HR). Agora parece que a taxa de risco da vida real não é con-
constante, mas proporcional ao tempo. Em seguida, foi feito um ajuste de Weibull com as observações corres-
resultados mais precisos. Para que a suposição de Cox PH seja válida, a diferença da tendência-
As linhas de tendência não são paralelas, o que implica que o modelo Cox PH pode não produzir o
correspondendo às duas curvas de sobrevivência usando Lifelines (2019). A Figura 10 mostra diferentes
Visualizações de Weibull para as duas populações.
40
Machine Translated by Google
mau funcionamento da porta, e que o efeito é bastante permanente. Subtraindo os meios do
duas distribuições Weibull produzem 98 dias. No entanto, a curva de elevação inferior direita codifica
informações ainda mais interessantes. Assumindo um período de observação ininterrupto t,
“Como o valor de uma visita de manutenção preventiva se desenvolve ao longo do tempo?”. O Elevador
taxa?”. Isto é melhor resumido pelo gráfico superior direito onde as funções de risco são representadas graficamente
para as duas populações de elevadores. Isso mostra que a manutenção diminui claramente a taxa de
que é “Quanto uma visita de manutenção preventiva melhora o mau funcionamento da porta
Agora que as estimativas de Weibull são conhecidas, vamos tentar responder à questão de pesquisa 1,
elevador mantido. Em outras palavras, Lift(t) quantifica, em média, o benefício futuro do per-
será aproveitado também mais tarde, quando a hipótese de pesquisa for examinada.
41
Lift(t) produz a razão entre as taxas de visitas não planejadas de um elevador médio e um elevador recém-manutido.
formando manutenção preventiva e, portanto, responde à questão de pesquisa 2, que é
Figura 10. Distribuições de Weibull baseadas nas curvas de sobrevivência de Kaplan-Meier.
Machine Translated by Google
1.0
Modelo WTTE-RNN. O índice C pode ser usado para avaliar seu desempenho. Avaliações
1.0
e CPU Intel core i5-6300U (2,40 GHz).
1.0
Razão de risco (por unidade)
NBR_DOOR_REOP_POR_MOTIVO_DESCONHECIDO
O modelo Cox PH foi ajustado com a matriz de covariáveis. Mais precisamente, um modelo Cox PH
1.479
NBR_CORTINA_DE_LUZ_CORTEIO
1.0
Antes de testar a hipótese de pesquisa, vamos primeiro examinar o modelo Cox PH e
A Figura 1 mostra as taxas de risco obtidas por unidade para cada covariável.
NBR_NUDGING
fato de que algumas covariáveis eram altamente correlacionadas entre si. Antes do ajuste, todas as co-
NBR_DOOR_REOP_PELO_BOTÃO_ABERTO
1.391
1.0
foram feitos executando notebooks Jupyter baseados em Python em um laptop com 16 GB de RAM
Covariável
NBR_INÍCIO_ABAIXO
1.161
4.2.1 Desempenho do modelo Cox PH
NBR_OPERAÇÕES_DE_PORTA
1.0
NBR_INÍCIOS_UP
NBR_DOOR_REOP_BY_LIGHT_CURTAIN_CUTS
com penalidade de rede elástica foi usada, pois o modelo Cox PH padrão não é capaz de lidar com a
1.0
42
NBR_DOOR_REOP_BY_SAFETY_EDGE
NBR_FOTOCÉLULA_CORTES
as variáveis foram dimensionadas para o mesmo intervalo (de 0 a 10). O ajuste real levou 20 minutos. Tabela
4.2 Validação do modelo
Tabela 1. Razões de risco do modelo Cox PH por unidade de mudança.
Machine Translated by Google
NúmeroDePortasDeAterrissagem
essas covariáveis estão presentes e nenhuma delas constitui um preditor muito forte. Lembre-se de que
efeito de financiamento, devido à suposição de PH estar ligeiramente errada para o conjunto de dados.
43
nenhuma tendência ou interação é fornecida ao modelo. É possível que, por meio da engenharia de recursos,
Tipo de edifício
1.047
DiasDesdeNãoPlanejado
[0,929,1,126]
nering pode-se construir melhores preditores.
A Figura 11 mostra um gráfico de caixa de razões de risco com intervalos de confiança de 95%, variância,
DiasDesdeManutenção
Os preditores de aumento de risco mais fortes são NBR_DOOR_OPERATIONS,
e média. A Figura 12 mostra as curvas de sobrevivência correspondentes, onde a média de Kaplan-Meier
NBR_DOOR_REOP_BY_LIGHTCURTAIN_CUTS e NumberOfFloors. Mais forte
0,819
a estimativa da Figura 7 é dimensionada pela razão das médias das razões de risco obtidas via Cox
Modelo PH. Comparado com estimadores estratificados de Kaplan-Meier e técnicas de ajuste de Weibull
1.063
NúmeroDeAndares
O preditor de redução de risco é DaysSinceUnplanned (talvez se o elevador estiver funcionando por um longo período)
tempo sem mau funcionamento da porta, é provável que isso aconteça também no futuro). BuildingType ex-
1.321
leva a tantas colunas codificadas one-hot que nos permitem apenas anotar o intervalo que
(cf. Figura 7 e Figura 10) o modelo Cox PH subestima significativamente a manutenção
Machine Translated by Google
44
Figura 12. Efeito da manutenção preventiva pelo modelo Cox PH.
Figura 11. Distribuição das taxas de risco.
Machine Translated by Google
Figura 13. Curvas de aprendizado para o modelo Cox PH com penalidade líquida elástica.
pontos no eixo x. Os gráficos mostram as médias dessas pontuações, bem como o desvio padrão
ções em função do tamanho do conjunto de treinamento.
Os gráficos indicam que o desempenho converge rapidamente e adicionar mais amostras não
índice C máximo de 0,65. A saturação precoce da curva de aprendizagem era esperada, pois
validação cruzada de grupo. Portanto, o modelo foi treinado 9 vezes (3 x 3) para cada um dos
não ajuda muito após o tamanho do conjunto de treinamento de um milhão de amostrasonde o modelo atinge seu
modelo com penalidade de rede elástica. As curvas foram obtidas por meio de 3 vezes repetidas 3 vezes
A Figura 13 mostra como o índice C se desenvolve em função do tamanho do conjunto de treinamento para o Cox PH
o modelo é tão simples. Por outro lado, o modelo parece estável e o overfitting não é
um problema.
45
Machine Translated by Google
Figura 14. Curvas de aprendizado para WTTE-RNN.
usado para treinar o modelo. O conjunto de treinamento consiste em uma matriz cujas linhas correspondem a
elevadores, colunas correspondem a dias e os conteúdos são o monitoramento diário das condições
morte e 0 para perda. A Figura 14 mostra as curvas de aprendizado do modelo. Treinamento do
camadas, seguidas por uma camada LSTM, uma camada densa e uma camada de saída final, e teve
Vamos agora construir um modelo de rede neural baseado em WTTE-RNN (Martinsson 2016).
covatiates e tuplas de verdade fundamental (t, d), onde t denota o tempo até o evento e d é 1 para
O autor do modelo divulgou o código fonte em Python WTTE-RNN (2019) e foi
4.2.2 Desempenho do modelo WTTE-RNN
completamente
46
modelo para o maior tamanho de conjunto de treinamento levou 40 minutos. O modelo consistiu em dois feed-forward
Machine Translated by Google
4.3 Validação da hipótese de pesquisa
Para validar a hipótese por meio de estudo de caso, vamos representar graficamente as métricas LiftA(t) e Lift(t) para ambos
interpretado como potencial para se beneficiar de uma visita de manutenção. Os 15% melhores classificados foram
considerado como de alta classificação e o restante como de baixa classificação. Este limite foi selecionado ad hoc, porque
modelos.
4.3.1 Elevadores do modelo Cox PH
As curvas de aprendizagem mostram que o modelo se beneficia da adição de mais amostras e que o modelo
Para calcular a elevação do modelo Cox PH, foi realizada uma validação cruzada de grupo triplo repetida 3 vezes.
porque forneceu elevadores suficientes no grupo de alto escalão que havia sido mantido (com-
colocar curvas de sobrevivência para um grupo com menos de 20 membros não é confiável e é usado
generaliza bem. Em cerca de 10 milhões de amostras, o desempenho no conjunto de teste é igual a
realizado no conjunto de dados para rotular amostras como amostras de classificação alta ou baixa. Para
pacote matemático deu um aviso sobre isso). O ajuste de Weibull foi feito em todas as rodadas e corre-
em cada rodada, o conjunto de trem foi usado para ajustar o modelo Cox PH com penalidade de rede elástica e ajustado
do conjunto de treinamento C-index sendo cerca de 0,71, o que é cerca de 6 pontos percentuais maior
curvas de sobrevivência e curvas de elevação correspondentes foram calculadas. A Figura 15 mostra a média de
as curvas de sobrevivência para elevadores de alto escalão (grupo A) e todos os elevadores.
do que o do modelo Cox PH em saturação.
modelo foi usado para prever as taxas de risco para as amostras de teste. Então cada previsão foi
normalizado subtraindo a razão de risco de base que foi a previsão no primeiro
A hipótese de pesquisa foi esculpida no Capítulo 1 e formulada formalmente no Capítulo 3.
dia do período de observação. Isso deu a classificação do elevador, que pode ser inter-
47
Machine Translated by Google
O eixo y é para os elevadores, enquanto o eixo y direito é para o ganho.
48
mostrado na Figura 16, bem como sua relação referida como Gain(t) := LiftA(t) / Lift(t). Esquerda
A hipótese de pesquisa é validada pelo exame dos gráficos LiftA(t) e Lift(t) que são
Figura 15. Estimativas da curva de sobrevivência no estudo de caso com modelo Cox PH.
Machine Translated by Google
A visita de manutenção reduz a taxa de futuras visitas não planejadas por um fator X em todos os grupos de elevadores
e fator XA no grupo de classificação alta. Escrevendo X = 1 / Lift e XA = 1 / LiftA, produz Gain
= X / XA. O ganho sendo 1,15 em 300 dias significa que a razão entre as taxas esperadas de não-
visitas planejadas logo após a manutenção nos dois grupos é XA / X = 1 / 1,15 que é
a programação produziria 13% menos visitas não planejadas do que a programação atual (ganho sendo
um elevador médio e um elevador recém-conservado. Agora, vamos denotar que um elevador em manutenção
1,15 em 300 dias). Para ver isso, lembre-se de que o aumento produz a proporção de taxas de visitas não planejadas de
Fixar o intervalo de manutenção para, por exemplo, 300 dias, o modelo Cox PH baseado no cronograma
em torno de 0,87. Em outras palavras, o valor esperado de visitas não planejadas no grupo de alta classificação
é 13% menor do que no grupo de todos os elevadores.
49
Figura 16. Elevações e ganhos no estudo de caso (modelo Cox PH).
Machine Translated by Google
Figura 17. Estimativas da curva de sobrevivência no estudo de caso com modelo WTTE-RNN
Exercício semelhante foi feito com o modelo WTTE-RNN. A Figura 17 representa graficamente a média do
A Figura 18 mostra os elevadores e ganhos correspondentes para o modelo WTTE-RNN. O ganho para
curvas de sobrevivência para os elevadores de alto escalão (grupo A) e todos os elevadores.
4.3.2 Elevadores do modelo WTTE-RNN
O intervalo de manutenção de 300 dias é de 1,39 em comparação com 1,15 obtido com o Cox
Modelo PH. As reduções respectivas na quantidade de visitas não planejadas são de 28% e 13%.
50
Machine Translated by Google
5 CONCLUSÕES
Figura 18. Elevações e ganhos no estudo de caso (modelo WTTE-RNN).
cabe na maioria das visitas de manutenção preventiva.
registros de manutenção e dados de monitoramento de condições (20 mil elevadores por um período de dois
Métodos de análise de sobrevivência foram usados para analisar os dados disponíveis que consistiam em manutenção
anos). Os dados de monitoramento de condições foram agregados em um nível diário. Primeiro, os dados de
agendando as visitas de manutenção preventiva conforme recomendações do modelo.
A ideia é que um modelo prognóstico possa ser usado para filtrar elevadores que se beneficiariam
um modelo prognóstico poderia ser usado para diminuir a taxa de mau funcionamento das portas do elevador
O objetivo da tese foi estudar como as portas dos elevadores respondem à manutenção e como
51
Machine Translated by Google
dados de monitoramento e um modelo semiparamétrico chamado modelo Cox PH foi usado para aproximar
inferido para sobrevivência usando dados de monitoramento de condição. O desempenho do modelo foi
elevadores contidos. Além disso, a chamada técnica de diagrama de Weibull foi usada para estabelecer
inferindo um modelo prognóstico para estimativas de sobrevivência diária de todos os elevadores desde o início de
elevadores de classificação. Em seguida, curvas de sobrevivência estratificadas foram calculadas realizando um Weibull
ajuste Weibull estratificado para os dois grupos, o que proporcionou uma boa visualização contínua de
um modelo de rede neural mais complexo chamado WTTE-RNN foi realizado. Foi estabelecidocondição do elevador. Acredita-se que os elevadores com maior deriva sejam os que mais se beneficiam de uma
e como o valor de uma visita de manutenção preventiva se desenvolve ao longo do tempo (questões de pesquisa
modelo e o modelo WTTE-RNN respectivamente. Esta análise respondeu à pesquisa
as visitas de manutenção seriam baseadas nas recomendações do modelo (ou seja, o desvio), em vez
registros de manutenção. Isso foi feito para dois grupos: todos os elevadores e recém-manutenção
estimar a sobrevivência. Ao contrário do estimador de Kaplan-Meier, um modelo de Cox treinado pode ser
Foi realizado um estudo de caso para validar a hipótese de pesquisa utilizando o método proposto
Em seguida, um conjunto de dados da vida real foi construído usando os registros de manutenção e as condições
com base em dados de monitoramento de condições?”).
programação baseada no monitoramento da condição da manutenção preventiva. O método se baseia em primeiro lugar
seus períodos de observação atuais. Essas previsões são então usadas para avaliar a deriva em
que os tempos de sobrevivência seguem aproximadamente a distribuição de Weibull. Isso justificou a realização
avaliados usando validação cruzada e uma métrica chamada C-index. Uma análise comparativa para
No estudo de caso, foram utilizadas recomendações do modelo prognóstico para selecionar altas diárias
52
como uma visita de manutenção geralmente melhora a taxa de mau funcionamento da porta (questão de pesquisa 1),
constatou-se que o índice C para os modelos em saturação foi de 0,65 e 0,71 para o Cox PH
visita de manutenção preventiva. A hipótese da pesquisa foi que se o agendamento da visita de manutenção preventiva
pergunta 3 (“Quão bem certos modelos matemáticos podem prever o risco de mau funcionamento
ção 2).
do que o agendamento baseado em calendário, a taxa de mau funcionamento das portas diminuiria.
Finalmente, foi proposto um método para diminuir a taxa de mau funcionamento das portas por meio de con-
com dados históricos. Tanto o modelo Cox PH quanto o WTTE-RNN foram avaliados.
As curvas vivais foram obtidas ajustando um estimador não paramétrico de Kaplan-Meier com o
Machine Translated by Google
conceito denominado Ganho foi utilizado para comparar o efeito de manutenção dentro do alto
elevadores de alta elevação ficariam sem carga, deixando o algoritmo de agendamento com uma distribuição bastante homogênea.
trabalho adicional para quantificar o benefício real da alavancagem dos métodos discutidos no
tese. Uma comparação entre o agendamento baseado no monitoramento de condições proposto e
grupo nous de elevadores para selecionar. Outro ponto prático a considerar é que o
elevadores de classificação e todos os elevadores. Uma curva de ganho foi obtida pela divisão dos dois elevadores
o agendamento baseado em calendário forneceria resultados claramente quantificados sobre a eficácia e
aplicabilidade do método proposto.
curvas. Da curva de ganho , foi derivado um resultado, que o método de escalonamento proposto
adequado para os elevadores recém-mantidos e todos os elevadores. Isso foi feito separadamente para
diminuiria a taxa de mau funcionamento da porta em 13% usando o modelo Cox PH e em 28%
a função de perda do modelo WTTE-RNN depende do processo de censura não ser
informativo. Agora, se as decisões de agendamento fossem baseadas no modelo WTTE-RNN,
os elevadores de alto escalão e todos os elevadores (ou seja, quatro curvas de sobrevivência foram obtidas alto-
utilizando o modelo WTTE-RNN (quando foi assumido um intervalo de manutenção de 300 dias).
então a censura não seria mais estritamente não informativa (como causa de visita preventiva
53
Como o estudo de caso foi feito retrospectivamente, não é possível antecipar o momento exato
juntos). Uma função chamada Lift foi definida para capturar o efeito de manutenção como uma função
censura). Períodos de observação que terminam devido à visita de manutenção preventiva sendo
programado pelo modelo deve, em teoria, ser descartado de futuros conjuntos de treinamento. Isto
tempo (ou seja, como uma visita de manutenção preventiva geralmente melhora a sobrevivência dentro
o grupo particular de elevadores). Usando as quatro estimativas da curva de sobrevivência, dois elevadores
alteração na taxa de mau funcionamento de portas relatadas caso o método proposto seja usado em
vida real. No início, o algoritmo poderia ser capaz de selecionar elevadores cujas portas
curvas foram formadas para elevadores de alto nível e todos os elevadores, respectivamente. Por fim, uma
beneficiaria significativamente da manutenção. No entanto, não está claro quando tal
poderia limitar a utilidade do método. Devido a estas razões, estaria sujeito a
Machine Translated by Google
métodos de suporte para manutenção baseada em condições: Journal of Intelligent Manufacturing,
computação 307, pp. 72-77.
Cox, DR 1972, Modelos de regressão e tabelas de vida: Journal of the Royal Statistical
Vol. 29, No. 6, pp. 1303–1316.
Castro, IT et al. 2012, Uma estratégia de manutenção preditiva baseada na vida residual média
para sistemas sujeitos a falhas concorrentes devido à degradação e choques: 11º Congresso Internacional
Sociedade. Série B (Metodológica), Vol. 34, No. 2, pp. 187–220.
Cox, DR 1975, Probabilidade parcial: Biometrika, Vol.62, No. 2, pp. 269–276.
Armitage P., Berry G., Matthews JNS 2002, Métodos estatísticos em pesquisa médica,
Conferência Nacional de Avaliação e Gestão de Segurança Probabilística e a Conferência Anual
De Laurentiis, M., Ravdin, PM, (1994), 'Análise de sobrevivência de dados censurados: Neural
Conferência Europeia sobre Segurança e Fiabilidade 2012, PSAM11 ESREL 2012, 1, pp. 375–
4ª ed., Blackwell Publishing, pp. 85-86.
análise de rede detecção de interações complexas entre variáveis.', Câncer de Mama
Tratamento de Pesquisa 32, pp. 113–118.
Bland, JM & Altman, DG 2004, O teste logrank: British Medical Journal, Vol. 328,
Edição 7447, p. 1073.
384.
Christ, M. & Braun, N. & Neuffer, J. & Kempa-Liehr AW 2018, Série Temporal FeatuRe
Bousdekis, A. et al. 2018, Revisão, análise e síntese de decisões baseadas em prognóstico
Extração com base em testes de hipóteses escaláveis (tsfresh -- Um pacote Python): Neuro-
REFERÊNCIAS
Machine Translated by Google
modelo recorrente para análise de sobrevivência: Apostilas em Ciência da Computação (incluindo
J. da ASA, 73(282), pp. 457–481. Disponível em:
Ciência de dados e análise avançada, DSAA 2016, pp. 21–30.
https://web.stanford.edu/~lutian/coursepdf/KMpaper.pdf.
subsérie Notas de aula em Inteligência Artificial e Notas de aula em Bioinformática),
11141 LNCS, págs. 23–32.
Deep-TTF 2018. Disponível em https://github.com/gm-spacagna/deep-ttf/, Acessado
Harrell, FE et al 1982, Avaliação do rendimento de testes médicos: JAMA - Journal of the
Lee, H. et al. (2010) 'Em direção à gestão ideal da rotatividade: um método de mínimos quadrados parciais (PLS)
modelo', 16ª Conferência das Américas sobre Sistemas de Informação 2010, AMCIS 2010,
AssociaçãoMédica Americana, Vol. 247, No. 18, pp. 2543–2546.
3.3.2020.
2(julho), pp. 961–971. Disponível em: https://www.scopus.com/inward/record.uri?eid=2-
Jing, B. et al. 2019, Um método de análise de sobrevivência profunda baseado em classificação: Inteligência Artificial
Dittman, D. e Khoshgoftaar, T. (2014) 'Comparação de abordagens de amostragem de dados
s2.0-84870447433&partnerID=40&md5=de6940dc252b840c89af555ff5d049be.
Leontjeva, A. & Kuzovkin, I. 2016, Combinando recursos estáticos e dinâmicos para multi-
para dados de bioinformática desequilibrados', The Twenty-Seventh …, pp. 268–271. Disponível
em: http://www.aaai.org/ocs/index.php/FLAIRS/FLAIRS14/paper/viewFile/7850/7850
inteligência em Medicina, Elsevier, Vol. 98, pp.
Kaplan, EL e Meier, P. (1958) 'Estimativa não paramétrica a partir de amostras incompletas-
Giunchiglia, E. & Nemchenko, A. & van der Schaar, M. 2018, RNN-SURV: Um profundo
por favor',
classificação de sequência de variáveis: Anais - 3ª Conferência Internacional IEEE sobre
Machine Translated by Google
https://github.com/gm-spacagna/deep-ttf/
https://ragulpr.github.io/assets/draft_master_thesis_martinsson_egil_wtte_rnn_2016.pdf
Schober, P. & Vetter, TR 2018, Análise de sobrevivência e interpretação do tempo até o evento
http://www.stat.washington.edu/fritz/DATAFILES498B2008/WeibullBounds.pdf.
59.
dados: A tartaruga e a lebre: Anestesia e Analgesia, Vol. 127, No. 3, pp. 792–
Nalchigar, S. & Yu, E. 2018, Análise de dados orientada a negócios: uma modelagem conceitual
pág.
estrutura: Engenharia de Dados e Conhecimento, Elsevier Ltd, Vol. 117, pp. 359–372.
Lifelines. 2019. Disponível em https://lifelines.readthedocs.io/en/latest/ Acessado
Nelson, WB 2004, Análise Aplicada de Dados de Vida, John Wiley & Sons, 664 páginas.
798.
Scholz, F. (2008) 'Inferência para a distribuição de Weibull', Stat 498B Estatística Industrial-
Ohno-Machado, L. 1996, Uso sequencial de redes neurais para predição de sobrevivência em
3.3.2020.
tiques,
AIDS: Anais de uma conferência da Associação Americana de Informática Médica,
Mantel, Nathan. 1966. 'Avaliação de dados de sobrevivência e duas novas estatísticas de ordem de classificação-
632, Disponível
tics surgindo em sua consideração.' Relatórios de quimioterapia do câncer 50 (3): 163–70.
Martinsson, E. (2016) 'WTTE-RNN: Rede Neural Recorrente de Tempo para Evento Weibull-
Simpósio de outono da AMIA, pp. 170–174.
Raykar, VC et al. 2008, Sobre classificação na análise de sobrevivência: limites na concordância
trabalho Um modelo para predição sequencial de tempo-para-evento no caso'. Disponível em:
índice: 20º NIPS, pp. 1209–1216.
no:
Machine Translated by Google
https://lifelines.readthedocs.io/en/latest/
Widrow, B. 2005, Pensando sobre o pensamento: A descoberta do algoritmo LMS: IEEE
Revista Signal Processing, Vol. 22, No. 1, pp. 100–103.
WTTE-RNN 2019. Disponível em https://github.com/ragulpr/wtte-rnn/ Acessado
Scikit-survival. 2019. Disponível em https://github.com/sebp/scikit-survival/ Acessado
3.3.2020.
3.3.2020.
Wolstenholme, LC 1999, Modelagem de confiabilidade: uma abordagem estatística, Chapman e
Hall/CRC, 256 páginas.
Vanderplas et al (2012), 'Introdução ao astroML: Aprendizado de máquina para astrofísica',
proc. do CIDU, pp. 47-54.
Weibull, W. 1951, Uma função de distribuição estatística de ampla aplicabilidade: ASME Journal-
Wu, SJ et al. 2007, Um sistema de suporte à decisão integrado de rede neural para condições
política de manutenção preditiva ótima baseada em informações: IEEE Transactions on Systems, Man,
final de Mecânica Aplicada, Vol. 18, No. 3, pp. 293–297.
e Cibernética Parte A: Sistemas e Humanos, Vol. 37, No. 2, pp. 226–236.
Machine Translated by Google
https://github.com/ragulpr/wtte-rnn/
https://github.com/sebp/scikit-survival/Google
Referências ................................................................................................................ 54
5 Conclusões ....................................................................................................... 51
Machine Translated by Google
Figura 6. Combinando recursos estáticos e recursos dinâmicos criando um tempo fictício
Figura 14. Curvas de aprendizagem para WTTE-RNN. ................................................................ 46
Figura 15. Estimativas da curva de sobrevivência no estudo de caso com modelo Cox PH................... 48
série de recursos estáticos.............................................................................................. 34
Figura 7. Curva de sobrevivência média e curva de sobrevivência após manutenção preventiva. .... 38
Figura 8. Diagrama de Weibull das curvas de sobrevivência de Kaplan-Meier. ........................................ 39
Figura 16. Elevações e ganhos no estudo de caso (modelo Cox PH). ........................................ 49
Figura 17. Estimativas da curva de sobrevivência no estudo de caso com modelo WTTE-RNN........... 50
Figura 1. Distribuição de Weibull por diferentes parâmetros de forma e escala. ....................... 22
Figura 9. Linhas de tendência para curvas de sobrevivência de Kaplan-Meier traçadas por Weibull. ...................... 40
Figura 18. Elevações e ganhos no estudo de caso (modelo WTTE-RNN). ................................ 51
Figura 10. Distribuições de Weibull baseadas nas curvas de sobrevivência de Kaplan-Meier..................... 41
Figura 2. Taxas de risco de Weibull com diferentes parâmetros de forma e escala. ................... 23
Tabela 1. Razões de risco do modelo Cox PH por unidade de mudança......................................... 42
Figura 3. Curvas de sobrevivência de Weibull.............................................................................. 24
Figura 4. Circuito ADALINE (Widrow 2005)............................................................... 28
Figura 11. Distribuição das taxas de risco. ......................................................................... 44
Figura 12. Efeito da manutenção preventiva pelo modelo Cox PH.................................... 44
Figura 5. Um pipeline que pode usar RNN para transformação de recursos (Leontjeva 2016).... 33
Figura 13. Curvas de aprendizagem para o modelo Cox PH com penalidade líquida elástica. ....................... 45
Tabelas
Figuras
Machine Translated by Google
trabalhar com.
Anton Akusok, que me orientou na direção certa no início desta tese
trabalho, quando eu lutava para encontrar uma boa abordagem e métodos para o problema de pesquisa.
Um agradecimento especial ao meu orientador e professor Dr. Leonardo Espinosa (Arcada), que
me manteve firme mesmo quando ficou evidente que a abordagem inicial ao problema
não estava funcionando. Seu incentivo e verdadeira curiosidade em relação à minha pesquisa foram surpreendentes.
Escrever esta tese me ensinou muito e espero que você ache o tópico útil.
esforço.
Esta tese foi encomendada pelo meu orientador e superior Dr. Olli Mali (KONE Oyj). Eu
ishing. Devo a ele (e a Olli) a revisão e muitas sugestões que tornaram isso
Hyvinkää, fevereiro de 2020
tese uma leitura melhor.
gostaria de expressar minha gratidão a ele pela ideia, confiança, bom espírito e companheirismo.
Mikko Alutoin
parceria. Sem seu apoio contínuo a tese nunca teria sido iniciada ainda
sozinho concluído. Além disso, sou grato pelos recursos admitidos a mim pela Kone Corpo-
Gostaria também de agradecer ao Dr. Magnus Westerlund (Arcada), diretor do programa
o programa de mestrado em Big Data Analytics. Meus estudos na Arcada têm
ração, e para meus colegas que são o grupo de profissionais mais motivados e divertidos de
abriu um novo mundo para mim profissionalmente. Finalmente, também sou grato ao meu professor Dr.
PREFÁCIO
Machine Translated by Google
que ajuda a formular as questões de pesquisa e a limitar o escopo da tese. O
os limites lógicos estão sendo empurrados ainda mais pelo aprendizado de máquina. No entanto, esses tipos de
processo de negócios de manutenção de um provedor de serviços industriais. O provedor de serviços é
oferecendo um serviço de manutenção contínua para elevadores. Os dados de monitoramento de condições são
aplicações são apenas a ponta de um iceberg. A maioria dos cientistas de dados hoje estão aplicando
A introdução é concluída com um esboço da estrutura da tese.
continuamente coletados de elevadores que estão sob contrato de manutenção. Existe
também dados sobre todas as visitas de manutenção. O objetivo da tese é pesquisar como a coleção
aprendizagem de máquina em um ambiente mais convencional, onde o desenvolvimento pode ser descrito
As técnicas de inteligência artificial e de aprendizagem automática estão a aumentar em quase todos os países
mais como uma evolução do que uma revolução: os serviços digitais existentes estão a ser optimizados e
O tópico desta tese e os problemas de pesquisa abordados são apresentados neste capítulo.
indústrias. Embora muitas técnicas de aprendizado de máquina, como redes neurais, tenham
automatizado por meio de aprendizado de máquina e análises avançadas. As empresas estão saltando
Os dados selecionados podem ser usados para otimizar o processo de manutenção para atingir uma meta comercial.
existem há muito tempo, parece que só recentemente ganharam força suficiente
Começa discutindo um cenário onde uma empresa oferece manutenção preventiva
no vagão e repensando as formas de conduzir seus processos de negócios e serviços
Por processo de manutenção nos referimos ao processo no qual os técnicos de manutenção são
vícios por meio da coleta e análise de dados e aproveitamento de insights da análise de dados.
e manutenção corretiva como um serviço contínuo aos seus clientes. Possibilidades de ma-
aprendizagem de máquinas para este processo de manutenção de negócios de automação e otimização são
para causar um impacto significativo em nossas vidas diárias. A evidência mais proeminente disso são
7
os produtos totalmente novos que estão sendo introduzidos por algumas das principais empresas de tecnologia
descrito e uma meta de negócios é definida. Em seguida, metas analíticas mais detalhadas são consideradas
empresas. Por exemplo, os veículos autônomos são um exemplo desta categoria onde a tecnologia
Esta tese centra-se no último tipo de aplicação, mais especificamente na automação de
1 INTRODUÇÃO
1.1 Objetivo de negócio
Machine Translated by Google
Ou o cliente final ou o gerente da instalação contatou o help desk ou ocorreu uma falha.
visitas de manutenção. São visitas programadas e recorrentes onde o técnico de manutenção
aplicar métodos adequados, como o aprendizado de máquina. Vamos agora prosseguir definindo o
8
como a lubrificação de peças de elevadores. Em muitos países, a frequência de visitas preventivas
O técnico deverá visitar o local imediatamente para resolver o problema técnico. O técnico
alto. O custo direto decorre da natureza sem precedentes da visita aolocal que causa ineficiência
tipo de visita é uma visita de reparo quando certas peças do elevador são substituídas. Gatilho para re-
sua ajuda é necessária urgentemente. Aprisionamento de um passageiro dentro do elevador é uma ex-
qualidade do serviço de manutenção recebida pelo cliente. A satisfação do cliente está em
tempo de atendimento do elevador diminuído. Chegamos à nossa definição de meta de negócio:
vida, técnico percebendo a necessidade durante visita de manutenção preventiva, ou cliente tendo
maneira apesar da hora.
ações. Existem diferentes tipos de visitas. A maioria das visitas são de manutenção preventiva.
Essas visitas são necessárias quando ocorre um problema sem precedentes com o elevador.
os objetivos de negócios e objetivos analíticos mais específicos foram esclarecidos, é hora de aplicar
mau funcionamento da porta.
objetivo de negócios. É evidente que o custo associado a uma visita não planejada ao local é muito
realiza verificações preventivas nas máquinas e realiza determinadas ações de manutenção,
detectado automaticamente (por exemplo, por meio de análise de dados). Neste caso, uma manutenção
é regido pela lei, a fim de garantir a operação segura do elevador. Outra
precisa cessar quaisquer ações que possa estar realizando no momento e viajar para o local onde
eficiência para o processo de outra forma simplificado. O custo indireto está associado ao desempenho
amplo do tipo mais urgente de visita não planejada, que deve ser respondida em tempo hábil
a colocação pode ter se originado devido à parte ter atingido seu fim predeterminado de
risco sempre que uma visita não planejada é necessária, pois muitas vezes isso é acompanhado por
despachado para realizar visitas ao local para execução de manutenção preventiva e corretiva
ing relatou um problema com o equipamento. Por fim, há as chamadas visitas não planejadas.
A otimização de qualquer processo de negócios começa com a definição de objetivos comerciais claros. Somente depois
Objetivo do negócio: diminuir a taxa de visitas de manutenção não planejadas causadas por
Machine Translated by Google
1.2 Objetivo de análise
das visitas de manutenção preventiva podem ser baseadas em recomendações de prognóstico
seu. Existem basicamente duas maneiras de abordar a meta de negócios usando análise orientada a dados
definindo uma ou mais metas analíticas. A função da meta analítica é fornecer insights de
e valores atípicos poderiam ser detectados, o que por sua vez poderia facilitar a localização e resolução de problemas.
as visitas de manutenção preventiva podem ser programadas de forma mais otimizada para reduzir a taxa de
Capítulo 3. Vamos agora discutir a visão do design analítico e definir a meta analítica
a máquina em boas condições ou que o técnico de manutenção seja capaz de detectar mais
escrito, conduzido e documentado por meio de três visões complementares chamadas 1) negócios
As capacidades de diferentes algoritmos de aprendizagem de máquina podem ser utilizadas para cumprir os objetivos do negócio.
Meta de descrição, Meta de prescrição ou Meta de prescrição (Nalchigar 2018a). Por exemplo, não-
técnicos de manutenção com insights sobre a causa raiz da falha, para que eles possam
separação útil de preocupações e, portanto, é usada também em toda esta tese. Em negócios
corrigindo a falha). Esta tese se concentra no primeiro caminho, estudando como o agendamento
síveis em portas de elevadores e mau funcionamento de portas representam uma grande parcela de visitas não planejadas
e definir requisitos para a visão de design analítico. Os requisitos de negócios levam a
Objetivo). No contexto desta tese, a análise poderia ser feita em diferentes viagens de elevador
dados a serem usados por vários atores. A visão de preparação de dados será discutida mais adiante em
(dado que a taxa de visitas de manutenção preventiva não deve ser aumentada). Por um lado
modelos.
9
falhas. A ideia é que as próprias ações de manutenção preventiva podem manter o ma-
Os autores em Nalchigar (2018a) apresentam uma estrutura onde um projeto analítico é de-
(dado o objetivo de negócio definido na Seção 1.1).
visão, 2) visão de design analítico e 3) visão de preparação de dados. Esta estrutura fornece uma
oportuna que uma visita de reparo seja necessária. O outro caminho para a melhoria é fornecer
objetivo de análise. Isso significa fornecer insights por meio de algum objetivo analítico, como Predic-
Esta tese se concentra em mau funcionamento de portas, pois muitos dados de monitoramento de condições estão disponíveis.
ser capaz de resolver o problema de forma mais eficiente (por exemplo, evitar múltiplas visitas ao local para
visão de negócio, as partes interessadas documentam seus requisitos para o processo de negócios como um todo
o aprendizado de máquina supervisionado pode ser usado para fornecer detecção de anomalias (Descrição
Machine Translated by Google
É a tarefa para o exercício de modelagem na visão de design analítico. Qual modelo
não é possível usar aprendizado de máquina supervisionado. A quantidade de dados desempenha um papel
nível de serviço obtido com antecedência (Meta de Predição). Por exemplo, uma máquina supervisionada
análise de causa. Em vez disso, o objetivo é construir um modelo de aprendizado de máquina supervisionado que possa
10
como a verdade fundamental. Finalmente, um modelo de aprendizado de máquina supervisionado poderia até mesmo fornecer
objetivo da análise, ele essencialmente especifica a variável alvo (ou seja, o que deve ser previsto).
programado em um elevador específico hoje, qual seria o benefício esperado com a re-
mau funcionamento portado (Meta de Prescrição). Isso exigiria uma análise da causa raiz para
ções. Nesta tese o objetivo principal da análise é:
A justificativa por trás da meta analítica selecionada é que deve existir uma sequência ótima
aplicado para prever o surgimento de tais anomalias ou qualquer desvio indesejável do alvo.
é aplicável é determinado pelos dados disponíveis. Sem verdades fundamentais, por exemplo, é
estima o número de visitas não planejadas causadas por mau funcionamento das portas. Prever probabilidades
A meta de análise constitui uma ponte entre a meta de negócios e o modelo de aprendizado de máquina.
objetivo de negócios).
fornecer um modelo prescritivo para auxiliar os técnicos de manutenção com a raiz
ser usado para responder à seguinte pergunta: “Se uma visita de manutenção preventiva fosse
a aprendizagem poderia ser treinada para avaliar o risco de mau funcionamento usando registros de manutenção
também - mais dados suportam algoritmos mais complexos. Caso o objetivo analítico seja uma previsão
objetivo de negócios. Isso ocorre porque certos elevadores podem ser permanentemente mais propensos a
técnico de manutenção com uma lista das causas mais prováveis para um problema potencial ou já existente
O objetivo do ics deve ser simples e permitir a definição de questões de pesquisa concisas e mensuráveis.
respeitoao objetivo comercial de reduzir a taxa de mau funcionamento das portas?”
Objetivo analítico: prever o valor de uma visita de manutenção preventiva (com relação ao
falhas passadas estariam disponíveis como verdade básica no treinamento.
para a realização das visitas de manutenção preventiva. Esta sequência é a que mini-
Note que este é um objetivo de previsão pura. Especificamente, não está no escopo desta tese
A existência de um mau funcionamento da porta por si só não é a informação mais útil em relação à
problemas de forma eficaz. Alternativamente, algoritmos de aprendizagem de máquina supervisionados poderiam ser aplicados
Machine Translated by Google
1.3 Objetivo da tese
rendimento em comparação com o esforço de implementação. Ou seja, seria simples
colocados em um simples calendário baseado em agendamento) e coletar os benefícios com um menor
manutenção apenas porque a taxa prevista de mau funcionamento é elevada. Uma abordagem melhor é
avaliando a chamada sobrevivência dos elevadores. Essas técnicas extraem informações
modelo prognóstico simples é treinado com dados de monitoramento de condições. Agora, este modelo pode
esses elevadores provavelmente se beneficiarão de atenção imediata. Um pequeno, mas significativo
as operações são uma ocasião rara - a maioria dos períodos de observação não terminam com um mau funcionamento, mas
parece duro, pois significa buscar vitórias fáceis e descartar aqueles elevadores que não
dados, especialmente com relação à meta analítica definida. Interesse especial está em de-
como novo). Neste contexto, a sobrevivência significa que o elevador não desenvolve um defeito na porta.
para programar visitas de manutenção preventiva tendo em conta a previsão (conforme opção)
em peças de reposição para elevadores, o que significa que não há utilidade em realizar a manutenção preventiva
apenas para comparar a sobrevivência de um elevador médio com um recém-mantido
objetivo de negócios. Outra justificativa para o objetivo analítico é que ele oferece potencialmente um alto
visitas de manutenção baseadas em recomendações de um modelo prognóstico alavancando con-
Os métodos de análise de sobrevivência, amplamente utilizados na área médica, são aplicados para
a partir de observações parciais (ou seja, os chamados dados censurados). Isso é útil, pois a porta funciona mal
para distinguir os elevadores cuja condição é detectada como tendo piorado rapidamente, como
mudança no próprio processo de negócios.
como a taxa de mau funcionamento da porta geralmente se desenvolve após uma visita de manutenção. Então, um
11
diferença a fazer, o que se reflete na meta analítica. A meta analítica pode
O objetivo da tese é extrair insights de registros de manutenção e monitoramento de condições.
por uma visita de manutenção preventiva (que se presume restaurar a condição da porta para o estado
aumentando a taxa geral de mau funcionamento das portas como um todo, programando ações preventivas
beneficiar de visitas de manutenção preventiva. No entanto, é imperativo, dada a
função. Um certo estimador estatístico não paramétrico é usado primeiro em rec-
dados de monitoramento de condições (em oposição ao agendamento atual baseado em calendário).
elevador. Isso dá uma ideia de como a visita de manutenção fornece valor em média, bem como
problemas do que outros. Por exemplo, o proprietário do elevador pode estar relutante em investir
Machine Translated by Google
1.4 Questões de pesquisa e hipóteses de pesquisa
objetivo de negócios) é examinado retrospectivamente usando um conjunto de dados da vida real, modelo por modelo.
Além de responder às questões de pesquisa, a tese propõe um método específico para
12
agendamento de visitas de manutenção preventiva com base no benefício previsto em termos
Assim, ficou estabelecido que a previsão do valor de uma visita de manutenção preventiva
ser inferido para uma estimativa de sobrevivência usando dados de monitoramento de condições. Desempenho de
é uma meta analítica útil. Vamos prosseguir definindo as questões de pesquisa mais interessantes
de sobrevivência melhorada (ou seja, tempo para mau funcionamento) após a manutenção. Uma hipótese nula é
que o método proposto não é mais benéfico no agendamento da manutenção preventiva
o modelo é avaliado por meio de validação cruzada e suas deficiências são discutidas. Em seguida, um
questões a serem abordadas no restante desta tese:
visitas de financiamento como o método atual baseado em calendário. Invertendo isso, a pesquisa hi-
1. Quanto uma visita de manutenção preventiva melhora a taxa de mau funcionamento da porta?
um modelo de rede neural mais complexo é treinado com os dados de monitoramento de condições e
a hipótese é a seguinte:
Hipótese de pesquisa: Método proposto para agendamento de visitas de manutenção preventiva
seu desempenho é comparado com o modelo simples. Finalmente, um método é proposto para
aproveitando a habilidade de qualquer modelo prognóstico para agendar visitas de manutenção preventiva
2. Como o valor de uma visita de manutenção preventiva se desenvolve ao longo do tempo?
3. Quão bem certos modelos matemáticos podem prever o risco de mau funcionamento da porta
com base na condição do elevador. A eficácia do método (para atingir o
com base em dados de monitoramento de condições?
resultaria em uma taxa menor de mau funcionamento das portas.
Machine Translated by Google
registrando todos os dias usando informações básicas conhecidas extraídas de registros de manutenção.
de mau funcionamento da porta.
As conclusões são apresentadas no Capítulo 5.
A manutenção baseada em condições (CBM) é discutida em Bousdekis (2018), onde a literatura
O conjunto de dados resultante é então usado para treinar o modelo prognóstico. Nesta tese, dois mod-
revisão sobre métodos de CBM de última geração é fornecida. Os autores definem manutenção como evitar-
Os modelos são treinados e seu desempenho de previsão é avaliado e comparado.
As previsões diárias podem ser usadas para avaliar a deriva nas condições do elevador. Elevadores com
A tese está organizada da seguinte forma. Primeiro, no Capítulo 2, é feita uma revisão da literatura sobre métodos relevantes
ods é fornecido. O foco está em entender que tipo de métodos e metodologias
Esta tese apresenta um método para alavancar o aprendizado de máquina no negócio de manutenção.
Acredita-se que os maiores desvios beneficiam a maior parte da manutenção preventiva. A cada dia, os elevadores
foram usados por outros para responder a perguntas semelhantes. Detalhes da preparação de dados
13
pode ser classificado com base na deriva avaliada. Para examinar a hipótese de pesquisa, uma prática
processo de manutenção do prestador de serviços. Mais precisamente, dados históricos sobre manutenção
visão são descritos no Capítulo 3, e também a metodologia da pesquisa é descrita. Re-
os resultados da pesquisa são apresentados no Capítulo 4, onde o desempenho de dois modelos prognósticos
visitas é usado para treinar ummodelo de aprendizado de máquina cujas previsões representam o risco
nível de desenvolvimento de mau funcionamento da porta. As previsões são feitas diariamente. Método
estudo de caso estatístico é feito (em retrospecto) para quantificar se a manutenção em
elevadores classificados tem sido historicamente mais benéfico do que o elevador médio. Caso
começa primeiro formando um conjunto de dados reais de monitoramento diário de condições e depois
estudo também fornece uma estimativa de quanto o método proposto poderia reduzir a taxa
é relatado e a hipótese de pesquisa é examinada por meio de um estudo de caso. Finalmente,
1.6 Esboço
1.5 Método proposto
2 TRABALHOS RELACIONADOS
Machine Translated by Google
intervalo de tempo fixo. A política de CBM (também conhecida como manutenção preditiva) está aprimorando isso como
obtidos por meio de inspeções regulares, denominadas monitoramento de condições. Monitoramento de condições-
seguintes três categorias de manutenção: manutenção de avarias, manutenção preventiva baseada no tempo
distribuição de vida útil (MRL) usando covariáveis do sistema obtidas por meio do monitoramento de condições.
técnicas têm sido usadas principalmente em estudos clínicos para estimar a eficácia de tratamentos médicos
manutenção ativa (ou reativa), manutenção preventiva e manutenção preditiva
14
ambos. Uma separação útil de preocupações é feita por autores onde um modelo prognóstico é
sistema portuário. Modelos de degradação multi-estado foram propostos onde o suporte à decisão
A vantagem é que ele melhora o tempo de serviço do equipamento, eliminando alguns dos
para produzir previsões instantâneas. Então, um método de suporte à decisão separado forma o
els assumem um processo de degradação contínuo onde o processo de degradação é descrito
o intervalo de tempo de manutenção também é afetado pela condição percebida do equipamento
termos de produtividade ou eliminação de avarias. Eles sugerem uma taxonomia de
Antes de nos aprofundarmos nos modelos específicos do CBM, vamos discutir os modelos mais gerais
não levar em consideração a condição do equipamento, pois o equipamento é mantido em
tomador de decisões humano em consideração.
processo de vários sistemas. O objetivo desses modelos é prever os resíduos marginais do sistema
Novas previsões são feitas a cada momento de inspeção para serem consumidas pelo suporte de decisão.
manutenção e CBM. Em outras literaturas, categorias semelhantes são chamadas de correções
A análise pode ser baseada em inspeções no local ou na coleta on-line de dados de sensores ou
métodos para analisar o tempo até a ocorrência de um evento de interesse. Essas técnicas
mento com o tempo da morte como o evento de interesse mais comum. Por exemplo, dado um conjunto
(Wu 2007). Vantagem da manutenção preventiva baseada no tempo sobre a manutenção de avarias
desenvolvido por meio de monitoramento de condições e o modelo é aplicado em fluxos de dados em tempo real
método é implementado como processo de decisão de Markov. No entanto, a maioria dos mod-
política final do CBM usando uma função de custo personalizada que leva em consideração as preferências e escolhas do
avarias de forma proativa. No entanto, a política de manutenção preventiva baseada no tempo não
usando, por exemplo, um modelo estocástico como o processo Gamma (Castro 2012).
Diferentes modelos prognósticos têm sido utilizados na literatura para modelar o processo de degradação
conceitos que vão sob o nome de análise de sobrevivência. A análise de sobrevivência lida com um conjunto de
reduzindo a quebra de equipamentos e melhorando o desempenho empresarial, por exemplo, em
Machine Translated by Google
2.1 Funções de sobrevivência
é dito ser censurado à direita. (Existem também observações censuradas à esquerda, onde o evento
A função de sobrevivência S(t) é uma função que fornece a probabilidade de que o evento de interesse (por exemplo,
função de densidade de probabilidade para o tempo de vida restante, dado que o sujeito sobreviveu até
de interesse ocorreu antes do início do período de observação, como o surgimento da criança
morte ou falha) ainda não aconteceu no momento t. Função de sobrevivência, que também é algumas-
um momento t0, pode ser escrito agora como segue:
primeiro dente.) Agora, no contexto dos elevadores, a grande maioria dos elevadores nunca passa por
vezes referida como função de sobrevivência (Armitage 2002) ou como função de confiabilidade (Wol-
15
de pacientes onde alguns recebem um tratamento experimental e outros não, sobrevivência
o evento de interesse (por exemplo, mau funcionamento da porta). No entanto, é importante saber que um
stenholme 1999), é derivado da função de distribuição cumulativa F(t) usando o seguinte-
a análise pode ser usada para determinar (e quantificar) se o tratamento teve efeito estatisticamente
o elevador ficou livre de avarias até ao ponto de censura, e a análise de sobrevivência
fórmula de ing onde T é uma variável aleatória contínua e f denota sua densidade de probabilidade
efeito significativo na vida dos pacientes. O que torna esses métodos particularmente
técnicas são projetadas para tirar proveito dessas informações. O processo de censura é
função ty:
interessante é que eles extraem informações de observações censuradas. Por exemplo,
diz-se que não é informativo se os tempos de censura e os tempos dos eventos forem independentes entre si
(1)
alguns pacientes podem abandonar o estudo clínico ou podem ainda estar vivos quando o estudo for concluído
outro, o que significa que a censura não vaza informações sobre a sobrevivência do sujeito.
O gráfico de S(t) em relação a t é chamado de curva de sobrevivência.
termina. Tal paciente, não vivenciando o evento de interesse durante o período de observação,
A função de sobrevivência se presta bem para estimar distribuições de tempo de vida. Por exemplo,
Machine Translated by Google
2.2 Estimador de Kaplan-Meier
morte em um momento específico no tempo, desde que o sujeito tenha sobrevivido até aquele momento.
Vamos prosseguir discutindo as funções de sobrevivência mais relevantes utilizadas no campo da
A função de risco h(t) é derivada da função de sobrevivência e da função de densidade de probabilidade
análise de sobrevivência.
do seguinte modo:
(2)
(4)
O estimador de Kaplan-Meier é um estimador não paramétrico que foi introduzido pela primeira vez em
A derivada em relação ao tempo produz a função de densidade de probabilidade do re-
Finalmente, uma função de risco cumulativa H(t) é definida como integral da função de risco
Kaplan (1958) - um artigo fundamental que foi citado dezenas de milhares de vezes
tempo de vida principal em t0:
e sua relação com a função de sobrevivência é:
16
(3)
(5)
Às vezes é conveniente usar a chamada função de risco que fornece a taxa de risco
Diferentes funções estatísticas foram usadas para modelar a função de sobrevivência. Estas podem
(ou seja, taxa de mortalidade) como uma função do tempo t. A taxade risco fornece a probabilidade de o sujeito
podem ser categorizadas como funções de sobrevivência não paramétricas, semiparamétricas e paramétricas.
Machine Translated by Google
2.3 Modelo de riscos proporcionais de Cox
a sobrevivência do sujeito é multiplicativa em relação à taxa de risco. Em outras palavras,
Onde o produto é tomado em todos os intervalos de tempo discretos ti onde pelo menos uma morte ocorreu
número de pacientes, é então possível visualizar (e quantificar) o quanto os diferentes
a mudança no valor de uma única covariável (outras permanecendo constantes) diminui (ou aumenta) o
(incluindo o intervalo de tempo t). di é o número de mortes no intervalo de tempo ti e ni denota o número
os genótipos afetam as curvas de sobrevivência correspondentes dos pacientes e se o efeito é
taxas de risco com uma quantidade semelhante ao longo do eixo do tempo. A taxa de mudança é de-
de indivíduos em risco (indivíduos que ainda não sofreram morte ou perda em
estatisticamente significativo. O modelo é, no entanto, limitado na sua capacidade de estimar a sobrevida
17
desde sua introdução há mais de 60 anos. O estimador de Kaplan-Meier é construído a partir de um conjunto
timestep ti). Esta fórmula produz uma função de degrau monotonicamente decrescente. O valor
vival com base em covariáveis devido à sua não parametricidade. Por exemplo, não pode ser usado para
de observações e é usado para estimar a função de sobrevivência das entidades observadas.
da função estimadora entre observações amostradas é assumida como constante. Im-
prever a sobrevivência de um sujeito individual.
Os autores definem o evento de interesse como morte e ocorrência prévia de alguma outra
característica importante do estimador de Kaplan-Meier é que ele também alavanca o centro direito
evento (ou seja, censura à direita) como perda. O estimador da função de sobrevivência é dado por
observações registradas (por meio do número de sobreviventes conhecidos).
O modelo de riscos proporcionais (PH) de Cox (Cox 1972) é um modelo semiparamétrico para
a seguinte função discreta:
Se as covariáveis dos sujeitos observados forem conhecidas, como os genótipos dos pacientes,
aproximando a sobrevivência. A principal suposição do modelo é que o efeito de cada covariável para
(6)
é possível calcular estimadores separados e agrupados para comparação. Com grandes
Machine Translated by Google
preditor é protetor e promove a sobrevivência. Em outras palavras, sinal do coeficiente
função de risco de base. Se uma distribuição conhecida for assumida para a função de risco de base
A resolução da equação de regressão linear produz os coeficientes (ou seja, riscos proporcionais).
18
função, então o modelo resultante é chamado de modelo PH paramétrico. Curiosamente, se
Cada coeficiente estimado ÿi representa uma mudança esperada do logaritmo da razão de risco
A função de risco de Weibull é assumida como a linha de base, então o modelo satisfaz os requisitos
por unidade de mudança na covariável Xi correspondente (assumindo que todas as outras covariáveis
determinado pelos coeficientes estimados do modelo. Formalmente, a função de risco agora assume
elementos de um modelo de tempo de falha acelerado.
permanecer constante). Isso pode ser visto facilmente escrevendo:
o formulário:
2.3.1 Razão de risco
(9)
(7)
Assim, a razão de risco é a razão entre a função de risco do indivíduo e a linha de base
Por exemplo, se a covariável Xi for um preditor dicotômico (por exemplo, fumar vs. não fumar),
Onde X é um vetor coluna das covariáveis do sujeito e ÿ é um vetor coluna de
função de risco. O modelo tem a propriedade conveniente de que o logaritmo natural do risco
então exp(ÿi) produz sua contribuição para a taxa de risco. Se a contribuição for maior
os coeficientes correspondentes, e h0(t) é uma função de risco de base que é aplicável
a razão HR(X) é uma função linear das covariáveis:
do que um, então o preditor aumenta o risco de morte. Se for menor do que um, então o
quando todas as covariáveis são definidas como zero. O modelo não faz nenhuma suposição sobre a forma do
(8)
Machine Translated by Google
ao conjunto R ao longo dos tempos de morte. Em cada tempo de morte distinto Xj, a contribuição para
Onde S0(t) é a função de sobrevivência de base e HR(X) é a razão de risco. Esta fórmula é usada-
estimativas de verossimilhança (MLE) para os coeficientes do modelo. O ajuste é normalmente feito usando um
a probabilidade parcial é:
completo quando S0(t) está disponível e o modelo Cox PH foi ajustado para calcular HR (X).
pacote de software estatístico, como o Lifelines (2019), que também fornece informações de confiança
consistente, o que significa que quando
funções dos humanos ou tempo de serviço das máquinas, como exponencial, gama e
O capô L sobre todos os tempos de morte pode ser escrito como:
número de mortes aumenta, as estimativas estão convergindo para os valores reais (Armitage
Distribuições Weibull (Wolstenholme 1999). Cada uma dessas distribuições é detalhada
(12)
(2002).
20
Esta é a probabilidade parcial definida em Cox (1975). Note que não há suposições sobre sub-
O modelo de riscos proporcionais de Cox ainda é hoje o modelo mais amplamente utilizado em sobrevivência
a distribuição de mentiras é feita quando a função de risco de base foi cancelada. Como-
análise. É um método seguro e comprovado de usar, pois não faz suposições sobre a dis-
Machine Translated by Google
distribuição permitindo que a taxa de risco aumente (ou diminua) ao longo do tempo. Muito mais realista
Isto é conhecido como expressão de distribuição Weibull de três parâmetros. Os três pa-
hipótese de tique para equipamentos mecânicos, razão pela qual a função de risco Weibull é
Os parâmetros são parâmetro de forma (ÿ), parâmetro de escala (ÿ) e parâmetro de localização (ÿ). Quando
amplamente utilizado em modelagem prognóstica. Devido à sua importância no campo da confiabilidade en-
o parâmetro de localização não é usado, ele é definido como zero e a equação é reduzida ao seu valor máximo
multado por seus parâmetros. A distribuição exponencial tem um único parâmetro lambda que
engenharia, vamos examinar as propriedades da distribuição Weibull um pouco mais de perto.
forma comum de dois parâmetros:
é o número de eventos por unidade de tempo (ou seja, taxa de mortalidade no contexto da análise de sobrevivência).
2.4.1 Distribuição Weibull
(15)
A distribuição exponencial estimaria perfeitamente a função de sobrevivência se a probabilidade
A função de densidade de probabilidade de uma variável aleatória distribuída de Weibull em sua forma mais
Que na verdade é um produto da função de risco e da função de sobrevivência, sendo elas:
da morte seria constante em cada ponto do tempo. Obviamente, isso não é muito aplicável
a forma geral é (Weibull 1951):
21
suposição com relação à manutenção baseada na condição, onde a função de sobrevivência é as-
(14)
supostamente depende das covariáveis do sistema. A distribuição Weibull estende a distribuição exponencial
Onde f(t) ÿ 0, ÿ > 0, ÿ > 0, ÿ 1 a função de densidade de probabilidade tem um ponto de inflexão em (e1/ ÿ
- 1) / e1/ ÿ. Aumentando o parâmetro de escala, mantendo o parâmetro de forma con-
permanecer semelhante. A área sob a curva deve permanecer a mesma e, portanto, o alongamento
faz com que o pico da distribuição se mova para baixo.
1, a taxa de risco diminui ao longo do tempo e para ÿ > 1 aumenta ao longo do tempo, como pode ser visto
constante, estende a distribuição ainda mais para baixo no eixo do tempo. O formato da distribuição irá
distribuição. Isto constitui um ponto de equilíbrio onde a taxa de risco é constante. Para ÿ 2 a função de risco
23
Machine Translated by Google
Figura 3. Curvas de sobrevivência de Weibull.
17).
Ao utilizar modelos paramétricos, deve-se ter cuidado para que a distribuição utilizada seja representativa.
representativo do fenômeno subjacente que deve ser modelado. Uma técnica chamada
o gráfico de probabilidade pode ser usado para garantir isso. A ideia é traçar estimativas de acumulação
curva vival que pode ser obtida plotando a função de sobrevivência de Weibull (Equação
2.4.2 Diagrama de Weibull
função logarítmica. A Figura 3 ilustra como os parâmetros de forma e escala afetam a superfície
a ação cresce mais como uma função exponencial e com 1> yi e pj >
pode dobrar o risco de uma parada cardíaca, e a pressão alta pode fazer o mesmo.
pares ordenados (ou seja, concordantes) para todos os pares comparáveis. O par é comparável se o menor dos
pi. O índice C produz a razão de tais pares concordantes para todos os pares comparáveis. Empates (pj = pi)
O modelo implicaria apenas um risco quádruplo para um indivíduo com ambas as condições.
os tempos de observação são para a morte ou os tempos de observação são iguais e um deles é
pode ser assumido como quebrado aleatoriamente. Formalmente, isso pode ser expresso como:
26
(25)
para morte e o outro é para perda. Sua interpretação é semelhante à área sob ROC
(26)
Novamente, os parâmetros da distribuição podem ser estimados aplicando o método MLE.
curva (AUC), o que significa que o valor 0,5 indica que o modelo não tem nenhuma habilidade, e o valor 1
Onde C é um conjunto de pares comparáveis e o indicador I retorna 1 para par concordante e 0
indica um modelo perfeito. A métrica é calculada da seguinte forma. Sejam observações um conjunto
para par discordante.
O índice de concordância de Harrell (índice C) é a métrica mais utilizada na avaliação do desempenho.
de tuplas (yi, di) onde yi denota o tempo até o evento de interesse e di denota o tipo do objeto-
desempenho de modelos de sobrevivência. Foi desenvolvido para avaliar modelos prognósticos ajustados com
sobrevivência (1 para morte 0 para perda). Assuma um modelo prognóstico que pode quantificar a sobrevivência
O modelo Cox PH tem suas deficiências. Uma desvantagem é que as interações entre co-
dados censurados (Harrell 1982). O índice C mede o quão bem o modelo preserva os dados em pares
de covariáveis, e as previsões (denotadas como pi) são comparáveis entre si.
2.5 Índice de concordância
2.6 Redes neurais
Machine Translated by Google
covariáveis variáveis. Essa desvantagem também precisa ser abordada com engenharia de recursos,
muito progresso foi feito nessa área. No entanto, também é um processo trabalhoso e
modelo complexo que é capaz de explicar interações de recursos inerentemente. Veja a página 28 em
A rede neural artificial (RNA) como conceito é algumas vezes creditada a um artigo publicado
reconhecimento de entradas digitais. O treinamento do neurônio foi implementado usando um
remediar as deficiências do modelo Cox PH com relação a isso. Mais um incômodo
27
modelos vivos nesta tese. Sabe-se que as redes neurais são capazes de aproximar com-
rons, inspirados em como os neurônios no cérebro humano podem funcionar, usando circuitos elétricos. Mesmo
é importante saber o nível de risco absoluto. Em terceiro lugar, ao contrário das redes neurais recorrentes,
Além disso, as redes neurais, ao contrário dos métodos populares de árvores de decisão, podem modificar inerentemente
descreveu o Perceptron, um modelo de como o cérebro humano aprende a reconhecer objetos (Ros-
Poder-se-ia aplicar a engenharia de recursos manuais para remediar este problema ou usar uma abordagem mais
o que acrescenta complexidade. Não há dúvidas de que a engenharia de recursos é uma disciplina por si só e
engenharia elétrica pelo professor Bernard Widrow e seu aluno de pós-graduação Ted Hoff
etapas de expectativa, os modelos tradicionais de sobrevivência não têm inerentemente qualquer noção de tempo.
A capacidade das redes neurais na análise de sobrevivência foi publicada recentemente. Um conciso
2.6.1 Advento das redes neurais
na década de 1940, McCulloch (1943), onde os autores modelaram uma rede simples de neurônios artificiais
Martinsson (2016) para uma discussão sobre diferentes abordagens que foram desenvolvidas para
às vezes o tempo é essencial. Por estas razões, vamos olhar para além do tradicional sur-
ADALINE, para “neurônio linear adaptativo” e implementou um classificador binário para padrões
Conjunto 4x4 de interruptores de alternância para alimentar padrões de entrada e um único interruptor de alternância para sinalizar
é que o modelo Cox PH só produz taxas de risco para preditores. Geralmente, é mais útil-
funções de mapeamento complexas, então por que não também aquela entre covariáveis e curvas de sobrevivência?
mais frequentemente, a invenção do conceito é creditada ao psicólogo Frank Rosenblatt, que
el também interações temporais por meio da adição de camadas recorrentes. Muitos artigos sobre aplicações
que pode extrair relações temporais de dados de monitoramento de condições em diferentes níveis
enblatt 1958). No entanto, um trabalho prático fundamental foi introduzido no campo da
uma revisão da literatura sobre estes assuntos é fornecida na Subseção 2.6.2.
(Widrow 1960) que implementou um circuito de processamento de sinal adaptativo. Foi nomeado
ções. Na vida real, o risco pode ser maior, devido aos preditores se amplificarem mutuamente.
Machine Translated by Google
Figura 4. Circuito ADALINE (Widrow 2005).
rede neural feed-forward baseada em circuitos ADALINE. Foi a primeira rede comercial
2.6.2 Redes neurais para análise de sobrevivência
Quando se trata de usar redes neurais para análise de sobrevivência, pesquisas foram feitas
aplicação de uma rede neural, implementando um filtro adaptativo para cancelamento de eco
em linhas telefônicas. Desde então, o número de aplicações de redes neurais aumentou
avançaram lentamente, mas ainda assim o reconhecimento de padrões é onde eles se destacam.
a saída binária desejada. A adaptação dos pesos foi governada pelo método chamado
principalmente na área médica. A seguir, vamos rever alguns dos 28 mais relevantes
descida mais íngreme e uma função de perda que mais tarde foi denominada mínimo quadrado médio (LMS).
Grande parte da fundação inicial ainda se mantém, enquanto novos conceitos submergiram no
anos como retropropagação, descida de gradiente estocástico, redes neurais recorrentes
Os pesos correspondem às configurações do potenciômetro que foram ajustadas manualmente. A Figura 4 é
de Widrow (2005), onde a Professora Widrow conta casualmente a história 45 anos depois.
(RNN). No restante do artigo, o termo rede neural é usado como um termo genérico
para se referir a qualquer tipo de algoritmo baseado no conceito de neurônios. Mais específico
ADALINE foi seguido por MADALINE, que era um sistema de três camadas totalmente conectado
termos, como RNN, são usados para se referir a arquiteturas mais específicas de redes neurais.
Machine Translated by Google
pela data do diagnóstico. As covariáveis incluem dados demográficos e socioeconômicos
Um modelo que consiste em um sistema hierárquico de redes neurais para prever a sobrevivência de
indo.
(a tabela é obtida usando ANN em um conjunto de dados de validação). Previsões de MRL corrigidas
por seis pontos de tempo discretos na curva de sobrevivência (1, 2, 3, 4, 5 e 6 anos), o que significa
equilíbrio entre manutenção de avarias e manutenção preventiva).
fornecer comparação entre o modelo desenvolvido e um método mais simples onde seis iso-
método de suporte para manutenção preditivade equipamentos rotativos (ou seja, elementos rolantes
problema de cação com seis horizontes de previsão diferentes. A curva de sobrevivência começa no momento
na curva de sobrevivência. Todas as redes são treinadas por retropropagação. Área sob recepção
por unidade de tempo operacional. Os autores definem um sinal de degradação com base no monitoramento de condições
O modelo de trabalho (ANN) é usado para prever a porcentagem de vida útil do equipamento a partir do grau
equivalente a uma rede neural recorrente, onde as covariáveis são estáticas em cada passo de tempo.
ser superior em todos os seis horizontes de previsão. Além disso, o número de in- não monotônicos
A rede neural é treinada com dados censurados à direita e um tipo de RNN é usado.
apenas em covariáveis de base (por exemplo, marcadores biológicos para progressão da doença) obtidos
tem potencial para produzir curvas de sobrevivência (discretas) que não sejam monotonicamente decrescentes
tabela para correção do erro cometido pela ANN em comparação com as distribuições MRL reais
Em Wu (2007) os autores definem um modelo prognóstico baseado em rede neural e um modelo de decisão
Pacientes com AIDS é apresentado em Ohno-Machado (1996). O modelo treinado pode ser consultado
variáveis explicativas, marcadores biológicos, achados clínicos e medicamentos. Autores
são alimentados em uma matriz de custos que sugere tempos de substituição ideais para a maquinaria (ou seja,
essencialmente o problema de avaliar a curva de sobrevivência é traduzido para uma classificação binária
redes neurais de feed-forward são usadas para obter previsões para os seis pontos de tempo
rolamentos). O método de apoio à decisão é uma função de custo que otimiza o custo esperado
29
características operacionais (AUC) é usada como a métrica principal. O método proposto é mostrado para
do diagnóstico de AIDS. Dados censurados são descartados no estudo. O sistema é computacionalmente
dados de monitoramento de sensores de vibração e definir um limite de falha. Rede neural artificial-
artigos. Dadas as características do CBM, o interesse recai particularmente sobre métodos onde
Isso ocorre porque nenhum dado de entrada é inserido no modelo anualmente, mas as previsões são baseadas
tervals parece ser muito pior com o método mais simples. No entanto, também a abordagem proposta
sinal de radiação e tempo de operação em cada momento de inspeção. Em seguida, os autores usam um separado
Machine Translated by Google
previsões mais bem informadas. O modelo assume que mortes recorrentes são possíveis, mas de-
observações registradas. O nome WTTE-RNN significa Weibull time to event RNN.
2.6.2.2 RNN-SOBREVIVÊNCIA
curva de sobrevivência média. Como em Ohno-Machado (1996), o problema é traduzido para uma
e as colunas correspondem aos intervalos de tempo. Os itens contêm as covariáveis e a verdade fundamental
30
análise al (Deep-ttf 2018).
apresentado. O modelo pode ser usado para prever pontuações de risco pessoal e curvas de sobrevivência
observa o tipo de evento (1 para morte e 0 para perda). O modelo treinado pode ser inferido
torna-os interessantes é a sua solidez matemática. As funções de perda são derivadas
sobre modelos concorrentes é relatado usando diferentes conjuntos de dados médicos bem conhecidos. Como o
melhoria do porto de até 28,4% em relação aos métodos de última geração. Os autores também fornecem visu-
arbitrário. Como saída, o modelo fornece uma matriz cujas linhas e colunas correspondem a
servações. Isto significa que, se o processo de censura não for informativo (ou seja, censura
respondendo ao passo de tempo. Normalmente, a última coluna é a interessante, pois contém o
Em Martinsson (2016), uma RNN é usada para aprender distribuições Weibull do centro direito
Distribuição Weibull, então a função de perda usada por este modelo é a ideal.
curva de sobrevivência e mostram que as curvas de sobrevivência individuais podem ser muito diferentes das
Em Giunchiglia (2018), um modelo de rede neural recorrente profunda chamado RNN-SURV é
O conjunto de dados de treinamento é uma matriz contínua de tamanho fixo cujas linhas correspondem aos assuntos
trabalhos competitivos já submergiram onde o modelo WTTE-RNN é aplicado para sobrevivência
combinação de problemas de classificação binária com diferentes horizontes de tempo. O modelo
que é uma tupla (t, d) onde t denota o número de passos de tempo para o próximo evento e d de-
O autor deriva funções de perda contínua e discreta para treinar o modelo. O que
para pacientes médicos. É descrito um estudo comparativo onde a superioridade do RNN-SURV
da fórmula geral de log-verossimilhança paramétrica (Equação 25) para objetos censurados à direita
com uma matriz de formato semelhante, onde o número de linhas e o número de colunas podem ser
o modelo usa dados censurados, os autores usam o índice C como a principal métrica de desempenho e re-
2.6.2.1 WTTE-RNN
a entrada e os itens contêm distribuições Weibull estimadas para cada sujeito na correlação
os tempos de sobrevivência são independentes entre si), e os tempos de sobrevivência seguem
alização onde as curvas de sobrevivência obtidas são comparadas com a média de Kaplan-Meier
Machine Translated by Google
Em Jing (2019), uma rede neural de feed-forward profunda é proposta para prever a sobrevivência
observa uma pontuação de risco que é calculada como uma combinação linear das estimativas de Si . Todos os co-
Os autores definem uma função de perda especialmente projetada para lidar com dados censurados. A perda
31
covariável. Os parâmetros do modelo são o número de camadas de feed-forward, o número de camadas recorrentes
e os autores mostram uma superioridade geral sobre outros modelos de sobrevivência, como o Cox PH
contribuição para a função, enquanto as perdas contribuem apenas se o valor previsto for menor que o
Como a rede prevê tanto a curva de sobrevivência quanto a pontuação de risco, os autores também definem a
é usado como métrica e o método bootstrap no conjunto de teste é usado para calcular a confiança
A interpretação de L2 é que a diferença de classificação em pares de sujeitos deve ser preservada por
completamente heurístico, pois não há prova de onde eles seriam derivados de qualquer conhecido
função de entropia que considera dados censurados e a segunda é um limite superior de
A ANN RankDeepSurv é uma rede neural feed-forward totalmente conectada, exceto para
horizonte de tempo correspondente. Si denota a estimativa da curva de sobrevivência e ri e de-
2.6.2.3 RankDeepSurv
parâmetro do modelo e pode ser alterado (por exemplo, para corresponder à quantidade de dados disponíveis).
(Equação 25). A prova de convergência é, no entanto, dada. Devido à fórmula L2, o tamanho do
função é a soma de dois termos L1 e L2. A interpretação de L1 é que as mortes sempre con-
as variáveis são estáticas em cada intervalo de tempo, exceto para o número do intervalo de tempo que é usado como um
curvas

Mais conteúdos dessa disciplina