Methodologies to improve one-class classifier performance applied to multivariate time series

dc.contributor.advisor-co1Ciarelli, Patrick Marques
dc.contributor.advisor-co1IDhttps://orcid.org/
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/
dc.contributor.advisor-co2Co-orientador2
dc.contributor.advisor-co2IDhttps://orcid.org/
dc.contributor.advisor-co2Latteshttp://lattes.cnpq.br/
dc.contributor.advisor-co3Co-orientador3
dc.contributor.advisor-co3IDhttps://orcid.org/
dc.contributor.advisor-co3Latteshttp://lattes.cnpq.br/
dc.contributor.advisor-co4Co-orientador4
dc.contributor.advisor-co4IDID do co-orientador4
dc.contributor.advisor-co4LattesLattes do co-orientador4
dc.contributor.advisor1Munaro, Celso José
dc.contributor.advisor1IDhttps://orcid.org/
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/
dc.contributor.advisor2Orientador2
dc.contributor.advisor2IDhttps://orcid.org/
dc.contributor.advisor2Latteshttp://lattes.cnpq.br/
dc.contributor.authorMachado, André Paulo Ferreira
dc.contributor.authorIDhttps://orcid.org/
dc.contributor.authorLatteshttp://lattes.cnpq.br/
dc.contributor.referee1Vargas, Ricardo Emanuel Vaz
dc.contributor.referee1IDhttps://orcid.org/
dc.contributor.referee1Latteshttp://lattes.cnpq.br/
dc.contributor.referee2Serra, Ginalber Luiz de Oliveira
dc.contributor.referee2IDhttps://orcid.org/
dc.contributor.referee2Latteshttp://lattes.cnpq.br/
dc.contributor.referee3Coelho, Leandro dos Santos
dc.contributor.referee3IDhttps://orcid.org/
dc.contributor.referee3Latteshttp://lattes.cnpq.br/
dc.contributor.referee4Lima Netto, Sergio
dc.contributor.referee4Latteshttp://lattes.cnpq.br/
dc.contributor.referee55º membro da banca
dc.contributor.referee5IDhttps://orcid.org/
dc.contributor.referee5Latteshttp://lattes.cnpq.br/
dc.contributor.referee66º membro da banca
dc.contributor.referee6IDhttps://orcid.org/
dc.contributor.referee6Latteshttp://lattes.cnpq.br/
dc.contributor.referee77º membro da banca
dc.contributor.referee7IDhttps://orcid.org/
dc.contributor.referee7Latteshttp://lattes.cnpq.br/
dc.date.accessioned2024-09-11T19:48:17Z
dc.date.available2024-09-11T19:48:17Z
dc.date.issued2024-04-05
dc.description.abstractThis work proposes novel methodologies to improve the performance of one-class classifiers applied to multivariate time series data. The main method is through clustering of multivariate time series. Datasets arising from real processes come from the available sensors and are affected by many factors, such as aging of the process, changes in the operation region, and equipment malfunction. Despite that, one expects that the classes represented by such diverse data can be unveiled via trained classifiers. This work hypothesizes that the overall performance can be improved by training sets of one-class classifiers with subsets of data clustered by similarity, obtained by DTW Barycenter Averaging (DBA) which is used to measure the similarity between the time series and each cluster. The proposed method is applied to one class classifiers since they are trained only with the target class, which is clustered based on time series similarity using Dynamic Time Warping and k-means. Additionally, a second approach is proposed, called time-shift of labels, to improve the differentiation between normal and faulty data. This method is applied during the training phase and focuses on particular situations involving the transition from normality to faulty data, where the boundaries are difficult to differentiate (overlapping data). The time-shift results show a mitigation of the effect of overlapping data. The advantages of the techniques are illustrated through their application to two public datasets one from the oil industry with instances characterizing eight classes of data represented by five time series (3W dataset), and another from a hydraulic system for the study of typical hydraulic system failures with five classes and seventeen time series (Condition monitoring of hydraulic systems - ICM dataset). For the 3W dataset, seven classes are selected to train Long Short Term Memory (LSTM) classifiers using the variables and instances clustered using time series clustering algorithms. The results demonstrate that increasing the similarity of training data tends to improve the performance of the LSTM classifier, achieving an increase of 10% in the overall performance on the 3W dataset. In a specific case, where the clustering model raised the similarity by 84%, the classification performance improved by 21%. For condition monitoring of hydraulic system data, the proposed method achieved a significant performance improvement of over 40% compared to the baseline model. Notably, in the specific case of leakage fault, the classification performance improvement rises by 64%
dc.description.resumoEssa dissertação propõe metodologias inovadoras para melhorar o desempenho de classificadores One-Class aplicados a dados de séries temporais multivariadas. O método principal se baseia no agrupamento de séries temporais multivariadas. Os conjuntos de dados provenientes de processos reais vêm de sensores disponíveis e são afetados por muitos fatores, tais como o mudança do processo, mudanças na região de operação e mau funcionamento do equipamento. Apesar disso, espera-se que as classes representadas por esses dados tão diversos possam ser reveladas por meio de classificadores treinados. Este trabalho levanta a hipótese de que o desempenho geral pode ser aprimorado treinando conjuntos de classificadores One-Class com subconjuntos de dados agrupados por similaridade, obtidos pela Média da Centroide de Distorção Temporal Dinâmica (DTW Barycenter Averaging - DBA), usada para medir a similaridade entre as séries temporais e de cada grupo. O método proposto é aplicado a classificadores One-Class, pois eles são treinados apenas com a classe alvo, que é agrupada com base na similaridade da série temporal usando Distorção Temporal Dinâmica (DBA) e agrupamento de dados k-médias. Além disso, uma segunda abordagem é proposta, chamada deslocamento temporal de rótulos, para melhorar a diferenciação entre dados normais e defeituosos. Este método é aplicado durante a fase de treinamento e foca em situações específicas envolvendo a transição da normalidade para dados defeituosos, onde os limites são difíceis de diferenciar (dados sobrepostos). Os resultados do deslocamento temporal mostram uma mitigação do efeito dos dados sobrepostos. As vantagens das técnicas são ilustradas por meio de sua aplicação em dois conjuntos de dados públicos: um da indústria de petróleo com instâncias que caracterizam oito classes de dados representadas por cinco séries temporais (conjunto de dados 3W) e outro de um sistema hidráulico para o estudo de falhas típicas de sistemas hidráulicos com cinco classes e dezessete séries temporais (conjunto de dados Monitoramento de condições de sistemas hidráulicos - ICM). Para o conjunto de dados 3W, sete classes são selecionadas para treinar classificadores LSTM (Long Short-Term Memory) usando o agrupamento de séries temporais. Os resultados demonstram que o aumento da similaridade dos dados de treinamento tende a melhorar o desempenho do classificador LSTM, alcançando um aumento de 10% no desempenho geral no conjunto de dados 3W. Em um caso específico, onde o modelo de agrupamento aumentou a similaridade em 84%, o desempenho da classificação melhorou em 21%. Para o monitoramento da condição de dados do sistema hidráulico, o método proposto alcançou uma melhoria significativa de desempenho de mais de 40% em comparação com o modelo base. Notavelmente, no caso específico de falha de vazamento, a melhoria do desempenho da classificação aumentou em 64%
dc.formatText
dc.identifier.urihttp://repositorio.ufes.br/handle/10/17724
dc.languagepor
dc.language.isoen
dc.publisherUniversidade Federal do Espírito Santo
dc.publisher.countryBR
dc.publisher.courseDoutorado em Engenharia Elétrica
dc.publisher.departmentCentro Tecnológico
dc.publisher.initialsUFES
dc.publisher.programPrograma de Pós-Graduação em Engenharia Elétrica
dc.rightsopen access
dc.subjectAgrupamento de series temporais
dc.subjectOne-Class Classifier
dc.subjectDynamic Time Warping
dc.subjectLong Short-Term Memory
dc.subjectClassificação de Series Temporais Multivariadas
dc.subject.cnpqEngenharia Elétrica
dc.titleMethodologies to improve one-class classifier performance applied to multivariate time series
dc.typedoctoralThesis
foaf.mboxandrepaulofm@gmail.com
Arquivos
Pacote Original
Agora exibindo 1 - 2 de 2
Carregando...
Imagem de Miniatura
Nome:
AndrePauloFerreiraMachado-2024-tese.pdf
Tamanho:
16.46 MB
Formato:
Adobe Portable Document Format
Descrição:
Carregando...
Imagem de Miniatura
Nome:
AndrePauloFerreiraMachado-2024-ata.pdf
Tamanho:
498.45 KB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: