Análise e priorização de alarmes industriais utilizando word embeddings e técnicas de aprendizado de máquina

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Medeiros, Isaac Emmanuel Azevedo de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal da Paraíba
Brasil
Engenharia Elétrica
Programa de Pós-Graduação em Engenharia Elétrica
UFPB
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpb.br/jspui/handle/123456789/33691
Resumo: The analysis of industrial alarm content is of utmost importance for the detection and prevention of failures in operational processes. Alarms function as an alert system, signaling the operations team about abnormal conditions and potential failures in real-time. However, the excessive generation of records by these systems can hinder the identification and effective response to critical situations. Therefore, it is essential to develop efficient alarm management, aiming to prioritize and intelligently group alarms. Additionally, by conducting a thorough analysis of industrial alarm data, it is possible to gain a deeper understanding of operational conditions, recognize recurring patterns, identify trends, and take proactive measures to prevent failures. In this study, event and alarm data were collected and used from the SCADA (Supervisory Control and Data Acquisition) system of a thermoelectric plant located in the state of Paraíba. An exploratory analysis was conducted to understand the operational impacts caused by the volume of alarms, and for these alarms and their respective clusters, patterns involving temporal sequences were sought, which may suggest causality and assist in determining root causes for specific records. Natural language processing (NLP) techniques were used in the preprocessing of alarm texts to generalize information, eliminating equipment identifiers and elements with low semantic relevance. The BERT (Bidirectional Encoder Representations from Transformers) language model was used for the numerical representation of the text, and clustering and classification techniques were applied for the efficient grouping of alarms. By clustering alarm messages using the K-means algorithm, and with the obtained clusters, the Support Vector Classifier (SVM) algorithm with a linear kernel was applied, achieving an accuracy greater than 99% on the test dataset. It was thus possible to label a new sample with considerable efficiency. The use of BERT to transform alarm messages into embeddings, as well as the text preprocessing, directly contributed to the results obtained. The approach taken in this work not only improves alarm management but also contributes to a safer and more efficient operational environment, which is essential for the sustainability and productivity of the industry.
id UFPB_54cdacc936811ab160872a9b455d96e2
oai_identifier_str oai:repositorio.ufpb.br:123456789/33691
network_acronym_str UFPB
network_name_str Biblioteca Digital de Teses e Dissertações da UFPB
repository_id_str
spelling Análise e priorização de alarmes industriais utilizando word embeddings e técnicas de aprendizado de máquinaAlarmes industriaisIncorporação de palavrasGerenciamento de alarmesIndustrial AlarmsAlarm ManagementClusteringClassificationNatural Language ProcessingWord embeddingCNPQ::ENGENHARIAS::ENGENHARIA ELETRICAThe analysis of industrial alarm content is of utmost importance for the detection and prevention of failures in operational processes. Alarms function as an alert system, signaling the operations team about abnormal conditions and potential failures in real-time. However, the excessive generation of records by these systems can hinder the identification and effective response to critical situations. Therefore, it is essential to develop efficient alarm management, aiming to prioritize and intelligently group alarms. Additionally, by conducting a thorough analysis of industrial alarm data, it is possible to gain a deeper understanding of operational conditions, recognize recurring patterns, identify trends, and take proactive measures to prevent failures. In this study, event and alarm data were collected and used from the SCADA (Supervisory Control and Data Acquisition) system of a thermoelectric plant located in the state of Paraíba. An exploratory analysis was conducted to understand the operational impacts caused by the volume of alarms, and for these alarms and their respective clusters, patterns involving temporal sequences were sought, which may suggest causality and assist in determining root causes for specific records. Natural language processing (NLP) techniques were used in the preprocessing of alarm texts to generalize information, eliminating equipment identifiers and elements with low semantic relevance. The BERT (Bidirectional Encoder Representations from Transformers) language model was used for the numerical representation of the text, and clustering and classification techniques were applied for the efficient grouping of alarms. By clustering alarm messages using the K-means algorithm, and with the obtained clusters, the Support Vector Classifier (SVM) algorithm with a linear kernel was applied, achieving an accuracy greater than 99% on the test dataset. It was thus possible to label a new sample with considerable efficiency. The use of BERT to transform alarm messages into embeddings, as well as the text preprocessing, directly contributed to the results obtained. The approach taken in this work not only improves alarm management but also contributes to a safer and more efficient operational environment, which is essential for the sustainability and productivity of the industry.Pró-Reitoria de Pós-graduação da UFPB (PRPG/UFPB)A análise do conteúdo de alarmes industriais é de suma importância para a detecção e prevenção de falhas em processos operacionais. Os alarmes funcionam como um sistema de alerta, sinalizando à equipe de operação sobre condições anormais e potenciais falhas em tempo real. Entretanto, a geração excessiva de registros por parte dos sistemas pode dificultar a identificação e a resposta eficaz diante de situações críticas. Por isso, torna-se imprescindível o desenvolvimento de uma gestão eficiente dos alarmes, a fim de priorizá-los e agrupá-los de maneira inteligente. Além disso, ao realizar uma análise minuciosa dos dados de alarmes industriais, é possível obter um entendimento mais aprofundado das condições operacionais, reconhecer padrões recorrentes e identificar tendências, além de agir de forma proativa para evitar falhas. Neste estudo, foram coletados e utilizados dados de eventos e alarmes extraídos do sistema SCADA (Supervisory Control and Data Acquisition) de uma usina termoelétrica situada no estado da Paraíba. Realizou-se uma análise exploratória, a fim de entender os impactos operacionais causados pela volumetria dos alarmes e, para estes e seus respectivos clusters, buscar padrões envolvendo sequências temporais, que podem sugerir causalidade, bem como auxiliar na determinação de causas raiz para determinados registros. Técnicas de processamento de linguagem natural (PLN) foram utilizadas no pré-processamento dos textos dos alarmes para generalizar informações, eliminando identificadores de equipamentos e elementos com baixa relevância semântica. Foi utilizado o modelo de linguagem BERT (Bidirectional Encoder Representations from Transformers) para a representação numérica do texto, e aplicadas técnicas de clusterização e classificação para o agrupamento eficiente dos alarmes. Por meio da clusterização das mensagens dos alarmes, utilizando o algoritmo K-means, com os os clusters obtidos, aplicou-se o algoritmo de classificação Support Vector Classifier (SVM) com kernel linear, alcançando uma acurácia superior a 99% no conjunto de dados de teste. Foi possível, portanto, rotular uma nova amostra com eficiência considerável. A utilização do BERT para transformar as mensagens dos alarmes em embeddings bem como o pré-processamento de texto contribuíram diretamente para os resultados obtidos. A abordagem realizada nesse trabalho não apenas permite melhorar a gestão dos alarmes, como também contribui para um ambiente operacional mais seguro e eficiente, o que é fundamental para a sustentabilidade e a produtividade da indústria.Universidade Federal da ParaíbaBrasilEngenharia ElétricaPrograma de Pós-Graduação em Engenharia ElétricaUFPBVillanueva, Juan Moises Mauriciohttp://lattes.cnpq.br/1446817462218646Medeiros, Isaac Emmanuel Azevedo de2025-02-21T14:01:21Z2024-09-182025-02-21T14:01:21Z2024-07-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttps://repositorio.ufpb.br/jspui/handle/123456789/33691porAttribution-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPB2025-02-22T06:22:53Zoai:repositorio.ufpb.br:123456789/33691Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufpb.br/PUBhttp://tede.biblioteca.ufpb.br:8080/oai/requestdiretoria@ufpb.br|| bdtd@biblioteca.ufpb.bropendoar:2025-02-22T06:22:53Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)false
dc.title.none.fl_str_mv Análise e priorização de alarmes industriais utilizando word embeddings e técnicas de aprendizado de máquina
title Análise e priorização de alarmes industriais utilizando word embeddings e técnicas de aprendizado de máquina
spellingShingle Análise e priorização de alarmes industriais utilizando word embeddings e técnicas de aprendizado de máquina
Medeiros, Isaac Emmanuel Azevedo de
Alarmes industriais
Incorporação de palavras
Gerenciamento de alarmes
Industrial Alarms
Alarm Management
Clustering
Classification
Natural Language Processing
Word embedding
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
title_short Análise e priorização de alarmes industriais utilizando word embeddings e técnicas de aprendizado de máquina
title_full Análise e priorização de alarmes industriais utilizando word embeddings e técnicas de aprendizado de máquina
title_fullStr Análise e priorização de alarmes industriais utilizando word embeddings e técnicas de aprendizado de máquina
title_full_unstemmed Análise e priorização de alarmes industriais utilizando word embeddings e técnicas de aprendizado de máquina
title_sort Análise e priorização de alarmes industriais utilizando word embeddings e técnicas de aprendizado de máquina
author Medeiros, Isaac Emmanuel Azevedo de
author_facet Medeiros, Isaac Emmanuel Azevedo de
author_role author
dc.contributor.none.fl_str_mv Villanueva, Juan Moises Mauricio
http://lattes.cnpq.br/1446817462218646
dc.contributor.author.fl_str_mv Medeiros, Isaac Emmanuel Azevedo de
dc.subject.por.fl_str_mv Alarmes industriais
Incorporação de palavras
Gerenciamento de alarmes
Industrial Alarms
Alarm Management
Clustering
Classification
Natural Language Processing
Word embedding
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
topic Alarmes industriais
Incorporação de palavras
Gerenciamento de alarmes
Industrial Alarms
Alarm Management
Clustering
Classification
Natural Language Processing
Word embedding
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
description The analysis of industrial alarm content is of utmost importance for the detection and prevention of failures in operational processes. Alarms function as an alert system, signaling the operations team about abnormal conditions and potential failures in real-time. However, the excessive generation of records by these systems can hinder the identification and effective response to critical situations. Therefore, it is essential to develop efficient alarm management, aiming to prioritize and intelligently group alarms. Additionally, by conducting a thorough analysis of industrial alarm data, it is possible to gain a deeper understanding of operational conditions, recognize recurring patterns, identify trends, and take proactive measures to prevent failures. In this study, event and alarm data were collected and used from the SCADA (Supervisory Control and Data Acquisition) system of a thermoelectric plant located in the state of Paraíba. An exploratory analysis was conducted to understand the operational impacts caused by the volume of alarms, and for these alarms and their respective clusters, patterns involving temporal sequences were sought, which may suggest causality and assist in determining root causes for specific records. Natural language processing (NLP) techniques were used in the preprocessing of alarm texts to generalize information, eliminating equipment identifiers and elements with low semantic relevance. The BERT (Bidirectional Encoder Representations from Transformers) language model was used for the numerical representation of the text, and clustering and classification techniques were applied for the efficient grouping of alarms. By clustering alarm messages using the K-means algorithm, and with the obtained clusters, the Support Vector Classifier (SVM) algorithm with a linear kernel was applied, achieving an accuracy greater than 99% on the test dataset. It was thus possible to label a new sample with considerable efficiency. The use of BERT to transform alarm messages into embeddings, as well as the text preprocessing, directly contributed to the results obtained. The approach taken in this work not only improves alarm management but also contributes to a safer and more efficient operational environment, which is essential for the sustainability and productivity of the industry.
publishDate 2024
dc.date.none.fl_str_mv 2024-09-18
2024-07-30
2025-02-21T14:01:21Z
2025-02-21T14:01:21Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpb.br/jspui/handle/123456789/33691
url https://repositorio.ufpb.br/jspui/handle/123456789/33691
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Engenharia Elétrica
Programa de Pós-Graduação em Engenharia Elétrica
UFPB
publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Engenharia Elétrica
Programa de Pós-Graduação em Engenharia Elétrica
UFPB
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFPB
instname:Universidade Federal da Paraíba (UFPB)
instacron:UFPB
instname_str Universidade Federal da Paraíba (UFPB)
instacron_str UFPB
institution UFPB
reponame_str Biblioteca Digital de Teses e Dissertações da UFPB
collection Biblioteca Digital de Teses e Dissertações da UFPB
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)
repository.mail.fl_str_mv diretoria@ufpb.br|| bdtd@biblioteca.ufpb.br
_version_ 1831315360191610880