Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo.

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Dias, Felipe Meneguitti
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3154/tde-16012026-084015/
Resumo: O eletrocardiograma (ECG) é uma ferramenta diagnóstica essencial, fornecendo informações cruciais para o manejo de condições cardíacas graves, como o infarto agudo do miocárdio. Sua importância é especialmente destacada em ambientes de emergência, onde a detecção rápida de certas alterações cardíacas é vital. Nesse contexto, o desenvolvimento de ferramentas de auxílio ao diagnóstico para exames de ECG é altamente desejável, especialmente em cenários com alta carga de trabalho para profissionais de saúde e em regiões com deficit de médicos especialistas. Existem diferentes estudos focados na classificação automatizada de exames de ECG. No entanto, esses trabalhos geralmente se concentram em sinais como série temporal, usualmente encontrados em bancos de dados públicos. A aplicabilidade desses métodos é, contudo, restrita em ambientes hospitalares, onde os ECGs são comumente analisados, compartilhados e armazenados como imagens. Neste trabalho, desenvolveu-se uma metodologia baseada em inteligência artificial utilizando redes neurais convolucionais (CNNs) para a classificação de imagens de ECG. Inicialmente, foram construídos três bancos de dados: um com imagens sintéticas, com mais de 2 milhões de imagens derivadas de dados públicos, e dois de imagens reais, provenientes de um hospital especializado em cardiologia. Os bancos com imagens reais incluem um conjunto ambulatorial com cerca de 100 mil imagens e um de emergência com 20 mil exames. Este último foi anotado por 19 cardiologistas, com dois anotadores por exame e um terceiro consultado em caso de discordância. Para a anotação, foram escolhidas 13 classes de interesse no contexto de emergência. O método de classificação proposto envolve a definição da melhor arquitetura de rede neural e da melhor estratégia de treinamento para os conjuntos de dados. Para isso, 20% dos dados do banco de emergência foram separados para testes finais, enquanto 80% foram utilizados no desenvolvimento das estratégias. Utilizou-se uma validação cruzada de 10 folds nos 80% dos dados, selecionando a arquitetura de rede neural com melhor desempenho, baseada no F1-score médio. Além disso, foram propostas diferentes otimizações de desempenho, incluindo o pré-treinamento com outros bancos de dados de ECG, a construção de uma função de perda customizada, o uso de metadados e o re-treinamento com imagens de resolução maior. Um estudo de ablação foi realizado para selecionar o conjunto de otimizações que resultaram no melhor F1-score. Dentre as arquiteturas de CNNs utilizadas, a ConvNeXt demonstrou o melhor desempenho. Ao empregar esta arquitetura com otimizações definidas a partir do estudo de ablação, o modelo atingiu um F1-score médio de 0,802 (0,749-0,855) no conjunto de teste, um resultado comparável ao dos cardiologistas, que apresentaram um F1-score de 0,819 (0,774-0,865), sem diferenças estatisticamente significativas entre os dois. O estudo demonstrou a capacidade das técnicas baseadas em aprendizado profundo por CNNs em oferecer suporte ao diagnóstico de imagens de exames de ECG, alcançando um desempenho comparável ao de especialistas humanos.
id USP_272120d25bf905f5d53a42ba01338501
oai_identifier_str oai:teses.usp.br:tde-16012026-084015
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo.Automated classification of electrocardiogram images using deep learningAprendizado profundoArtificial intelligence.Banco de dados médicosDeep learningElectrocardiogramElectrocardiogram ImagesEletrocardiografiaImagens de eletrocardiogramaInteligência artificialMedical databaseO eletrocardiograma (ECG) é uma ferramenta diagnóstica essencial, fornecendo informações cruciais para o manejo de condições cardíacas graves, como o infarto agudo do miocárdio. Sua importância é especialmente destacada em ambientes de emergência, onde a detecção rápida de certas alterações cardíacas é vital. Nesse contexto, o desenvolvimento de ferramentas de auxílio ao diagnóstico para exames de ECG é altamente desejável, especialmente em cenários com alta carga de trabalho para profissionais de saúde e em regiões com deficit de médicos especialistas. Existem diferentes estudos focados na classificação automatizada de exames de ECG. No entanto, esses trabalhos geralmente se concentram em sinais como série temporal, usualmente encontrados em bancos de dados públicos. A aplicabilidade desses métodos é, contudo, restrita em ambientes hospitalares, onde os ECGs são comumente analisados, compartilhados e armazenados como imagens. Neste trabalho, desenvolveu-se uma metodologia baseada em inteligência artificial utilizando redes neurais convolucionais (CNNs) para a classificação de imagens de ECG. Inicialmente, foram construídos três bancos de dados: um com imagens sintéticas, com mais de 2 milhões de imagens derivadas de dados públicos, e dois de imagens reais, provenientes de um hospital especializado em cardiologia. Os bancos com imagens reais incluem um conjunto ambulatorial com cerca de 100 mil imagens e um de emergência com 20 mil exames. Este último foi anotado por 19 cardiologistas, com dois anotadores por exame e um terceiro consultado em caso de discordância. Para a anotação, foram escolhidas 13 classes de interesse no contexto de emergência. O método de classificação proposto envolve a definição da melhor arquitetura de rede neural e da melhor estratégia de treinamento para os conjuntos de dados. Para isso, 20% dos dados do banco de emergência foram separados para testes finais, enquanto 80% foram utilizados no desenvolvimento das estratégias. Utilizou-se uma validação cruzada de 10 folds nos 80% dos dados, selecionando a arquitetura de rede neural com melhor desempenho, baseada no F1-score médio. Além disso, foram propostas diferentes otimizações de desempenho, incluindo o pré-treinamento com outros bancos de dados de ECG, a construção de uma função de perda customizada, o uso de metadados e o re-treinamento com imagens de resolução maior. Um estudo de ablação foi realizado para selecionar o conjunto de otimizações que resultaram no melhor F1-score. Dentre as arquiteturas de CNNs utilizadas, a ConvNeXt demonstrou o melhor desempenho. Ao empregar esta arquitetura com otimizações definidas a partir do estudo de ablação, o modelo atingiu um F1-score médio de 0,802 (0,749-0,855) no conjunto de teste, um resultado comparável ao dos cardiologistas, que apresentaram um F1-score de 0,819 (0,774-0,865), sem diferenças estatisticamente significativas entre os dois. O estudo demonstrou a capacidade das técnicas baseadas em aprendizado profundo por CNNs em oferecer suporte ao diagnóstico de imagens de exames de ECG, alcançando um desempenho comparável ao de especialistas humanos.The electrocardiogram (ECG) is an essential diagnostic tool that provides critical information for managing serious cardiac conditions, such as acute myocardial infarction. Its importance is particularly evident in emergency settings, where the rapid detection of certain cardiac abnormalities is vital. In this context, the development of diagnostic support tools for ECG exams is highly desirable, especially in scenarios with high workloads for healthcare professionals and in regions with a shortage of medical specialists. Various studies have focused on the automated classification of ECG exams. However, these studies typically concentrate on signal-based time series data, which are commonly found in public datasets. The applicability of such methods is limited in hospital environments, where ECGs are frequently analyzed, shared, and stored as images. In this study, we developed an artificial intelligence-based methodology using convolutional neural networks (CNNs) to classify ECG images. Initially, three datasets were created: one synthetic dataset containing over 2 million images generated from public data, and two real-image datasets sourced from a specialized cardiology hospital. The real-image datasets include an outpatient set with approximately 100,000 images and an emergency set with 20,000 exams. The latter was annotated by 19 cardiologists, with each exam reviewed by two annotators and a third consulted in case of disagreement. Thirteen clinically relevant classes were selected for annotation in the emergency setting. The proposed classification method involved determining the best neural network architecture and training strategy for the datasets. To that end, 20% of the emergency dataset was set aside for final testing, while the remaining 80% was used to develop the strategies. A 10-fold cross-validation was performed on the 80% development set, and the network architecture with the highest average F1-score was selected. In addition, various performance optimizations were explored, including pretraining with other ECG datasets, the design of a custom loss function, the incorporation of metadata, and retraining with higher-resolution images. An ablation study was conducted to identify the combination of optimizations that achieved the best F1-score. Among the CNN architectures evaluated, ConvNeXt demonstrated the best performance. By employing this architecture with optimizations defined through the ablation study, the model achieved a mean F1-score of 0.802 (0.7490.855) on the test set, a result comparable to that of cardiologists, who obtained 0.819 (0.7740.865), with no statistically significant differences. The study demonstrated that deep learning techniques based on CNNs can support the diagnosis of ECG images, achieving performance comparable to that of human experts.Biblioteca Digitais de Teses e Dissertações da USPGutierrez, Marco AntonioDias, Felipe Meneguitti2025-08-04info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3154/tde-16012026-084015/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2026-01-16T10:52:02Zoai:teses.usp.br:tde-16012026-084015Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212026-01-16T10:52:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo.
Automated classification of electrocardiogram images using deep learning
title Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo.
spellingShingle Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo.
Dias, Felipe Meneguitti
Aprendizado profundo
Artificial intelligence.
Banco de dados médicos
Deep learning
Electrocardiogram
Electrocardiogram Images
Eletrocardiografia
Imagens de eletrocardiograma
Inteligência artificial
Medical database
title_short Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo.
title_full Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo.
title_fullStr Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo.
title_full_unstemmed Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo.
title_sort Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo.
author Dias, Felipe Meneguitti
author_facet Dias, Felipe Meneguitti
author_role author
dc.contributor.none.fl_str_mv Gutierrez, Marco Antonio
dc.contributor.author.fl_str_mv Dias, Felipe Meneguitti
dc.subject.por.fl_str_mv Aprendizado profundo
Artificial intelligence.
Banco de dados médicos
Deep learning
Electrocardiogram
Electrocardiogram Images
Eletrocardiografia
Imagens de eletrocardiograma
Inteligência artificial
Medical database
topic Aprendizado profundo
Artificial intelligence.
Banco de dados médicos
Deep learning
Electrocardiogram
Electrocardiogram Images
Eletrocardiografia
Imagens de eletrocardiograma
Inteligência artificial
Medical database
description O eletrocardiograma (ECG) é uma ferramenta diagnóstica essencial, fornecendo informações cruciais para o manejo de condições cardíacas graves, como o infarto agudo do miocárdio. Sua importância é especialmente destacada em ambientes de emergência, onde a detecção rápida de certas alterações cardíacas é vital. Nesse contexto, o desenvolvimento de ferramentas de auxílio ao diagnóstico para exames de ECG é altamente desejável, especialmente em cenários com alta carga de trabalho para profissionais de saúde e em regiões com deficit de médicos especialistas. Existem diferentes estudos focados na classificação automatizada de exames de ECG. No entanto, esses trabalhos geralmente se concentram em sinais como série temporal, usualmente encontrados em bancos de dados públicos. A aplicabilidade desses métodos é, contudo, restrita em ambientes hospitalares, onde os ECGs são comumente analisados, compartilhados e armazenados como imagens. Neste trabalho, desenvolveu-se uma metodologia baseada em inteligência artificial utilizando redes neurais convolucionais (CNNs) para a classificação de imagens de ECG. Inicialmente, foram construídos três bancos de dados: um com imagens sintéticas, com mais de 2 milhões de imagens derivadas de dados públicos, e dois de imagens reais, provenientes de um hospital especializado em cardiologia. Os bancos com imagens reais incluem um conjunto ambulatorial com cerca de 100 mil imagens e um de emergência com 20 mil exames. Este último foi anotado por 19 cardiologistas, com dois anotadores por exame e um terceiro consultado em caso de discordância. Para a anotação, foram escolhidas 13 classes de interesse no contexto de emergência. O método de classificação proposto envolve a definição da melhor arquitetura de rede neural e da melhor estratégia de treinamento para os conjuntos de dados. Para isso, 20% dos dados do banco de emergência foram separados para testes finais, enquanto 80% foram utilizados no desenvolvimento das estratégias. Utilizou-se uma validação cruzada de 10 folds nos 80% dos dados, selecionando a arquitetura de rede neural com melhor desempenho, baseada no F1-score médio. Além disso, foram propostas diferentes otimizações de desempenho, incluindo o pré-treinamento com outros bancos de dados de ECG, a construção de uma função de perda customizada, o uso de metadados e o re-treinamento com imagens de resolução maior. Um estudo de ablação foi realizado para selecionar o conjunto de otimizações que resultaram no melhor F1-score. Dentre as arquiteturas de CNNs utilizadas, a ConvNeXt demonstrou o melhor desempenho. Ao empregar esta arquitetura com otimizações definidas a partir do estudo de ablação, o modelo atingiu um F1-score médio de 0,802 (0,749-0,855) no conjunto de teste, um resultado comparável ao dos cardiologistas, que apresentaram um F1-score de 0,819 (0,774-0,865), sem diferenças estatisticamente significativas entre os dois. O estudo demonstrou a capacidade das técnicas baseadas em aprendizado profundo por CNNs em oferecer suporte ao diagnóstico de imagens de exames de ECG, alcançando um desempenho comparável ao de especialistas humanos.
publishDate 2025
dc.date.none.fl_str_mv 2025-08-04
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/3/3154/tde-16012026-084015/
url https://www.teses.usp.br/teses/disponiveis/3/3154/tde-16012026-084015/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1857669979077345280