Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo.
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/3/3154/tde-16012026-084015/ |
Resumo: | O eletrocardiograma (ECG) é uma ferramenta diagnóstica essencial, fornecendo informações cruciais para o manejo de condições cardíacas graves, como o infarto agudo do miocárdio. Sua importância é especialmente destacada em ambientes de emergência, onde a detecção rápida de certas alterações cardíacas é vital. Nesse contexto, o desenvolvimento de ferramentas de auxílio ao diagnóstico para exames de ECG é altamente desejável, especialmente em cenários com alta carga de trabalho para profissionais de saúde e em regiões com deficit de médicos especialistas. Existem diferentes estudos focados na classificação automatizada de exames de ECG. No entanto, esses trabalhos geralmente se concentram em sinais como série temporal, usualmente encontrados em bancos de dados públicos. A aplicabilidade desses métodos é, contudo, restrita em ambientes hospitalares, onde os ECGs são comumente analisados, compartilhados e armazenados como imagens. Neste trabalho, desenvolveu-se uma metodologia baseada em inteligência artificial utilizando redes neurais convolucionais (CNNs) para a classificação de imagens de ECG. Inicialmente, foram construídos três bancos de dados: um com imagens sintéticas, com mais de 2 milhões de imagens derivadas de dados públicos, e dois de imagens reais, provenientes de um hospital especializado em cardiologia. Os bancos com imagens reais incluem um conjunto ambulatorial com cerca de 100 mil imagens e um de emergência com 20 mil exames. Este último foi anotado por 19 cardiologistas, com dois anotadores por exame e um terceiro consultado em caso de discordância. Para a anotação, foram escolhidas 13 classes de interesse no contexto de emergência. O método de classificação proposto envolve a definição da melhor arquitetura de rede neural e da melhor estratégia de treinamento para os conjuntos de dados. Para isso, 20% dos dados do banco de emergência foram separados para testes finais, enquanto 80% foram utilizados no desenvolvimento das estratégias. Utilizou-se uma validação cruzada de 10 folds nos 80% dos dados, selecionando a arquitetura de rede neural com melhor desempenho, baseada no F1-score médio. Além disso, foram propostas diferentes otimizações de desempenho, incluindo o pré-treinamento com outros bancos de dados de ECG, a construção de uma função de perda customizada, o uso de metadados e o re-treinamento com imagens de resolução maior. Um estudo de ablação foi realizado para selecionar o conjunto de otimizações que resultaram no melhor F1-score. Dentre as arquiteturas de CNNs utilizadas, a ConvNeXt demonstrou o melhor desempenho. Ao empregar esta arquitetura com otimizações definidas a partir do estudo de ablação, o modelo atingiu um F1-score médio de 0,802 (0,749-0,855) no conjunto de teste, um resultado comparável ao dos cardiologistas, que apresentaram um F1-score de 0,819 (0,774-0,865), sem diferenças estatisticamente significativas entre os dois. O estudo demonstrou a capacidade das técnicas baseadas em aprendizado profundo por CNNs em oferecer suporte ao diagnóstico de imagens de exames de ECG, alcançando um desempenho comparável ao de especialistas humanos. |
| id |
USP_272120d25bf905f5d53a42ba01338501 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-16012026-084015 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo.Automated classification of electrocardiogram images using deep learningAprendizado profundoArtificial intelligence.Banco de dados médicosDeep learningElectrocardiogramElectrocardiogram ImagesEletrocardiografiaImagens de eletrocardiogramaInteligência artificialMedical databaseO eletrocardiograma (ECG) é uma ferramenta diagnóstica essencial, fornecendo informações cruciais para o manejo de condições cardíacas graves, como o infarto agudo do miocárdio. Sua importância é especialmente destacada em ambientes de emergência, onde a detecção rápida de certas alterações cardíacas é vital. Nesse contexto, o desenvolvimento de ferramentas de auxílio ao diagnóstico para exames de ECG é altamente desejável, especialmente em cenários com alta carga de trabalho para profissionais de saúde e em regiões com deficit de médicos especialistas. Existem diferentes estudos focados na classificação automatizada de exames de ECG. No entanto, esses trabalhos geralmente se concentram em sinais como série temporal, usualmente encontrados em bancos de dados públicos. A aplicabilidade desses métodos é, contudo, restrita em ambientes hospitalares, onde os ECGs são comumente analisados, compartilhados e armazenados como imagens. Neste trabalho, desenvolveu-se uma metodologia baseada em inteligência artificial utilizando redes neurais convolucionais (CNNs) para a classificação de imagens de ECG. Inicialmente, foram construídos três bancos de dados: um com imagens sintéticas, com mais de 2 milhões de imagens derivadas de dados públicos, e dois de imagens reais, provenientes de um hospital especializado em cardiologia. Os bancos com imagens reais incluem um conjunto ambulatorial com cerca de 100 mil imagens e um de emergência com 20 mil exames. Este último foi anotado por 19 cardiologistas, com dois anotadores por exame e um terceiro consultado em caso de discordância. Para a anotação, foram escolhidas 13 classes de interesse no contexto de emergência. O método de classificação proposto envolve a definição da melhor arquitetura de rede neural e da melhor estratégia de treinamento para os conjuntos de dados. Para isso, 20% dos dados do banco de emergência foram separados para testes finais, enquanto 80% foram utilizados no desenvolvimento das estratégias. Utilizou-se uma validação cruzada de 10 folds nos 80% dos dados, selecionando a arquitetura de rede neural com melhor desempenho, baseada no F1-score médio. Além disso, foram propostas diferentes otimizações de desempenho, incluindo o pré-treinamento com outros bancos de dados de ECG, a construção de uma função de perda customizada, o uso de metadados e o re-treinamento com imagens de resolução maior. Um estudo de ablação foi realizado para selecionar o conjunto de otimizações que resultaram no melhor F1-score. Dentre as arquiteturas de CNNs utilizadas, a ConvNeXt demonstrou o melhor desempenho. Ao empregar esta arquitetura com otimizações definidas a partir do estudo de ablação, o modelo atingiu um F1-score médio de 0,802 (0,749-0,855) no conjunto de teste, um resultado comparável ao dos cardiologistas, que apresentaram um F1-score de 0,819 (0,774-0,865), sem diferenças estatisticamente significativas entre os dois. O estudo demonstrou a capacidade das técnicas baseadas em aprendizado profundo por CNNs em oferecer suporte ao diagnóstico de imagens de exames de ECG, alcançando um desempenho comparável ao de especialistas humanos.The electrocardiogram (ECG) is an essential diagnostic tool that provides critical information for managing serious cardiac conditions, such as acute myocardial infarction. Its importance is particularly evident in emergency settings, where the rapid detection of certain cardiac abnormalities is vital. In this context, the development of diagnostic support tools for ECG exams is highly desirable, especially in scenarios with high workloads for healthcare professionals and in regions with a shortage of medical specialists. Various studies have focused on the automated classification of ECG exams. However, these studies typically concentrate on signal-based time series data, which are commonly found in public datasets. The applicability of such methods is limited in hospital environments, where ECGs are frequently analyzed, shared, and stored as images. In this study, we developed an artificial intelligence-based methodology using convolutional neural networks (CNNs) to classify ECG images. Initially, three datasets were created: one synthetic dataset containing over 2 million images generated from public data, and two real-image datasets sourced from a specialized cardiology hospital. The real-image datasets include an outpatient set with approximately 100,000 images and an emergency set with 20,000 exams. The latter was annotated by 19 cardiologists, with each exam reviewed by two annotators and a third consulted in case of disagreement. Thirteen clinically relevant classes were selected for annotation in the emergency setting. The proposed classification method involved determining the best neural network architecture and training strategy for the datasets. To that end, 20% of the emergency dataset was set aside for final testing, while the remaining 80% was used to develop the strategies. A 10-fold cross-validation was performed on the 80% development set, and the network architecture with the highest average F1-score was selected. In addition, various performance optimizations were explored, including pretraining with other ECG datasets, the design of a custom loss function, the incorporation of metadata, and retraining with higher-resolution images. An ablation study was conducted to identify the combination of optimizations that achieved the best F1-score. Among the CNN architectures evaluated, ConvNeXt demonstrated the best performance. By employing this architecture with optimizations defined through the ablation study, the model achieved a mean F1-score of 0.802 (0.7490.855) on the test set, a result comparable to that of cardiologists, who obtained 0.819 (0.7740.865), with no statistically significant differences. The study demonstrated that deep learning techniques based on CNNs can support the diagnosis of ECG images, achieving performance comparable to that of human experts.Biblioteca Digitais de Teses e Dissertações da USPGutierrez, Marco AntonioDias, Felipe Meneguitti2025-08-04info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3154/tde-16012026-084015/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2026-01-16T10:52:02Zoai:teses.usp.br:tde-16012026-084015Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212026-01-16T10:52:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo. Automated classification of electrocardiogram images using deep learning |
| title |
Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo. |
| spellingShingle |
Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo. Dias, Felipe Meneguitti Aprendizado profundo Artificial intelligence. Banco de dados médicos Deep learning Electrocardiogram Electrocardiogram Images Eletrocardiografia Imagens de eletrocardiograma Inteligência artificial Medical database |
| title_short |
Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo. |
| title_full |
Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo. |
| title_fullStr |
Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo. |
| title_full_unstemmed |
Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo. |
| title_sort |
Classificação automatizada de imagens de eletrocardiogramas por aprendizado profundo. |
| author |
Dias, Felipe Meneguitti |
| author_facet |
Dias, Felipe Meneguitti |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Gutierrez, Marco Antonio |
| dc.contributor.author.fl_str_mv |
Dias, Felipe Meneguitti |
| dc.subject.por.fl_str_mv |
Aprendizado profundo Artificial intelligence. Banco de dados médicos Deep learning Electrocardiogram Electrocardiogram Images Eletrocardiografia Imagens de eletrocardiograma Inteligência artificial Medical database |
| topic |
Aprendizado profundo Artificial intelligence. Banco de dados médicos Deep learning Electrocardiogram Electrocardiogram Images Eletrocardiografia Imagens de eletrocardiograma Inteligência artificial Medical database |
| description |
O eletrocardiograma (ECG) é uma ferramenta diagnóstica essencial, fornecendo informações cruciais para o manejo de condições cardíacas graves, como o infarto agudo do miocárdio. Sua importância é especialmente destacada em ambientes de emergência, onde a detecção rápida de certas alterações cardíacas é vital. Nesse contexto, o desenvolvimento de ferramentas de auxílio ao diagnóstico para exames de ECG é altamente desejável, especialmente em cenários com alta carga de trabalho para profissionais de saúde e em regiões com deficit de médicos especialistas. Existem diferentes estudos focados na classificação automatizada de exames de ECG. No entanto, esses trabalhos geralmente se concentram em sinais como série temporal, usualmente encontrados em bancos de dados públicos. A aplicabilidade desses métodos é, contudo, restrita em ambientes hospitalares, onde os ECGs são comumente analisados, compartilhados e armazenados como imagens. Neste trabalho, desenvolveu-se uma metodologia baseada em inteligência artificial utilizando redes neurais convolucionais (CNNs) para a classificação de imagens de ECG. Inicialmente, foram construídos três bancos de dados: um com imagens sintéticas, com mais de 2 milhões de imagens derivadas de dados públicos, e dois de imagens reais, provenientes de um hospital especializado em cardiologia. Os bancos com imagens reais incluem um conjunto ambulatorial com cerca de 100 mil imagens e um de emergência com 20 mil exames. Este último foi anotado por 19 cardiologistas, com dois anotadores por exame e um terceiro consultado em caso de discordância. Para a anotação, foram escolhidas 13 classes de interesse no contexto de emergência. O método de classificação proposto envolve a definição da melhor arquitetura de rede neural e da melhor estratégia de treinamento para os conjuntos de dados. Para isso, 20% dos dados do banco de emergência foram separados para testes finais, enquanto 80% foram utilizados no desenvolvimento das estratégias. Utilizou-se uma validação cruzada de 10 folds nos 80% dos dados, selecionando a arquitetura de rede neural com melhor desempenho, baseada no F1-score médio. Além disso, foram propostas diferentes otimizações de desempenho, incluindo o pré-treinamento com outros bancos de dados de ECG, a construção de uma função de perda customizada, o uso de metadados e o re-treinamento com imagens de resolução maior. Um estudo de ablação foi realizado para selecionar o conjunto de otimizações que resultaram no melhor F1-score. Dentre as arquiteturas de CNNs utilizadas, a ConvNeXt demonstrou o melhor desempenho. Ao empregar esta arquitetura com otimizações definidas a partir do estudo de ablação, o modelo atingiu um F1-score médio de 0,802 (0,749-0,855) no conjunto de teste, um resultado comparável ao dos cardiologistas, que apresentaram um F1-score de 0,819 (0,774-0,865), sem diferenças estatisticamente significativas entre os dois. O estudo demonstrou a capacidade das técnicas baseadas em aprendizado profundo por CNNs em oferecer suporte ao diagnóstico de imagens de exames de ECG, alcançando um desempenho comparável ao de especialistas humanos. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-08-04 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3154/tde-16012026-084015/ |
| url |
https://www.teses.usp.br/teses/disponiveis/3/3154/tde-16012026-084015/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1857669979077345280 |