Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Santos, Mauricio Koenigkam
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/82/82131/tde-19012026-160127/
Resumo: A doença pelo Coronavírus 19 (COVID-19) e a tuberculose são doenças respiratórias que apresentam cerca de 1,97 e 1,4 milhão de mortes por ano, respectivamente, na data de submissão deste trabalho (2024). O objetivo é realizar experimentos com 4 bancos de dados contendo imagens de radiografia simples de tórax (RXT) para estudar, implementar e testar 5 arquiteturas de rede neural convolucional (RNC) para classificar os dados em COVID-19, doença intersticial pulmonar (DIP), tuberculose e sem doenças. Foram utilizadas as técnicas de transfer learning (TL) e fine tuning (FT) para o treinamento dos modelos. A pneumonia por COVID-19 apresenta semelhança radiológica com DIP, por isso é importante testar a capacidade de diferenciação dos modelos. Para o estudo foi desenvolvido retrospectivamente uma base com exames de imagem de COVID-19, DIPs e tuberculose, provenientes de serviços do Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto (HCFMRP), USP. Também foram testadas imagens de outros três bancos de dados públicos, um com imagens de RXT de COVID-19 e dois com imagens de RXT de tuberculose. Foram realizados experimentos com a arquitetura de RNC VGG19 e três grupos de dados: Todos sem aumento (4 bancos de dados distintos e sem aumento artificial da quantidade de dados), Todos com aumento (4 bancos de dados distintos e com aumento artificial da quantidade de dados), HCFMRP com aumento (1 banco de dado próprio e com aumento artificial da quantidade de dados). 15% das imagens foram separadas para teste, o restante foi dividido em 5 partições para a realização do cross-validation. A melhor partição de cada experimento foi testada com o grupo de imagens para teste. Com o grupo de dados Todos com aumento foram obtidos os melhores resultados: acurácia geral de 88,26%, as médias (entre as classes) de precisão, sensibilidade, f1-score e AUC-ROC foram de 0,875, 0,867, 0,872 e 0,972, respectivamente. Depois foram mantidos os dados de treinamento, validação e teste e foram feitos experimentos com mais 4 RNCs: EfficientNetV2S, ResNet152V2, InceptionV3 e Xception. Nenhuma destas redes obteve desempenho melhor que a VGG19, as acurácias das outras redes apresentadas foram 86,68%, 84,23%, 84,90% e 82,55%, respectivamente. Foi realizado o Grad-CAM Heatmap para ajudar a visualizar como a RNC VGG19 utilizou as imagens para fazer a classificação. Os resultados são compatíveis com os encontrados na literatura sobre RNC e RXT e também com os trabalhos sobre desempenho dos médicos radiologistas.
id USP_09f2b904e2426dfedbac59187d1ee495
oai_identifier_str oai:teses.usp.br:tde-19012026-160127
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculoseConvolutional neural networks in chest X-Ray image classification: COVID-19, interstitial lung diseases, and tuberculosisconvolutional neural networkCOVID-19COVID-19doenças intersticiais pulmonaresinterstitial lung diseasesrede neural convolucionaltuberculosetuberculosisA doença pelo Coronavírus 19 (COVID-19) e a tuberculose são doenças respiratórias que apresentam cerca de 1,97 e 1,4 milhão de mortes por ano, respectivamente, na data de submissão deste trabalho (2024). O objetivo é realizar experimentos com 4 bancos de dados contendo imagens de radiografia simples de tórax (RXT) para estudar, implementar e testar 5 arquiteturas de rede neural convolucional (RNC) para classificar os dados em COVID-19, doença intersticial pulmonar (DIP), tuberculose e sem doenças. Foram utilizadas as técnicas de transfer learning (TL) e fine tuning (FT) para o treinamento dos modelos. A pneumonia por COVID-19 apresenta semelhança radiológica com DIP, por isso é importante testar a capacidade de diferenciação dos modelos. Para o estudo foi desenvolvido retrospectivamente uma base com exames de imagem de COVID-19, DIPs e tuberculose, provenientes de serviços do Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto (HCFMRP), USP. Também foram testadas imagens de outros três bancos de dados públicos, um com imagens de RXT de COVID-19 e dois com imagens de RXT de tuberculose. Foram realizados experimentos com a arquitetura de RNC VGG19 e três grupos de dados: Todos sem aumento (4 bancos de dados distintos e sem aumento artificial da quantidade de dados), Todos com aumento (4 bancos de dados distintos e com aumento artificial da quantidade de dados), HCFMRP com aumento (1 banco de dado próprio e com aumento artificial da quantidade de dados). 15% das imagens foram separadas para teste, o restante foi dividido em 5 partições para a realização do cross-validation. A melhor partição de cada experimento foi testada com o grupo de imagens para teste. Com o grupo de dados Todos com aumento foram obtidos os melhores resultados: acurácia geral de 88,26%, as médias (entre as classes) de precisão, sensibilidade, f1-score e AUC-ROC foram de 0,875, 0,867, 0,872 e 0,972, respectivamente. Depois foram mantidos os dados de treinamento, validação e teste e foram feitos experimentos com mais 4 RNCs: EfficientNetV2S, ResNet152V2, InceptionV3 e Xception. Nenhuma destas redes obteve desempenho melhor que a VGG19, as acurácias das outras redes apresentadas foram 86,68%, 84,23%, 84,90% e 82,55%, respectivamente. Foi realizado o Grad-CAM Heatmap para ajudar a visualizar como a RNC VGG19 utilizou as imagens para fazer a classificação. Os resultados são compatíveis com os encontrados na literatura sobre RNC e RXT e também com os trabalhos sobre desempenho dos médicos radiologistas.Coronavirus Disease 19 (COVID-19) and tuberculosis are two respiratory diseases with approximately 1.97 and 1.4 million deaths per year, respectively, as of the submission date of this work (2024). The aim of this study is to conduct experiments with 4 databases containing chest X-ray (CXR) images to study, implement, and test 5 convolutional neural network (CNN) architectures to classify the data into COVID-19, interstitial lung disease (ILD), tuberculosis, and no disease categories. The techniques of transfer learning (TL) and fine-tuning (FT) were used for model training. COVID-19 pneumonia presents radiological similarity to ILD, making it important to test the models differentiation capability. For this study, a database was retrospectively developed with imaging exams for COVID-19, ILD and tuberculosis, sourced from the Hospital das Clínicas of the Faculty of Medicine of Ribeirão Preto (HCFMRP), University of São Paulo. Images from three other public databases were also tested, one with CXR images of COVID-19 and two with CXR images of tuberculosis. Experiments were conducted with the VGG19 CNN architecture and three data groups: All without augmentation (4 distinct databases without artificial data augmentation), All with augmentation (4 distinct databases with artificial data augmentation), and HCFMRP with augmentation (1 more reliable proprietary database with artificial data augmentation). 15% of the images were set aside for testing, and the remainder was divided into 5 partitions for cross-validation. The best partition from each experiment was tested with the test image group. The All with augmentation data group yielded the best results: an overall accuracy of 88.26%, with mean precision, sensitivity, F1-score, and AUC-ROC (across classes) of 0.875, 0.867, 0.872, and 0.972, respectively. Subsequently, the training, validation, and test data were retained, and experiments were conducted with 4 additional CNNs: EfficientNetV2S, ResNet152V2, InceptionV3, and Xception. None of these networks performed better than VGG19, with accuracies of 86.68%, 84.23%, 84.90%, and 82.55%, respectively. Grad-CAM Heatmaps were generated to visualize how the VGG19 CNN utilized the images for classification. The findings are consistent with those reported in the literature on CNNs and CXR, as well as studies on the performance of radiologists.Biblioteca Digitais de Teses e Dissertações da USPMarques, Paulo Mazzoncini de AzevedoSantos, Mauricio Koenigkam2024-04-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/82/82131/tde-19012026-160127/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2026-01-20T19:26:02Zoai:teses.usp.br:tde-19012026-160127Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212026-01-20T19:26:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose
Convolutional neural networks in chest X-Ray image classification: COVID-19, interstitial lung diseases, and tuberculosis
title Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose
spellingShingle Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose
Santos, Mauricio Koenigkam
convolutional neural network
COVID-19
COVID-19
doenças intersticiais pulmonares
interstitial lung diseases
rede neural convolucional
tuberculose
tuberculosis
title_short Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose
title_full Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose
title_fullStr Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose
title_full_unstemmed Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose
title_sort Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose
author Santos, Mauricio Koenigkam
author_facet Santos, Mauricio Koenigkam
author_role author
dc.contributor.none.fl_str_mv Marques, Paulo Mazzoncini de Azevedo
dc.contributor.author.fl_str_mv Santos, Mauricio Koenigkam
dc.subject.por.fl_str_mv convolutional neural network
COVID-19
COVID-19
doenças intersticiais pulmonares
interstitial lung diseases
rede neural convolucional
tuberculose
tuberculosis
topic convolutional neural network
COVID-19
COVID-19
doenças intersticiais pulmonares
interstitial lung diseases
rede neural convolucional
tuberculose
tuberculosis
description A doença pelo Coronavírus 19 (COVID-19) e a tuberculose são doenças respiratórias que apresentam cerca de 1,97 e 1,4 milhão de mortes por ano, respectivamente, na data de submissão deste trabalho (2024). O objetivo é realizar experimentos com 4 bancos de dados contendo imagens de radiografia simples de tórax (RXT) para estudar, implementar e testar 5 arquiteturas de rede neural convolucional (RNC) para classificar os dados em COVID-19, doença intersticial pulmonar (DIP), tuberculose e sem doenças. Foram utilizadas as técnicas de transfer learning (TL) e fine tuning (FT) para o treinamento dos modelos. A pneumonia por COVID-19 apresenta semelhança radiológica com DIP, por isso é importante testar a capacidade de diferenciação dos modelos. Para o estudo foi desenvolvido retrospectivamente uma base com exames de imagem de COVID-19, DIPs e tuberculose, provenientes de serviços do Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto (HCFMRP), USP. Também foram testadas imagens de outros três bancos de dados públicos, um com imagens de RXT de COVID-19 e dois com imagens de RXT de tuberculose. Foram realizados experimentos com a arquitetura de RNC VGG19 e três grupos de dados: Todos sem aumento (4 bancos de dados distintos e sem aumento artificial da quantidade de dados), Todos com aumento (4 bancos de dados distintos e com aumento artificial da quantidade de dados), HCFMRP com aumento (1 banco de dado próprio e com aumento artificial da quantidade de dados). 15% das imagens foram separadas para teste, o restante foi dividido em 5 partições para a realização do cross-validation. A melhor partição de cada experimento foi testada com o grupo de imagens para teste. Com o grupo de dados Todos com aumento foram obtidos os melhores resultados: acurácia geral de 88,26%, as médias (entre as classes) de precisão, sensibilidade, f1-score e AUC-ROC foram de 0,875, 0,867, 0,872 e 0,972, respectivamente. Depois foram mantidos os dados de treinamento, validação e teste e foram feitos experimentos com mais 4 RNCs: EfficientNetV2S, ResNet152V2, InceptionV3 e Xception. Nenhuma destas redes obteve desempenho melhor que a VGG19, as acurácias das outras redes apresentadas foram 86,68%, 84,23%, 84,90% e 82,55%, respectivamente. Foi realizado o Grad-CAM Heatmap para ajudar a visualizar como a RNC VGG19 utilizou as imagens para fazer a classificação. Os resultados são compatíveis com os encontrados na literatura sobre RNC e RXT e também com os trabalhos sobre desempenho dos médicos radiologistas.
publishDate 2024
dc.date.none.fl_str_mv 2024-04-17
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/82/82131/tde-19012026-160127/
url https://www.teses.usp.br/teses/disponiveis/82/82131/tde-19012026-160127/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1857669979768356864