Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/82/82131/tde-19012026-160127/ |
Resumo: | A doença pelo Coronavírus 19 (COVID-19) e a tuberculose são doenças respiratórias que apresentam cerca de 1,97 e 1,4 milhão de mortes por ano, respectivamente, na data de submissão deste trabalho (2024). O objetivo é realizar experimentos com 4 bancos de dados contendo imagens de radiografia simples de tórax (RXT) para estudar, implementar e testar 5 arquiteturas de rede neural convolucional (RNC) para classificar os dados em COVID-19, doença intersticial pulmonar (DIP), tuberculose e sem doenças. Foram utilizadas as técnicas de transfer learning (TL) e fine tuning (FT) para o treinamento dos modelos. A pneumonia por COVID-19 apresenta semelhança radiológica com DIP, por isso é importante testar a capacidade de diferenciação dos modelos. Para o estudo foi desenvolvido retrospectivamente uma base com exames de imagem de COVID-19, DIPs e tuberculose, provenientes de serviços do Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto (HCFMRP), USP. Também foram testadas imagens de outros três bancos de dados públicos, um com imagens de RXT de COVID-19 e dois com imagens de RXT de tuberculose. Foram realizados experimentos com a arquitetura de RNC VGG19 e três grupos de dados: Todos sem aumento (4 bancos de dados distintos e sem aumento artificial da quantidade de dados), Todos com aumento (4 bancos de dados distintos e com aumento artificial da quantidade de dados), HCFMRP com aumento (1 banco de dado próprio e com aumento artificial da quantidade de dados). 15% das imagens foram separadas para teste, o restante foi dividido em 5 partições para a realização do cross-validation. A melhor partição de cada experimento foi testada com o grupo de imagens para teste. Com o grupo de dados Todos com aumento foram obtidos os melhores resultados: acurácia geral de 88,26%, as médias (entre as classes) de precisão, sensibilidade, f1-score e AUC-ROC foram de 0,875, 0,867, 0,872 e 0,972, respectivamente. Depois foram mantidos os dados de treinamento, validação e teste e foram feitos experimentos com mais 4 RNCs: EfficientNetV2S, ResNet152V2, InceptionV3 e Xception. Nenhuma destas redes obteve desempenho melhor que a VGG19, as acurácias das outras redes apresentadas foram 86,68%, 84,23%, 84,90% e 82,55%, respectivamente. Foi realizado o Grad-CAM Heatmap para ajudar a visualizar como a RNC VGG19 utilizou as imagens para fazer a classificação. Os resultados são compatíveis com os encontrados na literatura sobre RNC e RXT e também com os trabalhos sobre desempenho dos médicos radiologistas. |
| id |
USP_09f2b904e2426dfedbac59187d1ee495 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-19012026-160127 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculoseConvolutional neural networks in chest X-Ray image classification: COVID-19, interstitial lung diseases, and tuberculosisconvolutional neural networkCOVID-19COVID-19doenças intersticiais pulmonaresinterstitial lung diseasesrede neural convolucionaltuberculosetuberculosisA doença pelo Coronavírus 19 (COVID-19) e a tuberculose são doenças respiratórias que apresentam cerca de 1,97 e 1,4 milhão de mortes por ano, respectivamente, na data de submissão deste trabalho (2024). O objetivo é realizar experimentos com 4 bancos de dados contendo imagens de radiografia simples de tórax (RXT) para estudar, implementar e testar 5 arquiteturas de rede neural convolucional (RNC) para classificar os dados em COVID-19, doença intersticial pulmonar (DIP), tuberculose e sem doenças. Foram utilizadas as técnicas de transfer learning (TL) e fine tuning (FT) para o treinamento dos modelos. A pneumonia por COVID-19 apresenta semelhança radiológica com DIP, por isso é importante testar a capacidade de diferenciação dos modelos. Para o estudo foi desenvolvido retrospectivamente uma base com exames de imagem de COVID-19, DIPs e tuberculose, provenientes de serviços do Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto (HCFMRP), USP. Também foram testadas imagens de outros três bancos de dados públicos, um com imagens de RXT de COVID-19 e dois com imagens de RXT de tuberculose. Foram realizados experimentos com a arquitetura de RNC VGG19 e três grupos de dados: Todos sem aumento (4 bancos de dados distintos e sem aumento artificial da quantidade de dados), Todos com aumento (4 bancos de dados distintos e com aumento artificial da quantidade de dados), HCFMRP com aumento (1 banco de dado próprio e com aumento artificial da quantidade de dados). 15% das imagens foram separadas para teste, o restante foi dividido em 5 partições para a realização do cross-validation. A melhor partição de cada experimento foi testada com o grupo de imagens para teste. Com o grupo de dados Todos com aumento foram obtidos os melhores resultados: acurácia geral de 88,26%, as médias (entre as classes) de precisão, sensibilidade, f1-score e AUC-ROC foram de 0,875, 0,867, 0,872 e 0,972, respectivamente. Depois foram mantidos os dados de treinamento, validação e teste e foram feitos experimentos com mais 4 RNCs: EfficientNetV2S, ResNet152V2, InceptionV3 e Xception. Nenhuma destas redes obteve desempenho melhor que a VGG19, as acurácias das outras redes apresentadas foram 86,68%, 84,23%, 84,90% e 82,55%, respectivamente. Foi realizado o Grad-CAM Heatmap para ajudar a visualizar como a RNC VGG19 utilizou as imagens para fazer a classificação. Os resultados são compatíveis com os encontrados na literatura sobre RNC e RXT e também com os trabalhos sobre desempenho dos médicos radiologistas.Coronavirus Disease 19 (COVID-19) and tuberculosis are two respiratory diseases with approximately 1.97 and 1.4 million deaths per year, respectively, as of the submission date of this work (2024). The aim of this study is to conduct experiments with 4 databases containing chest X-ray (CXR) images to study, implement, and test 5 convolutional neural network (CNN) architectures to classify the data into COVID-19, interstitial lung disease (ILD), tuberculosis, and no disease categories. The techniques of transfer learning (TL) and fine-tuning (FT) were used for model training. COVID-19 pneumonia presents radiological similarity to ILD, making it important to test the models differentiation capability. For this study, a database was retrospectively developed with imaging exams for COVID-19, ILD and tuberculosis, sourced from the Hospital das Clínicas of the Faculty of Medicine of Ribeirão Preto (HCFMRP), University of São Paulo. Images from three other public databases were also tested, one with CXR images of COVID-19 and two with CXR images of tuberculosis. Experiments were conducted with the VGG19 CNN architecture and three data groups: All without augmentation (4 distinct databases without artificial data augmentation), All with augmentation (4 distinct databases with artificial data augmentation), and HCFMRP with augmentation (1 more reliable proprietary database with artificial data augmentation). 15% of the images were set aside for testing, and the remainder was divided into 5 partitions for cross-validation. The best partition from each experiment was tested with the test image group. The All with augmentation data group yielded the best results: an overall accuracy of 88.26%, with mean precision, sensitivity, F1-score, and AUC-ROC (across classes) of 0.875, 0.867, 0.872, and 0.972, respectively. Subsequently, the training, validation, and test data were retained, and experiments were conducted with 4 additional CNNs: EfficientNetV2S, ResNet152V2, InceptionV3, and Xception. None of these networks performed better than VGG19, with accuracies of 86.68%, 84.23%, 84.90%, and 82.55%, respectively. Grad-CAM Heatmaps were generated to visualize how the VGG19 CNN utilized the images for classification. The findings are consistent with those reported in the literature on CNNs and CXR, as well as studies on the performance of radiologists.Biblioteca Digitais de Teses e Dissertações da USPMarques, Paulo Mazzoncini de AzevedoSantos, Mauricio Koenigkam2024-04-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/82/82131/tde-19012026-160127/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2026-01-20T19:26:02Zoai:teses.usp.br:tde-19012026-160127Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212026-01-20T19:26:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose Convolutional neural networks in chest X-Ray image classification: COVID-19, interstitial lung diseases, and tuberculosis |
| title |
Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose |
| spellingShingle |
Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose Santos, Mauricio Koenigkam convolutional neural network COVID-19 COVID-19 doenças intersticiais pulmonares interstitial lung diseases rede neural convolucional tuberculose tuberculosis |
| title_short |
Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose |
| title_full |
Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose |
| title_fullStr |
Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose |
| title_full_unstemmed |
Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose |
| title_sort |
Redes neurais convolucionais na classificação de imagens de RX de tórax: COVID-19, doenças intersticiais pulmonares e tuberculose |
| author |
Santos, Mauricio Koenigkam |
| author_facet |
Santos, Mauricio Koenigkam |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Marques, Paulo Mazzoncini de Azevedo |
| dc.contributor.author.fl_str_mv |
Santos, Mauricio Koenigkam |
| dc.subject.por.fl_str_mv |
convolutional neural network COVID-19 COVID-19 doenças intersticiais pulmonares interstitial lung diseases rede neural convolucional tuberculose tuberculosis |
| topic |
convolutional neural network COVID-19 COVID-19 doenças intersticiais pulmonares interstitial lung diseases rede neural convolucional tuberculose tuberculosis |
| description |
A doença pelo Coronavírus 19 (COVID-19) e a tuberculose são doenças respiratórias que apresentam cerca de 1,97 e 1,4 milhão de mortes por ano, respectivamente, na data de submissão deste trabalho (2024). O objetivo é realizar experimentos com 4 bancos de dados contendo imagens de radiografia simples de tórax (RXT) para estudar, implementar e testar 5 arquiteturas de rede neural convolucional (RNC) para classificar os dados em COVID-19, doença intersticial pulmonar (DIP), tuberculose e sem doenças. Foram utilizadas as técnicas de transfer learning (TL) e fine tuning (FT) para o treinamento dos modelos. A pneumonia por COVID-19 apresenta semelhança radiológica com DIP, por isso é importante testar a capacidade de diferenciação dos modelos. Para o estudo foi desenvolvido retrospectivamente uma base com exames de imagem de COVID-19, DIPs e tuberculose, provenientes de serviços do Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto (HCFMRP), USP. Também foram testadas imagens de outros três bancos de dados públicos, um com imagens de RXT de COVID-19 e dois com imagens de RXT de tuberculose. Foram realizados experimentos com a arquitetura de RNC VGG19 e três grupos de dados: Todos sem aumento (4 bancos de dados distintos e sem aumento artificial da quantidade de dados), Todos com aumento (4 bancos de dados distintos e com aumento artificial da quantidade de dados), HCFMRP com aumento (1 banco de dado próprio e com aumento artificial da quantidade de dados). 15% das imagens foram separadas para teste, o restante foi dividido em 5 partições para a realização do cross-validation. A melhor partição de cada experimento foi testada com o grupo de imagens para teste. Com o grupo de dados Todos com aumento foram obtidos os melhores resultados: acurácia geral de 88,26%, as médias (entre as classes) de precisão, sensibilidade, f1-score e AUC-ROC foram de 0,875, 0,867, 0,872 e 0,972, respectivamente. Depois foram mantidos os dados de treinamento, validação e teste e foram feitos experimentos com mais 4 RNCs: EfficientNetV2S, ResNet152V2, InceptionV3 e Xception. Nenhuma destas redes obteve desempenho melhor que a VGG19, as acurácias das outras redes apresentadas foram 86,68%, 84,23%, 84,90% e 82,55%, respectivamente. Foi realizado o Grad-CAM Heatmap para ajudar a visualizar como a RNC VGG19 utilizou as imagens para fazer a classificação. Os resultados são compatíveis com os encontrados na literatura sobre RNC e RXT e também com os trabalhos sobre desempenho dos médicos radiologistas. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-04-17 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/82/82131/tde-19012026-160127/ |
| url |
https://www.teses.usp.br/teses/disponiveis/82/82131/tde-19012026-160127/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1857669979768356864 |