Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas.
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/3/3142/tde-14032025-073816/ |
Resumo: | A mamografia, um exame de triagem baseado em raios-x, desempenha um papel essencial na detecção precoce do câncer de mama. Ela requer a interpretação cuidadosa de radiologistas experientes para reduzir a taxa de erro. Para auxiliar nesse processo, sistemas de detecção e diagnóstico auxiliado por computador têm sido desenvolvidos, especialmente impulsionados pelos avanços na inteligência artificial e nas técnicas de aprendizado de máquina. Estudos recentes indicam que redes neurais profundas apresentam um desempenho comparável ou até superior ao de especialistas humanos no diagnóstico dessa doença. Apesar do sucesso das redes neurais convolucionais na classificação de imagens naturais, a classificação de mamografias apresenta desafios únicos devido ao pequeno tamanho das regiões de interesse e à altíssima resolução das imagens. Consequentemente, abordagens tradicionais de classificação de imagens frequentemente não funcionam bem em mamografias. Shen et al. (2019) propuseram fazer duas transferências de aprendizado: primeiro treinando classificadores de pequenos recortes (patches) e segundo utilizando esses classificadores para melhorar a classificação de mamografias inteiras. Este trabalho objetiva aprimorar a detecção de câncer em mamografias. Na primeira etapa, melhoramos os resultados de Shen et al. de duas formas: (1) Substituindo o modelo-base antigo ResNet50 pelo moderno EfficientNet. (2) Fazendo uma terceira transferência de aprendizado para obter o classificador de duas vistas que usa simultaneamente as duas incidências de mamografia. O modelo resultante é treinado de ponta a ponta. Testamos essas ideias de duas formas usando o conjunto CBIS-DDSM: (a) No teste validação cruzada de 5 partições, a ideia (1) aumentou AUC (Area Under Curve) de 0,8512 para 0,8757 e a ideia (2) aumentou para 0,9298. Usando test time augmentation e ensemble de 4 modelos, atingimos AUC de 0,9344. (b) No teste divisão original, a ideia (1) aumentou AUC de 0,7590 para 0,8033 e a ideia (2) aumentou para 0,8418. Fazendo exploração de arquiteturas da segunda etapa, obtivemos aumento de AUC para 0,8643 e 0,8658 respectivamente sem e com test time augmentation. Este último parece ser o melhor resultado para este problema, segundo o nosso conhecimento. Na segunda etapa, fizemos uma série de testes para responder questões em aberto: (1) Usar o classificador de recortes, como proposto por Shen et al., é realmente necessário? Concluímos que usar esse classificador intermediário não é necessário para mamografias de baixa qualidade, mas é necessário para mamografias de alta qualidade. (2) Os modelos com desempenho melhor em classificar imagens naturais também são melhores para classificar mamografias? Concluímos que isto é normalmente verdade para classificadores baseados em recortes, mas não vale para classificadores que não usam recortes. (3) É possível reduzir a resolução de uma mamografia para de 1.152×892 para 576×448 sem comprometer o desempenho de classificação? Concluímos que o desempenho sempre diminui quando se diminui a resolução. (4) Reduzir mamografias usando técnica learn to resize é melhor do que usar técnicas clássicas? Constatamos que o algoritmo learn to resize é pior do que as técnicas clássicas para diminuir resolução de mamografias em todos os testes. (5) O classificador de duas vistas proposto realmente proporciona um ganho de desempenho? Concluímos que o aumento de desempenho do classificador de duas vistas é real e estatisticamente significativo. |
| id |
USP_8f23f9d47267ce2d929a442002bcf64a |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-14032025-073816 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas.Mammograms diagnosis using multiple views with deep neural networks.Aprendizado profundoBreast cancerCâncer de mamaCBIS-DDSMConvolutional neural networkDeep learningMammographyMamografiRedes neuraisTwo-view classifierVinDr-MammoA mamografia, um exame de triagem baseado em raios-x, desempenha um papel essencial na detecção precoce do câncer de mama. Ela requer a interpretação cuidadosa de radiologistas experientes para reduzir a taxa de erro. Para auxiliar nesse processo, sistemas de detecção e diagnóstico auxiliado por computador têm sido desenvolvidos, especialmente impulsionados pelos avanços na inteligência artificial e nas técnicas de aprendizado de máquina. Estudos recentes indicam que redes neurais profundas apresentam um desempenho comparável ou até superior ao de especialistas humanos no diagnóstico dessa doença. Apesar do sucesso das redes neurais convolucionais na classificação de imagens naturais, a classificação de mamografias apresenta desafios únicos devido ao pequeno tamanho das regiões de interesse e à altíssima resolução das imagens. Consequentemente, abordagens tradicionais de classificação de imagens frequentemente não funcionam bem em mamografias. Shen et al. (2019) propuseram fazer duas transferências de aprendizado: primeiro treinando classificadores de pequenos recortes (patches) e segundo utilizando esses classificadores para melhorar a classificação de mamografias inteiras. Este trabalho objetiva aprimorar a detecção de câncer em mamografias. Na primeira etapa, melhoramos os resultados de Shen et al. de duas formas: (1) Substituindo o modelo-base antigo ResNet50 pelo moderno EfficientNet. (2) Fazendo uma terceira transferência de aprendizado para obter o classificador de duas vistas que usa simultaneamente as duas incidências de mamografia. O modelo resultante é treinado de ponta a ponta. Testamos essas ideias de duas formas usando o conjunto CBIS-DDSM: (a) No teste validação cruzada de 5 partições, a ideia (1) aumentou AUC (Area Under Curve) de 0,8512 para 0,8757 e a ideia (2) aumentou para 0,9298. Usando test time augmentation e ensemble de 4 modelos, atingimos AUC de 0,9344. (b) No teste divisão original, a ideia (1) aumentou AUC de 0,7590 para 0,8033 e a ideia (2) aumentou para 0,8418. Fazendo exploração de arquiteturas da segunda etapa, obtivemos aumento de AUC para 0,8643 e 0,8658 respectivamente sem e com test time augmentation. Este último parece ser o melhor resultado para este problema, segundo o nosso conhecimento. Na segunda etapa, fizemos uma série de testes para responder questões em aberto: (1) Usar o classificador de recortes, como proposto por Shen et al., é realmente necessário? Concluímos que usar esse classificador intermediário não é necessário para mamografias de baixa qualidade, mas é necessário para mamografias de alta qualidade. (2) Os modelos com desempenho melhor em classificar imagens naturais também são melhores para classificar mamografias? Concluímos que isto é normalmente verdade para classificadores baseados em recortes, mas não vale para classificadores que não usam recortes. (3) É possível reduzir a resolução de uma mamografia para de 1.152×892 para 576×448 sem comprometer o desempenho de classificação? Concluímos que o desempenho sempre diminui quando se diminui a resolução. (4) Reduzir mamografias usando técnica learn to resize é melhor do que usar técnicas clássicas? Constatamos que o algoritmo learn to resize é pior do que as técnicas clássicas para diminuir resolução de mamografias em todos os testes. (5) O classificador de duas vistas proposto realmente proporciona um ganho de desempenho? Concluímos que o aumento de desempenho do classificador de duas vistas é real e estatisticamente significativo.Mammography, an x-ray-based screening test, plays an essential role in breast cancer early detection. It requires careful interpretation by experts radiologists to reduce the error rate. To assist in this process, detection and computer-aided diagnosis have been developed, especially driven by advances in artificial intelligence and machine learning techniques. Recent studies indicate that deep neural networks perform comparable or even superior to human experts in diagnosing this disease. Despite the success of convolutional neural networks in classifying natural images, the mammograms classification presents unique challenges due to the small size of the regions of interest and the very high resolution of the images. Consequently, traditional imagem classification approaches often do not work well on mammograms. Shen et al. (2019) proposed to carry out two transfer learnings: first training patch classifiers and second using these classifiers to improve the classification of entire mammograms. This work aims to improve cancer detection on mammograms. In the first stage, we improved the results of Shen et al. in two ways: (1) Replacing the old base model ResNet50 by modern EfficientNet. (2) Making a third transfer learning to obtain the two-view classifier that simultaneously uses the two incidences of mammography. The resulting model is trained end-to-end. We tested these ideas in two ways using the CBIS-DDSM set: (a) In the 5-partition cross-validation test, idea (1) increased AUC (Area Under Curve) from 0.8512 to 0.8757 and idea (2) increased to 0.9298. Using test time augmentation and an ensemble of 4 models, we achieved an AUC of 0.9344. (b) In the original test split, idea (1) increased AUC from 0.7590 to 0.8033 and idea (2) increased to 0.8418. By exploring architectures in the second stage, we obtained increase in AUC to 0.8643 and 0.8658 respectively without and with test time augmentation. The latter seems to be the best result for this problem, according to our knowledge. In the second stage, we carried out a series of tests to answer open questions: (1) Is using the patch classifier, as proposed by Shen et al., really necessary? We conclude that using this intermediate classifier is not necessary for low quality mammograms, but is necessary for high-quality mammograms. (2) Are models that perform better at classifying natural images also better at classifying mammograms? We conclude that this is typically true for patch-based classifiers, but not true for classifiers that do not use patches. (3) Is it possible to reduce the resolution of a mammogram from 1,152×892 to 576×448 without compromise classification performance? We conclude that performance always decreases when the resolution is reduced. (4) Reducing mammograms using the learn to resize technique is better than using classical techniques? We found that the learn to resize algorithm is worse than classical techniques to decrease resolution of mammograms in all tests. (5) Does the proposed two-view classifier really provide a performance gain? We conclude that the performance increase of the two-view classifier is real and statistically significant.Biblioteca Digitais de Teses e Dissertações da USPKim, Hae YongPetrini, Daniel Gustavo Pellacani2025-02-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3142/tde-14032025-073816/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-03-18T15:21:02Zoai:teses.usp.br:tde-14032025-073816Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-03-18T15:21:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas. Mammograms diagnosis using multiple views with deep neural networks. |
| title |
Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas. |
| spellingShingle |
Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas. Petrini, Daniel Gustavo Pellacani Aprendizado profundo Breast cancer Câncer de mama CBIS-DDSM Convolutional neural network Deep learning Mammography Mamografi Redes neurais Two-view classifier VinDr-Mammo |
| title_short |
Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas. |
| title_full |
Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas. |
| title_fullStr |
Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas. |
| title_full_unstemmed |
Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas. |
| title_sort |
Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas. |
| author |
Petrini, Daniel Gustavo Pellacani |
| author_facet |
Petrini, Daniel Gustavo Pellacani |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Kim, Hae Yong |
| dc.contributor.author.fl_str_mv |
Petrini, Daniel Gustavo Pellacani |
| dc.subject.por.fl_str_mv |
Aprendizado profundo Breast cancer Câncer de mama CBIS-DDSM Convolutional neural network Deep learning Mammography Mamografi Redes neurais Two-view classifier VinDr-Mammo |
| topic |
Aprendizado profundo Breast cancer Câncer de mama CBIS-DDSM Convolutional neural network Deep learning Mammography Mamografi Redes neurais Two-view classifier VinDr-Mammo |
| description |
A mamografia, um exame de triagem baseado em raios-x, desempenha um papel essencial na detecção precoce do câncer de mama. Ela requer a interpretação cuidadosa de radiologistas experientes para reduzir a taxa de erro. Para auxiliar nesse processo, sistemas de detecção e diagnóstico auxiliado por computador têm sido desenvolvidos, especialmente impulsionados pelos avanços na inteligência artificial e nas técnicas de aprendizado de máquina. Estudos recentes indicam que redes neurais profundas apresentam um desempenho comparável ou até superior ao de especialistas humanos no diagnóstico dessa doença. Apesar do sucesso das redes neurais convolucionais na classificação de imagens naturais, a classificação de mamografias apresenta desafios únicos devido ao pequeno tamanho das regiões de interesse e à altíssima resolução das imagens. Consequentemente, abordagens tradicionais de classificação de imagens frequentemente não funcionam bem em mamografias. Shen et al. (2019) propuseram fazer duas transferências de aprendizado: primeiro treinando classificadores de pequenos recortes (patches) e segundo utilizando esses classificadores para melhorar a classificação de mamografias inteiras. Este trabalho objetiva aprimorar a detecção de câncer em mamografias. Na primeira etapa, melhoramos os resultados de Shen et al. de duas formas: (1) Substituindo o modelo-base antigo ResNet50 pelo moderno EfficientNet. (2) Fazendo uma terceira transferência de aprendizado para obter o classificador de duas vistas que usa simultaneamente as duas incidências de mamografia. O modelo resultante é treinado de ponta a ponta. Testamos essas ideias de duas formas usando o conjunto CBIS-DDSM: (a) No teste validação cruzada de 5 partições, a ideia (1) aumentou AUC (Area Under Curve) de 0,8512 para 0,8757 e a ideia (2) aumentou para 0,9298. Usando test time augmentation e ensemble de 4 modelos, atingimos AUC de 0,9344. (b) No teste divisão original, a ideia (1) aumentou AUC de 0,7590 para 0,8033 e a ideia (2) aumentou para 0,8418. Fazendo exploração de arquiteturas da segunda etapa, obtivemos aumento de AUC para 0,8643 e 0,8658 respectivamente sem e com test time augmentation. Este último parece ser o melhor resultado para este problema, segundo o nosso conhecimento. Na segunda etapa, fizemos uma série de testes para responder questões em aberto: (1) Usar o classificador de recortes, como proposto por Shen et al., é realmente necessário? Concluímos que usar esse classificador intermediário não é necessário para mamografias de baixa qualidade, mas é necessário para mamografias de alta qualidade. (2) Os modelos com desempenho melhor em classificar imagens naturais também são melhores para classificar mamografias? Concluímos que isto é normalmente verdade para classificadores baseados em recortes, mas não vale para classificadores que não usam recortes. (3) É possível reduzir a resolução de uma mamografia para de 1.152×892 para 576×448 sem comprometer o desempenho de classificação? Concluímos que o desempenho sempre diminui quando se diminui a resolução. (4) Reduzir mamografias usando técnica learn to resize é melhor do que usar técnicas clássicas? Constatamos que o algoritmo learn to resize é pior do que as técnicas clássicas para diminuir resolução de mamografias em todos os testes. (5) O classificador de duas vistas proposto realmente proporciona um ganho de desempenho? Concluímos que o aumento de desempenho do classificador de duas vistas é real e estatisticamente significativo. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-02-13 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-14032025-073816/ |
| url |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-14032025-073816/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1839839145926590464 |