Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas.

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Petrini, Daniel Gustavo Pellacani
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3142/tde-14032025-073816/
Resumo: A mamografia, um exame de triagem baseado em raios-x, desempenha um papel essencial na detecção precoce do câncer de mama. Ela requer a interpretação cuidadosa de radiologistas experientes para reduzir a taxa de erro. Para auxiliar nesse processo, sistemas de detecção e diagnóstico auxiliado por computador têm sido desenvolvidos, especialmente impulsionados pelos avanços na inteligência artificial e nas técnicas de aprendizado de máquina. Estudos recentes indicam que redes neurais profundas apresentam um desempenho comparável ou até superior ao de especialistas humanos no diagnóstico dessa doença. Apesar do sucesso das redes neurais convolucionais na classificação de imagens naturais, a classificação de mamografias apresenta desafios únicos devido ao pequeno tamanho das regiões de interesse e à altíssima resolução das imagens. Consequentemente, abordagens tradicionais de classificação de imagens frequentemente não funcionam bem em mamografias. Shen et al. (2019) propuseram fazer duas transferências de aprendizado: primeiro treinando classificadores de pequenos recortes (patches) e segundo utilizando esses classificadores para melhorar a classificação de mamografias inteiras. Este trabalho objetiva aprimorar a detecção de câncer em mamografias. Na primeira etapa, melhoramos os resultados de Shen et al. de duas formas: (1) Substituindo o modelo-base antigo ResNet50 pelo moderno EfficientNet. (2) Fazendo uma terceira transferência de aprendizado para obter o classificador de duas vistas que usa simultaneamente as duas incidências de mamografia. O modelo resultante é treinado de ponta a ponta. Testamos essas ideias de duas formas usando o conjunto CBIS-DDSM: (a) No teste validação cruzada de 5 partições, a ideia (1) aumentou AUC (Area Under Curve) de 0,8512 para 0,8757 e a ideia (2) aumentou para 0,9298. Usando test time augmentation e ensemble de 4 modelos, atingimos AUC de 0,9344. (b) No teste divisão original, a ideia (1) aumentou AUC de 0,7590 para 0,8033 e a ideia (2) aumentou para 0,8418. Fazendo exploração de arquiteturas da segunda etapa, obtivemos aumento de AUC para 0,8643 e 0,8658 respectivamente sem e com test time augmentation. Este último parece ser o melhor resultado para este problema, segundo o nosso conhecimento. Na segunda etapa, fizemos uma série de testes para responder questões em aberto: (1) Usar o classificador de recortes, como proposto por Shen et al., é realmente necessário? Concluímos que usar esse classificador intermediário não é necessário para mamografias de baixa qualidade, mas é necessário para mamografias de alta qualidade. (2) Os modelos com desempenho melhor em classificar imagens naturais também são melhores para classificar mamografias? Concluímos que isto é normalmente verdade para classificadores baseados em recortes, mas não vale para classificadores que não usam recortes. (3) É possível reduzir a resolução de uma mamografia para de 1.152×892 para 576×448 sem comprometer o desempenho de classificação? Concluímos que o desempenho sempre diminui quando se diminui a resolução. (4) Reduzir mamografias usando técnica learn to resize é melhor do que usar técnicas clássicas? Constatamos que o algoritmo learn to resize é pior do que as técnicas clássicas para diminuir resolução de mamografias em todos os testes. (5) O classificador de duas vistas proposto realmente proporciona um ganho de desempenho? Concluímos que o aumento de desempenho do classificador de duas vistas é real e estatisticamente significativo.
id USP_8f23f9d47267ce2d929a442002bcf64a
oai_identifier_str oai:teses.usp.br:tde-14032025-073816
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas.Mammograms diagnosis using multiple views with deep neural networks.Aprendizado profundoBreast cancerCâncer de mamaCBIS-DDSMConvolutional neural networkDeep learningMammographyMamografiRedes neuraisTwo-view classifierVinDr-MammoA mamografia, um exame de triagem baseado em raios-x, desempenha um papel essencial na detecção precoce do câncer de mama. Ela requer a interpretação cuidadosa de radiologistas experientes para reduzir a taxa de erro. Para auxiliar nesse processo, sistemas de detecção e diagnóstico auxiliado por computador têm sido desenvolvidos, especialmente impulsionados pelos avanços na inteligência artificial e nas técnicas de aprendizado de máquina. Estudos recentes indicam que redes neurais profundas apresentam um desempenho comparável ou até superior ao de especialistas humanos no diagnóstico dessa doença. Apesar do sucesso das redes neurais convolucionais na classificação de imagens naturais, a classificação de mamografias apresenta desafios únicos devido ao pequeno tamanho das regiões de interesse e à altíssima resolução das imagens. Consequentemente, abordagens tradicionais de classificação de imagens frequentemente não funcionam bem em mamografias. Shen et al. (2019) propuseram fazer duas transferências de aprendizado: primeiro treinando classificadores de pequenos recortes (patches) e segundo utilizando esses classificadores para melhorar a classificação de mamografias inteiras. Este trabalho objetiva aprimorar a detecção de câncer em mamografias. Na primeira etapa, melhoramos os resultados de Shen et al. de duas formas: (1) Substituindo o modelo-base antigo ResNet50 pelo moderno EfficientNet. (2) Fazendo uma terceira transferência de aprendizado para obter o classificador de duas vistas que usa simultaneamente as duas incidências de mamografia. O modelo resultante é treinado de ponta a ponta. Testamos essas ideias de duas formas usando o conjunto CBIS-DDSM: (a) No teste validação cruzada de 5 partições, a ideia (1) aumentou AUC (Area Under Curve) de 0,8512 para 0,8757 e a ideia (2) aumentou para 0,9298. Usando test time augmentation e ensemble de 4 modelos, atingimos AUC de 0,9344. (b) No teste divisão original, a ideia (1) aumentou AUC de 0,7590 para 0,8033 e a ideia (2) aumentou para 0,8418. Fazendo exploração de arquiteturas da segunda etapa, obtivemos aumento de AUC para 0,8643 e 0,8658 respectivamente sem e com test time augmentation. Este último parece ser o melhor resultado para este problema, segundo o nosso conhecimento. Na segunda etapa, fizemos uma série de testes para responder questões em aberto: (1) Usar o classificador de recortes, como proposto por Shen et al., é realmente necessário? Concluímos que usar esse classificador intermediário não é necessário para mamografias de baixa qualidade, mas é necessário para mamografias de alta qualidade. (2) Os modelos com desempenho melhor em classificar imagens naturais também são melhores para classificar mamografias? Concluímos que isto é normalmente verdade para classificadores baseados em recortes, mas não vale para classificadores que não usam recortes. (3) É possível reduzir a resolução de uma mamografia para de 1.152×892 para 576×448 sem comprometer o desempenho de classificação? Concluímos que o desempenho sempre diminui quando se diminui a resolução. (4) Reduzir mamografias usando técnica learn to resize é melhor do que usar técnicas clássicas? Constatamos que o algoritmo learn to resize é pior do que as técnicas clássicas para diminuir resolução de mamografias em todos os testes. (5) O classificador de duas vistas proposto realmente proporciona um ganho de desempenho? Concluímos que o aumento de desempenho do classificador de duas vistas é real e estatisticamente significativo.Mammography, an x-ray-based screening test, plays an essential role in breast cancer early detection. It requires careful interpretation by experts radiologists to reduce the error rate. To assist in this process, detection and computer-aided diagnosis have been developed, especially driven by advances in artificial intelligence and machine learning techniques. Recent studies indicate that deep neural networks perform comparable or even superior to human experts in diagnosing this disease. Despite the success of convolutional neural networks in classifying natural images, the mammograms classification presents unique challenges due to the small size of the regions of interest and the very high resolution of the images. Consequently, traditional imagem classification approaches often do not work well on mammograms. Shen et al. (2019) proposed to carry out two transfer learnings: first training patch classifiers and second using these classifiers to improve the classification of entire mammograms. This work aims to improve cancer detection on mammograms. In the first stage, we improved the results of Shen et al. in two ways: (1) Replacing the old base model ResNet50 by modern EfficientNet. (2) Making a third transfer learning to obtain the two-view classifier that simultaneously uses the two incidences of mammography. The resulting model is trained end-to-end. We tested these ideas in two ways using the CBIS-DDSM set: (a) In the 5-partition cross-validation test, idea (1) increased AUC (Area Under Curve) from 0.8512 to 0.8757 and idea (2) increased to 0.9298. Using test time augmentation and an ensemble of 4 models, we achieved an AUC of 0.9344. (b) In the original test split, idea (1) increased AUC from 0.7590 to 0.8033 and idea (2) increased to 0.8418. By exploring architectures in the second stage, we obtained increase in AUC to 0.8643 and 0.8658 respectively without and with test time augmentation. The latter seems to be the best result for this problem, according to our knowledge. In the second stage, we carried out a series of tests to answer open questions: (1) Is using the patch classifier, as proposed by Shen et al., really necessary? We conclude that using this intermediate classifier is not necessary for low quality mammograms, but is necessary for high-quality mammograms. (2) Are models that perform better at classifying natural images also better at classifying mammograms? We conclude that this is typically true for patch-based classifiers, but not true for classifiers that do not use patches. (3) Is it possible to reduce the resolution of a mammogram from 1,152×892 to 576×448 without compromise classification performance? We conclude that performance always decreases when the resolution is reduced. (4) Reducing mammograms using the learn to resize technique is better than using classical techniques? We found that the learn to resize algorithm is worse than classical techniques to decrease resolution of mammograms in all tests. (5) Does the proposed two-view classifier really provide a performance gain? We conclude that the performance increase of the two-view classifier is real and statistically significant.Biblioteca Digitais de Teses e Dissertações da USPKim, Hae YongPetrini, Daniel Gustavo Pellacani2025-02-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3142/tde-14032025-073816/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-03-18T15:21:02Zoai:teses.usp.br:tde-14032025-073816Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-03-18T15:21:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas.
Mammograms diagnosis using multiple views with deep neural networks.
title Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas.
spellingShingle Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas.
Petrini, Daniel Gustavo Pellacani
Aprendizado profundo
Breast cancer
Câncer de mama
CBIS-DDSM
Convolutional neural network
Deep learning
Mammography
Mamografi
Redes neurais
Two-view classifier
VinDr-Mammo
title_short Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas.
title_full Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas.
title_fullStr Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas.
title_full_unstemmed Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas.
title_sort Diagnóstico de mamografias utilizando múltiplas vistas com redes neurais profundas.
author Petrini, Daniel Gustavo Pellacani
author_facet Petrini, Daniel Gustavo Pellacani
author_role author
dc.contributor.none.fl_str_mv Kim, Hae Yong
dc.contributor.author.fl_str_mv Petrini, Daniel Gustavo Pellacani
dc.subject.por.fl_str_mv Aprendizado profundo
Breast cancer
Câncer de mama
CBIS-DDSM
Convolutional neural network
Deep learning
Mammography
Mamografi
Redes neurais
Two-view classifier
VinDr-Mammo
topic Aprendizado profundo
Breast cancer
Câncer de mama
CBIS-DDSM
Convolutional neural network
Deep learning
Mammography
Mamografi
Redes neurais
Two-view classifier
VinDr-Mammo
description A mamografia, um exame de triagem baseado em raios-x, desempenha um papel essencial na detecção precoce do câncer de mama. Ela requer a interpretação cuidadosa de radiologistas experientes para reduzir a taxa de erro. Para auxiliar nesse processo, sistemas de detecção e diagnóstico auxiliado por computador têm sido desenvolvidos, especialmente impulsionados pelos avanços na inteligência artificial e nas técnicas de aprendizado de máquina. Estudos recentes indicam que redes neurais profundas apresentam um desempenho comparável ou até superior ao de especialistas humanos no diagnóstico dessa doença. Apesar do sucesso das redes neurais convolucionais na classificação de imagens naturais, a classificação de mamografias apresenta desafios únicos devido ao pequeno tamanho das regiões de interesse e à altíssima resolução das imagens. Consequentemente, abordagens tradicionais de classificação de imagens frequentemente não funcionam bem em mamografias. Shen et al. (2019) propuseram fazer duas transferências de aprendizado: primeiro treinando classificadores de pequenos recortes (patches) e segundo utilizando esses classificadores para melhorar a classificação de mamografias inteiras. Este trabalho objetiva aprimorar a detecção de câncer em mamografias. Na primeira etapa, melhoramos os resultados de Shen et al. de duas formas: (1) Substituindo o modelo-base antigo ResNet50 pelo moderno EfficientNet. (2) Fazendo uma terceira transferência de aprendizado para obter o classificador de duas vistas que usa simultaneamente as duas incidências de mamografia. O modelo resultante é treinado de ponta a ponta. Testamos essas ideias de duas formas usando o conjunto CBIS-DDSM: (a) No teste validação cruzada de 5 partições, a ideia (1) aumentou AUC (Area Under Curve) de 0,8512 para 0,8757 e a ideia (2) aumentou para 0,9298. Usando test time augmentation e ensemble de 4 modelos, atingimos AUC de 0,9344. (b) No teste divisão original, a ideia (1) aumentou AUC de 0,7590 para 0,8033 e a ideia (2) aumentou para 0,8418. Fazendo exploração de arquiteturas da segunda etapa, obtivemos aumento de AUC para 0,8643 e 0,8658 respectivamente sem e com test time augmentation. Este último parece ser o melhor resultado para este problema, segundo o nosso conhecimento. Na segunda etapa, fizemos uma série de testes para responder questões em aberto: (1) Usar o classificador de recortes, como proposto por Shen et al., é realmente necessário? Concluímos que usar esse classificador intermediário não é necessário para mamografias de baixa qualidade, mas é necessário para mamografias de alta qualidade. (2) Os modelos com desempenho melhor em classificar imagens naturais também são melhores para classificar mamografias? Concluímos que isto é normalmente verdade para classificadores baseados em recortes, mas não vale para classificadores que não usam recortes. (3) É possível reduzir a resolução de uma mamografia para de 1.152×892 para 576×448 sem comprometer o desempenho de classificação? Concluímos que o desempenho sempre diminui quando se diminui a resolução. (4) Reduzir mamografias usando técnica learn to resize é melhor do que usar técnicas clássicas? Constatamos que o algoritmo learn to resize é pior do que as técnicas clássicas para diminuir resolução de mamografias em todos os testes. (5) O classificador de duas vistas proposto realmente proporciona um ganho de desempenho? Concluímos que o aumento de desempenho do classificador de duas vistas é real e estatisticamente significativo.
publishDate 2025
dc.date.none.fl_str_mv 2025-02-13
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/3/3142/tde-14032025-073816/
url https://www.teses.usp.br/teses/disponiveis/3/3142/tde-14032025-073816/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1839839145926590464