Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Buzatto, Isabela Panzeri Carlotti
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/17/17145/tde-25092024-105306/
Resumo: A ultrassonografia mamária (US) é amplamente utilizada como ferramenta diagnóstica, complementando mamografias inconclusivas, avaliando achados palpáveis e orientando biópsias mamárias. A interpretação do exame é desafiadora, pois o método depende do operador e tem uma alta taxa de falso positivo. Recentemente, o aprendizado de máquina, um tipo de inteligência artificial, vem ganhando atenção por seu excelente desempenho em tarefas de reconhecimento de imagens e preditivas. O objetivo do presente estudo foi estabelecer um modelo confiável de aprendizado de máquina para classificar lesões mamárias como malignas ou benignas, com base em atributos clínicos e ultrassonográficos. Consideramos importante otimizar o valor preditivo negativo (VPN), para minimizar o número de biópsias desnecessárias, sem perder muitos casos de câncer. Trata-se de estudo observacional multicêntrico, em que foram coletados dados clínicos, características ultrassonográficas dos laudos, e imagens ultrassonográficas, de pacientes com lesões mamárias suspeitas, classificadas como BI-RADS 3, 4, 5 e 6, que foram submetidas à biópsia por agulha grossa, em quatro instituições. Foram selecionados os atributos mais informativos para treinar, validar e testar modelos de aprendizado de máquina, para prever a malignidade dessas lesões mamárias. Os atributos selecionados foram forma, margem, orientação, tamanho da lesão, presença de vaso interno no estudo Doppler, índice de resistência do vaso, quando presente, idade do paciente e presença de nódulo palpável. O maior VPN médio foi alcançado com o algoritmo XGBoost, após ajuste do \"threshold\", para minimizar os casos falsos negativos. O desempenho testado do modelo foi: VPN 98,1%, falso negativo 1,9%, valor preditivo positivo 77,1% e falso positivo 22,9%. Aplicando este modelo, teríamos perdido 2 das 231 lesões malignas do conjunto de dados de teste (0,8%). Para minimizar a interpretação dependente do operador, também foram treinados e validados algoritmos, utilizando as próprias imagens de US associadas apenas aos dados clínicos (idade, nódulo palpável e tamanho da lesão). O erro médio do modelo em classificar casos de câncer, como lesões benignas, no conjunto de dados de validação foi inferior a 0,5%. Concluímos que o aprendizado de máquina pode ajudar a predizer malignidade, em lesões mamárias suspeitas identificadas pela US. Estas ferramentas de inteligência artificial têm o potencial de reduzir o número de biópsias mamárias desnecessárias, um ponto fraco dos programas de rastreamento.
id USP_4d889ec286d368cc7141b3c83a6d14ea
oai_identifier_str oai:teses.usp.br:tde-25092024-105306
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografiaMachine learning to predict malignancy of breast masses identified by ultrasoundAprendizado de máquinaBreast ultrasoundMachine learningMalignancy predictionPredição de malignidadeUltrassonografia mamáriaA ultrassonografia mamária (US) é amplamente utilizada como ferramenta diagnóstica, complementando mamografias inconclusivas, avaliando achados palpáveis e orientando biópsias mamárias. A interpretação do exame é desafiadora, pois o método depende do operador e tem uma alta taxa de falso positivo. Recentemente, o aprendizado de máquina, um tipo de inteligência artificial, vem ganhando atenção por seu excelente desempenho em tarefas de reconhecimento de imagens e preditivas. O objetivo do presente estudo foi estabelecer um modelo confiável de aprendizado de máquina para classificar lesões mamárias como malignas ou benignas, com base em atributos clínicos e ultrassonográficos. Consideramos importante otimizar o valor preditivo negativo (VPN), para minimizar o número de biópsias desnecessárias, sem perder muitos casos de câncer. Trata-se de estudo observacional multicêntrico, em que foram coletados dados clínicos, características ultrassonográficas dos laudos, e imagens ultrassonográficas, de pacientes com lesões mamárias suspeitas, classificadas como BI-RADS 3, 4, 5 e 6, que foram submetidas à biópsia por agulha grossa, em quatro instituições. Foram selecionados os atributos mais informativos para treinar, validar e testar modelos de aprendizado de máquina, para prever a malignidade dessas lesões mamárias. Os atributos selecionados foram forma, margem, orientação, tamanho da lesão, presença de vaso interno no estudo Doppler, índice de resistência do vaso, quando presente, idade do paciente e presença de nódulo palpável. O maior VPN médio foi alcançado com o algoritmo XGBoost, após ajuste do \"threshold\", para minimizar os casos falsos negativos. O desempenho testado do modelo foi: VPN 98,1%, falso negativo 1,9%, valor preditivo positivo 77,1% e falso positivo 22,9%. Aplicando este modelo, teríamos perdido 2 das 231 lesões malignas do conjunto de dados de teste (0,8%). Para minimizar a interpretação dependente do operador, também foram treinados e validados algoritmos, utilizando as próprias imagens de US associadas apenas aos dados clínicos (idade, nódulo palpável e tamanho da lesão). O erro médio do modelo em classificar casos de câncer, como lesões benignas, no conjunto de dados de validação foi inferior a 0,5%. Concluímos que o aprendizado de máquina pode ajudar a predizer malignidade, em lesões mamárias suspeitas identificadas pela US. Estas ferramentas de inteligência artificial têm o potencial de reduzir o número de biópsias mamárias desnecessárias, um ponto fraco dos programas de rastreamento.Breast ultrasound (US) is widely used as a diagnostic tool complementing inconclusive mammograms, evaluating palpable findings, and guiding breast biopsies. Interpreting the exam is challenging though, as the method is operator-dependent and has a high false-positive rate. Recently, machine learning (ML), a type of artificial intelligence, is gaining attention for its excellent performance in image-recognition tasks and potential application in image data processing and model prediction. Our objective was to establish a reliable machine learning model to classify breast lesions as malignant or benign based on clinical and ultrasonographic attributes. The primary endpoint was to optimize the negative predictive value (NPV) to minimize the number of unnecessary biopsies without missing many cancer cases. In our observational multicenter study, we collected clinical data, US features from the reports and US images from patients with suspicious breast lesions classified as BI-RADS 3, 4, 5 and 6 that underwent core needle biopsy in four Institutions. We selected the most informative attributes to train, validate and test machine learning models to predict malignancy of these breast masses. The attributes selected were shape, margin, orientation, size of the lesion, the presence of internal vessels in the Doppler study, the resistance index of the vessel when present, the age of the patient and the presence of a palpable lump. The highest mean NPV was achieved with the algorithm XGBoost after tuning the threshold to minimize the false negative cases. The tested performance of the model was: NPV 98.1%, false negative 1.9%, positive predictive value 77.1% and false positive 22.9%. Applying this model, we would have missed 2 of the 231 malignant lesions of the test dataset (0.8%). To minimize the operator-dependent interpretation of the lesion we also trained and validated algorithms using the US images associated only with clinical data (age, palpable lump, and size of the lesion). The mean error of the ML model classifying cancer as benign lesions in the validation dataset was below 0.5%. We concluded that machine learning can help physicians predict malignancy in suspicious breast lesions identified by the US. These tools have the potential to safely reduce the number of unnecessary breast biopsies, an important frailty of the screening programs.Biblioteca Digitais de Teses e Dissertações da USPTiezzi, Daniel GuimarãesBuzatto, Isabela Panzeri Carlotti2024-06-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/17/17145/tde-25092024-105306/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-10-17T17:00:05Zoai:teses.usp.br:tde-25092024-105306Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-10-17T17:00:05Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia
Machine learning to predict malignancy of breast masses identified by ultrasound
title Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia
spellingShingle Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia
Buzatto, Isabela Panzeri Carlotti
Aprendizado de máquina
Breast ultrasound
Machine learning
Malignancy prediction
Predição de malignidade
Ultrassonografia mamária
title_short Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia
title_full Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia
title_fullStr Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia
title_full_unstemmed Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia
title_sort Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia
author Buzatto, Isabela Panzeri Carlotti
author_facet Buzatto, Isabela Panzeri Carlotti
author_role author
dc.contributor.none.fl_str_mv Tiezzi, Daniel Guimarães
dc.contributor.author.fl_str_mv Buzatto, Isabela Panzeri Carlotti
dc.subject.por.fl_str_mv Aprendizado de máquina
Breast ultrasound
Machine learning
Malignancy prediction
Predição de malignidade
Ultrassonografia mamária
topic Aprendizado de máquina
Breast ultrasound
Machine learning
Malignancy prediction
Predição de malignidade
Ultrassonografia mamária
description A ultrassonografia mamária (US) é amplamente utilizada como ferramenta diagnóstica, complementando mamografias inconclusivas, avaliando achados palpáveis e orientando biópsias mamárias. A interpretação do exame é desafiadora, pois o método depende do operador e tem uma alta taxa de falso positivo. Recentemente, o aprendizado de máquina, um tipo de inteligência artificial, vem ganhando atenção por seu excelente desempenho em tarefas de reconhecimento de imagens e preditivas. O objetivo do presente estudo foi estabelecer um modelo confiável de aprendizado de máquina para classificar lesões mamárias como malignas ou benignas, com base em atributos clínicos e ultrassonográficos. Consideramos importante otimizar o valor preditivo negativo (VPN), para minimizar o número de biópsias desnecessárias, sem perder muitos casos de câncer. Trata-se de estudo observacional multicêntrico, em que foram coletados dados clínicos, características ultrassonográficas dos laudos, e imagens ultrassonográficas, de pacientes com lesões mamárias suspeitas, classificadas como BI-RADS 3, 4, 5 e 6, que foram submetidas à biópsia por agulha grossa, em quatro instituições. Foram selecionados os atributos mais informativos para treinar, validar e testar modelos de aprendizado de máquina, para prever a malignidade dessas lesões mamárias. Os atributos selecionados foram forma, margem, orientação, tamanho da lesão, presença de vaso interno no estudo Doppler, índice de resistência do vaso, quando presente, idade do paciente e presença de nódulo palpável. O maior VPN médio foi alcançado com o algoritmo XGBoost, após ajuste do \"threshold\", para minimizar os casos falsos negativos. O desempenho testado do modelo foi: VPN 98,1%, falso negativo 1,9%, valor preditivo positivo 77,1% e falso positivo 22,9%. Aplicando este modelo, teríamos perdido 2 das 231 lesões malignas do conjunto de dados de teste (0,8%). Para minimizar a interpretação dependente do operador, também foram treinados e validados algoritmos, utilizando as próprias imagens de US associadas apenas aos dados clínicos (idade, nódulo palpável e tamanho da lesão). O erro médio do modelo em classificar casos de câncer, como lesões benignas, no conjunto de dados de validação foi inferior a 0,5%. Concluímos que o aprendizado de máquina pode ajudar a predizer malignidade, em lesões mamárias suspeitas identificadas pela US. Estas ferramentas de inteligência artificial têm o potencial de reduzir o número de biópsias mamárias desnecessárias, um ponto fraco dos programas de rastreamento.
publishDate 2024
dc.date.none.fl_str_mv 2024-06-13
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/17/17145/tde-25092024-105306/
url https://www.teses.usp.br/teses/disponiveis/17/17145/tde-25092024-105306/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1818279233368096768