Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/17/17145/tde-25092024-105306/ |
Resumo: | A ultrassonografia mamária (US) é amplamente utilizada como ferramenta diagnóstica, complementando mamografias inconclusivas, avaliando achados palpáveis e orientando biópsias mamárias. A interpretação do exame é desafiadora, pois o método depende do operador e tem uma alta taxa de falso positivo. Recentemente, o aprendizado de máquina, um tipo de inteligência artificial, vem ganhando atenção por seu excelente desempenho em tarefas de reconhecimento de imagens e preditivas. O objetivo do presente estudo foi estabelecer um modelo confiável de aprendizado de máquina para classificar lesões mamárias como malignas ou benignas, com base em atributos clínicos e ultrassonográficos. Consideramos importante otimizar o valor preditivo negativo (VPN), para minimizar o número de biópsias desnecessárias, sem perder muitos casos de câncer. Trata-se de estudo observacional multicêntrico, em que foram coletados dados clínicos, características ultrassonográficas dos laudos, e imagens ultrassonográficas, de pacientes com lesões mamárias suspeitas, classificadas como BI-RADS 3, 4, 5 e 6, que foram submetidas à biópsia por agulha grossa, em quatro instituições. Foram selecionados os atributos mais informativos para treinar, validar e testar modelos de aprendizado de máquina, para prever a malignidade dessas lesões mamárias. Os atributos selecionados foram forma, margem, orientação, tamanho da lesão, presença de vaso interno no estudo Doppler, índice de resistência do vaso, quando presente, idade do paciente e presença de nódulo palpável. O maior VPN médio foi alcançado com o algoritmo XGBoost, após ajuste do \"threshold\", para minimizar os casos falsos negativos. O desempenho testado do modelo foi: VPN 98,1%, falso negativo 1,9%, valor preditivo positivo 77,1% e falso positivo 22,9%. Aplicando este modelo, teríamos perdido 2 das 231 lesões malignas do conjunto de dados de teste (0,8%). Para minimizar a interpretação dependente do operador, também foram treinados e validados algoritmos, utilizando as próprias imagens de US associadas apenas aos dados clínicos (idade, nódulo palpável e tamanho da lesão). O erro médio do modelo em classificar casos de câncer, como lesões benignas, no conjunto de dados de validação foi inferior a 0,5%. Concluímos que o aprendizado de máquina pode ajudar a predizer malignidade, em lesões mamárias suspeitas identificadas pela US. Estas ferramentas de inteligência artificial têm o potencial de reduzir o número de biópsias mamárias desnecessárias, um ponto fraco dos programas de rastreamento. |
| id |
USP_4d889ec286d368cc7141b3c83a6d14ea |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-25092024-105306 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografiaMachine learning to predict malignancy of breast masses identified by ultrasoundAprendizado de máquinaBreast ultrasoundMachine learningMalignancy predictionPredição de malignidadeUltrassonografia mamáriaA ultrassonografia mamária (US) é amplamente utilizada como ferramenta diagnóstica, complementando mamografias inconclusivas, avaliando achados palpáveis e orientando biópsias mamárias. A interpretação do exame é desafiadora, pois o método depende do operador e tem uma alta taxa de falso positivo. Recentemente, o aprendizado de máquina, um tipo de inteligência artificial, vem ganhando atenção por seu excelente desempenho em tarefas de reconhecimento de imagens e preditivas. O objetivo do presente estudo foi estabelecer um modelo confiável de aprendizado de máquina para classificar lesões mamárias como malignas ou benignas, com base em atributos clínicos e ultrassonográficos. Consideramos importante otimizar o valor preditivo negativo (VPN), para minimizar o número de biópsias desnecessárias, sem perder muitos casos de câncer. Trata-se de estudo observacional multicêntrico, em que foram coletados dados clínicos, características ultrassonográficas dos laudos, e imagens ultrassonográficas, de pacientes com lesões mamárias suspeitas, classificadas como BI-RADS 3, 4, 5 e 6, que foram submetidas à biópsia por agulha grossa, em quatro instituições. Foram selecionados os atributos mais informativos para treinar, validar e testar modelos de aprendizado de máquina, para prever a malignidade dessas lesões mamárias. Os atributos selecionados foram forma, margem, orientação, tamanho da lesão, presença de vaso interno no estudo Doppler, índice de resistência do vaso, quando presente, idade do paciente e presença de nódulo palpável. O maior VPN médio foi alcançado com o algoritmo XGBoost, após ajuste do \"threshold\", para minimizar os casos falsos negativos. O desempenho testado do modelo foi: VPN 98,1%, falso negativo 1,9%, valor preditivo positivo 77,1% e falso positivo 22,9%. Aplicando este modelo, teríamos perdido 2 das 231 lesões malignas do conjunto de dados de teste (0,8%). Para minimizar a interpretação dependente do operador, também foram treinados e validados algoritmos, utilizando as próprias imagens de US associadas apenas aos dados clínicos (idade, nódulo palpável e tamanho da lesão). O erro médio do modelo em classificar casos de câncer, como lesões benignas, no conjunto de dados de validação foi inferior a 0,5%. Concluímos que o aprendizado de máquina pode ajudar a predizer malignidade, em lesões mamárias suspeitas identificadas pela US. Estas ferramentas de inteligência artificial têm o potencial de reduzir o número de biópsias mamárias desnecessárias, um ponto fraco dos programas de rastreamento.Breast ultrasound (US) is widely used as a diagnostic tool complementing inconclusive mammograms, evaluating palpable findings, and guiding breast biopsies. Interpreting the exam is challenging though, as the method is operator-dependent and has a high false-positive rate. Recently, machine learning (ML), a type of artificial intelligence, is gaining attention for its excellent performance in image-recognition tasks and potential application in image data processing and model prediction. Our objective was to establish a reliable machine learning model to classify breast lesions as malignant or benign based on clinical and ultrasonographic attributes. The primary endpoint was to optimize the negative predictive value (NPV) to minimize the number of unnecessary biopsies without missing many cancer cases. In our observational multicenter study, we collected clinical data, US features from the reports and US images from patients with suspicious breast lesions classified as BI-RADS 3, 4, 5 and 6 that underwent core needle biopsy in four Institutions. We selected the most informative attributes to train, validate and test machine learning models to predict malignancy of these breast masses. The attributes selected were shape, margin, orientation, size of the lesion, the presence of internal vessels in the Doppler study, the resistance index of the vessel when present, the age of the patient and the presence of a palpable lump. The highest mean NPV was achieved with the algorithm XGBoost after tuning the threshold to minimize the false negative cases. The tested performance of the model was: NPV 98.1%, false negative 1.9%, positive predictive value 77.1% and false positive 22.9%. Applying this model, we would have missed 2 of the 231 malignant lesions of the test dataset (0.8%). To minimize the operator-dependent interpretation of the lesion we also trained and validated algorithms using the US images associated only with clinical data (age, palpable lump, and size of the lesion). The mean error of the ML model classifying cancer as benign lesions in the validation dataset was below 0.5%. We concluded that machine learning can help physicians predict malignancy in suspicious breast lesions identified by the US. These tools have the potential to safely reduce the number of unnecessary breast biopsies, an important frailty of the screening programs.Biblioteca Digitais de Teses e Dissertações da USPTiezzi, Daniel GuimarãesBuzatto, Isabela Panzeri Carlotti2024-06-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/17/17145/tde-25092024-105306/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-10-17T17:00:05Zoai:teses.usp.br:tde-25092024-105306Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-10-17T17:00:05Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia Machine learning to predict malignancy of breast masses identified by ultrasound |
| title |
Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia |
| spellingShingle |
Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia Buzatto, Isabela Panzeri Carlotti Aprendizado de máquina Breast ultrasound Machine learning Malignancy prediction Predição de malignidade Ultrassonografia mamária |
| title_short |
Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia |
| title_full |
Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia |
| title_fullStr |
Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia |
| title_full_unstemmed |
Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia |
| title_sort |
Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia |
| author |
Buzatto, Isabela Panzeri Carlotti |
| author_facet |
Buzatto, Isabela Panzeri Carlotti |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Tiezzi, Daniel Guimarães |
| dc.contributor.author.fl_str_mv |
Buzatto, Isabela Panzeri Carlotti |
| dc.subject.por.fl_str_mv |
Aprendizado de máquina Breast ultrasound Machine learning Malignancy prediction Predição de malignidade Ultrassonografia mamária |
| topic |
Aprendizado de máquina Breast ultrasound Machine learning Malignancy prediction Predição de malignidade Ultrassonografia mamária |
| description |
A ultrassonografia mamária (US) é amplamente utilizada como ferramenta diagnóstica, complementando mamografias inconclusivas, avaliando achados palpáveis e orientando biópsias mamárias. A interpretação do exame é desafiadora, pois o método depende do operador e tem uma alta taxa de falso positivo. Recentemente, o aprendizado de máquina, um tipo de inteligência artificial, vem ganhando atenção por seu excelente desempenho em tarefas de reconhecimento de imagens e preditivas. O objetivo do presente estudo foi estabelecer um modelo confiável de aprendizado de máquina para classificar lesões mamárias como malignas ou benignas, com base em atributos clínicos e ultrassonográficos. Consideramos importante otimizar o valor preditivo negativo (VPN), para minimizar o número de biópsias desnecessárias, sem perder muitos casos de câncer. Trata-se de estudo observacional multicêntrico, em que foram coletados dados clínicos, características ultrassonográficas dos laudos, e imagens ultrassonográficas, de pacientes com lesões mamárias suspeitas, classificadas como BI-RADS 3, 4, 5 e 6, que foram submetidas à biópsia por agulha grossa, em quatro instituições. Foram selecionados os atributos mais informativos para treinar, validar e testar modelos de aprendizado de máquina, para prever a malignidade dessas lesões mamárias. Os atributos selecionados foram forma, margem, orientação, tamanho da lesão, presença de vaso interno no estudo Doppler, índice de resistência do vaso, quando presente, idade do paciente e presença de nódulo palpável. O maior VPN médio foi alcançado com o algoritmo XGBoost, após ajuste do \"threshold\", para minimizar os casos falsos negativos. O desempenho testado do modelo foi: VPN 98,1%, falso negativo 1,9%, valor preditivo positivo 77,1% e falso positivo 22,9%. Aplicando este modelo, teríamos perdido 2 das 231 lesões malignas do conjunto de dados de teste (0,8%). Para minimizar a interpretação dependente do operador, também foram treinados e validados algoritmos, utilizando as próprias imagens de US associadas apenas aos dados clínicos (idade, nódulo palpável e tamanho da lesão). O erro médio do modelo em classificar casos de câncer, como lesões benignas, no conjunto de dados de validação foi inferior a 0,5%. Concluímos que o aprendizado de máquina pode ajudar a predizer malignidade, em lesões mamárias suspeitas identificadas pela US. Estas ferramentas de inteligência artificial têm o potencial de reduzir o número de biópsias mamárias desnecessárias, um ponto fraco dos programas de rastreamento. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-06-13 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/17/17145/tde-25092024-105306/ |
| url |
https://www.teses.usp.br/teses/disponiveis/17/17145/tde-25092024-105306/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1818279233368096768 |