Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia

Buzatto, Isabela Panzeri Carlotti

Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia

Detalhes bibliográficos
Ano de defesa:	2024
Autor(a) principal:	Buzatto, Isabela Panzeri Carlotti
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Tese
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Aprendizado de máquina Breast ultrasound Machine learning Malignancy prediction Predição de malignidade Ultrassonografia mamária
Link de acesso:	https://www.teses.usp.br/teses/disponiveis/17/17145/tde-25092024-105306/
Resumo:	A ultrassonografia mamária (US) é amplamente utilizada como ferramenta diagnóstica, complementando mamografias inconclusivas, avaliando achados palpáveis e orientando biópsias mamárias. A interpretação do exame é desafiadora, pois o método depende do operador e tem uma alta taxa de falso positivo. Recentemente, o aprendizado de máquina, um tipo de inteligência artificial, vem ganhando atenção por seu excelente desempenho em tarefas de reconhecimento de imagens e preditivas. O objetivo do presente estudo foi estabelecer um modelo confiável de aprendizado de máquina para classificar lesões mamárias como malignas ou benignas, com base em atributos clínicos e ultrassonográficos. Consideramos importante otimizar o valor preditivo negativo (VPN), para minimizar o número de biópsias desnecessárias, sem perder muitos casos de câncer. Trata-se de estudo observacional multicêntrico, em que foram coletados dados clínicos, características ultrassonográficas dos laudos, e imagens ultrassonográficas, de pacientes com lesões mamárias suspeitas, classificadas como BI-RADS 3, 4, 5 e 6, que foram submetidas à biópsia por agulha grossa, em quatro instituições. Foram selecionados os atributos mais informativos para treinar, validar e testar modelos de aprendizado de máquina, para prever a malignidade dessas lesões mamárias. Os atributos selecionados foram forma, margem, orientação, tamanho da lesão, presença de vaso interno no estudo Doppler, índice de resistência do vaso, quando presente, idade do paciente e presença de nódulo palpável. O maior VPN médio foi alcançado com o algoritmo XGBoost, após ajuste do \"threshold\", para minimizar os casos falsos negativos. O desempenho testado do modelo foi: VPN 98,1%, falso negativo 1,9%, valor preditivo positivo 77,1% e falso positivo 22,9%. Aplicando este modelo, teríamos perdido 2 das 231 lesões malignas do conjunto de dados de teste (0,8%). Para minimizar a interpretação dependente do operador, também foram treinados e validados algoritmos, utilizando as próprias imagens de US associadas apenas aos dados clínicos (idade, nódulo palpável e tamanho da lesão). O erro médio do modelo em classificar casos de câncer, como lesões benignas, no conjunto de dados de validação foi inferior a 0,5%. Concluímos que o aprendizado de máquina pode ajudar a predizer malignidade, em lesões mamárias suspeitas identificadas pela US. Estas ferramentas de inteligência artificial têm o potencial de reduzir o número de biópsias mamárias desnecessárias, um ponto fraco dos programas de rastreamento.

Metadados do item

id	USP_4d889ec286d368cc7141b3c83a6d14ea
oai_identifier_str	oai:teses.usp.br:tde-25092024-105306
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling	Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografiaMachine learning to predict malignancy of breast masses identified by ultrasoundAprendizado de máquinaBreast ultrasoundMachine learningMalignancy predictionPredição de malignidadeUltrassonografia mamáriaA ultrassonografia mamária (US) é amplamente utilizada como ferramenta diagnóstica, complementando mamografias inconclusivas, avaliando achados palpáveis e orientando biópsias mamárias. A interpretação do exame é desafiadora, pois o método depende do operador e tem uma alta taxa de falso positivo. Recentemente, o aprendizado de máquina, um tipo de inteligência artificial, vem ganhando atenção por seu excelente desempenho em tarefas de reconhecimento de imagens e preditivas. O objetivo do presente estudo foi estabelecer um modelo confiável de aprendizado de máquina para classificar lesões mamárias como malignas ou benignas, com base em atributos clínicos e ultrassonográficos. Consideramos importante otimizar o valor preditivo negativo (VPN), para minimizar o número de biópsias desnecessárias, sem perder muitos casos de câncer. Trata-se de estudo observacional multicêntrico, em que foram coletados dados clínicos, características ultrassonográficas dos laudos, e imagens ultrassonográficas, de pacientes com lesões mamárias suspeitas, classificadas como BI-RADS 3, 4, 5 e 6, que foram submetidas à biópsia por agulha grossa, em quatro instituições. Foram selecionados os atributos mais informativos para treinar, validar e testar modelos de aprendizado de máquina, para prever a malignidade dessas lesões mamárias. Os atributos selecionados foram forma, margem, orientação, tamanho da lesão, presença de vaso interno no estudo Doppler, índice de resistência do vaso, quando presente, idade do paciente e presença de nódulo palpável. O maior VPN médio foi alcançado com o algoritmo XGBoost, após ajuste do \"threshold\", para minimizar os casos falsos negativos. O desempenho testado do modelo foi: VPN 98,1%, falso negativo 1,9%, valor preditivo positivo 77,1% e falso positivo 22,9%. Aplicando este modelo, teríamos perdido 2 das 231 lesões malignas do conjunto de dados de teste (0,8%). Para minimizar a interpretação dependente do operador, também foram treinados e validados algoritmos, utilizando as próprias imagens de US associadas apenas aos dados clínicos (idade, nódulo palpável e tamanho da lesão). O erro médio do modelo em classificar casos de câncer, como lesões benignas, no conjunto de dados de validação foi inferior a 0,5%. Concluímos que o aprendizado de máquina pode ajudar a predizer malignidade, em lesões mamárias suspeitas identificadas pela US. Estas ferramentas de inteligência artificial têm o potencial de reduzir o número de biópsias mamárias desnecessárias, um ponto fraco dos programas de rastreamento.Breast ultrasound (US) is widely used as a diagnostic tool complementing inconclusive mammograms, evaluating palpable findings, and guiding breast biopsies. Interpreting the exam is challenging though, as the method is operator-dependent and has a high false-positive rate. Recently, machine learning (ML), a type of artificial intelligence, is gaining attention for its excellent performance in image-recognition tasks and potential application in image data processing and model prediction. Our objective was to establish a reliable machine learning model to classify breast lesions as malignant or benign based on clinical and ultrasonographic attributes. The primary endpoint was to optimize the negative predictive value (NPV) to minimize the number of unnecessary biopsies without missing many cancer cases. In our observational multicenter study, we collected clinical data, US features from the reports and US images from patients with suspicious breast lesions classified as BI-RADS 3, 4, 5 and 6 that underwent core needle biopsy in four Institutions. We selected the most informative attributes to train, validate and test machine learning models to predict malignancy of these breast masses. The attributes selected were shape, margin, orientation, size of the lesion, the presence of internal vessels in the Doppler study, the resistance index of the vessel when present, the age of the patient and the presence of a palpable lump. The highest mean NPV was achieved with the algorithm XGBoost after tuning the threshold to minimize the false negative cases. The tested performance of the model was: NPV 98.1%, false negative 1.9%, positive predictive value 77.1% and false positive 22.9%. Applying this model, we would have missed 2 of the 231 malignant lesions of the test dataset (0.8%). To minimize the operator-dependent interpretation of the lesion we also trained and validated algorithms using the US images associated only with clinical data (age, palpable lump, and size of the lesion). The mean error of the ML model classifying cancer as benign lesions in the validation dataset was below 0.5%. We concluded that machine learning can help physicians predict malignancy in suspicious breast lesions identified by the US. These tools have the potential to safely reduce the number of unnecessary breast biopsies, an important frailty of the screening programs.Biblioteca Digitais de Teses e Dissertações da USPTiezzi, Daniel GuimarãesBuzatto, Isabela Panzeri Carlotti2024-06-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/17/17145/tde-25092024-105306/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-10-17T17:00:05Zoai:teses.usp.br:tde-25092024-105306Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212024-10-17T17:00:05Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia Machine learning to predict malignancy of breast masses identified by ultrasound
title	Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia
spellingShingle	Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia Buzatto, Isabela Panzeri Carlotti Aprendizado de máquina Breast ultrasound Machine learning Malignancy prediction Predição de malignidade Ultrassonografia mamária
title_short	Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia
title_full	Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia
title_fullStr	Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia
title_full_unstemmed	Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia
title_sort	Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia
author	Buzatto, Isabela Panzeri Carlotti
author_facet	Buzatto, Isabela Panzeri Carlotti
author_role	author
dc.contributor.none.fl_str_mv	Tiezzi, Daniel Guimarães
dc.contributor.author.fl_str_mv	Buzatto, Isabela Panzeri Carlotti
dc.subject.por.fl_str_mv	Aprendizado de máquina Breast ultrasound Machine learning Malignancy prediction Predição de malignidade Ultrassonografia mamária
topic	Aprendizado de máquina Breast ultrasound Machine learning Malignancy prediction Predição de malignidade Ultrassonografia mamária
description	A ultrassonografia mamária (US) é amplamente utilizada como ferramenta diagnóstica, complementando mamografias inconclusivas, avaliando achados palpáveis e orientando biópsias mamárias. A interpretação do exame é desafiadora, pois o método depende do operador e tem uma alta taxa de falso positivo. Recentemente, o aprendizado de máquina, um tipo de inteligência artificial, vem ganhando atenção por seu excelente desempenho em tarefas de reconhecimento de imagens e preditivas. O objetivo do presente estudo foi estabelecer um modelo confiável de aprendizado de máquina para classificar lesões mamárias como malignas ou benignas, com base em atributos clínicos e ultrassonográficos. Consideramos importante otimizar o valor preditivo negativo (VPN), para minimizar o número de biópsias desnecessárias, sem perder muitos casos de câncer. Trata-se de estudo observacional multicêntrico, em que foram coletados dados clínicos, características ultrassonográficas dos laudos, e imagens ultrassonográficas, de pacientes com lesões mamárias suspeitas, classificadas como BI-RADS 3, 4, 5 e 6, que foram submetidas à biópsia por agulha grossa, em quatro instituições. Foram selecionados os atributos mais informativos para treinar, validar e testar modelos de aprendizado de máquina, para prever a malignidade dessas lesões mamárias. Os atributos selecionados foram forma, margem, orientação, tamanho da lesão, presença de vaso interno no estudo Doppler, índice de resistência do vaso, quando presente, idade do paciente e presença de nódulo palpável. O maior VPN médio foi alcançado com o algoritmo XGBoost, após ajuste do \"threshold\", para minimizar os casos falsos negativos. O desempenho testado do modelo foi: VPN 98,1%, falso negativo 1,9%, valor preditivo positivo 77,1% e falso positivo 22,9%. Aplicando este modelo, teríamos perdido 2 das 231 lesões malignas do conjunto de dados de teste (0,8%). Para minimizar a interpretação dependente do operador, também foram treinados e validados algoritmos, utilizando as próprias imagens de US associadas apenas aos dados clínicos (idade, nódulo palpável e tamanho da lesão). O erro médio do modelo em classificar casos de câncer, como lesões benignas, no conjunto de dados de validação foi inferior a 0,5%. Concluímos que o aprendizado de máquina pode ajudar a predizer malignidade, em lesões mamárias suspeitas identificadas pela US. Estas ferramentas de inteligência artificial têm o potencial de reduzir o número de biópsias mamárias desnecessárias, um ponto fraco dos programas de rastreamento.
publishDate	2024
dc.date.none.fl_str_mv	2024-06-13
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/doctoralThesis
format	doctoralThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://www.teses.usp.br/teses/disponiveis/17/17145/tde-25092024-105306/
url	https://www.teses.usp.br/teses/disponiveis/17/17145/tde-25092024-105306/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1818279233368096768

Machine learning como método de predição de malignidade em lesões mamárias identificadas à ultrassonografia

Registros relacionados