Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: ARAUJO, Wesley Batista Dominices de lattes
Orientador(a): SANTANA, Ewaldo Eder Carvalho lattes
Banca de defesa: SANTANA, Ewaldo Eder Carvalho lattes, LOBATO, Fábio Manoel França lattes, ROSA, Claudia Regina de Andrade Arrais lattes, SILVA, Luís Cláudio Nascimento da lattes, BARROS FILHO, Allan Kardec Duailibe lattes
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Maranhão
Programa de Pós-Graduação: PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET
Departamento: DEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCET
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://tedebc.ufma.br/jspui/handle/tede/5792
Resumo: Prostate cancer, after non-melanoma skin cancer, is the most common type of cancer among men, and the one that causes the most deaths. To begin the diagnosis of prostate cancer, a physical examination (digital rectal exam) and laboratory exam (prostate-specific antigen) are used. If there are changes in these tests, other tests may be requested, such as resonance magnetic imaging and biopsy. Currently, biopsy is the only procedure capable of confirming cancer, it has a high financial cost and is a very invasive procedure. This thesis proposes a new method to aid in the screening of patients at risk for prostate cancer. The method was developed based on clinical variables (age, race, systemic arterial hypertension, diabetes mellitus, smoking, alcoholism, digital rectal examination, and total PSA) of 274 patients, of which 137 have cancer and 137 do not, as obtained from medical records. The data were analyzed using several machine learning algorithms, such as Artificial Neural Networks, Support Vector Machine, Naive Bayes, K-nearest neighbors, and decision tree, to classify the samples according to the presence or absence of prostate cancer. The method was evaluated based on performance metrics, including accuracy, sensitivity, specificity, and area under the ROC curve. To increase the reliability of the results and the generalization capacity of the classifier, the 10-fold cross-validation technique was used. The best performance was obtained with the Naive Bayes model, resulting in an accuracy of 89.09%, sensitivity of 92%, specificity of 86.67% and an Area under the ROC curve of 0.9187.
id UFMA_2513d05359ebddab2d311679740540ac
oai_identifier_str oai:tede2:tede/5792
network_acronym_str UFMA
network_name_str Biblioteca Digital de Teses e Dissertações da UFMA
repository_id_str
spelling SANTANA, Ewaldo Eder Carvalhohttp://lattes.cnpq.br/0660692009750374SANTANA, Ewaldo Eder Carvalhohttp://lattes.cnpq.br/0660692009750374LOBATO, Fábio Manoel Françahttp://lattes.cnpq.br/8320014491229434ROSA, Claudia Regina de Andrade Arraishttp://lattes.cnpq.br/9537148233753880SILVA, Luís Cláudio Nascimento dahttp://lattes.cnpq.br/6016850820500623BARROS FILHO, Allan Kardec Duailibehttp://lattes.cnpq.br/0492330410079141http://lattes.cnpq.br/6048598111441819ARAUJO, Wesley Batista Dominices de2025-01-06T18:06:58Z2024-12-10ARAUJO, Wesley Batista Dominices de. Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos. 2024. 141 f. Tese(Programa de Pós-graduação em Engenharia de Eletricidade/CCET) - Universidade Federal do Maranhão, São Luís, 2024.https://tedebc.ufma.br/jspui/handle/tede/5792Prostate cancer, after non-melanoma skin cancer, is the most common type of cancer among men, and the one that causes the most deaths. To begin the diagnosis of prostate cancer, a physical examination (digital rectal exam) and laboratory exam (prostate-specific antigen) are used. If there are changes in these tests, other tests may be requested, such as resonance magnetic imaging and biopsy. Currently, biopsy is the only procedure capable of confirming cancer, it has a high financial cost and is a very invasive procedure. This thesis proposes a new method to aid in the screening of patients at risk for prostate cancer. The method was developed based on clinical variables (age, race, systemic arterial hypertension, diabetes mellitus, smoking, alcoholism, digital rectal examination, and total PSA) of 274 patients, of which 137 have cancer and 137 do not, as obtained from medical records. The data were analyzed using several machine learning algorithms, such as Artificial Neural Networks, Support Vector Machine, Naive Bayes, K-nearest neighbors, and decision tree, to classify the samples according to the presence or absence of prostate cancer. The method was evaluated based on performance metrics, including accuracy, sensitivity, specificity, and area under the ROC curve. To increase the reliability of the results and the generalization capacity of the classifier, the 10-fold cross-validation technique was used. The best performance was obtained with the Naive Bayes model, resulting in an accuracy of 89.09%, sensitivity of 92%, specificity of 86.67% and an Area under the ROC curve of 0.9187.O câncer de próstata, depois do câncer de pele não-melanoma, é o tipo de câncer mais comum entre os homens, e o que causa mais mortes. Para iniciar o diagnóstico de câncer de próstata são utilizados o exame físico (toque retal) e o exame laboratorial (antígeno específico da próstata). Se houver alterações nestes exames, outros podem ser solicitados, como ressonância magnética e biópsia. Atualmente, a biópsia é o único procedimento capaz de confirmar o câncer, tem um custo financeiro elevado, e é um procedimento muito invasivo. Esta Tese propõe um novo método para auxiliar na triagem de pacientes em risco de câncer de próstata. O método foi desenvolvido com base em variáveis clínicas (idade, raça, hipertensão arterial sistêmica, diabetes mellitus, tabagismo, etilismo, toque retal e PSA total) de 274 pacientes, dos quais 137 têm câncer e 137 não têm, conforme obtido dos prontuários médicos. Os dados foram analisados utilizando diversos algoritmos de aprendizado de máquina, como Redes Neurais Artificiais, Máquina de Vetor de Suporte, Naive Bayes, K-vizinhos mais próximos e árvore de decisão, para classificar as amostras quanto à presença ou ausência de câncer de próstata. O método foi avaliado com base em métricas de desempenho, incluindo acurácia, sensibilidade, especificidade e área sob a curva ROC. Para aumentar a confiabilidade dos resultados e a capacidade de generalização do classificador, foi utilizada a técnica de validação cruzada 10-fold. O melhor desempenho foi obtido com o modelo Naive Bayes, resultando em uma acurácia de 89,09%, sensibilidade de 92%, especificidade de 86,67% e uma Área sob a curva ROC de 0,9187.Submitted by Maria Aparecida (cidazen@gmail.com) on 2025-01-06T18:06:58Z No. of bitstreams: 1 WESLEY BATISTA DOMINICES DE ARAUJO.pdf: 6415702 bytes, checksum: 3b45f84a50749da2e698269e985a0016 (MD5)Made available in DSpace on 2025-01-06T18:06:58Z (GMT). No. of bitstreams: 1 WESLEY BATISTA DOMINICES DE ARAUJO.pdf: 6415702 bytes, checksum: 3b45f84a50749da2e698269e985a0016 (MD5) Previous issue date: 2024-12-10application/pdfporUniversidade Federal do MaranhãoPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCETUFMABrasilDEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCETCâncer de próstata;Aprendizado de máquina;Triagem;DiagnósticoProstate cancer;Machine learning;Screening;DiagnosisEngenharia de SoftwareMétodo de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicosMethod to aid in the diagnosis of prostate cancer using machine learning and clinical datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFMAinstname:Universidade Federal do Maranhão (UFMA)instacron:UFMAORIGINALWESLEY BATISTA DOMINICES DE ARAUJO.pdfWESLEY BATISTA DOMINICES DE ARAUJO.pdfapplication/pdf6415702http://tedebc.ufma.br:8080/bitstream/tede/5792/2/WESLEY+BATISTA+DOMINICES+DE+ARAUJO.pdf3b45f84a50749da2e698269e985a0016MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82255http://tedebc.ufma.br:8080/bitstream/tede/5792/1/license.txt97eeade1fce43278e63fe063657f8083MD51tede/57922025-01-06 15:06:59.001oai:tede2:tede/5792IExJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpDb20gYSBhcHJlc2VudGHDp8OjbyBkZXN0YSBsaWNlbsOnYSxvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBjb25jZWRlIMOgIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRvIE1hcmFuaMOjbyAoVUZNQSkgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IGRpc3RyaWJ1aXIgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBjb25jb3JkYSBxdWUgYSBVRk1BIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGTUEgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVUZNQSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRk1BLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCkEgVUZNQSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbywgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgoKRGVjbGFyYSB0YW1iw6ltIHF1ZSB0b2RhcyBhcyBhZmlsaWHDp8O1ZXMgY29ycG9yYXRpdmFzIG91IGluc3RpdHVjaW9uYWlzIGUgdG9kYXMgYXMgZm9udGVzIGRlIGFwb2lvIGZpbmFuY2Vpcm8gYW8gdHJhYmFsaG8gZXN0w6NvIGRldmlkYW1lbnRlIGNpdGFkYXMgb3UgbWVuY2lvbmFkYXMgZSBjZXJ0aWZpY2EgcXVlIG7Do28gaMOhIG5lbmh1bSBpbnRlcmVzc2UgY29tZXJjaWFsIG91IGFzc29jaWF0aXZvIHF1ZSByZXByZXNlbnRlIGNvbmZsaXRvIGRlIGludGVyZXNzZSBlbSBjb25leMOjbyBjb20gbyB0cmFiYWxobyBzdWJtZXRpZG8uCgoKCgoKCgo=Biblioteca Digital de Teses e Dissertaçõeshttps://tedebc.ufma.br/jspui/PUBhttp://tedebc.ufma.br:8080/oai/requestrepositorio@ufma.br||repositorio@ufma.bropendoar:21312025-01-06T18:06:59Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA)false
dc.title.por.fl_str_mv Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos
dc.title.alternative.eng.fl_str_mv Method to aid in the diagnosis of prostate cancer using machine learning and clinical data
title Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos
spellingShingle Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos
ARAUJO, Wesley Batista Dominices de
Câncer de próstata;
Aprendizado de máquina;
Triagem;
Diagnóstico
Prostate cancer;
Machine learning;
Screening;
Diagnosis
Engenharia de Software
title_short Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos
title_full Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos
title_fullStr Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos
title_full_unstemmed Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos
title_sort Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos
author ARAUJO, Wesley Batista Dominices de
author_facet ARAUJO, Wesley Batista Dominices de
author_role author
dc.contributor.advisor1.fl_str_mv SANTANA, Ewaldo Eder Carvalho
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/0660692009750374
dc.contributor.referee1.fl_str_mv SANTANA, Ewaldo Eder Carvalho
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/0660692009750374
dc.contributor.referee2.fl_str_mv LOBATO, Fábio Manoel França
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/8320014491229434
dc.contributor.referee3.fl_str_mv ROSA, Claudia Regina de Andrade Arrais
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/9537148233753880
dc.contributor.referee4.fl_str_mv SILVA, Luís Cláudio Nascimento da
dc.contributor.referee4Lattes.fl_str_mv http://lattes.cnpq.br/6016850820500623
dc.contributor.referee5.fl_str_mv BARROS FILHO, Allan Kardec Duailibe
dc.contributor.referee5Lattes.fl_str_mv http://lattes.cnpq.br/0492330410079141
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/6048598111441819
dc.contributor.author.fl_str_mv ARAUJO, Wesley Batista Dominices de
contributor_str_mv SANTANA, Ewaldo Eder Carvalho
SANTANA, Ewaldo Eder Carvalho
LOBATO, Fábio Manoel França
ROSA, Claudia Regina de Andrade Arrais
SILVA, Luís Cláudio Nascimento da
BARROS FILHO, Allan Kardec Duailibe
dc.subject.por.fl_str_mv Câncer de próstata;
Aprendizado de máquina;
Triagem;
Diagnóstico
topic Câncer de próstata;
Aprendizado de máquina;
Triagem;
Diagnóstico
Prostate cancer;
Machine learning;
Screening;
Diagnosis
Engenharia de Software
dc.subject.eng.fl_str_mv Prostate cancer;
Machine learning;
Screening;
Diagnosis
dc.subject.cnpq.fl_str_mv Engenharia de Software
description Prostate cancer, after non-melanoma skin cancer, is the most common type of cancer among men, and the one that causes the most deaths. To begin the diagnosis of prostate cancer, a physical examination (digital rectal exam) and laboratory exam (prostate-specific antigen) are used. If there are changes in these tests, other tests may be requested, such as resonance magnetic imaging and biopsy. Currently, biopsy is the only procedure capable of confirming cancer, it has a high financial cost and is a very invasive procedure. This thesis proposes a new method to aid in the screening of patients at risk for prostate cancer. The method was developed based on clinical variables (age, race, systemic arterial hypertension, diabetes mellitus, smoking, alcoholism, digital rectal examination, and total PSA) of 274 patients, of which 137 have cancer and 137 do not, as obtained from medical records. The data were analyzed using several machine learning algorithms, such as Artificial Neural Networks, Support Vector Machine, Naive Bayes, K-nearest neighbors, and decision tree, to classify the samples according to the presence or absence of prostate cancer. The method was evaluated based on performance metrics, including accuracy, sensitivity, specificity, and area under the ROC curve. To increase the reliability of the results and the generalization capacity of the classifier, the 10-fold cross-validation technique was used. The best performance was obtained with the Naive Bayes model, resulting in an accuracy of 89.09%, sensitivity of 92%, specificity of 86.67% and an Area under the ROC curve of 0.9187.
publishDate 2024
dc.date.issued.fl_str_mv 2024-12-10
dc.date.accessioned.fl_str_mv 2025-01-06T18:06:58Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ARAUJO, Wesley Batista Dominices de. Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos. 2024. 141 f. Tese(Programa de Pós-graduação em Engenharia de Eletricidade/CCET) - Universidade Federal do Maranhão, São Luís, 2024.
dc.identifier.uri.fl_str_mv https://tedebc.ufma.br/jspui/handle/tede/5792
identifier_str_mv ARAUJO, Wesley Batista Dominices de. Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos. 2024. 141 f. Tese(Programa de Pós-graduação em Engenharia de Eletricidade/CCET) - Universidade Federal do Maranhão, São Luís, 2024.
url https://tedebc.ufma.br/jspui/handle/tede/5792
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Maranhão
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET
dc.publisher.initials.fl_str_mv UFMA
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv DEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCET
publisher.none.fl_str_mv Universidade Federal do Maranhão
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFMA
instname:Universidade Federal do Maranhão (UFMA)
instacron:UFMA
instname_str Universidade Federal do Maranhão (UFMA)
instacron_str UFMA
institution UFMA
reponame_str Biblioteca Digital de Teses e Dissertações da UFMA
collection Biblioteca Digital de Teses e Dissertações da UFMA
bitstream.url.fl_str_mv http://tedebc.ufma.br:8080/bitstream/tede/5792/2/WESLEY+BATISTA+DOMINICES+DE+ARAUJO.pdf
http://tedebc.ufma.br:8080/bitstream/tede/5792/1/license.txt
bitstream.checksum.fl_str_mv 3b45f84a50749da2e698269e985a0016
97eeade1fce43278e63fe063657f8083
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA)
repository.mail.fl_str_mv repositorio@ufma.br||repositorio@ufma.br
_version_ 1853508041434988544