Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | , , , , |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal do Maranhão
|
| Programa de Pós-Graduação: |
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET
|
| Departamento: |
DEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCET
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://tedebc.ufma.br/jspui/handle/tede/5792 |
Resumo: | Prostate cancer, after non-melanoma skin cancer, is the most common type of cancer among men, and the one that causes the most deaths. To begin the diagnosis of prostate cancer, a physical examination (digital rectal exam) and laboratory exam (prostate-specific antigen) are used. If there are changes in these tests, other tests may be requested, such as resonance magnetic imaging and biopsy. Currently, biopsy is the only procedure capable of confirming cancer, it has a high financial cost and is a very invasive procedure. This thesis proposes a new method to aid in the screening of patients at risk for prostate cancer. The method was developed based on clinical variables (age, race, systemic arterial hypertension, diabetes mellitus, smoking, alcoholism, digital rectal examination, and total PSA) of 274 patients, of which 137 have cancer and 137 do not, as obtained from medical records. The data were analyzed using several machine learning algorithms, such as Artificial Neural Networks, Support Vector Machine, Naive Bayes, K-nearest neighbors, and decision tree, to classify the samples according to the presence or absence of prostate cancer. The method was evaluated based on performance metrics, including accuracy, sensitivity, specificity, and area under the ROC curve. To increase the reliability of the results and the generalization capacity of the classifier, the 10-fold cross-validation technique was used. The best performance was obtained with the Naive Bayes model, resulting in an accuracy of 89.09%, sensitivity of 92%, specificity of 86.67% and an Area under the ROC curve of 0.9187. |
| id |
UFMA_2513d05359ebddab2d311679740540ac |
|---|---|
| oai_identifier_str |
oai:tede2:tede/5792 |
| network_acronym_str |
UFMA |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UFMA |
| repository_id_str |
|
| spelling |
SANTANA, Ewaldo Eder Carvalhohttp://lattes.cnpq.br/0660692009750374SANTANA, Ewaldo Eder Carvalhohttp://lattes.cnpq.br/0660692009750374LOBATO, Fábio Manoel Françahttp://lattes.cnpq.br/8320014491229434ROSA, Claudia Regina de Andrade Arraishttp://lattes.cnpq.br/9537148233753880SILVA, Luís Cláudio Nascimento dahttp://lattes.cnpq.br/6016850820500623BARROS FILHO, Allan Kardec Duailibehttp://lattes.cnpq.br/0492330410079141http://lattes.cnpq.br/6048598111441819ARAUJO, Wesley Batista Dominices de2025-01-06T18:06:58Z2024-12-10ARAUJO, Wesley Batista Dominices de. Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos. 2024. 141 f. Tese(Programa de Pós-graduação em Engenharia de Eletricidade/CCET) - Universidade Federal do Maranhão, São Luís, 2024.https://tedebc.ufma.br/jspui/handle/tede/5792Prostate cancer, after non-melanoma skin cancer, is the most common type of cancer among men, and the one that causes the most deaths. To begin the diagnosis of prostate cancer, a physical examination (digital rectal exam) and laboratory exam (prostate-specific antigen) are used. If there are changes in these tests, other tests may be requested, such as resonance magnetic imaging and biopsy. Currently, biopsy is the only procedure capable of confirming cancer, it has a high financial cost and is a very invasive procedure. This thesis proposes a new method to aid in the screening of patients at risk for prostate cancer. The method was developed based on clinical variables (age, race, systemic arterial hypertension, diabetes mellitus, smoking, alcoholism, digital rectal examination, and total PSA) of 274 patients, of which 137 have cancer and 137 do not, as obtained from medical records. The data were analyzed using several machine learning algorithms, such as Artificial Neural Networks, Support Vector Machine, Naive Bayes, K-nearest neighbors, and decision tree, to classify the samples according to the presence or absence of prostate cancer. The method was evaluated based on performance metrics, including accuracy, sensitivity, specificity, and area under the ROC curve. To increase the reliability of the results and the generalization capacity of the classifier, the 10-fold cross-validation technique was used. The best performance was obtained with the Naive Bayes model, resulting in an accuracy of 89.09%, sensitivity of 92%, specificity of 86.67% and an Area under the ROC curve of 0.9187.O câncer de próstata, depois do câncer de pele não-melanoma, é o tipo de câncer mais comum entre os homens, e o que causa mais mortes. Para iniciar o diagnóstico de câncer de próstata são utilizados o exame físico (toque retal) e o exame laboratorial (antígeno específico da próstata). Se houver alterações nestes exames, outros podem ser solicitados, como ressonância magnética e biópsia. Atualmente, a biópsia é o único procedimento capaz de confirmar o câncer, tem um custo financeiro elevado, e é um procedimento muito invasivo. Esta Tese propõe um novo método para auxiliar na triagem de pacientes em risco de câncer de próstata. O método foi desenvolvido com base em variáveis clínicas (idade, raça, hipertensão arterial sistêmica, diabetes mellitus, tabagismo, etilismo, toque retal e PSA total) de 274 pacientes, dos quais 137 têm câncer e 137 não têm, conforme obtido dos prontuários médicos. Os dados foram analisados utilizando diversos algoritmos de aprendizado de máquina, como Redes Neurais Artificiais, Máquina de Vetor de Suporte, Naive Bayes, K-vizinhos mais próximos e árvore de decisão, para classificar as amostras quanto à presença ou ausência de câncer de próstata. O método foi avaliado com base em métricas de desempenho, incluindo acurácia, sensibilidade, especificidade e área sob a curva ROC. Para aumentar a confiabilidade dos resultados e a capacidade de generalização do classificador, foi utilizada a técnica de validação cruzada 10-fold. O melhor desempenho foi obtido com o modelo Naive Bayes, resultando em uma acurácia de 89,09%, sensibilidade de 92%, especificidade de 86,67% e uma Área sob a curva ROC de 0,9187.Submitted by Maria Aparecida (cidazen@gmail.com) on 2025-01-06T18:06:58Z No. of bitstreams: 1 WESLEY BATISTA DOMINICES DE ARAUJO.pdf: 6415702 bytes, checksum: 3b45f84a50749da2e698269e985a0016 (MD5)Made available in DSpace on 2025-01-06T18:06:58Z (GMT). No. of bitstreams: 1 WESLEY BATISTA DOMINICES DE ARAUJO.pdf: 6415702 bytes, checksum: 3b45f84a50749da2e698269e985a0016 (MD5) Previous issue date: 2024-12-10application/pdfporUniversidade Federal do MaranhãoPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCETUFMABrasilDEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCETCâncer de próstata;Aprendizado de máquina;Triagem;DiagnósticoProstate cancer;Machine learning;Screening;DiagnosisEngenharia de SoftwareMétodo de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicosMethod to aid in the diagnosis of prostate cancer using machine learning and clinical datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFMAinstname:Universidade Federal do Maranhão (UFMA)instacron:UFMAORIGINALWESLEY BATISTA DOMINICES DE ARAUJO.pdfWESLEY BATISTA DOMINICES DE ARAUJO.pdfapplication/pdf6415702http://tedebc.ufma.br:8080/bitstream/tede/5792/2/WESLEY+BATISTA+DOMINICES+DE+ARAUJO.pdf3b45f84a50749da2e698269e985a0016MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82255http://tedebc.ufma.br:8080/bitstream/tede/5792/1/license.txt97eeade1fce43278e63fe063657f8083MD51tede/57922025-01-06 15:06:59.001oai:tede2:tede/5792IExJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpDb20gYSBhcHJlc2VudGHDp8OjbyBkZXN0YSBsaWNlbsOnYSxvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBjb25jZWRlIMOgIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRvIE1hcmFuaMOjbyAoVUZNQSkgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IGRpc3RyaWJ1aXIgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBjb25jb3JkYSBxdWUgYSBVRk1BIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGTUEgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVUZNQSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRk1BLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCkEgVUZNQSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbywgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgoKRGVjbGFyYSB0YW1iw6ltIHF1ZSB0b2RhcyBhcyBhZmlsaWHDp8O1ZXMgY29ycG9yYXRpdmFzIG91IGluc3RpdHVjaW9uYWlzIGUgdG9kYXMgYXMgZm9udGVzIGRlIGFwb2lvIGZpbmFuY2Vpcm8gYW8gdHJhYmFsaG8gZXN0w6NvIGRldmlkYW1lbnRlIGNpdGFkYXMgb3UgbWVuY2lvbmFkYXMgZSBjZXJ0aWZpY2EgcXVlIG7Do28gaMOhIG5lbmh1bSBpbnRlcmVzc2UgY29tZXJjaWFsIG91IGFzc29jaWF0aXZvIHF1ZSByZXByZXNlbnRlIGNvbmZsaXRvIGRlIGludGVyZXNzZSBlbSBjb25leMOjbyBjb20gbyB0cmFiYWxobyBzdWJtZXRpZG8uCgoKCgoKCgo=Biblioteca Digital de Teses e Dissertaçõeshttps://tedebc.ufma.br/jspui/PUBhttp://tedebc.ufma.br:8080/oai/requestrepositorio@ufma.br||repositorio@ufma.bropendoar:21312025-01-06T18:06:59Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA)false |
| dc.title.por.fl_str_mv |
Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos |
| dc.title.alternative.eng.fl_str_mv |
Method to aid in the diagnosis of prostate cancer using machine learning and clinical data |
| title |
Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos |
| spellingShingle |
Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos ARAUJO, Wesley Batista Dominices de Câncer de próstata; Aprendizado de máquina; Triagem; Diagnóstico Prostate cancer; Machine learning; Screening; Diagnosis Engenharia de Software |
| title_short |
Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos |
| title_full |
Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos |
| title_fullStr |
Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos |
| title_full_unstemmed |
Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos |
| title_sort |
Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos |
| author |
ARAUJO, Wesley Batista Dominices de |
| author_facet |
ARAUJO, Wesley Batista Dominices de |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
SANTANA, Ewaldo Eder Carvalho |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/0660692009750374 |
| dc.contributor.referee1.fl_str_mv |
SANTANA, Ewaldo Eder Carvalho |
| dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/0660692009750374 |
| dc.contributor.referee2.fl_str_mv |
LOBATO, Fábio Manoel França |
| dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/8320014491229434 |
| dc.contributor.referee3.fl_str_mv |
ROSA, Claudia Regina de Andrade Arrais |
| dc.contributor.referee3Lattes.fl_str_mv |
http://lattes.cnpq.br/9537148233753880 |
| dc.contributor.referee4.fl_str_mv |
SILVA, Luís Cláudio Nascimento da |
| dc.contributor.referee4Lattes.fl_str_mv |
http://lattes.cnpq.br/6016850820500623 |
| dc.contributor.referee5.fl_str_mv |
BARROS FILHO, Allan Kardec Duailibe |
| dc.contributor.referee5Lattes.fl_str_mv |
http://lattes.cnpq.br/0492330410079141 |
| dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/6048598111441819 |
| dc.contributor.author.fl_str_mv |
ARAUJO, Wesley Batista Dominices de |
| contributor_str_mv |
SANTANA, Ewaldo Eder Carvalho SANTANA, Ewaldo Eder Carvalho LOBATO, Fábio Manoel França ROSA, Claudia Regina de Andrade Arrais SILVA, Luís Cláudio Nascimento da BARROS FILHO, Allan Kardec Duailibe |
| dc.subject.por.fl_str_mv |
Câncer de próstata; Aprendizado de máquina; Triagem; Diagnóstico |
| topic |
Câncer de próstata; Aprendizado de máquina; Triagem; Diagnóstico Prostate cancer; Machine learning; Screening; Diagnosis Engenharia de Software |
| dc.subject.eng.fl_str_mv |
Prostate cancer; Machine learning; Screening; Diagnosis |
| dc.subject.cnpq.fl_str_mv |
Engenharia de Software |
| description |
Prostate cancer, after non-melanoma skin cancer, is the most common type of cancer among men, and the one that causes the most deaths. To begin the diagnosis of prostate cancer, a physical examination (digital rectal exam) and laboratory exam (prostate-specific antigen) are used. If there are changes in these tests, other tests may be requested, such as resonance magnetic imaging and biopsy. Currently, biopsy is the only procedure capable of confirming cancer, it has a high financial cost and is a very invasive procedure. This thesis proposes a new method to aid in the screening of patients at risk for prostate cancer. The method was developed based on clinical variables (age, race, systemic arterial hypertension, diabetes mellitus, smoking, alcoholism, digital rectal examination, and total PSA) of 274 patients, of which 137 have cancer and 137 do not, as obtained from medical records. The data were analyzed using several machine learning algorithms, such as Artificial Neural Networks, Support Vector Machine, Naive Bayes, K-nearest neighbors, and decision tree, to classify the samples according to the presence or absence of prostate cancer. The method was evaluated based on performance metrics, including accuracy, sensitivity, specificity, and area under the ROC curve. To increase the reliability of the results and the generalization capacity of the classifier, the 10-fold cross-validation technique was used. The best performance was obtained with the Naive Bayes model, resulting in an accuracy of 89.09%, sensitivity of 92%, specificity of 86.67% and an Area under the ROC curve of 0.9187. |
| publishDate |
2024 |
| dc.date.issued.fl_str_mv |
2024-12-10 |
| dc.date.accessioned.fl_str_mv |
2025-01-06T18:06:58Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
ARAUJO, Wesley Batista Dominices de. Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos. 2024. 141 f. Tese(Programa de Pós-graduação em Engenharia de Eletricidade/CCET) - Universidade Federal do Maranhão, São Luís, 2024. |
| dc.identifier.uri.fl_str_mv |
https://tedebc.ufma.br/jspui/handle/tede/5792 |
| identifier_str_mv |
ARAUJO, Wesley Batista Dominices de. Método de auxílio ao diagnóstico de câncer de próstata utilizando aprendizado de máquina e dados clínicos. 2024. 141 f. Tese(Programa de Pós-graduação em Engenharia de Eletricidade/CCET) - Universidade Federal do Maranhão, São Luís, 2024. |
| url |
https://tedebc.ufma.br/jspui/handle/tede/5792 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal do Maranhão |
| dc.publisher.program.fl_str_mv |
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET |
| dc.publisher.initials.fl_str_mv |
UFMA |
| dc.publisher.country.fl_str_mv |
Brasil |
| dc.publisher.department.fl_str_mv |
DEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCET |
| publisher.none.fl_str_mv |
Universidade Federal do Maranhão |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFMA instname:Universidade Federal do Maranhão (UFMA) instacron:UFMA |
| instname_str |
Universidade Federal do Maranhão (UFMA) |
| instacron_str |
UFMA |
| institution |
UFMA |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UFMA |
| collection |
Biblioteca Digital de Teses e Dissertações da UFMA |
| bitstream.url.fl_str_mv |
http://tedebc.ufma.br:8080/bitstream/tede/5792/2/WESLEY+BATISTA+DOMINICES+DE+ARAUJO.pdf http://tedebc.ufma.br:8080/bitstream/tede/5792/1/license.txt |
| bitstream.checksum.fl_str_mv |
3b45f84a50749da2e698269e985a0016 97eeade1fce43278e63fe063657f8083 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA) |
| repository.mail.fl_str_mv |
repositorio@ufma.br||repositorio@ufma.br |
| _version_ |
1853508041434988544 |