An explainable deep learning approach for antimicrobial resistance proteins functional annotation
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertacoes da USP
Universidade de São Paulo Faculdade de Medicina de Ribeirão Preto |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/17/17136/tde-17032026-164855/ |
Resumo: | Bacterial resistance to antimicrobials is one of the main global public health problems, according to the World Health Organization. It burdens public health systems more than AIDS and malaria combined and therefore needs to be addressed on multiple fronts: from the development of new antimicrobials to the creation of genomic surveillance strategies. However, the identification of proteins involved in antimicrobial resistance is limited due to the high similarity required between candidate proteins and those used as references for sequence alignment, resulting in a high number of false negatives. Therefore, there is a need to develop tools that do not rely on direct sequence alignment. This work presents a study on the current state of resistance protein databases as well as the development of DeepSEA, an alignment-independent tool for the functional annotation of resistance proteins using convolutional neural networks. The results show a high degree of redundancy both within and between databases. Annotation errors propagated during the concatenation of these databases were also found, particularly among multidrug class proteins. DeepSEA outperformed alignment-based \"state-of-the-art\" tools and showed performance comparable to more complex transformer-based models. Furthermore, it was possible to manipulate the weights of the convolutional layers and demonstrate that DeepSEA learned to recognize protein domains related to antimicrobial resistance. |
| id |
USP_bf90c158ae82d79f0014d1f88d9ce9e6 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-17032026-164855 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
An explainable deep learning approach for antimicrobial resistance proteins functional annotationUma abordagem de aprendizado profundo explicável para anotação funcional de proteínas de resistência antimicrobianaAnotação funcionalAprendizado de máquinaRedes neurais convolucionaisResistência antimicrobianaAntimicrobial resistanceConvolutional neural networksFunctional annotationMachine learningBacterial resistance to antimicrobials is one of the main global public health problems, according to the World Health Organization. It burdens public health systems more than AIDS and malaria combined and therefore needs to be addressed on multiple fronts: from the development of new antimicrobials to the creation of genomic surveillance strategies. However, the identification of proteins involved in antimicrobial resistance is limited due to the high similarity required between candidate proteins and those used as references for sequence alignment, resulting in a high number of false negatives. Therefore, there is a need to develop tools that do not rely on direct sequence alignment. This work presents a study on the current state of resistance protein databases as well as the development of DeepSEA, an alignment-independent tool for the functional annotation of resistance proteins using convolutional neural networks. The results show a high degree of redundancy both within and between databases. Annotation errors propagated during the concatenation of these databases were also found, particularly among multidrug class proteins. DeepSEA outperformed alignment-based \"state-of-the-art\" tools and showed performance comparable to more complex transformer-based models. Furthermore, it was possible to manipulate the weights of the convolutional layers and demonstrate that DeepSEA learned to recognize protein domains related to antimicrobial resistance.A resistência bacteriana aos antimicrobianos é um dos principais problemas de saúde pública global, de acordo com a Organização Mundial da Saúde. Ela onera mais os sistemas públicos de saúde que as doenças AIDS e malária combinadas e, por isso, necessita ser abordada por diferentes frentes: desde desenvolvimento de novos antimicrobianos a criação de estratégias de vigilância genômica. Contudo, a identificação de proteínas envolvidas na resistência aos antimicrobianos é limitada devido à alta similaridade exigida entre as proteínas candidatas e aquelas usadas como referência para o alinhamento de sequências, resultando num alto número de falsos negativos. Portanto, existe a necessidade do desenvolvimento de ferramentas que não se valham da comparação direta por alinhamento de sequências. Esse trabalho apresenta um estudo sobre o estado atual dos bancos de dados de proteínas de resistência, bem como o desenvolvimento do DeepSEA, uma ferramenta independente de alinhamento para anotação funcional de proteínas de resistência através de redes neurais convolucionais. Os resultados mostram um alto grau de redundância inter e intra bancos de dados. Foram encontrados, também, erros de anotação propagados durante a concatenação desses bancos de dados, com destaque para proteínas da classe multidrogas. DeepSEA, apresentou melhor desempenho quando comparado às ferramentas de alinhamento consideradas \"estado da arte\" da área e foi similar à modelos mais complexos com arquitetura baseada em <i>transformer</i>. Ainda, foi possível manipular os pesos das camadas convolucionais e demonstrar que o DeepSEA aprendeu a reconhecer domínios proteicos relacionados à resistência antimicrobiana.Biblioteca Digitais de Teses e Dissertacoes da USPUniversidade de São PauloFaculdade de Medicina de Ribeirão PretoSilva, Ricardo Roberto daBorelli, Tiago Cabral2025-11-182026-04-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/17/17136/tde-17032026-164855/doi:10.11606/T.17.2025.tde-17032026-164855Liberar o conteúdo para acesso público.info:eu-repo/semantics/openAccessengreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2026-04-16T13:57:02Zoai:teses.usp.br:tde-17032026-164855Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212026-04-16T13:57:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
An explainable deep learning approach for antimicrobial resistance proteins functional annotation Uma abordagem de aprendizado profundo explicável para anotação funcional de proteínas de resistência antimicrobiana |
| title |
An explainable deep learning approach for antimicrobial resistance proteins functional annotation |
| spellingShingle |
An explainable deep learning approach for antimicrobial resistance proteins functional annotation Borelli, Tiago Cabral Anotação funcional Aprendizado de máquina Redes neurais convolucionais Resistência antimicrobiana Antimicrobial resistance Convolutional neural networks Functional annotation Machine learning |
| title_short |
An explainable deep learning approach for antimicrobial resistance proteins functional annotation |
| title_full |
An explainable deep learning approach for antimicrobial resistance proteins functional annotation |
| title_fullStr |
An explainable deep learning approach for antimicrobial resistance proteins functional annotation |
| title_full_unstemmed |
An explainable deep learning approach for antimicrobial resistance proteins functional annotation |
| title_sort |
An explainable deep learning approach for antimicrobial resistance proteins functional annotation |
| author |
Borelli, Tiago Cabral |
| author_facet |
Borelli, Tiago Cabral |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Silva, Ricardo Roberto da |
| dc.contributor.author.fl_str_mv |
Borelli, Tiago Cabral |
| dc.subject.por.fl_str_mv |
Anotação funcional Aprendizado de máquina Redes neurais convolucionais Resistência antimicrobiana Antimicrobial resistance Convolutional neural networks Functional annotation Machine learning |
| topic |
Anotação funcional Aprendizado de máquina Redes neurais convolucionais Resistência antimicrobiana Antimicrobial resistance Convolutional neural networks Functional annotation Machine learning |
| description |
Bacterial resistance to antimicrobials is one of the main global public health problems, according to the World Health Organization. It burdens public health systems more than AIDS and malaria combined and therefore needs to be addressed on multiple fronts: from the development of new antimicrobials to the creation of genomic surveillance strategies. However, the identification of proteins involved in antimicrobial resistance is limited due to the high similarity required between candidate proteins and those used as references for sequence alignment, resulting in a high number of false negatives. Therefore, there is a need to develop tools that do not rely on direct sequence alignment. This work presents a study on the current state of resistance protein databases as well as the development of DeepSEA, an alignment-independent tool for the functional annotation of resistance proteins using convolutional neural networks. The results show a high degree of redundancy both within and between databases. Annotation errors propagated during the concatenation of these databases were also found, particularly among multidrug class proteins. DeepSEA outperformed alignment-based \"state-of-the-art\" tools and showed performance comparable to more complex transformer-based models. Furthermore, it was possible to manipulate the weights of the convolutional layers and demonstrate that DeepSEA learned to recognize protein domains related to antimicrobial resistance. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-11-18 2026-04-16 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/17/17136/tde-17032026-164855/ doi:10.11606/T.17.2025.tde-17032026-164855 |
| url |
https://www.teses.usp.br/teses/disponiveis/17/17136/tde-17032026-164855/ |
| identifier_str_mv |
doi:10.11606/T.17.2025.tde-17032026-164855 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertacoes da USP Universidade de São Paulo Faculdade de Medicina de Ribeirão Preto |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertacoes da USP Universidade de São Paulo Faculdade de Medicina de Ribeirão Preto |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865492704344932352 |