An explainable deep learning approach for antimicrobial resistance proteins functional annotation

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Borelli, Tiago Cabral
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Biblioteca Digitais de Teses e Dissertacoes da USP
Universidade de São Paulo
Faculdade de Medicina de Ribeirão Preto
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/17/17136/tde-17032026-164855/
Resumo: Bacterial resistance to antimicrobials is one of the main global public health problems, according to the World Health Organization. It burdens public health systems more than AIDS and malaria combined and therefore needs to be addressed on multiple fronts: from the development of new antimicrobials to the creation of genomic surveillance strategies. However, the identification of proteins involved in antimicrobial resistance is limited due to the high similarity required between candidate proteins and those used as references for sequence alignment, resulting in a high number of false negatives. Therefore, there is a need to develop tools that do not rely on direct sequence alignment. This work presents a study on the current state of resistance protein databases as well as the development of DeepSEA, an alignment-independent tool for the functional annotation of resistance proteins using convolutional neural networks. The results show a high degree of redundancy both within and between databases. Annotation errors propagated during the concatenation of these databases were also found, particularly among multidrug class proteins. DeepSEA outperformed alignment-based \"state-of-the-art\" tools and showed performance comparable to more complex transformer-based models. Furthermore, it was possible to manipulate the weights of the convolutional layers and demonstrate that DeepSEA learned to recognize protein domains related to antimicrobial resistance.
id USP_bf90c158ae82d79f0014d1f88d9ce9e6
oai_identifier_str oai:teses.usp.br:tde-17032026-164855
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling An explainable deep learning approach for antimicrobial resistance proteins functional annotationUma abordagem de aprendizado profundo explicável para anotação funcional de proteínas de resistência antimicrobianaAnotação funcionalAprendizado de máquinaRedes neurais convolucionaisResistência antimicrobianaAntimicrobial resistanceConvolutional neural networksFunctional annotationMachine learningBacterial resistance to antimicrobials is one of the main global public health problems, according to the World Health Organization. It burdens public health systems more than AIDS and malaria combined and therefore needs to be addressed on multiple fronts: from the development of new antimicrobials to the creation of genomic surveillance strategies. However, the identification of proteins involved in antimicrobial resistance is limited due to the high similarity required between candidate proteins and those used as references for sequence alignment, resulting in a high number of false negatives. Therefore, there is a need to develop tools that do not rely on direct sequence alignment. This work presents a study on the current state of resistance protein databases as well as the development of DeepSEA, an alignment-independent tool for the functional annotation of resistance proteins using convolutional neural networks. The results show a high degree of redundancy both within and between databases. Annotation errors propagated during the concatenation of these databases were also found, particularly among multidrug class proteins. DeepSEA outperformed alignment-based \"state-of-the-art\" tools and showed performance comparable to more complex transformer-based models. Furthermore, it was possible to manipulate the weights of the convolutional layers and demonstrate that DeepSEA learned to recognize protein domains related to antimicrobial resistance.A resistência bacteriana aos antimicrobianos é um dos principais problemas de saúde pública global, de acordo com a Organização Mundial da Saúde. Ela onera mais os sistemas públicos de saúde que as doenças AIDS e malária combinadas e, por isso, necessita ser abordada por diferentes frentes: desde desenvolvimento de novos antimicrobianos a criação de estratégias de vigilância genômica. Contudo, a identificação de proteínas envolvidas na resistência aos antimicrobianos é limitada devido à alta similaridade exigida entre as proteínas candidatas e aquelas usadas como referência para o alinhamento de sequências, resultando num alto número de falsos negativos. Portanto, existe a necessidade do desenvolvimento de ferramentas que não se valham da comparação direta por alinhamento de sequências. Esse trabalho apresenta um estudo sobre o estado atual dos bancos de dados de proteínas de resistência, bem como o desenvolvimento do DeepSEA, uma ferramenta independente de alinhamento para anotação funcional de proteínas de resistência através de redes neurais convolucionais. Os resultados mostram um alto grau de redundância inter e intra bancos de dados. Foram encontrados, também, erros de anotação propagados durante a concatenação desses bancos de dados, com destaque para proteínas da classe multidrogas. DeepSEA, apresentou melhor desempenho quando comparado às ferramentas de alinhamento consideradas \"estado da arte\" da área e foi similar à modelos mais complexos com arquitetura baseada em <i>transformer</i>. Ainda, foi possível manipular os pesos das camadas convolucionais e demonstrar que o DeepSEA aprendeu a reconhecer domínios proteicos relacionados à resistência antimicrobiana.Biblioteca Digitais de Teses e Dissertacoes da USPUniversidade de São PauloFaculdade de Medicina de Ribeirão PretoSilva, Ricardo Roberto daBorelli, Tiago Cabral2025-11-182026-04-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/17/17136/tde-17032026-164855/doi:10.11606/T.17.2025.tde-17032026-164855Liberar o conteúdo para acesso público.info:eu-repo/semantics/openAccessengreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2026-04-16T13:57:02Zoai:teses.usp.br:tde-17032026-164855Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212026-04-16T13:57:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv An explainable deep learning approach for antimicrobial resistance proteins functional annotation
Uma abordagem de aprendizado profundo explicável para anotação funcional de proteínas de resistência antimicrobiana
title An explainable deep learning approach for antimicrobial resistance proteins functional annotation
spellingShingle An explainable deep learning approach for antimicrobial resistance proteins functional annotation
Borelli, Tiago Cabral
Anotação funcional
Aprendizado de máquina
Redes neurais convolucionais
Resistência antimicrobiana
Antimicrobial resistance
Convolutional neural networks
Functional annotation
Machine learning
title_short An explainable deep learning approach for antimicrobial resistance proteins functional annotation
title_full An explainable deep learning approach for antimicrobial resistance proteins functional annotation
title_fullStr An explainable deep learning approach for antimicrobial resistance proteins functional annotation
title_full_unstemmed An explainable deep learning approach for antimicrobial resistance proteins functional annotation
title_sort An explainable deep learning approach for antimicrobial resistance proteins functional annotation
author Borelli, Tiago Cabral
author_facet Borelli, Tiago Cabral
author_role author
dc.contributor.none.fl_str_mv Silva, Ricardo Roberto da
dc.contributor.author.fl_str_mv Borelli, Tiago Cabral
dc.subject.por.fl_str_mv Anotação funcional
Aprendizado de máquina
Redes neurais convolucionais
Resistência antimicrobiana
Antimicrobial resistance
Convolutional neural networks
Functional annotation
Machine learning
topic Anotação funcional
Aprendizado de máquina
Redes neurais convolucionais
Resistência antimicrobiana
Antimicrobial resistance
Convolutional neural networks
Functional annotation
Machine learning
description Bacterial resistance to antimicrobials is one of the main global public health problems, according to the World Health Organization. It burdens public health systems more than AIDS and malaria combined and therefore needs to be addressed on multiple fronts: from the development of new antimicrobials to the creation of genomic surveillance strategies. However, the identification of proteins involved in antimicrobial resistance is limited due to the high similarity required between candidate proteins and those used as references for sequence alignment, resulting in a high number of false negatives. Therefore, there is a need to develop tools that do not rely on direct sequence alignment. This work presents a study on the current state of resistance protein databases as well as the development of DeepSEA, an alignment-independent tool for the functional annotation of resistance proteins using convolutional neural networks. The results show a high degree of redundancy both within and between databases. Annotation errors propagated during the concatenation of these databases were also found, particularly among multidrug class proteins. DeepSEA outperformed alignment-based \"state-of-the-art\" tools and showed performance comparable to more complex transformer-based models. Furthermore, it was possible to manipulate the weights of the convolutional layers and demonstrate that DeepSEA learned to recognize protein domains related to antimicrobial resistance.
publishDate 2025
dc.date.none.fl_str_mv 2025-11-18
2026-04-16
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/17/17136/tde-17032026-164855/
doi:10.11606/T.17.2025.tde-17032026-164855
url https://www.teses.usp.br/teses/disponiveis/17/17136/tde-17032026-164855/
identifier_str_mv doi:10.11606/T.17.2025.tde-17032026-164855
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertacoes da USP
Universidade de São Paulo
Faculdade de Medicina de Ribeirão Preto
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertacoes da USP
Universidade de São Paulo
Faculdade de Medicina de Ribeirão Preto
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865492704344932352