GRaSP: uma estratégia de aprendizagem supervisionada baseada em grafos de vizinhança de resíduo para previsão de sítio de ligação

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Charles Abreu Santana
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Minas Gerais
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/1843/51121
Resumo: Proteins are macromolecules crucial for the maintenance of biological systems and participate in vital processes for the cell. Protein activity is performed through physicochemical interactions between the protein and other molecules called ligands. These ligands comprise organic compounds, metal ions, nucleic acids or even other proteins, in which attach to the protein so that its activity is properly performed. The region on the protein where these interactions take place is called binding sites. The identification and characterization of these regions is crucial to determine the function of a protein, which is one of the necessary steps in areas such as the design and development of new drugs. Due to experimental issues, the location of these regions may not be trivial, requiring the support of automatic methods to assist in their identification. In this thesis, the GRaSP is proposed, a machine learning-based strategy for binding site prediction that uses residue neighborhood graphs as input. From experiments using databases of different protein structures, GRASP proved to be robust, presenting compatible or better results in relation to the tools already consolidated in the literature. Furthermore, due to the simple and informative modeling provided by the graphs, the algorithm proved to be efficient. While already consolidated methods take around 5 hours of processing for protein structures with approximately 300 residues, the GRASP is able to process them in an average time of 20 seconds.
id UFMG_d831b1c1e051d010fc4c40a1fce603da
oai_identifier_str oai:repositorio.ufmg.br:1843/51121
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling GRaSP: uma estratégia de aprendizagem supervisionada baseada em grafos de vizinhança de resíduo para previsão de sítio de ligaçãoProteínaSítio de ligaçãoGrafoAprendizagem supervisionadaBiologia computacionalProteínasSítios de ligaçãoTeoria dos grafosAprendizado de máquina supervisionadoProteins are macromolecules crucial for the maintenance of biological systems and participate in vital processes for the cell. Protein activity is performed through physicochemical interactions between the protein and other molecules called ligands. These ligands comprise organic compounds, metal ions, nucleic acids or even other proteins, in which attach to the protein so that its activity is properly performed. The region on the protein where these interactions take place is called binding sites. The identification and characterization of these regions is crucial to determine the function of a protein, which is one of the necessary steps in areas such as the design and development of new drugs. Due to experimental issues, the location of these regions may not be trivial, requiring the support of automatic methods to assist in their identification. In this thesis, the GRaSP is proposed, a machine learning-based strategy for binding site prediction that uses residue neighborhood graphs as input. From experiments using databases of different protein structures, GRASP proved to be robust, presenting compatible or better results in relation to the tools already consolidated in the literature. Furthermore, due to the simple and informative modeling provided by the graphs, the algorithm proved to be efficient. While already consolidated methods take around 5 hours of processing for protein structures with approximately 300 residues, the GRASP is able to process them in an average time of 20 seconds.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorUniversidade Federal de Minas Gerais2023-03-22T14:55:45Z2025-09-09T00:33:55Z2023-03-22T14:55:45Z2021-08-31info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://hdl.handle.net/1843/51121porhttp://creativecommons.org/licenses/by/3.0/pt/info:eu-repo/semantics/openAccessCharles Abreu Santanareponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMG2025-09-09T00:33:55Zoai:repositorio.ufmg.br:1843/51121Repositório InstitucionalPUBhttps://repositorio.ufmg.br/oairepositorio@ufmg.bropendoar:2025-09-09T00:33:55Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.none.fl_str_mv GRaSP: uma estratégia de aprendizagem supervisionada baseada em grafos de vizinhança de resíduo para previsão de sítio de ligação
title GRaSP: uma estratégia de aprendizagem supervisionada baseada em grafos de vizinhança de resíduo para previsão de sítio de ligação
spellingShingle GRaSP: uma estratégia de aprendizagem supervisionada baseada em grafos de vizinhança de resíduo para previsão de sítio de ligação
Charles Abreu Santana
Proteína
Sítio de ligação
Grafo
Aprendizagem supervisionada
Biologia computacional
Proteínas
Sítios de ligação
Teoria dos grafos
Aprendizado de máquina supervisionado
title_short GRaSP: uma estratégia de aprendizagem supervisionada baseada em grafos de vizinhança de resíduo para previsão de sítio de ligação
title_full GRaSP: uma estratégia de aprendizagem supervisionada baseada em grafos de vizinhança de resíduo para previsão de sítio de ligação
title_fullStr GRaSP: uma estratégia de aprendizagem supervisionada baseada em grafos de vizinhança de resíduo para previsão de sítio de ligação
title_full_unstemmed GRaSP: uma estratégia de aprendizagem supervisionada baseada em grafos de vizinhança de resíduo para previsão de sítio de ligação
title_sort GRaSP: uma estratégia de aprendizagem supervisionada baseada em grafos de vizinhança de resíduo para previsão de sítio de ligação
author Charles Abreu Santana
author_facet Charles Abreu Santana
author_role author
dc.contributor.author.fl_str_mv Charles Abreu Santana
dc.subject.por.fl_str_mv Proteína
Sítio de ligação
Grafo
Aprendizagem supervisionada
Biologia computacional
Proteínas
Sítios de ligação
Teoria dos grafos
Aprendizado de máquina supervisionado
topic Proteína
Sítio de ligação
Grafo
Aprendizagem supervisionada
Biologia computacional
Proteínas
Sítios de ligação
Teoria dos grafos
Aprendizado de máquina supervisionado
description Proteins are macromolecules crucial for the maintenance of biological systems and participate in vital processes for the cell. Protein activity is performed through physicochemical interactions between the protein and other molecules called ligands. These ligands comprise organic compounds, metal ions, nucleic acids or even other proteins, in which attach to the protein so that its activity is properly performed. The region on the protein where these interactions take place is called binding sites. The identification and characterization of these regions is crucial to determine the function of a protein, which is one of the necessary steps in areas such as the design and development of new drugs. Due to experimental issues, the location of these regions may not be trivial, requiring the support of automatic methods to assist in their identification. In this thesis, the GRaSP is proposed, a machine learning-based strategy for binding site prediction that uses residue neighborhood graphs as input. From experiments using databases of different protein structures, GRASP proved to be robust, presenting compatible or better results in relation to the tools already consolidated in the literature. Furthermore, due to the simple and informative modeling provided by the graphs, the algorithm proved to be efficient. While already consolidated methods take around 5 hours of processing for protein structures with approximately 300 residues, the GRASP is able to process them in an average time of 20 seconds.
publishDate 2021
dc.date.none.fl_str_mv 2021-08-31
2023-03-22T14:55:45Z
2023-03-22T14:55:45Z
2025-09-09T00:33:55Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1843/51121
url https://hdl.handle.net/1843/51121
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by/3.0/pt/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/3.0/pt/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv repositorio@ufmg.br
_version_ 1856413946965131264