Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: ALBUQUERQUE, Lucas Vinícius Silva de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Engenharia Biomedica
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/64570
Resumo: Docking molecular é uma técnica computacional utilizada para prever como duas moléculas, geralmente uma proteína e um ligante, interagem entre si. Essa técnica simula o encaixe da molécula menor (ligante) no sítio ativo da molécula maior (proteína), permitindo a análise de afinidade e especificidade das interações. Essa abordagem é fundamental para a desco berta de novos medicamentos, pois auxilia na identificação de possíveis candidatos a fármacos e na compreensão dos mecanismos moleculares subjacentes a diversas doenças. Além disso, técnicas avançadas de Inteligência Artificial (IA) e aprendizado de máquina têm aprimorado a precisão e a eficiência dessas previsões, reduzindo custos e tempo no desenvolvimento de novos tratamentos. Neste trabalho, foi desenvolvida uma abordagem híbrida inteligente para a estimativa do encaixe molecular entre proteínas, integrando redes de pseudo-convolução e algoritmos de *Random Forests*. O objetivo foi melhorar a precisão na previsão da afinidade de ligação entre proteínas por meio de uma estratégia baseada em aprendizado de máquina. As redes de pseudo-convolução foram empregadas para processar sequências de aminoácidos das proteínas candidatas, fragmentando-as em segmentos menores e capturando informações estruturais relevantes. Posteriormente, os vetores resultantes foram classificados por modelos de Random Forests. A metodologia foi avaliada por meio de experimentos comparativos com abordagens tradicionais de *docking* molecular, explorando também a capacidade de gene ralização do modelo a diferentes tipos de proteínas e interações moleculares. Os resultados demonstraram avanços significativos, com destaque para a redução de 8113 para 11 atributos, o que aumentou a eficiência computacional sem prejuízo da acurácia. O modelo de Random Forest com 200 árvores obteve acurácia de 99,8%, índice Kappa de 0,997, sensibilidade de 0,997, especificidade de 1,000 e AUC de 1,000, evidenciando alto desempenho e contribuições relevantes para a descoberta computacional de medicamentos. A conclusão deste trabalho evidencia que a abordagem proposta, baseada em redes de pseudo-convolução e algoritmos Random Forest, obteve desempenho elevado na tarefa de predição de docking molecular, com acurácia de 99,8% e índice Kappa de 0,997. Também é destacado que a redução de atributos, de 8113 para apenas 11, possibilitou uma significativa diminuição no tempo de treinamento dos modelos, mantendo a alta performance. Por fim, são sugeridas aplicações futuras da me todologia em diferentes bases de dados e cenários de interação molecular.
id UFPE_b4c8aa88f8e8869ccb47895773d5ed05
oai_identifier_str oai:repositorio.ufpe.br:123456789/64570
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random ForestsDocking molecularInterações proteína-proteínaRedes de pseudo-convoluçãoRandom ForestsDescoberta de medicamentosAfinidade de ligaçãoDocking molecular é uma técnica computacional utilizada para prever como duas moléculas, geralmente uma proteína e um ligante, interagem entre si. Essa técnica simula o encaixe da molécula menor (ligante) no sítio ativo da molécula maior (proteína), permitindo a análise de afinidade e especificidade das interações. Essa abordagem é fundamental para a desco berta de novos medicamentos, pois auxilia na identificação de possíveis candidatos a fármacos e na compreensão dos mecanismos moleculares subjacentes a diversas doenças. Além disso, técnicas avançadas de Inteligência Artificial (IA) e aprendizado de máquina têm aprimorado a precisão e a eficiência dessas previsões, reduzindo custos e tempo no desenvolvimento de novos tratamentos. Neste trabalho, foi desenvolvida uma abordagem híbrida inteligente para a estimativa do encaixe molecular entre proteínas, integrando redes de pseudo-convolução e algoritmos de *Random Forests*. O objetivo foi melhorar a precisão na previsão da afinidade de ligação entre proteínas por meio de uma estratégia baseada em aprendizado de máquina. As redes de pseudo-convolução foram empregadas para processar sequências de aminoácidos das proteínas candidatas, fragmentando-as em segmentos menores e capturando informações estruturais relevantes. Posteriormente, os vetores resultantes foram classificados por modelos de Random Forests. A metodologia foi avaliada por meio de experimentos comparativos com abordagens tradicionais de *docking* molecular, explorando também a capacidade de gene ralização do modelo a diferentes tipos de proteínas e interações moleculares. Os resultados demonstraram avanços significativos, com destaque para a redução de 8113 para 11 atributos, o que aumentou a eficiência computacional sem prejuízo da acurácia. O modelo de Random Forest com 200 árvores obteve acurácia de 99,8%, índice Kappa de 0,997, sensibilidade de 0,997, especificidade de 1,000 e AUC de 1,000, evidenciando alto desempenho e contribuições relevantes para a descoberta computacional de medicamentos. A conclusão deste trabalho evidencia que a abordagem proposta, baseada em redes de pseudo-convolução e algoritmos Random Forest, obteve desempenho elevado na tarefa de predição de docking molecular, com acurácia de 99,8% e índice Kappa de 0,997. Também é destacado que a redução de atributos, de 8113 para apenas 11, possibilitou uma significativa diminuição no tempo de treinamento dos modelos, mantendo a alta performance. Por fim, são sugeridas aplicações futuras da me todologia em diferentes bases de dados e cenários de interação molecular.Molecular docking is a computational technique used to predict how two molecules, usu ally a protein and a ligand, interact with each other. This technique simulates the fitting of the smaller molecule (ligand) into the active site of the larger molecule (protein), enabling the analysis of binding affinity and interaction specificity. This approach is essential for drug discovery, as it assists in identifying potential drug candidates and understanding the molecu lar mechanisms underlying various diseases. Furthermore, advanced Artificial Intelligence (AI) and machine learning techniques have enhanced the accuracy and efficiency of such predic tions, reducing the costs and time involved in drug development. In this work, an intelligent hybrid approach was developed to estimate molecular docking between proteins, integrating pseudo-convolutional networks and Random Forests. The aim was to improve the accuracy of predicting protein binding affinity through a machine learning strategy. Pseudo-convolutional networks were used to process amino acid sequences of candidate proteins, segmenting them into smaller fragments and extracting structural features. Then, the resulting vectors were classified using Random Forest models. The methodology was evaluated through experiments comparing its performance with traditional molecular docking techniques, also exploring the model’s ability to generalize across different types of proteins and molecular interactions. The results demonstrated significant advances, including a reduction from 8113 to 11 attributes, which increased computational efficiency without compromising accuracy. The Random Forest model with 200 trees achieved 99.8% accuracy, a Kappa index of 0.997, sensitivity of 0.997, specificity of 1.000, and AUC of 1.000, indicating high performance and promising contribu tions to computational drug discovery. The conclusion highlights that the proposed approach achieved outstanding performance in docking prediction, with significant reduction in train ing time due to dimensionality reduction. The study also suggests future applications of the methodology in different datasets and molecular interaction contexts.Universidade Federal de PernambucoUFPEBrasilPrograma de Pos Graduacao em Engenharia BiomedicaSANTOS, Wellington Pinheiro dosSOARES, Luiz Alberto Lirahttp://lattes.cnpq.br/4723512564485916http://lattes.cnpq.br/6413917211782026http://lattes.cnpq.br/4290808161139329ALBUQUERQUE, Lucas Vinícius Silva de2025-07-21T19:06:38Z2025-07-21T19:06:38Z2025-03-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfALBUQUERQUE, Lucas Vinicius Silva de. Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests. 2025. Dissertação (Mestrado em Engenharia Biomédica) – Universidade Federal de Pernambuco, Recife, 2025.https://repositorio.ufpe.br/handle/123456789/64570porhttps://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPE2025-07-27T18:00:55Zoai:repositorio.ufpe.br:123456789/64570Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212025-07-27T18:00:55Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.none.fl_str_mv Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests
title Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests
spellingShingle Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests
ALBUQUERQUE, Lucas Vinícius Silva de
Docking molecular
Interações proteína-proteína
Redes de pseudo-convolução
Random Forests
Descoberta de medicamentos
Afinidade de ligação
title_short Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests
title_full Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests
title_fullStr Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests
title_full_unstemmed Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests
title_sort Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests
author ALBUQUERQUE, Lucas Vinícius Silva de
author_facet ALBUQUERQUE, Lucas Vinícius Silva de
author_role author
dc.contributor.none.fl_str_mv SANTOS, Wellington Pinheiro dos
SOARES, Luiz Alberto Lira
http://lattes.cnpq.br/4723512564485916
http://lattes.cnpq.br/6413917211782026
http://lattes.cnpq.br/4290808161139329
dc.contributor.author.fl_str_mv ALBUQUERQUE, Lucas Vinícius Silva de
dc.subject.por.fl_str_mv Docking molecular
Interações proteína-proteína
Redes de pseudo-convolução
Random Forests
Descoberta de medicamentos
Afinidade de ligação
topic Docking molecular
Interações proteína-proteína
Redes de pseudo-convolução
Random Forests
Descoberta de medicamentos
Afinidade de ligação
description Docking molecular é uma técnica computacional utilizada para prever como duas moléculas, geralmente uma proteína e um ligante, interagem entre si. Essa técnica simula o encaixe da molécula menor (ligante) no sítio ativo da molécula maior (proteína), permitindo a análise de afinidade e especificidade das interações. Essa abordagem é fundamental para a desco berta de novos medicamentos, pois auxilia na identificação de possíveis candidatos a fármacos e na compreensão dos mecanismos moleculares subjacentes a diversas doenças. Além disso, técnicas avançadas de Inteligência Artificial (IA) e aprendizado de máquina têm aprimorado a precisão e a eficiência dessas previsões, reduzindo custos e tempo no desenvolvimento de novos tratamentos. Neste trabalho, foi desenvolvida uma abordagem híbrida inteligente para a estimativa do encaixe molecular entre proteínas, integrando redes de pseudo-convolução e algoritmos de *Random Forests*. O objetivo foi melhorar a precisão na previsão da afinidade de ligação entre proteínas por meio de uma estratégia baseada em aprendizado de máquina. As redes de pseudo-convolução foram empregadas para processar sequências de aminoácidos das proteínas candidatas, fragmentando-as em segmentos menores e capturando informações estruturais relevantes. Posteriormente, os vetores resultantes foram classificados por modelos de Random Forests. A metodologia foi avaliada por meio de experimentos comparativos com abordagens tradicionais de *docking* molecular, explorando também a capacidade de gene ralização do modelo a diferentes tipos de proteínas e interações moleculares. Os resultados demonstraram avanços significativos, com destaque para a redução de 8113 para 11 atributos, o que aumentou a eficiência computacional sem prejuízo da acurácia. O modelo de Random Forest com 200 árvores obteve acurácia de 99,8%, índice Kappa de 0,997, sensibilidade de 0,997, especificidade de 1,000 e AUC de 1,000, evidenciando alto desempenho e contribuições relevantes para a descoberta computacional de medicamentos. A conclusão deste trabalho evidencia que a abordagem proposta, baseada em redes de pseudo-convolução e algoritmos Random Forest, obteve desempenho elevado na tarefa de predição de docking molecular, com acurácia de 99,8% e índice Kappa de 0,997. Também é destacado que a redução de atributos, de 8113 para apenas 11, possibilitou uma significativa diminuição no tempo de treinamento dos modelos, mantendo a alta performance. Por fim, são sugeridas aplicações futuras da me todologia em diferentes bases de dados e cenários de interação molecular.
publishDate 2025
dc.date.none.fl_str_mv 2025-07-21T19:06:38Z
2025-07-21T19:06:38Z
2025-03-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv ALBUQUERQUE, Lucas Vinicius Silva de. Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests. 2025. Dissertação (Mestrado em Engenharia Biomédica) – Universidade Federal de Pernambuco, Recife, 2025.
https://repositorio.ufpe.br/handle/123456789/64570
identifier_str_mv ALBUQUERQUE, Lucas Vinicius Silva de. Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests. 2025. Dissertação (Mestrado em Engenharia Biomédica) – Universidade Federal de Pernambuco, Recife, 2025.
url https://repositorio.ufpe.br/handle/123456789/64570
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Engenharia Biomedica
publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Engenharia Biomedica
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1856041851727904768