Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Pernambuco
UFPE Brasil Programa de Pos Graduacao em Engenharia Biomedica |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ufpe.br/handle/123456789/64570 |
Resumo: | Docking molecular é uma técnica computacional utilizada para prever como duas moléculas, geralmente uma proteína e um ligante, interagem entre si. Essa técnica simula o encaixe da molécula menor (ligante) no sítio ativo da molécula maior (proteína), permitindo a análise de afinidade e especificidade das interações. Essa abordagem é fundamental para a desco berta de novos medicamentos, pois auxilia na identificação de possíveis candidatos a fármacos e na compreensão dos mecanismos moleculares subjacentes a diversas doenças. Além disso, técnicas avançadas de Inteligência Artificial (IA) e aprendizado de máquina têm aprimorado a precisão e a eficiência dessas previsões, reduzindo custos e tempo no desenvolvimento de novos tratamentos. Neste trabalho, foi desenvolvida uma abordagem híbrida inteligente para a estimativa do encaixe molecular entre proteínas, integrando redes de pseudo-convolução e algoritmos de *Random Forests*. O objetivo foi melhorar a precisão na previsão da afinidade de ligação entre proteínas por meio de uma estratégia baseada em aprendizado de máquina. As redes de pseudo-convolução foram empregadas para processar sequências de aminoácidos das proteínas candidatas, fragmentando-as em segmentos menores e capturando informações estruturais relevantes. Posteriormente, os vetores resultantes foram classificados por modelos de Random Forests. A metodologia foi avaliada por meio de experimentos comparativos com abordagens tradicionais de *docking* molecular, explorando também a capacidade de gene ralização do modelo a diferentes tipos de proteínas e interações moleculares. Os resultados demonstraram avanços significativos, com destaque para a redução de 8113 para 11 atributos, o que aumentou a eficiência computacional sem prejuízo da acurácia. O modelo de Random Forest com 200 árvores obteve acurácia de 99,8%, índice Kappa de 0,997, sensibilidade de 0,997, especificidade de 1,000 e AUC de 1,000, evidenciando alto desempenho e contribuições relevantes para a descoberta computacional de medicamentos. A conclusão deste trabalho evidencia que a abordagem proposta, baseada em redes de pseudo-convolução e algoritmos Random Forest, obteve desempenho elevado na tarefa de predição de docking molecular, com acurácia de 99,8% e índice Kappa de 0,997. Também é destacado que a redução de atributos, de 8113 para apenas 11, possibilitou uma significativa diminuição no tempo de treinamento dos modelos, mantendo a alta performance. Por fim, são sugeridas aplicações futuras da me todologia em diferentes bases de dados e cenários de interação molecular. |
| id |
UFPE_b4c8aa88f8e8869ccb47895773d5ed05 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufpe.br:123456789/64570 |
| network_acronym_str |
UFPE |
| network_name_str |
Repositório Institucional da UFPE |
| repository_id_str |
|
| spelling |
Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random ForestsDocking molecularInterações proteína-proteínaRedes de pseudo-convoluçãoRandom ForestsDescoberta de medicamentosAfinidade de ligaçãoDocking molecular é uma técnica computacional utilizada para prever como duas moléculas, geralmente uma proteína e um ligante, interagem entre si. Essa técnica simula o encaixe da molécula menor (ligante) no sítio ativo da molécula maior (proteína), permitindo a análise de afinidade e especificidade das interações. Essa abordagem é fundamental para a desco berta de novos medicamentos, pois auxilia na identificação de possíveis candidatos a fármacos e na compreensão dos mecanismos moleculares subjacentes a diversas doenças. Além disso, técnicas avançadas de Inteligência Artificial (IA) e aprendizado de máquina têm aprimorado a precisão e a eficiência dessas previsões, reduzindo custos e tempo no desenvolvimento de novos tratamentos. Neste trabalho, foi desenvolvida uma abordagem híbrida inteligente para a estimativa do encaixe molecular entre proteínas, integrando redes de pseudo-convolução e algoritmos de *Random Forests*. O objetivo foi melhorar a precisão na previsão da afinidade de ligação entre proteínas por meio de uma estratégia baseada em aprendizado de máquina. As redes de pseudo-convolução foram empregadas para processar sequências de aminoácidos das proteínas candidatas, fragmentando-as em segmentos menores e capturando informações estruturais relevantes. Posteriormente, os vetores resultantes foram classificados por modelos de Random Forests. A metodologia foi avaliada por meio de experimentos comparativos com abordagens tradicionais de *docking* molecular, explorando também a capacidade de gene ralização do modelo a diferentes tipos de proteínas e interações moleculares. Os resultados demonstraram avanços significativos, com destaque para a redução de 8113 para 11 atributos, o que aumentou a eficiência computacional sem prejuízo da acurácia. O modelo de Random Forest com 200 árvores obteve acurácia de 99,8%, índice Kappa de 0,997, sensibilidade de 0,997, especificidade de 1,000 e AUC de 1,000, evidenciando alto desempenho e contribuições relevantes para a descoberta computacional de medicamentos. A conclusão deste trabalho evidencia que a abordagem proposta, baseada em redes de pseudo-convolução e algoritmos Random Forest, obteve desempenho elevado na tarefa de predição de docking molecular, com acurácia de 99,8% e índice Kappa de 0,997. Também é destacado que a redução de atributos, de 8113 para apenas 11, possibilitou uma significativa diminuição no tempo de treinamento dos modelos, mantendo a alta performance. Por fim, são sugeridas aplicações futuras da me todologia em diferentes bases de dados e cenários de interação molecular.Molecular docking is a computational technique used to predict how two molecules, usu ally a protein and a ligand, interact with each other. This technique simulates the fitting of the smaller molecule (ligand) into the active site of the larger molecule (protein), enabling the analysis of binding affinity and interaction specificity. This approach is essential for drug discovery, as it assists in identifying potential drug candidates and understanding the molecu lar mechanisms underlying various diseases. Furthermore, advanced Artificial Intelligence (AI) and machine learning techniques have enhanced the accuracy and efficiency of such predic tions, reducing the costs and time involved in drug development. In this work, an intelligent hybrid approach was developed to estimate molecular docking between proteins, integrating pseudo-convolutional networks and Random Forests. The aim was to improve the accuracy of predicting protein binding affinity through a machine learning strategy. Pseudo-convolutional networks were used to process amino acid sequences of candidate proteins, segmenting them into smaller fragments and extracting structural features. Then, the resulting vectors were classified using Random Forest models. The methodology was evaluated through experiments comparing its performance with traditional molecular docking techniques, also exploring the model’s ability to generalize across different types of proteins and molecular interactions. The results demonstrated significant advances, including a reduction from 8113 to 11 attributes, which increased computational efficiency without compromising accuracy. The Random Forest model with 200 trees achieved 99.8% accuracy, a Kappa index of 0.997, sensitivity of 0.997, specificity of 1.000, and AUC of 1.000, indicating high performance and promising contribu tions to computational drug discovery. The conclusion highlights that the proposed approach achieved outstanding performance in docking prediction, with significant reduction in train ing time due to dimensionality reduction. The study also suggests future applications of the methodology in different datasets and molecular interaction contexts.Universidade Federal de PernambucoUFPEBrasilPrograma de Pos Graduacao em Engenharia BiomedicaSANTOS, Wellington Pinheiro dosSOARES, Luiz Alberto Lirahttp://lattes.cnpq.br/4723512564485916http://lattes.cnpq.br/6413917211782026http://lattes.cnpq.br/4290808161139329ALBUQUERQUE, Lucas Vinícius Silva de2025-07-21T19:06:38Z2025-07-21T19:06:38Z2025-03-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfALBUQUERQUE, Lucas Vinicius Silva de. Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests. 2025. Dissertação (Mestrado em Engenharia Biomédica) – Universidade Federal de Pernambuco, Recife, 2025.https://repositorio.ufpe.br/handle/123456789/64570porhttps://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPE2025-07-27T18:00:55Zoai:repositorio.ufpe.br:123456789/64570Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212025-07-27T18:00:55Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
| dc.title.none.fl_str_mv |
Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests |
| title |
Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests |
| spellingShingle |
Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests ALBUQUERQUE, Lucas Vinícius Silva de Docking molecular Interações proteína-proteína Redes de pseudo-convolução Random Forests Descoberta de medicamentos Afinidade de ligação |
| title_short |
Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests |
| title_full |
Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests |
| title_fullStr |
Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests |
| title_full_unstemmed |
Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests |
| title_sort |
Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests |
| author |
ALBUQUERQUE, Lucas Vinícius Silva de |
| author_facet |
ALBUQUERQUE, Lucas Vinícius Silva de |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
SANTOS, Wellington Pinheiro dos SOARES, Luiz Alberto Lira http://lattes.cnpq.br/4723512564485916 http://lattes.cnpq.br/6413917211782026 http://lattes.cnpq.br/4290808161139329 |
| dc.contributor.author.fl_str_mv |
ALBUQUERQUE, Lucas Vinícius Silva de |
| dc.subject.por.fl_str_mv |
Docking molecular Interações proteína-proteína Redes de pseudo-convolução Random Forests Descoberta de medicamentos Afinidade de ligação |
| topic |
Docking molecular Interações proteína-proteína Redes de pseudo-convolução Random Forests Descoberta de medicamentos Afinidade de ligação |
| description |
Docking molecular é uma técnica computacional utilizada para prever como duas moléculas, geralmente uma proteína e um ligante, interagem entre si. Essa técnica simula o encaixe da molécula menor (ligante) no sítio ativo da molécula maior (proteína), permitindo a análise de afinidade e especificidade das interações. Essa abordagem é fundamental para a desco berta de novos medicamentos, pois auxilia na identificação de possíveis candidatos a fármacos e na compreensão dos mecanismos moleculares subjacentes a diversas doenças. Além disso, técnicas avançadas de Inteligência Artificial (IA) e aprendizado de máquina têm aprimorado a precisão e a eficiência dessas previsões, reduzindo custos e tempo no desenvolvimento de novos tratamentos. Neste trabalho, foi desenvolvida uma abordagem híbrida inteligente para a estimativa do encaixe molecular entre proteínas, integrando redes de pseudo-convolução e algoritmos de *Random Forests*. O objetivo foi melhorar a precisão na previsão da afinidade de ligação entre proteínas por meio de uma estratégia baseada em aprendizado de máquina. As redes de pseudo-convolução foram empregadas para processar sequências de aminoácidos das proteínas candidatas, fragmentando-as em segmentos menores e capturando informações estruturais relevantes. Posteriormente, os vetores resultantes foram classificados por modelos de Random Forests. A metodologia foi avaliada por meio de experimentos comparativos com abordagens tradicionais de *docking* molecular, explorando também a capacidade de gene ralização do modelo a diferentes tipos de proteínas e interações moleculares. Os resultados demonstraram avanços significativos, com destaque para a redução de 8113 para 11 atributos, o que aumentou a eficiência computacional sem prejuízo da acurácia. O modelo de Random Forest com 200 árvores obteve acurácia de 99,8%, índice Kappa de 0,997, sensibilidade de 0,997, especificidade de 1,000 e AUC de 1,000, evidenciando alto desempenho e contribuições relevantes para a descoberta computacional de medicamentos. A conclusão deste trabalho evidencia que a abordagem proposta, baseada em redes de pseudo-convolução e algoritmos Random Forest, obteve desempenho elevado na tarefa de predição de docking molecular, com acurácia de 99,8% e índice Kappa de 0,997. Também é destacado que a redução de atributos, de 8113 para apenas 11, possibilitou uma significativa diminuição no tempo de treinamento dos modelos, mantendo a alta performance. Por fim, são sugeridas aplicações futuras da me todologia em diferentes bases de dados e cenários de interação molecular. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-07-21T19:06:38Z 2025-07-21T19:06:38Z 2025-03-24 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
ALBUQUERQUE, Lucas Vinicius Silva de. Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests. 2025. Dissertação (Mestrado em Engenharia Biomédica) – Universidade Federal de Pernambuco, Recife, 2025. https://repositorio.ufpe.br/handle/123456789/64570 |
| identifier_str_mv |
ALBUQUERQUE, Lucas Vinicius Silva de. Desenvolvimento de uma abordagem híbrida inteligente para estimação de docking molecular entre proteínas utilizando redes de pseudo-convolução e Random Forests. 2025. Dissertação (Mestrado em Engenharia Biomédica) – Universidade Federal de Pernambuco, Recife, 2025. |
| url |
https://repositorio.ufpe.br/handle/123456789/64570 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco UFPE Brasil Programa de Pos Graduacao em Engenharia Biomedica |
| publisher.none.fl_str_mv |
Universidade Federal de Pernambuco UFPE Brasil Programa de Pos Graduacao em Engenharia Biomedica |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
| instname_str |
Universidade Federal de Pernambuco (UFPE) |
| instacron_str |
UFPE |
| institution |
UFPE |
| reponame_str |
Repositório Institucional da UFPE |
| collection |
Repositório Institucional da UFPE |
| repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
| repository.mail.fl_str_mv |
attena@ufpe.br |
| _version_ |
1856041851727904768 |