Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Waszak, Rosana da Silva
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Pontifícia Universidade Católica do Rio Grande do Sul
Escola de Ciências
Brasil
PUCRS
Programa de Pós-Graduação em Biologia Celular e Molecular
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://tede2.pucrs.br/tede2/handle/tede/9136
Resumo: Cinases são as proteínas mais intensamente estudadas no desenvolvimento e desenho de fármacos. Dentre as cinases, as serino/treonino cinases não específicas representam um sistema proteico interessante para propósitos de modelagem, devido à grande disponibilidade de dados experimentais estruturais e funcionais. As serino/treonino cinases não específicas compreendem uma importante classe de proteínas alvo usadas para o desenvolvimento de fármacos para tratamento de câncer. Neste estudo, foi descrita a criação de modelos de Aprendizado de Máquina para predição de afinidade entre proteínas e ligantes para esta classe enzimática. Foram utilizados para tal termos de energia calculados por Funções Escore clássicas disponíveis em programas como AutoDock4 e AutoDock Vina. Estes termos foram empregados para a criação de novas Funções Escore específicas para um conjunto de dados composto por aproximadamente 100 complexos proteína-ligante, para os quais dados experimentais como a estrutura cristalográfica e a constante de inibição estavam disponíveis. Foi aplicado também um método híbrido que utiliza a simulação de um sistema de massa-mola para determinar a afinidade de ligação, usando o programa Taba. Todas as Funções Escore geradas tiveram sua performance preditiva analisada. Os resultados mostram claramente que os modelos de aprendizado de máquina apresentam capacidade preditiva superior quando comparados com as Funções Escore clássicas. Além disso, os modelos de Aprendizado de Máquina gerados foram capazes de identificar características estruturais, responsáveis pela afinidade de ligação junto a serino/treonino cinases não específicas.
id P_RS_6bc8b24b087ac34b18eaaba09e2491d6
oai_identifier_str oai:tede2.pucrs.br:tede/9136
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantesFunções escoreInterações proteína-liganteAprendizado de máquinaBioinformáticaScoring functionsProtein-ligand InteractionsMachine learningBioinformaticsCIENCIAS BIOLOGICAS::BIOLOGIA GERALCinases são as proteínas mais intensamente estudadas no desenvolvimento e desenho de fármacos. Dentre as cinases, as serino/treonino cinases não específicas representam um sistema proteico interessante para propósitos de modelagem, devido à grande disponibilidade de dados experimentais estruturais e funcionais. As serino/treonino cinases não específicas compreendem uma importante classe de proteínas alvo usadas para o desenvolvimento de fármacos para tratamento de câncer. Neste estudo, foi descrita a criação de modelos de Aprendizado de Máquina para predição de afinidade entre proteínas e ligantes para esta classe enzimática. Foram utilizados para tal termos de energia calculados por Funções Escore clássicas disponíveis em programas como AutoDock4 e AutoDock Vina. Estes termos foram empregados para a criação de novas Funções Escore específicas para um conjunto de dados composto por aproximadamente 100 complexos proteína-ligante, para os quais dados experimentais como a estrutura cristalográfica e a constante de inibição estavam disponíveis. Foi aplicado também um método híbrido que utiliza a simulação de um sistema de massa-mola para determinar a afinidade de ligação, usando o programa Taba. Todas as Funções Escore geradas tiveram sua performance preditiva analisada. Os resultados mostram claramente que os modelos de aprendizado de máquina apresentam capacidade preditiva superior quando comparados com as Funções Escore clássicas. Além disso, os modelos de Aprendizado de Máquina gerados foram capazes de identificar características estruturais, responsáveis pela afinidade de ligação junto a serino/treonino cinases não específicas.Kinases are the most intensively studied protein in drug design and development. Among kinases, non-specific serine/threonine protein kinase represents an interesting protein system for modeling purposes due to the availability of structural and functional experimental data. Non-specific serine/threonine protein kinase comprises an important class of protein targets used to develop drugs to treat cancer. In this study, we describe the creation of machine learning models to predict protein-ligand binding affinity for this enzymatic class. We make use of energy terms available in classical scoring functions such as Autodock4 and AutoDock Vina. We use these terms to build a novel scoring function targeted to a dataset comprised of nearly 100 protein-ligand complexes for which experimental crystallographic structure and inhibition constant data are available. We also applied a hybrid mass-spring method to determine binding affinity using the program Taba. We carried out predictive performance analysis of all scoring functions. Our study clearly shows that machine learning models present superior predictive performance when compared with classical scoring functions. Also, our machine learning models can capture structural features responsible for the binding affinity against non-specific serine/threonine protein kinases.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESPontifícia Universidade Católica do Rio Grande do SulEscola de CiênciasBrasilPUCRSPrograma de Pós-Graduação em Biologia Celular e MolecularAzevedo Junior, Walter Filgueira dehttp://lattes.cnpq.br/4183276948524704Waszak, Rosana da Silva2020-07-02T20:06:48Z2020-03-06info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://tede2.pucrs.br/tede2/handle/tede/9136porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RS2020-07-02T23:01:26Zoai:tede2.pucrs.br:tede/9136Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2020-07-02T23:01:26Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.none.fl_str_mv Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes
title Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes
spellingShingle Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes
Waszak, Rosana da Silva
Funções escore
Interações proteína-ligante
Aprendizado de máquina
Bioinformática
Scoring functions
Protein-ligand Interactions
Machine learning
Bioinformatics
CIENCIAS BIOLOGICAS::BIOLOGIA GERAL
title_short Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes
title_full Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes
title_fullStr Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes
title_full_unstemmed Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes
title_sort Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes
author Waszak, Rosana da Silva
author_facet Waszak, Rosana da Silva
author_role author
dc.contributor.none.fl_str_mv Azevedo Junior, Walter Filgueira de
http://lattes.cnpq.br/4183276948524704
dc.contributor.author.fl_str_mv Waszak, Rosana da Silva
dc.subject.por.fl_str_mv Funções escore
Interações proteína-ligante
Aprendizado de máquina
Bioinformática
Scoring functions
Protein-ligand Interactions
Machine learning
Bioinformatics
CIENCIAS BIOLOGICAS::BIOLOGIA GERAL
topic Funções escore
Interações proteína-ligante
Aprendizado de máquina
Bioinformática
Scoring functions
Protein-ligand Interactions
Machine learning
Bioinformatics
CIENCIAS BIOLOGICAS::BIOLOGIA GERAL
description Cinases são as proteínas mais intensamente estudadas no desenvolvimento e desenho de fármacos. Dentre as cinases, as serino/treonino cinases não específicas representam um sistema proteico interessante para propósitos de modelagem, devido à grande disponibilidade de dados experimentais estruturais e funcionais. As serino/treonino cinases não específicas compreendem uma importante classe de proteínas alvo usadas para o desenvolvimento de fármacos para tratamento de câncer. Neste estudo, foi descrita a criação de modelos de Aprendizado de Máquina para predição de afinidade entre proteínas e ligantes para esta classe enzimática. Foram utilizados para tal termos de energia calculados por Funções Escore clássicas disponíveis em programas como AutoDock4 e AutoDock Vina. Estes termos foram empregados para a criação de novas Funções Escore específicas para um conjunto de dados composto por aproximadamente 100 complexos proteína-ligante, para os quais dados experimentais como a estrutura cristalográfica e a constante de inibição estavam disponíveis. Foi aplicado também um método híbrido que utiliza a simulação de um sistema de massa-mola para determinar a afinidade de ligação, usando o programa Taba. Todas as Funções Escore geradas tiveram sua performance preditiva analisada. Os resultados mostram claramente que os modelos de aprendizado de máquina apresentam capacidade preditiva superior quando comparados com as Funções Escore clássicas. Além disso, os modelos de Aprendizado de Máquina gerados foram capazes de identificar características estruturais, responsáveis pela afinidade de ligação junto a serino/treonino cinases não específicas.
publishDate 2020
dc.date.none.fl_str_mv 2020-07-02T20:06:48Z
2020-03-06
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/9136
url http://tede2.pucrs.br/tede2/handle/tede/9136
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Escola de Ciências
Brasil
PUCRS
Programa de Pós-Graduação em Biologia Celular e Molecular
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Escola de Ciências
Brasil
PUCRS
Programa de Pós-Graduação em Biologia Celular e Molecular
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1850041299702382592