Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Silva, Raphael Giordano do Nascimento e lattes
Orientador(a): Winck, Ana Trindade lattes
Banca de defesa: Machado, Karina dos Santos lattes, Silva, Luís Alvaro de Lima lattes
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Santa Maria
Centro de Tecnologia
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação
Departamento: Ciência da Computação
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: http://repositorio.ufsm.br/handle/1/16579
Resumo: A new drug discovery is financially costly and time-consuming. To deal this issue, the Rational Drug Design process investigates the macromolecular interaction between receptor molecules and drug-candidate ligands. Through molecular docking experiments it becomes possible to evaluate the binding quality between these molecules. To simulate the flexibility of the receptor, molecular dynamics simulations can be performed, where the protein is represented by a distinct conformation at each instant of time. Thus, molecular docking experiments can be performed on these different conformations. Several machine learning techniques can be used to mine these data. This work presents an approach for artificial neural networks deep learning, which uses as input several conformation about a given protein, generated through molecular dynamic simulations. These conformation are described in terms of its atoms tridimensional coordinates, labeled by a target attribute FEB, which points out the quality about each conformation in molecular docking experiments. In the deep learning approaches proposed in this work, we consider as input both these raw data, as well as we consider an approach that makes use of clustering experiments that generates a good parallelepiped surface for each atom, instead of the raw data. These strategies are implemented in terms deep feedforward networks and deep convolutional networks algorithms. For both architectures, the clustering-based strategy showed up promising results. However, models generated through deep feedforward showed up the best global results, being that those with the DBSCAN-Clustering-based approach highlight from the other ones.
id UFSM-20_feb5409c139e71603291d3b151fa3e4f
oai_identifier_str oai:repositorio.ufsm.br:1/16579
network_acronym_str UFSM-20
network_name_str Manancial - Repositório Digital da UFSM
repository_id_str
spelling 2019-05-20T12:04:16Z2019-05-20T12:04:16Z2018-08-27http://repositorio.ufsm.br/handle/1/16579A new drug discovery is financially costly and time-consuming. To deal this issue, the Rational Drug Design process investigates the macromolecular interaction between receptor molecules and drug-candidate ligands. Through molecular docking experiments it becomes possible to evaluate the binding quality between these molecules. To simulate the flexibility of the receptor, molecular dynamics simulations can be performed, where the protein is represented by a distinct conformation at each instant of time. Thus, molecular docking experiments can be performed on these different conformations. Several machine learning techniques can be used to mine these data. This work presents an approach for artificial neural networks deep learning, which uses as input several conformation about a given protein, generated through molecular dynamic simulations. These conformation are described in terms of its atoms tridimensional coordinates, labeled by a target attribute FEB, which points out the quality about each conformation in molecular docking experiments. In the deep learning approaches proposed in this work, we consider as input both these raw data, as well as we consider an approach that makes use of clustering experiments that generates a good parallelepiped surface for each atom, instead of the raw data. These strategies are implemented in terms deep feedforward networks and deep convolutional networks algorithms. For both architectures, the clustering-based strategy showed up promising results. However, models generated through deep feedforward showed up the best global results, being that those with the DBSCAN-Clustering-based approach highlight from the other ones.A descoberta de novos fármacos é custosa, tanto financeiramente como em tempo. Para tratar essa questão, o processo de Desenho Racional de Fármacos investiga a interação entre moléculas receptoras e ligantes candidatos a fármacos. Por meio de experimentos de simulação de docagem molecular é possível avaliar a qualidade da ligação entre essas moléculas. Para simular a flexibilidade do receptor, podem ser executados simulações de dinâmica molecular, onde a proteína é representada por uma conformação distinta em cada instante de tempo. Assim, os experimentos de docagem molecular podem ser executados sobre essas diferentes conformações. Diversas técnicas de aprendizagem de máquina podem ser utilizadas para minerar esses dados. Esta dissertação apresenta uma abordagem para redes neurais deep learning que utiliza como dados de entrada diferentes conformações de uma proteína, geradas por meio de simulações de dinâmica molecular. Essas conformações são descritas em termos das coordenadas tridimensionais dos átomos que a compõem, rotuladas por um atributo alvo FEB (Free Energy of Binding), que relaciona a interação entre a conformação do receptor e o ligante em experimentos de docagem molecular. Nas abordagens de deep learning propostas neste trabalho, são considerados como entrada tanto esses dados brutos, como são considerados uma abordagem que utiliza resultados agrupamento de dados para gerar um bloco com intervalos ideais para cada átomo, em vez dos dados brutos. Essas propostas são implementadas em termos de redes neurais deep feedforward e convolucional. As estratégias são comparadas com redes neurais com a mesma arquitetura, sem o uso dos blocos. Para ambas arquiteturas, a estratégia de utilizar os blocos gerados por agrupamento mostrou resultados promissores. Entretanto os modelos gerados a partir da arquitetura deep feedforward apresentam os melhores resultados globais, sendo que aqueles com abordagem de agrupamento por DBSCAN destacam-se frente às outras duas abordagens.porUniversidade Federal de Santa MariaCentro de TecnologiaPrograma de Pós-Graduação em Ciência da ComputaçãoUFSMBrasilCiência da ComputaçãoAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessAprendizagem profundaRedes neurais convolucionaisDocagem molecularDeep learningConvolutional neural networksMolecular dockingCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAODeep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionaisDeep learning on protein conformation selection considering their tridimensional propertiesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisWinck, Ana Trindadehttp://lattes.cnpq.br/5075974938483862Machado, Karina dos Santoshttp://lattes.cnpq.br/3528633359332021Silva, Luís Alvaro de Limahttp://lattes.cnpq.br/8066370508832550http://lattes.cnpq.br/5913037348154812Silva, Raphael Giordano do Nascimento e100300000007600bc659cff-88e7-46d3-ad6b-6a06414190a15c022f33-a018-404e-9aad-3e1fea8e4b25da1b8d34-fab2-4eef-8d6f-b38d56b4fc8134d7f124-0151-4dbb-8392-c5c83e0dc8f1reponame:Manancial - Repositório Digital da UFSMinstname:Universidade Federal de Santa Maria (UFSM)instacron:UFSMORIGINALDIS_PPGCC_2018_SILVA_RAPHAEL.pdfDIS_PPGCC_2018_SILVA_RAPHAEL.pdfDissertação de Mestradoapplication/pdf2671590http://repositorio.ufsm.br/bitstream/1/16579/1/DIS_PPGCC_2018_SILVA_RAPHAEL.pdf8a6cf2c99fa627ee555779fc65504488MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805http://repositorio.ufsm.br/bitstream/1/16579/2/license_rdf4460e5956bc1d1639be9ae6146a50347MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-816http://repositorio.ufsm.br/bitstream/1/16579/3/license.txtf8fcb28efb1c8cf0dc096bec902bf4c4MD53TEXTDIS_PPGCC_2018_SILVA_RAPHAEL.pdf.txtDIS_PPGCC_2018_SILVA_RAPHAEL.pdf.txtExtracted texttext/plain131127http://repositorio.ufsm.br/bitstream/1/16579/4/DIS_PPGCC_2018_SILVA_RAPHAEL.pdf.txtb4ca6ef6673c12f0ddc29c7cf3f0d060MD54THUMBNAILDIS_PPGCC_2018_SILVA_RAPHAEL.pdf.jpgDIS_PPGCC_2018_SILVA_RAPHAEL.pdf.jpgIM Thumbnailimage/jpeg4477http://repositorio.ufsm.br/bitstream/1/16579/5/DIS_PPGCC_2018_SILVA_RAPHAEL.pdf.jpga437eb8b4b316c81b4e551b78458ef33MD551/165792019-05-21 03:00:43.228oai:repositorio.ufsm.br:1/16579Q3JlYXRpdmUgQ29tbW9ucw==Repositório Institucionalhttp://repositorio.ufsm.br/PUBhttp://repositorio.ufsm.br/oai/requestopendoar:39132019-05-21T06:00:43Manancial - Repositório Digital da UFSM - Universidade Federal de Santa Maria (UFSM)false
dc.title.por.fl_str_mv Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais
dc.title.alternative.eng.fl_str_mv Deep learning on protein conformation selection considering their tridimensional properties
title Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais
spellingShingle Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais
Silva, Raphael Giordano do Nascimento e
Aprendizagem profunda
Redes neurais convolucionais
Docagem molecular
Deep learning
Convolutional neural networks
Molecular docking
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais
title_full Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais
title_fullStr Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais
title_full_unstemmed Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais
title_sort Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais
author Silva, Raphael Giordano do Nascimento e
author_facet Silva, Raphael Giordano do Nascimento e
author_role author
dc.contributor.advisor1.fl_str_mv Winck, Ana Trindade
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/5075974938483862
dc.contributor.referee1.fl_str_mv Machado, Karina dos Santos
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/3528633359332021
dc.contributor.referee2.fl_str_mv Silva, Luís Alvaro de Lima
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/8066370508832550
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/5913037348154812
dc.contributor.author.fl_str_mv Silva, Raphael Giordano do Nascimento e
contributor_str_mv Winck, Ana Trindade
Machado, Karina dos Santos
Silva, Luís Alvaro de Lima
dc.subject.por.fl_str_mv Aprendizagem profunda
Redes neurais convolucionais
Docagem molecular
topic Aprendizagem profunda
Redes neurais convolucionais
Docagem molecular
Deep learning
Convolutional neural networks
Molecular docking
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Deep learning
Convolutional neural networks
Molecular docking
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description A new drug discovery is financially costly and time-consuming. To deal this issue, the Rational Drug Design process investigates the macromolecular interaction between receptor molecules and drug-candidate ligands. Through molecular docking experiments it becomes possible to evaluate the binding quality between these molecules. To simulate the flexibility of the receptor, molecular dynamics simulations can be performed, where the protein is represented by a distinct conformation at each instant of time. Thus, molecular docking experiments can be performed on these different conformations. Several machine learning techniques can be used to mine these data. This work presents an approach for artificial neural networks deep learning, which uses as input several conformation about a given protein, generated through molecular dynamic simulations. These conformation are described in terms of its atoms tridimensional coordinates, labeled by a target attribute FEB, which points out the quality about each conformation in molecular docking experiments. In the deep learning approaches proposed in this work, we consider as input both these raw data, as well as we consider an approach that makes use of clustering experiments that generates a good parallelepiped surface for each atom, instead of the raw data. These strategies are implemented in terms deep feedforward networks and deep convolutional networks algorithms. For both architectures, the clustering-based strategy showed up promising results. However, models generated through deep feedforward showed up the best global results, being that those with the DBSCAN-Clustering-based approach highlight from the other ones.
publishDate 2018
dc.date.issued.fl_str_mv 2018-08-27
dc.date.accessioned.fl_str_mv 2019-05-20T12:04:16Z
dc.date.available.fl_str_mv 2019-05-20T12:04:16Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.ufsm.br/handle/1/16579
url http://repositorio.ufsm.br/handle/1/16579
dc.language.iso.fl_str_mv por
language por
dc.relation.cnpq.fl_str_mv 100300000007
dc.relation.confidence.fl_str_mv 600
dc.relation.authority.fl_str_mv bc659cff-88e7-46d3-ad6b-6a06414190a1
5c022f33-a018-404e-9aad-3e1fea8e4b25
da1b8d34-fab2-4eef-8d6f-b38d56b4fc81
34d7f124-0151-4dbb-8392-c5c83e0dc8f1
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Santa Maria
Centro de Tecnologia
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv UFSM
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Ciência da Computação
publisher.none.fl_str_mv Universidade Federal de Santa Maria
Centro de Tecnologia
dc.source.none.fl_str_mv reponame:Manancial - Repositório Digital da UFSM
instname:Universidade Federal de Santa Maria (UFSM)
instacron:UFSM
instname_str Universidade Federal de Santa Maria (UFSM)
instacron_str UFSM
institution UFSM
reponame_str Manancial - Repositório Digital da UFSM
collection Manancial - Repositório Digital da UFSM
bitstream.url.fl_str_mv http://repositorio.ufsm.br/bitstream/1/16579/1/DIS_PPGCC_2018_SILVA_RAPHAEL.pdf
http://repositorio.ufsm.br/bitstream/1/16579/2/license_rdf
http://repositorio.ufsm.br/bitstream/1/16579/3/license.txt
http://repositorio.ufsm.br/bitstream/1/16579/4/DIS_PPGCC_2018_SILVA_RAPHAEL.pdf.txt
http://repositorio.ufsm.br/bitstream/1/16579/5/DIS_PPGCC_2018_SILVA_RAPHAEL.pdf.jpg
bitstream.checksum.fl_str_mv 8a6cf2c99fa627ee555779fc65504488
4460e5956bc1d1639be9ae6146a50347
f8fcb28efb1c8cf0dc096bec902bf4c4
b4ca6ef6673c12f0ddc29c7cf3f0d060
a437eb8b4b316c81b4e551b78458ef33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Manancial - Repositório Digital da UFSM - Universidade Federal de Santa Maria (UFSM)
repository.mail.fl_str_mv
_version_ 1794524319600082944