Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais
Ano de defesa: | 2018 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | , |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Santa Maria
Centro de Tecnologia |
Programa de Pós-Graduação: |
Programa de Pós-Graduação em Ciência da Computação
|
Departamento: |
Ciência da Computação
|
País: |
Brasil
|
Palavras-chave em Português: | |
Palavras-chave em Inglês: | |
Área do conhecimento CNPq: | |
Link de acesso: | http://repositorio.ufsm.br/handle/1/16579 |
Resumo: | A new drug discovery is financially costly and time-consuming. To deal this issue, the Rational Drug Design process investigates the macromolecular interaction between receptor molecules and drug-candidate ligands. Through molecular docking experiments it becomes possible to evaluate the binding quality between these molecules. To simulate the flexibility of the receptor, molecular dynamics simulations can be performed, where the protein is represented by a distinct conformation at each instant of time. Thus, molecular docking experiments can be performed on these different conformations. Several machine learning techniques can be used to mine these data. This work presents an approach for artificial neural networks deep learning, which uses as input several conformation about a given protein, generated through molecular dynamic simulations. These conformation are described in terms of its atoms tridimensional coordinates, labeled by a target attribute FEB, which points out the quality about each conformation in molecular docking experiments. In the deep learning approaches proposed in this work, we consider as input both these raw data, as well as we consider an approach that makes use of clustering experiments that generates a good parallelepiped surface for each atom, instead of the raw data. These strategies are implemented in terms deep feedforward networks and deep convolutional networks algorithms. For both architectures, the clustering-based strategy showed up promising results. However, models generated through deep feedforward showed up the best global results, being that those with the DBSCAN-Clustering-based approach highlight from the other ones. |
id |
UFSM-20_feb5409c139e71603291d3b151fa3e4f |
---|---|
oai_identifier_str |
oai:repositorio.ufsm.br:1/16579 |
network_acronym_str |
UFSM-20 |
network_name_str |
Manancial - Repositório Digital da UFSM |
repository_id_str |
|
spelling |
2019-05-20T12:04:16Z2019-05-20T12:04:16Z2018-08-27http://repositorio.ufsm.br/handle/1/16579A new drug discovery is financially costly and time-consuming. To deal this issue, the Rational Drug Design process investigates the macromolecular interaction between receptor molecules and drug-candidate ligands. Through molecular docking experiments it becomes possible to evaluate the binding quality between these molecules. To simulate the flexibility of the receptor, molecular dynamics simulations can be performed, where the protein is represented by a distinct conformation at each instant of time. Thus, molecular docking experiments can be performed on these different conformations. Several machine learning techniques can be used to mine these data. This work presents an approach for artificial neural networks deep learning, which uses as input several conformation about a given protein, generated through molecular dynamic simulations. These conformation are described in terms of its atoms tridimensional coordinates, labeled by a target attribute FEB, which points out the quality about each conformation in molecular docking experiments. In the deep learning approaches proposed in this work, we consider as input both these raw data, as well as we consider an approach that makes use of clustering experiments that generates a good parallelepiped surface for each atom, instead of the raw data. These strategies are implemented in terms deep feedforward networks and deep convolutional networks algorithms. For both architectures, the clustering-based strategy showed up promising results. However, models generated through deep feedforward showed up the best global results, being that those with the DBSCAN-Clustering-based approach highlight from the other ones.A descoberta de novos fármacos é custosa, tanto financeiramente como em tempo. Para tratar essa questão, o processo de Desenho Racional de Fármacos investiga a interação entre moléculas receptoras e ligantes candidatos a fármacos. Por meio de experimentos de simulação de docagem molecular é possível avaliar a qualidade da ligação entre essas moléculas. Para simular a flexibilidade do receptor, podem ser executados simulações de dinâmica molecular, onde a proteína é representada por uma conformação distinta em cada instante de tempo. Assim, os experimentos de docagem molecular podem ser executados sobre essas diferentes conformações. Diversas técnicas de aprendizagem de máquina podem ser utilizadas para minerar esses dados. Esta dissertação apresenta uma abordagem para redes neurais deep learning que utiliza como dados de entrada diferentes conformações de uma proteína, geradas por meio de simulações de dinâmica molecular. Essas conformações são descritas em termos das coordenadas tridimensionais dos átomos que a compõem, rotuladas por um atributo alvo FEB (Free Energy of Binding), que relaciona a interação entre a conformação do receptor e o ligante em experimentos de docagem molecular. Nas abordagens de deep learning propostas neste trabalho, são considerados como entrada tanto esses dados brutos, como são considerados uma abordagem que utiliza resultados agrupamento de dados para gerar um bloco com intervalos ideais para cada átomo, em vez dos dados brutos. Essas propostas são implementadas em termos de redes neurais deep feedforward e convolucional. As estratégias são comparadas com redes neurais com a mesma arquitetura, sem o uso dos blocos. Para ambas arquiteturas, a estratégia de utilizar os blocos gerados por agrupamento mostrou resultados promissores. Entretanto os modelos gerados a partir da arquitetura deep feedforward apresentam os melhores resultados globais, sendo que aqueles com abordagem de agrupamento por DBSCAN destacam-se frente às outras duas abordagens.porUniversidade Federal de Santa MariaCentro de TecnologiaPrograma de Pós-Graduação em Ciência da ComputaçãoUFSMBrasilCiência da ComputaçãoAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessAprendizagem profundaRedes neurais convolucionaisDocagem molecularDeep learningConvolutional neural networksMolecular dockingCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAODeep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionaisDeep learning on protein conformation selection considering their tridimensional propertiesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisWinck, Ana Trindadehttp://lattes.cnpq.br/5075974938483862Machado, Karina dos Santoshttp://lattes.cnpq.br/3528633359332021Silva, Luís Alvaro de Limahttp://lattes.cnpq.br/8066370508832550http://lattes.cnpq.br/5913037348154812Silva, Raphael Giordano do Nascimento e100300000007600bc659cff-88e7-46d3-ad6b-6a06414190a15c022f33-a018-404e-9aad-3e1fea8e4b25da1b8d34-fab2-4eef-8d6f-b38d56b4fc8134d7f124-0151-4dbb-8392-c5c83e0dc8f1reponame:Manancial - Repositório Digital da UFSMinstname:Universidade Federal de Santa Maria (UFSM)instacron:UFSMORIGINALDIS_PPGCC_2018_SILVA_RAPHAEL.pdfDIS_PPGCC_2018_SILVA_RAPHAEL.pdfDissertação de Mestradoapplication/pdf2671590http://repositorio.ufsm.br/bitstream/1/16579/1/DIS_PPGCC_2018_SILVA_RAPHAEL.pdf8a6cf2c99fa627ee555779fc65504488MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805http://repositorio.ufsm.br/bitstream/1/16579/2/license_rdf4460e5956bc1d1639be9ae6146a50347MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-816http://repositorio.ufsm.br/bitstream/1/16579/3/license.txtf8fcb28efb1c8cf0dc096bec902bf4c4MD53TEXTDIS_PPGCC_2018_SILVA_RAPHAEL.pdf.txtDIS_PPGCC_2018_SILVA_RAPHAEL.pdf.txtExtracted texttext/plain131127http://repositorio.ufsm.br/bitstream/1/16579/4/DIS_PPGCC_2018_SILVA_RAPHAEL.pdf.txtb4ca6ef6673c12f0ddc29c7cf3f0d060MD54THUMBNAILDIS_PPGCC_2018_SILVA_RAPHAEL.pdf.jpgDIS_PPGCC_2018_SILVA_RAPHAEL.pdf.jpgIM Thumbnailimage/jpeg4477http://repositorio.ufsm.br/bitstream/1/16579/5/DIS_PPGCC_2018_SILVA_RAPHAEL.pdf.jpga437eb8b4b316c81b4e551b78458ef33MD551/165792019-05-21 03:00:43.228oai:repositorio.ufsm.br:1/16579Q3JlYXRpdmUgQ29tbW9ucw==Repositório Institucionalhttp://repositorio.ufsm.br/PUBhttp://repositorio.ufsm.br/oai/requestopendoar:39132019-05-21T06:00:43Manancial - Repositório Digital da UFSM - Universidade Federal de Santa Maria (UFSM)false |
dc.title.por.fl_str_mv |
Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais |
dc.title.alternative.eng.fl_str_mv |
Deep learning on protein conformation selection considering their tridimensional properties |
title |
Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais |
spellingShingle |
Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais Silva, Raphael Giordano do Nascimento e Aprendizagem profunda Redes neurais convolucionais Docagem molecular Deep learning Convolutional neural networks Molecular docking CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais |
title_full |
Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais |
title_fullStr |
Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais |
title_full_unstemmed |
Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais |
title_sort |
Deep learning para seleção de conformações de proteínas considerando suas propriedades tridimensionais |
author |
Silva, Raphael Giordano do Nascimento e |
author_facet |
Silva, Raphael Giordano do Nascimento e |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Winck, Ana Trindade |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/5075974938483862 |
dc.contributor.referee1.fl_str_mv |
Machado, Karina dos Santos |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/3528633359332021 |
dc.contributor.referee2.fl_str_mv |
Silva, Luís Alvaro de Lima |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/8066370508832550 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/5913037348154812 |
dc.contributor.author.fl_str_mv |
Silva, Raphael Giordano do Nascimento e |
contributor_str_mv |
Winck, Ana Trindade Machado, Karina dos Santos Silva, Luís Alvaro de Lima |
dc.subject.por.fl_str_mv |
Aprendizagem profunda Redes neurais convolucionais Docagem molecular |
topic |
Aprendizagem profunda Redes neurais convolucionais Docagem molecular Deep learning Convolutional neural networks Molecular docking CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Deep learning Convolutional neural networks Molecular docking |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
A new drug discovery is financially costly and time-consuming. To deal this issue, the Rational Drug Design process investigates the macromolecular interaction between receptor molecules and drug-candidate ligands. Through molecular docking experiments it becomes possible to evaluate the binding quality between these molecules. To simulate the flexibility of the receptor, molecular dynamics simulations can be performed, where the protein is represented by a distinct conformation at each instant of time. Thus, molecular docking experiments can be performed on these different conformations. Several machine learning techniques can be used to mine these data. This work presents an approach for artificial neural networks deep learning, which uses as input several conformation about a given protein, generated through molecular dynamic simulations. These conformation are described in terms of its atoms tridimensional coordinates, labeled by a target attribute FEB, which points out the quality about each conformation in molecular docking experiments. In the deep learning approaches proposed in this work, we consider as input both these raw data, as well as we consider an approach that makes use of clustering experiments that generates a good parallelepiped surface for each atom, instead of the raw data. These strategies are implemented in terms deep feedforward networks and deep convolutional networks algorithms. For both architectures, the clustering-based strategy showed up promising results. However, models generated through deep feedforward showed up the best global results, being that those with the DBSCAN-Clustering-based approach highlight from the other ones. |
publishDate |
2018 |
dc.date.issued.fl_str_mv |
2018-08-27 |
dc.date.accessioned.fl_str_mv |
2019-05-20T12:04:16Z |
dc.date.available.fl_str_mv |
2019-05-20T12:04:16Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://repositorio.ufsm.br/handle/1/16579 |
url |
http://repositorio.ufsm.br/handle/1/16579 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.cnpq.fl_str_mv |
100300000007 |
dc.relation.confidence.fl_str_mv |
600 |
dc.relation.authority.fl_str_mv |
bc659cff-88e7-46d3-ad6b-6a06414190a1 5c022f33-a018-404e-9aad-3e1fea8e4b25 da1b8d34-fab2-4eef-8d6f-b38d56b4fc81 34d7f124-0151-4dbb-8392-c5c83e0dc8f1 |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International http://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International http://creativecommons.org/licenses/by-nc-nd/4.0/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Santa Maria Centro de Tecnologia |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UFSM |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Ciência da Computação |
publisher.none.fl_str_mv |
Universidade Federal de Santa Maria Centro de Tecnologia |
dc.source.none.fl_str_mv |
reponame:Manancial - Repositório Digital da UFSM instname:Universidade Federal de Santa Maria (UFSM) instacron:UFSM |
instname_str |
Universidade Federal de Santa Maria (UFSM) |
instacron_str |
UFSM |
institution |
UFSM |
reponame_str |
Manancial - Repositório Digital da UFSM |
collection |
Manancial - Repositório Digital da UFSM |
bitstream.url.fl_str_mv |
http://repositorio.ufsm.br/bitstream/1/16579/1/DIS_PPGCC_2018_SILVA_RAPHAEL.pdf http://repositorio.ufsm.br/bitstream/1/16579/2/license_rdf http://repositorio.ufsm.br/bitstream/1/16579/3/license.txt http://repositorio.ufsm.br/bitstream/1/16579/4/DIS_PPGCC_2018_SILVA_RAPHAEL.pdf.txt http://repositorio.ufsm.br/bitstream/1/16579/5/DIS_PPGCC_2018_SILVA_RAPHAEL.pdf.jpg |
bitstream.checksum.fl_str_mv |
8a6cf2c99fa627ee555779fc65504488 4460e5956bc1d1639be9ae6146a50347 f8fcb28efb1c8cf0dc096bec902bf4c4 b4ca6ef6673c12f0ddc29c7cf3f0d060 a437eb8b4b316c81b4e551b78458ef33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Manancial - Repositório Digital da UFSM - Universidade Federal de Santa Maria (UFSM) |
repository.mail.fl_str_mv |
|
_version_ |
1794524319600082944 |