Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Oliveira, Gabriel Bianchin de, 1997-
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: [s.n.]
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/20.500.12733/1641175
Resumo: Orientadores: Zanoni Dias, Hélio Pedrini
id UNICAMP-30_e51e8495714154481e085cf0e816a982
oai_identifier_str oai::1162360
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLASTProtein secondary structure prediction using machine learning and BLASTAprendizado de máquinaAprendizado profundoProteinas - EstruturaMachine learningDeep learningProteins - StructureOrientadores: Zanoni Dias, Hélio PedriniDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Proteínas, que são sequências de aminoácidos, são fundamentais em diversos processos biológicos dos seres vivos. Devido às interações físicas e químicas entre os aminoácidos que formam as proteínas, estruturas tridimensionais locais e globais são formadas. Com os avanços tecnológicos na área biológica, o sequenciamento de proteínas se tornou simples e rápido de ser feito. Por outro lado, a definição de estruturas tridimensionais locais, chamadas de estruturas secundárias, e globais, chamadas de estruturas terciárias, continua custosa. Estruturas tridimensionais têm alto impacto na definição de funções de proteínas e no auxílio ao desenvolvimento de aplicações, como remédios e biossensores. Como opção para a definição de estruturas globais das proteínas a partir da sequência de aminoácidos, a análise de estruturas secundárias se tornou o principal método intermediário na literatura. Para realizar a predição de estruturas secundárias, duas abordagens são mais comumente utilizadas, sendo elas métodos baseados em modelo, que usam ferramentas que encontram proteínas similares, e métodos livres de modelo, que usam classificadores de aprendizado de máquina. Nos trabalhos recentes, diversas metodologias foram propostas para predizer estruturas secundárias, porém este problema continua em aberto. Outro ponto importante nos métodos atuais é que a maioria das abordagens utiliza informações evolutivas além da sequência de aminoácidos que formam as proteínas, sendo incapazes de predizer estruturas secundárias utilizando apenas a cadeia de aminoácidos. Nesta pesquisa, propomos diversos classificadores baseados em modelo e livres de modelo para realizar a classificação de estruturas secundárias das proteínas. Além da análise individual dos classificadores, investigamos a fusão entre os preditores baseados em modelo e preditores livres de modelo, assim como a fusão entre todos os classificadores. Nossos preditores são capazes de classificar estruturas secundárias a partir de sequências de aminoácidos com ou sem informações evolutivas, o que não é possível para a maioria dos métodos disponíveis na literatura. Os resultados obtidos em três bases de dados diferentes mostram que nossos classificadores são competitivos comparados com as abordagens da literatura.Abstract: Proteins, which are sequences of amino acids, are fundamental in several biological processes of living beings. Due to physical and chemical interactions between the amino acids that form proteins, local and global three-dimensional structures are formed. With technological advances in the biological area, protein sequencing has become simple and quick to be done. On the other hand, the definition of local three-dimensional structures, called secondary structures, and global three-dimensional structures, called tertiary structures, remains costly. Three-dimensional structures have a high impact on the definition of protein functions and the aid of application development, such as medicines and biosensors. As an option for the definition of global protein structures from the amino acid sequence, the analysis of secondary structures has become the main intermediate method in the literature. To perform the prediction of secondary structures, two approaches are most commonly used, namely template-based methods, which use tools that find similar proteins, and template-free methods, which use machine learning classifiers. In recent works, several methodologies have been proposed to predict secondary structures, but this problem remains open. Another important point in current methods is that most approaches use evolutionary information in addition to the sequence of amino acids that form proteins, being unable to predict secondary structures using only the chain of amino acids. In this research, we propose several template-based and template-free models to classify secondary structures of proteins. In addition to the individual classifier analysis, we investigated the fusion between template-based predictors and template-free predictors, as well as the fusion between all classifiers. Our predictors can classify secondary structures from amino acid sequences with or without evolutionary information, which is not possible for most methods available in the literature. The results obtained in three different databases show that our classifiers are competitive compared to the approaches in the literature.MestradoCiência da ComputaçãoMestre em Ciência da Computação[s.n.]Dias, Zanoni, 1975-Pedrini, Hélio, 1963-Cerri, RicardoTelles, Guilherme PimentelUniversidade Estadual de Campinas. Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASOliveira, Gabriel Bianchin de, 1997-20212021-03-11T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf1 recurso online ( 139 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/1641175OLIVEIRA, Gabriel Bianchin de. Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST . 2021. 1 recurso online ( 139 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641175. Acesso em: 26 abr. 2024.https://repositorio.unicamp.br/acervo/detalhe/1162360Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2021-04-29T08:39:17Zoai::1162360Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2021-04-29T08:39:17Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST
Protein secondary structure prediction using machine learning and BLAST
title Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST
spellingShingle Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST
Oliveira, Gabriel Bianchin de, 1997-
Aprendizado de máquina
Aprendizado profundo
Proteinas - Estrutura
Machine learning
Deep learning
Proteins - Structure
title_short Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST
title_full Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST
title_fullStr Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST
title_full_unstemmed Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST
title_sort Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST
author Oliveira, Gabriel Bianchin de, 1997-
author_facet Oliveira, Gabriel Bianchin de, 1997-
author_role author
dc.contributor.none.fl_str_mv Dias, Zanoni, 1975-
Pedrini, Hélio, 1963-
Cerri, Ricardo
Telles, Guilherme Pimentel
Universidade Estadual de Campinas. Instituto de Computação
Programa de Pós-Graduação em Ciência da Computação
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Oliveira, Gabriel Bianchin de, 1997-
dc.subject.por.fl_str_mv Aprendizado de máquina
Aprendizado profundo
Proteinas - Estrutura
Machine learning
Deep learning
Proteins - Structure
topic Aprendizado de máquina
Aprendizado profundo
Proteinas - Estrutura
Machine learning
Deep learning
Proteins - Structure
description Orientadores: Zanoni Dias, Hélio Pedrini
publishDate 2021
dc.date.none.fl_str_mv 2021
2021-03-11T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1641175
OLIVEIRA, Gabriel Bianchin de. Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST . 2021. 1 recurso online ( 139 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641175. Acesso em: 26 abr. 2024.
url https://hdl.handle.net/20.500.12733/1641175
identifier_str_mv OLIVEIRA, Gabriel Bianchin de. Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST . 2021. 1 recurso online ( 139 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641175. Acesso em: 26 abr. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/1162360
Requisitos do sistema: Software para leitura de arquivo em PDF
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
1 recurso online ( 139 p.) : il., digital, arquivo PDF.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1797405532754018304