Probabilistic graphical models and deep learning techniques for gene prediction
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/45/45134/tde-19082025-123303/ |
Resumo: | Sequential data emerges in various research fields including computer vision, natural language processing, and biology, posing complex inference challenges like filtering, prediction, control, and labeling. Probabilistic Graphical Models (PGMs) are comprehensive mathematical frameworks that have been extensively utilized for these tasks with significant success. For gene prediction the best predictors currently focus on utilizing Markov Chains such as Augustus, SNAP, Genscan, or MYOP. Numerous studies have emphasized the efficacy of Deep Neural Networks (DNNs) in tackling complex problems. These models offer an advanced representation that facilitates inference tasks. For instance, Convolutional Neural Networks (CNNs) have been employed to infer biological signals, sequence motifs and classify pre-miRNAs, whereas Recurrent Neural Networks (RNNs) are used for predicting protein secondary structures. In this work, we introduce a framework that integrates DNN models with PGMs to enhance gene prediction from sequential data, surpassing current state-of-the-art methods. To achieve this, we developed DeepToPS, an extension of the ToPS tool, which is an object-oriented framework with efficient implementations of frequently used PGMs for sequential data, now incorporating DNNs. Consequently, DeepToPS facilitates the creation of gene predictors utilizing hybrid models that seamlessly blend deep learning techniques with graphical models. |
| id |
USP_5d846aadbaddc4fc4b2cb132124bfca2 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-19082025-123303 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Probabilistic graphical models and deep learning techniques for gene predictionModelos gráficos probabilísticos e técnicas de aprendizado profundo para predição de genesAprendizado computacionalArcabouços probabilísticosComputational genomicsGene predictionGenômica computacionalMachine learningNeural networksPredição de genesProbabilistic frameworksRedes neuraisSequential data emerges in various research fields including computer vision, natural language processing, and biology, posing complex inference challenges like filtering, prediction, control, and labeling. Probabilistic Graphical Models (PGMs) are comprehensive mathematical frameworks that have been extensively utilized for these tasks with significant success. For gene prediction the best predictors currently focus on utilizing Markov Chains such as Augustus, SNAP, Genscan, or MYOP. Numerous studies have emphasized the efficacy of Deep Neural Networks (DNNs) in tackling complex problems. These models offer an advanced representation that facilitates inference tasks. For instance, Convolutional Neural Networks (CNNs) have been employed to infer biological signals, sequence motifs and classify pre-miRNAs, whereas Recurrent Neural Networks (RNNs) are used for predicting protein secondary structures. In this work, we introduce a framework that integrates DNN models with PGMs to enhance gene prediction from sequential data, surpassing current state-of-the-art methods. To achieve this, we developed DeepToPS, an extension of the ToPS tool, which is an object-oriented framework with efficient implementations of frequently used PGMs for sequential data, now incorporating DNNs. Consequently, DeepToPS facilitates the creation of gene predictors utilizing hybrid models that seamlessly blend deep learning techniques with graphical models.Dados sequenciais surgem em várias áreas de pesquisa, incluindo visão computacional, processamento de linguagem natural e biologia, apresentando desafios complexos de inferência como filtração, predição, controle e rotulação. Modelos Gráficos Probabilísticos (PGMs, do inglês Probabilistic Graphical Models) são arcabouços de estruturas matemáticas abrangentes que têm sido amplamente utilizadas para essas tarefas com sucesso significativo. Para a predição de genes, os melhores preditores atualmente focam no uso de Cadeias de Markov, como Augustus, SNAP, Genscan ou MYOP. Diversos estudos têm destacado a eficácia das Redes Neurais Profundas (DNNs, do inglês Deep Neural Networks) na resolução de problemas complexos. Esses modelos oferecem uma representação avançada que facilita as tarefas de inferência. Por exemplo, Redes Neurais Convolucionais (CNNs, do inglês Convolutional Neural Networks) têm sido empregadas para inferir sinais biológicos, sequenciar motivos e classificar pré-miRNAs, enquanto Redes Neurais Recorrentes (RNNs, do inglês Recurrent Neural Networks) são usadas para prever estruturas secundárias de proteínas. Neste trabalho, introduzimos uma estrutura que integra modelos de DNN com PGMs para aprimorar a predição de genes a partir de dados sequenciais, superando os métodos atuais. Para isso, desenvolvemos o DeepToPS, uma extensão da ferramenta ToPS, que é uma estrutura orientada a objetos com implementações eficientes de PGMs comumente utilizadas para dados sequenciais, agora incorporando DNNs. Consequentemente, o DeepToPS facilita a criação de preditores de genes utilizando modelos híbridos que combinam, de forma integrada, técnicas de aprendizado profundo com modelos gráficos.Biblioteca Digitais de Teses e Dissertações da USPDurham, Alan MitchellCaro, Waldir Edison Farfán2025-03-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-19082025-123303/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2025-08-20T09:02:02Zoai:teses.usp.br:tde-19082025-123303Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-08-20T09:02:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Probabilistic graphical models and deep learning techniques for gene prediction Modelos gráficos probabilísticos e técnicas de aprendizado profundo para predição de genes |
| title |
Probabilistic graphical models and deep learning techniques for gene prediction |
| spellingShingle |
Probabilistic graphical models and deep learning techniques for gene prediction Caro, Waldir Edison Farfán Aprendizado computacional Arcabouços probabilísticos Computational genomics Gene prediction Genômica computacional Machine learning Neural networks Predição de genes Probabilistic frameworks Redes neurais |
| title_short |
Probabilistic graphical models and deep learning techniques for gene prediction |
| title_full |
Probabilistic graphical models and deep learning techniques for gene prediction |
| title_fullStr |
Probabilistic graphical models and deep learning techniques for gene prediction |
| title_full_unstemmed |
Probabilistic graphical models and deep learning techniques for gene prediction |
| title_sort |
Probabilistic graphical models and deep learning techniques for gene prediction |
| author |
Caro, Waldir Edison Farfán |
| author_facet |
Caro, Waldir Edison Farfán |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Durham, Alan Mitchell |
| dc.contributor.author.fl_str_mv |
Caro, Waldir Edison Farfán |
| dc.subject.por.fl_str_mv |
Aprendizado computacional Arcabouços probabilísticos Computational genomics Gene prediction Genômica computacional Machine learning Neural networks Predição de genes Probabilistic frameworks Redes neurais |
| topic |
Aprendizado computacional Arcabouços probabilísticos Computational genomics Gene prediction Genômica computacional Machine learning Neural networks Predição de genes Probabilistic frameworks Redes neurais |
| description |
Sequential data emerges in various research fields including computer vision, natural language processing, and biology, posing complex inference challenges like filtering, prediction, control, and labeling. Probabilistic Graphical Models (PGMs) are comprehensive mathematical frameworks that have been extensively utilized for these tasks with significant success. For gene prediction the best predictors currently focus on utilizing Markov Chains such as Augustus, SNAP, Genscan, or MYOP. Numerous studies have emphasized the efficacy of Deep Neural Networks (DNNs) in tackling complex problems. These models offer an advanced representation that facilitates inference tasks. For instance, Convolutional Neural Networks (CNNs) have been employed to infer biological signals, sequence motifs and classify pre-miRNAs, whereas Recurrent Neural Networks (RNNs) are used for predicting protein secondary structures. In this work, we introduce a framework that integrates DNN models with PGMs to enhance gene prediction from sequential data, surpassing current state-of-the-art methods. To achieve this, we developed DeepToPS, an extension of the ToPS tool, which is an object-oriented framework with efficient implementations of frequently used PGMs for sequential data, now incorporating DNNs. Consequently, DeepToPS facilitates the creation of gene predictors utilizing hybrid models that seamlessly blend deep learning techniques with graphical models. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-03-21 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-19082025-123303/ |
| url |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-19082025-123303/ |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1848370486324494336 |