Probabilistic graphical models and deep learning techniques for gene prediction

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Caro, Waldir Edison Farfán
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-19082025-123303/
Resumo: Sequential data emerges in various research fields including computer vision, natural language processing, and biology, posing complex inference challenges like filtering, prediction, control, and labeling. Probabilistic Graphical Models (PGMs) are comprehensive mathematical frameworks that have been extensively utilized for these tasks with significant success. For gene prediction the best predictors currently focus on utilizing Markov Chains such as Augustus, SNAP, Genscan, or MYOP. Numerous studies have emphasized the efficacy of Deep Neural Networks (DNNs) in tackling complex problems. These models offer an advanced representation that facilitates inference tasks. For instance, Convolutional Neural Networks (CNNs) have been employed to infer biological signals, sequence motifs and classify pre-miRNAs, whereas Recurrent Neural Networks (RNNs) are used for predicting protein secondary structures. In this work, we introduce a framework that integrates DNN models with PGMs to enhance gene prediction from sequential data, surpassing current state-of-the-art methods. To achieve this, we developed DeepToPS, an extension of the ToPS tool, which is an object-oriented framework with efficient implementations of frequently used PGMs for sequential data, now incorporating DNNs. Consequently, DeepToPS facilitates the creation of gene predictors utilizing hybrid models that seamlessly blend deep learning techniques with graphical models.
id USP_5d846aadbaddc4fc4b2cb132124bfca2
oai_identifier_str oai:teses.usp.br:tde-19082025-123303
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Probabilistic graphical models and deep learning techniques for gene predictionModelos gráficos probabilísticos e técnicas de aprendizado profundo para predição de genesAprendizado computacionalArcabouços probabilísticosComputational genomicsGene predictionGenômica computacionalMachine learningNeural networksPredição de genesProbabilistic frameworksRedes neuraisSequential data emerges in various research fields including computer vision, natural language processing, and biology, posing complex inference challenges like filtering, prediction, control, and labeling. Probabilistic Graphical Models (PGMs) are comprehensive mathematical frameworks that have been extensively utilized for these tasks with significant success. For gene prediction the best predictors currently focus on utilizing Markov Chains such as Augustus, SNAP, Genscan, or MYOP. Numerous studies have emphasized the efficacy of Deep Neural Networks (DNNs) in tackling complex problems. These models offer an advanced representation that facilitates inference tasks. For instance, Convolutional Neural Networks (CNNs) have been employed to infer biological signals, sequence motifs and classify pre-miRNAs, whereas Recurrent Neural Networks (RNNs) are used for predicting protein secondary structures. In this work, we introduce a framework that integrates DNN models with PGMs to enhance gene prediction from sequential data, surpassing current state-of-the-art methods. To achieve this, we developed DeepToPS, an extension of the ToPS tool, which is an object-oriented framework with efficient implementations of frequently used PGMs for sequential data, now incorporating DNNs. Consequently, DeepToPS facilitates the creation of gene predictors utilizing hybrid models that seamlessly blend deep learning techniques with graphical models.Dados sequenciais surgem em várias áreas de pesquisa, incluindo visão computacional, processamento de linguagem natural e biologia, apresentando desafios complexos de inferência como filtração, predição, controle e rotulação. Modelos Gráficos Probabilísticos (PGMs, do inglês Probabilistic Graphical Models) são arcabouços de estruturas matemáticas abrangentes que têm sido amplamente utilizadas para essas tarefas com sucesso significativo. Para a predição de genes, os melhores preditores atualmente focam no uso de Cadeias de Markov, como Augustus, SNAP, Genscan ou MYOP. Diversos estudos têm destacado a eficácia das Redes Neurais Profundas (DNNs, do inglês Deep Neural Networks) na resolução de problemas complexos. Esses modelos oferecem uma representação avançada que facilita as tarefas de inferência. Por exemplo, Redes Neurais Convolucionais (CNNs, do inglês Convolutional Neural Networks) têm sido empregadas para inferir sinais biológicos, sequenciar motivos e classificar pré-miRNAs, enquanto Redes Neurais Recorrentes (RNNs, do inglês Recurrent Neural Networks) são usadas para prever estruturas secundárias de proteínas. Neste trabalho, introduzimos uma estrutura que integra modelos de DNN com PGMs para aprimorar a predição de genes a partir de dados sequenciais, superando os métodos atuais. Para isso, desenvolvemos o DeepToPS, uma extensão da ferramenta ToPS, que é uma estrutura orientada a objetos com implementações eficientes de PGMs comumente utilizadas para dados sequenciais, agora incorporando DNNs. Consequentemente, o DeepToPS facilita a criação de preditores de genes utilizando modelos híbridos que combinam, de forma integrada, técnicas de aprendizado profundo com modelos gráficos.Biblioteca Digitais de Teses e Dissertações da USPDurham, Alan MitchellCaro, Waldir Edison Farfán2025-03-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-19082025-123303/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2025-08-20T09:02:02Zoai:teses.usp.br:tde-19082025-123303Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-08-20T09:02:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Probabilistic graphical models and deep learning techniques for gene prediction
Modelos gráficos probabilísticos e técnicas de aprendizado profundo para predição de genes
title Probabilistic graphical models and deep learning techniques for gene prediction
spellingShingle Probabilistic graphical models and deep learning techniques for gene prediction
Caro, Waldir Edison Farfán
Aprendizado computacional
Arcabouços probabilísticos
Computational genomics
Gene prediction
Genômica computacional
Machine learning
Neural networks
Predição de genes
Probabilistic frameworks
Redes neurais
title_short Probabilistic graphical models and deep learning techniques for gene prediction
title_full Probabilistic graphical models and deep learning techniques for gene prediction
title_fullStr Probabilistic graphical models and deep learning techniques for gene prediction
title_full_unstemmed Probabilistic graphical models and deep learning techniques for gene prediction
title_sort Probabilistic graphical models and deep learning techniques for gene prediction
author Caro, Waldir Edison Farfán
author_facet Caro, Waldir Edison Farfán
author_role author
dc.contributor.none.fl_str_mv Durham, Alan Mitchell
dc.contributor.author.fl_str_mv Caro, Waldir Edison Farfán
dc.subject.por.fl_str_mv Aprendizado computacional
Arcabouços probabilísticos
Computational genomics
Gene prediction
Genômica computacional
Machine learning
Neural networks
Predição de genes
Probabilistic frameworks
Redes neurais
topic Aprendizado computacional
Arcabouços probabilísticos
Computational genomics
Gene prediction
Genômica computacional
Machine learning
Neural networks
Predição de genes
Probabilistic frameworks
Redes neurais
description Sequential data emerges in various research fields including computer vision, natural language processing, and biology, posing complex inference challenges like filtering, prediction, control, and labeling. Probabilistic Graphical Models (PGMs) are comprehensive mathematical frameworks that have been extensively utilized for these tasks with significant success. For gene prediction the best predictors currently focus on utilizing Markov Chains such as Augustus, SNAP, Genscan, or MYOP. Numerous studies have emphasized the efficacy of Deep Neural Networks (DNNs) in tackling complex problems. These models offer an advanced representation that facilitates inference tasks. For instance, Convolutional Neural Networks (CNNs) have been employed to infer biological signals, sequence motifs and classify pre-miRNAs, whereas Recurrent Neural Networks (RNNs) are used for predicting protein secondary structures. In this work, we introduce a framework that integrates DNN models with PGMs to enhance gene prediction from sequential data, surpassing current state-of-the-art methods. To achieve this, we developed DeepToPS, an extension of the ToPS tool, which is an object-oriented framework with efficient implementations of frequently used PGMs for sequential data, now incorporating DNNs. Consequently, DeepToPS facilitates the creation of gene predictors utilizing hybrid models that seamlessly blend deep learning techniques with graphical models.
publishDate 2025
dc.date.none.fl_str_mv 2025-03-21
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/45/45134/tde-19082025-123303/
url https://www.teses.usp.br/teses/disponiveis/45/45134/tde-19082025-123303/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1848370486324494336