Identification of cell signaling pathways based on biochemical reaction kinetics repositories

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Matos, Gustavo Estrela de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-08032021-211926/
Resumo: Cell signaling pathways are composed of a set of biochemical reactions that are associated with signal transmission within the cell and its surroundings. From a computational perspective, those pathways are identified through statistical analyses on results from biological assays, in which involved chemical species are quantified. However, once generally it is measured only a few time points for a fraction of the chemical species, to effectively tackle this problem it is required to design and simulate functional dynamic models. Recently, a method was introduced to design functional models, which is based on systematic modifications of an initial model through the inclusion of biochemical reactions, which in turn were obtained from the interactome repository KEGG. Nevertheless, this method presents some shortcomings that impair the estimated model; among them are the incompleteness of the information extracted from KEGG, the absence of rate constants, the usage of sub-optimal search algorithms and an unsatisfactory overfitting penalization. In this work, we propose a new methodology for identification of cell signaling pathways, based on the aforementioned method, with modifications on the cost function that aims to solve the unsatisfactory overfitting penalization. To this end, we use a cost function based on the marginal likelihood of a model producing the observed experimental data. We show how this new cost function automatically penalize complex models, since marginal likelihood approaches tend to select models with intermediate complexity. The new methodology was tested on artificial instances of model selection; for one of the experiments, we solved the model selection problem as a feature selection problem, walking on the space of solutions to get a glance of the surface induced by the defined cost function. With this work, we expect to contribute towards the solution of the cell signaling pathway identification problem, by providing the implementation of a cost function that can be used in a feature selection approach.
id USP_6d4c2c05218d47aada0bd48d503617de
oai_identifier_str oai:teses.usp.br:tde-08032021-211926
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Identification of cell signaling pathways based on biochemical reaction kinetics repositoriesIdentificação de vias de sinalização celular baseada em repositórios de cinética de reações bioquímicasCell signaling pathwaysEquações diferenciais ordináriasFeature selectionModel selectionOrdinary differential equationsSeleção de característicasSeleção de modelosVias de sinalização celularCell signaling pathways are composed of a set of biochemical reactions that are associated with signal transmission within the cell and its surroundings. From a computational perspective, those pathways are identified through statistical analyses on results from biological assays, in which involved chemical species are quantified. However, once generally it is measured only a few time points for a fraction of the chemical species, to effectively tackle this problem it is required to design and simulate functional dynamic models. Recently, a method was introduced to design functional models, which is based on systematic modifications of an initial model through the inclusion of biochemical reactions, which in turn were obtained from the interactome repository KEGG. Nevertheless, this method presents some shortcomings that impair the estimated model; among them are the incompleteness of the information extracted from KEGG, the absence of rate constants, the usage of sub-optimal search algorithms and an unsatisfactory overfitting penalization. In this work, we propose a new methodology for identification of cell signaling pathways, based on the aforementioned method, with modifications on the cost function that aims to solve the unsatisfactory overfitting penalization. To this end, we use a cost function based on the marginal likelihood of a model producing the observed experimental data. We show how this new cost function automatically penalize complex models, since marginal likelihood approaches tend to select models with intermediate complexity. The new methodology was tested on artificial instances of model selection; for one of the experiments, we solved the model selection problem as a feature selection problem, walking on the space of solutions to get a glance of the surface induced by the defined cost function. With this work, we expect to contribute towards the solution of the cell signaling pathway identification problem, by providing the implementation of a cost function that can be used in a feature selection approach.Vias de sinalização celular são compostas por um conjunto de reações bioquímicas que estão associadas à transmissão de informação no interior de uma célula e suas imediações. Em uma perspectiva computacional, essas vias são identificadas com análises estatísticas sobre resultados de ensaios biológicos que quantificam espécies químicas envolvidas. Todavia, como geralmente são medidos apenas alguns instantes de tempo de uma fração dessas espécies químicas, para efetivamente abordar esse problema é necessário o desenho e a simulação de modelos dinâmicos funcionais. Recentemente, foi introduzido um método para desenho de modelos funcionais baseado em modificações sistemáticas de um modelo inicial através da inclusão de reações bioquímicas extraídas do repositório de interatomas KEGG. Entretanto, este método apresenta limitações que comprometem o modelo estimado; entre elas, a incompletude das informações extraídas do KEGG, a ausência de constantes de velocidade, o uso de algoritmos de busca subótimos e uma penalização insatisfatória para sobre-ajuste. Neste trabalho, propomos uma nova metodologia para identificação de vias de sinalização celular, baseada no método citado, com modificações na função de custo que tem como objetivo penalizar complexidade de modelos satisfatoriamente. Para isso, utilizamos uma função de custo baseada na verossimilhança marginal de um modelo reproduzir dados experimentais. Produzimos experimentos e mostramos como a nova função de custo automaticamente penaliza modelos mais complexos, o que é esperado pois abordagens baseadas em verossimilhança marginal tendem a selecionar modelos de complexidade intermediária. Nossa metodologia foi testada em instancias artificiais de seleção de modelos; em um dos experimentos, realizamos a seleção de modelos como um problema de seleção de características, caminhando pelo espaço de soluções para se obter indícios sobre a superfície induzida pela função de custo sobre o espaço de busca. Com este trabalho, esperamos contribuir para a elucidação do problema de seleção modelos de vias de sinalização celular, fornecendo uma função de custo que possa ser utilizada em uma abordagem baseada em seleção de características.Biblioteca Digitais de Teses e Dissertações da USPReis, Marcelo da SilvaMatos, Gustavo Estrela de2021-02-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-08032021-211926/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2021-04-06T01:34:02Zoai:teses.usp.br:tde-08032021-211926Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212021-04-06T01:34:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Identification of cell signaling pathways based on biochemical reaction kinetics repositories
Identificação de vias de sinalização celular baseada em repositórios de cinética de reações bioquímicas
title Identification of cell signaling pathways based on biochemical reaction kinetics repositories
spellingShingle Identification of cell signaling pathways based on biochemical reaction kinetics repositories
Matos, Gustavo Estrela de
Cell signaling pathways
Equações diferenciais ordinárias
Feature selection
Model selection
Ordinary differential equations
Seleção de características
Seleção de modelos
Vias de sinalização celular
title_short Identification of cell signaling pathways based on biochemical reaction kinetics repositories
title_full Identification of cell signaling pathways based on biochemical reaction kinetics repositories
title_fullStr Identification of cell signaling pathways based on biochemical reaction kinetics repositories
title_full_unstemmed Identification of cell signaling pathways based on biochemical reaction kinetics repositories
title_sort Identification of cell signaling pathways based on biochemical reaction kinetics repositories
author Matos, Gustavo Estrela de
author_facet Matos, Gustavo Estrela de
author_role author
dc.contributor.none.fl_str_mv Reis, Marcelo da Silva
dc.contributor.author.fl_str_mv Matos, Gustavo Estrela de
dc.subject.por.fl_str_mv Cell signaling pathways
Equações diferenciais ordinárias
Feature selection
Model selection
Ordinary differential equations
Seleção de características
Seleção de modelos
Vias de sinalização celular
topic Cell signaling pathways
Equações diferenciais ordinárias
Feature selection
Model selection
Ordinary differential equations
Seleção de características
Seleção de modelos
Vias de sinalização celular
description Cell signaling pathways are composed of a set of biochemical reactions that are associated with signal transmission within the cell and its surroundings. From a computational perspective, those pathways are identified through statistical analyses on results from biological assays, in which involved chemical species are quantified. However, once generally it is measured only a few time points for a fraction of the chemical species, to effectively tackle this problem it is required to design and simulate functional dynamic models. Recently, a method was introduced to design functional models, which is based on systematic modifications of an initial model through the inclusion of biochemical reactions, which in turn were obtained from the interactome repository KEGG. Nevertheless, this method presents some shortcomings that impair the estimated model; among them are the incompleteness of the information extracted from KEGG, the absence of rate constants, the usage of sub-optimal search algorithms and an unsatisfactory overfitting penalization. In this work, we propose a new methodology for identification of cell signaling pathways, based on the aforementioned method, with modifications on the cost function that aims to solve the unsatisfactory overfitting penalization. To this end, we use a cost function based on the marginal likelihood of a model producing the observed experimental data. We show how this new cost function automatically penalize complex models, since marginal likelihood approaches tend to select models with intermediate complexity. The new methodology was tested on artificial instances of model selection; for one of the experiments, we solved the model selection problem as a feature selection problem, walking on the space of solutions to get a glance of the surface induced by the defined cost function. With this work, we expect to contribute towards the solution of the cell signaling pathway identification problem, by providing the implementation of a cost function that can be used in a feature selection approach.
publishDate 2021
dc.date.none.fl_str_mv 2021-02-05
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/45/45134/tde-08032021-211926/
url https://www.teses.usp.br/teses/disponiveis/45/45134/tde-08032021-211926/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865491908527128576