Identification of cell signaling pathways based on biochemical reaction kinetics repositories
| Ano de defesa: | 2021 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/45/45134/tde-08032021-211926/ |
Resumo: | Cell signaling pathways are composed of a set of biochemical reactions that are associated with signal transmission within the cell and its surroundings. From a computational perspective, those pathways are identified through statistical analyses on results from biological assays, in which involved chemical species are quantified. However, once generally it is measured only a few time points for a fraction of the chemical species, to effectively tackle this problem it is required to design and simulate functional dynamic models. Recently, a method was introduced to design functional models, which is based on systematic modifications of an initial model through the inclusion of biochemical reactions, which in turn were obtained from the interactome repository KEGG. Nevertheless, this method presents some shortcomings that impair the estimated model; among them are the incompleteness of the information extracted from KEGG, the absence of rate constants, the usage of sub-optimal search algorithms and an unsatisfactory overfitting penalization. In this work, we propose a new methodology for identification of cell signaling pathways, based on the aforementioned method, with modifications on the cost function that aims to solve the unsatisfactory overfitting penalization. To this end, we use a cost function based on the marginal likelihood of a model producing the observed experimental data. We show how this new cost function automatically penalize complex models, since marginal likelihood approaches tend to select models with intermediate complexity. The new methodology was tested on artificial instances of model selection; for one of the experiments, we solved the model selection problem as a feature selection problem, walking on the space of solutions to get a glance of the surface induced by the defined cost function. With this work, we expect to contribute towards the solution of the cell signaling pathway identification problem, by providing the implementation of a cost function that can be used in a feature selection approach. |
| id |
USP_6d4c2c05218d47aada0bd48d503617de |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-08032021-211926 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Identification of cell signaling pathways based on biochemical reaction kinetics repositoriesIdentificação de vias de sinalização celular baseada em repositórios de cinética de reações bioquímicasCell signaling pathwaysEquações diferenciais ordináriasFeature selectionModel selectionOrdinary differential equationsSeleção de característicasSeleção de modelosVias de sinalização celularCell signaling pathways are composed of a set of biochemical reactions that are associated with signal transmission within the cell and its surroundings. From a computational perspective, those pathways are identified through statistical analyses on results from biological assays, in which involved chemical species are quantified. However, once generally it is measured only a few time points for a fraction of the chemical species, to effectively tackle this problem it is required to design and simulate functional dynamic models. Recently, a method was introduced to design functional models, which is based on systematic modifications of an initial model through the inclusion of biochemical reactions, which in turn were obtained from the interactome repository KEGG. Nevertheless, this method presents some shortcomings that impair the estimated model; among them are the incompleteness of the information extracted from KEGG, the absence of rate constants, the usage of sub-optimal search algorithms and an unsatisfactory overfitting penalization. In this work, we propose a new methodology for identification of cell signaling pathways, based on the aforementioned method, with modifications on the cost function that aims to solve the unsatisfactory overfitting penalization. To this end, we use a cost function based on the marginal likelihood of a model producing the observed experimental data. We show how this new cost function automatically penalize complex models, since marginal likelihood approaches tend to select models with intermediate complexity. The new methodology was tested on artificial instances of model selection; for one of the experiments, we solved the model selection problem as a feature selection problem, walking on the space of solutions to get a glance of the surface induced by the defined cost function. With this work, we expect to contribute towards the solution of the cell signaling pathway identification problem, by providing the implementation of a cost function that can be used in a feature selection approach.Vias de sinalização celular são compostas por um conjunto de reações bioquímicas que estão associadas à transmissão de informação no interior de uma célula e suas imediações. Em uma perspectiva computacional, essas vias são identificadas com análises estatísticas sobre resultados de ensaios biológicos que quantificam espécies químicas envolvidas. Todavia, como geralmente são medidos apenas alguns instantes de tempo de uma fração dessas espécies químicas, para efetivamente abordar esse problema é necessário o desenho e a simulação de modelos dinâmicos funcionais. Recentemente, foi introduzido um método para desenho de modelos funcionais baseado em modificações sistemáticas de um modelo inicial através da inclusão de reações bioquímicas extraídas do repositório de interatomas KEGG. Entretanto, este método apresenta limitações que comprometem o modelo estimado; entre elas, a incompletude das informações extraídas do KEGG, a ausência de constantes de velocidade, o uso de algoritmos de busca subótimos e uma penalização insatisfatória para sobre-ajuste. Neste trabalho, propomos uma nova metodologia para identificação de vias de sinalização celular, baseada no método citado, com modificações na função de custo que tem como objetivo penalizar complexidade de modelos satisfatoriamente. Para isso, utilizamos uma função de custo baseada na verossimilhança marginal de um modelo reproduzir dados experimentais. Produzimos experimentos e mostramos como a nova função de custo automaticamente penaliza modelos mais complexos, o que é esperado pois abordagens baseadas em verossimilhança marginal tendem a selecionar modelos de complexidade intermediária. Nossa metodologia foi testada em instancias artificiais de seleção de modelos; em um dos experimentos, realizamos a seleção de modelos como um problema de seleção de características, caminhando pelo espaço de soluções para se obter indícios sobre a superfície induzida pela função de custo sobre o espaço de busca. Com este trabalho, esperamos contribuir para a elucidação do problema de seleção modelos de vias de sinalização celular, fornecendo uma função de custo que possa ser utilizada em uma abordagem baseada em seleção de características.Biblioteca Digitais de Teses e Dissertações da USPReis, Marcelo da SilvaMatos, Gustavo Estrela de2021-02-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-08032021-211926/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2021-04-06T01:34:02Zoai:teses.usp.br:tde-08032021-211926Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212021-04-06T01:34:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Identification of cell signaling pathways based on biochemical reaction kinetics repositories Identificação de vias de sinalização celular baseada em repositórios de cinética de reações bioquímicas |
| title |
Identification of cell signaling pathways based on biochemical reaction kinetics repositories |
| spellingShingle |
Identification of cell signaling pathways based on biochemical reaction kinetics repositories Matos, Gustavo Estrela de Cell signaling pathways Equações diferenciais ordinárias Feature selection Model selection Ordinary differential equations Seleção de características Seleção de modelos Vias de sinalização celular |
| title_short |
Identification of cell signaling pathways based on biochemical reaction kinetics repositories |
| title_full |
Identification of cell signaling pathways based on biochemical reaction kinetics repositories |
| title_fullStr |
Identification of cell signaling pathways based on biochemical reaction kinetics repositories |
| title_full_unstemmed |
Identification of cell signaling pathways based on biochemical reaction kinetics repositories |
| title_sort |
Identification of cell signaling pathways based on biochemical reaction kinetics repositories |
| author |
Matos, Gustavo Estrela de |
| author_facet |
Matos, Gustavo Estrela de |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Reis, Marcelo da Silva |
| dc.contributor.author.fl_str_mv |
Matos, Gustavo Estrela de |
| dc.subject.por.fl_str_mv |
Cell signaling pathways Equações diferenciais ordinárias Feature selection Model selection Ordinary differential equations Seleção de características Seleção de modelos Vias de sinalização celular |
| topic |
Cell signaling pathways Equações diferenciais ordinárias Feature selection Model selection Ordinary differential equations Seleção de características Seleção de modelos Vias de sinalização celular |
| description |
Cell signaling pathways are composed of a set of biochemical reactions that are associated with signal transmission within the cell and its surroundings. From a computational perspective, those pathways are identified through statistical analyses on results from biological assays, in which involved chemical species are quantified. However, once generally it is measured only a few time points for a fraction of the chemical species, to effectively tackle this problem it is required to design and simulate functional dynamic models. Recently, a method was introduced to design functional models, which is based on systematic modifications of an initial model through the inclusion of biochemical reactions, which in turn were obtained from the interactome repository KEGG. Nevertheless, this method presents some shortcomings that impair the estimated model; among them are the incompleteness of the information extracted from KEGG, the absence of rate constants, the usage of sub-optimal search algorithms and an unsatisfactory overfitting penalization. In this work, we propose a new methodology for identification of cell signaling pathways, based on the aforementioned method, with modifications on the cost function that aims to solve the unsatisfactory overfitting penalization. To this end, we use a cost function based on the marginal likelihood of a model producing the observed experimental data. We show how this new cost function automatically penalize complex models, since marginal likelihood approaches tend to select models with intermediate complexity. The new methodology was tested on artificial instances of model selection; for one of the experiments, we solved the model selection problem as a feature selection problem, walking on the space of solutions to get a glance of the surface induced by the defined cost function. With this work, we expect to contribute towards the solution of the cell signaling pathway identification problem, by providing the implementation of a cost function that can be used in a feature selection approach. |
| publishDate |
2021 |
| dc.date.none.fl_str_mv |
2021-02-05 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-08032021-211926/ |
| url |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-08032021-211926/ |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865491908527128576 |