Desenvolvimento e validação de um score de desregulação das vias de reparo de DNA na predição do prognóstico em diferentes tipos de câncer

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Restrepo, Jeffersson Leandro Jimenez
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/9/9142/tde-01112023-144151/
Resumo: As técnicas de aprendizado de máquina têm se destacado na identificação de padrões em dados de RNA-seq, particularmente no reconhecimento de padrões de expressão gênica associados à sobrevivência em casos de câncer. No entanto, um desafio persistente é a validação destes padrões em novos conjuntos de amostras, visto que a acurácia frequentemente diminui. A razão primária para tal é que muitos desses modelos se baseiam em estruturas matemáticas, sem um embasamento biológico. Para contornar esta limitação, focamos em processos biológicos naturalmente associados com a sobrevida dos pacientes com câncer. Estudos recentes apontam para uma associação entre genes de reparo de DNA e a sobrevivência global em vários tipos de câncer. Com base nisso, nosso trabalho inicial visou criar e validar um score que levasse em conta a expressão destes genes em 32 coortes de pacientes com tumores primários do banco de dados TCGA. Em consequência, a estratégia simples de conformação de 7 scores de desregulação, composto com 10 genes de reparo ao DNA mostrou uma associação com a sobrevida em 31 coortes diferentes, englobando mais de 10,000 pacientes. Além disso, foi possível validar um destes score em dados scRNA-seq de células tumorais de amostras de pacientes com câncer de ovário. Os modelos de aprendizado de máquina na análise de sobrevivência mostraram-se bem ajustados aos conjuntos dados de expressão onde foram gerados. Identificamos nos dois algoritmos surv.blackboost e surv.ranger, junto ao método de composição, as melhores estratégias para a análise de sobrevivência. Em síntese, os scores de desregulação utilizando genes envolvidos nos mecanismos de reparo ao DNA estão associados com a sobrevida global em diferentes tipos de câncer enquanto os métodos de aprendizados tem um overfitting ao conjunto de genes analisados.
id USP_6b542eb793469451161d93a202adbd61
oai_identifier_str oai:teses.usp.br:tde-01112023-144151
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Desenvolvimento e validação de um score de desregulação das vias de reparo de DNA na predição do prognóstico em diferentes tipos de câncerDevelopment and validation of a DNA repair pathway deregulation score in predicting prognosis in different types of cancerCancerCâncerExpressão gênicaGene expressionMachine learningMachine learningRNA-seqRNA-seqSobrevidaSurvivalAs técnicas de aprendizado de máquina têm se destacado na identificação de padrões em dados de RNA-seq, particularmente no reconhecimento de padrões de expressão gênica associados à sobrevivência em casos de câncer. No entanto, um desafio persistente é a validação destes padrões em novos conjuntos de amostras, visto que a acurácia frequentemente diminui. A razão primária para tal é que muitos desses modelos se baseiam em estruturas matemáticas, sem um embasamento biológico. Para contornar esta limitação, focamos em processos biológicos naturalmente associados com a sobrevida dos pacientes com câncer. Estudos recentes apontam para uma associação entre genes de reparo de DNA e a sobrevivência global em vários tipos de câncer. Com base nisso, nosso trabalho inicial visou criar e validar um score que levasse em conta a expressão destes genes em 32 coortes de pacientes com tumores primários do banco de dados TCGA. Em consequência, a estratégia simples de conformação de 7 scores de desregulação, composto com 10 genes de reparo ao DNA mostrou uma associação com a sobrevida em 31 coortes diferentes, englobando mais de 10,000 pacientes. Além disso, foi possível validar um destes score em dados scRNA-seq de células tumorais de amostras de pacientes com câncer de ovário. Os modelos de aprendizado de máquina na análise de sobrevivência mostraram-se bem ajustados aos conjuntos dados de expressão onde foram gerados. Identificamos nos dois algoritmos surv.blackboost e surv.ranger, junto ao método de composição, as melhores estratégias para a análise de sobrevivência. Em síntese, os scores de desregulação utilizando genes envolvidos nos mecanismos de reparo ao DNA estão associados com a sobrevida global em diferentes tipos de câncer enquanto os métodos de aprendizados tem um overfitting ao conjunto de genes analisados.Machine learning techniques have been prominent in identifying patterns in RNA-seq data, particularly in recognizing gene expression patterns associated with survival in cancer cases. However, a persistent challenge is the validation of these patterns in new sample sets, as accuracy often decreases. The primary reason for this is that many of these models rely on mathematical structures without a biological meaning. To address this limitation, we focused on biological processes naturally associated with the survival of cancer patients. Recent studies point to an association between DNA repair genes and overall survival in various types of cancer. Based on this, our initial work aimed to create and validate a score that took into account the expression of these genes in 32 cohorts of patients with primary tumors from the TCGA database. As a result, the simple strategy of conforming 7 deregulation scores, composed of 10 DNA repair genes, showed an association with survival in 31 different cohorts, encompassing over 10,000 patients. Furthermore, it was possible to validate one of these scores in scRNA-seq data from tumor cells from ovarian cancer patient samples. Machine learning models in survival analysis were well-suited to the expression data sets where they were generated. We identified in the two algorithms, surv.blackboost and surv.ranger, along with the composition method, the best strategies for survival analysis. In summary, the deregulation scores using genes involved in DNA repair mechanisms are associated with overall survival in different types of cancer, while learning methods are highly tailored to the algorithm and the set of genes analyzed.Biblioteca Digitais de Teses e Dissertações da USPNakaya, Helder Takashi ImotoRestrepo, Jeffersson Leandro Jimenez2023-07-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/9/9142/tde-01112023-144151/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-12-08T19:28:02Zoai:teses.usp.br:tde-01112023-144151Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-12-08T19:28:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Desenvolvimento e validação de um score de desregulação das vias de reparo de DNA na predição do prognóstico em diferentes tipos de câncer
Development and validation of a DNA repair pathway deregulation score in predicting prognosis in different types of cancer
title Desenvolvimento e validação de um score de desregulação das vias de reparo de DNA na predição do prognóstico em diferentes tipos de câncer
spellingShingle Desenvolvimento e validação de um score de desregulação das vias de reparo de DNA na predição do prognóstico em diferentes tipos de câncer
Restrepo, Jeffersson Leandro Jimenez
Cancer
Câncer
Expressão gênica
Gene expression
Machine learning
Machine learning
RNA-seq
RNA-seq
Sobrevida
Survival
title_short Desenvolvimento e validação de um score de desregulação das vias de reparo de DNA na predição do prognóstico em diferentes tipos de câncer
title_full Desenvolvimento e validação de um score de desregulação das vias de reparo de DNA na predição do prognóstico em diferentes tipos de câncer
title_fullStr Desenvolvimento e validação de um score de desregulação das vias de reparo de DNA na predição do prognóstico em diferentes tipos de câncer
title_full_unstemmed Desenvolvimento e validação de um score de desregulação das vias de reparo de DNA na predição do prognóstico em diferentes tipos de câncer
title_sort Desenvolvimento e validação de um score de desregulação das vias de reparo de DNA na predição do prognóstico em diferentes tipos de câncer
author Restrepo, Jeffersson Leandro Jimenez
author_facet Restrepo, Jeffersson Leandro Jimenez
author_role author
dc.contributor.none.fl_str_mv Nakaya, Helder Takashi Imoto
dc.contributor.author.fl_str_mv Restrepo, Jeffersson Leandro Jimenez
dc.subject.por.fl_str_mv Cancer
Câncer
Expressão gênica
Gene expression
Machine learning
Machine learning
RNA-seq
RNA-seq
Sobrevida
Survival
topic Cancer
Câncer
Expressão gênica
Gene expression
Machine learning
Machine learning
RNA-seq
RNA-seq
Sobrevida
Survival
description As técnicas de aprendizado de máquina têm se destacado na identificação de padrões em dados de RNA-seq, particularmente no reconhecimento de padrões de expressão gênica associados à sobrevivência em casos de câncer. No entanto, um desafio persistente é a validação destes padrões em novos conjuntos de amostras, visto que a acurácia frequentemente diminui. A razão primária para tal é que muitos desses modelos se baseiam em estruturas matemáticas, sem um embasamento biológico. Para contornar esta limitação, focamos em processos biológicos naturalmente associados com a sobrevida dos pacientes com câncer. Estudos recentes apontam para uma associação entre genes de reparo de DNA e a sobrevivência global em vários tipos de câncer. Com base nisso, nosso trabalho inicial visou criar e validar um score que levasse em conta a expressão destes genes em 32 coortes de pacientes com tumores primários do banco de dados TCGA. Em consequência, a estratégia simples de conformação de 7 scores de desregulação, composto com 10 genes de reparo ao DNA mostrou uma associação com a sobrevida em 31 coortes diferentes, englobando mais de 10,000 pacientes. Além disso, foi possível validar um destes score em dados scRNA-seq de células tumorais de amostras de pacientes com câncer de ovário. Os modelos de aprendizado de máquina na análise de sobrevivência mostraram-se bem ajustados aos conjuntos dados de expressão onde foram gerados. Identificamos nos dois algoritmos surv.blackboost e surv.ranger, junto ao método de composição, as melhores estratégias para a análise de sobrevivência. Em síntese, os scores de desregulação utilizando genes envolvidos nos mecanismos de reparo ao DNA estão associados com a sobrevida global em diferentes tipos de câncer enquanto os métodos de aprendizados tem um overfitting ao conjunto de genes analisados.
publishDate 2023
dc.date.none.fl_str_mv 2023-07-05
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/9/9142/tde-01112023-144151/
url https://www.teses.usp.br/teses/disponiveis/9/9142/tde-01112023-144151/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257796939087872