Seleção de genes para a predição da sobrevida em pacientes com câncer de mama
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/55/55134/tde-12072024-113349/ |
Resumo: | Milhares de pessoas sofrem com o câncer, tornando-a uma das doenças que mais matam pessoas ao redor do mundo. Esta doença se carateriza por modificações na estrutura do DNA, o que impacta na produção descontrolada das células. Neste estudo abordamos uma predição da sobrevida para pacientes com câncer de mama nos estágios I, II e III, levando em consideração informações clinicas e genéticas. Para isto, o método de Cox, uma regressão capaz de estimar a função de risco, é usada para predizer a sobrevida dos pacientes. Devido a alta dimensionalidade da informação genética e as limitações do modelo Cox, são abordados métodos para a redução dos dados. Abordamos três maneiras para a redução de dimensionalidade, consistindo na penalização lasso na regressão de Cox, seleção por similaridade na expressão genética, com o algoritmo de agrupamento K-means, e a redução da dimensionalidade por meio da rede neural AutoEncoder, baseado nos grupos de similaridade. A partir dos experimentos, constatamos que a informação genética colabora para a criação de melhores preditores, em que as três abordagens de redução da dimensionalidade, apresentaram um melhor C-index, quando comparado ao método abordando apenas informações clinicas. Ao decorrer desta pesquisa, também verificamos que o material genético, além de aumentar o risco da sobrevida em alguns casos, há ocorrência do efeito de proteção. Ao final, propomos baseado nos resultados obtidos, uma possível evolução para a criação de um método capaz de otimizar o erro na predição da sobrevida, interpretar suas decisões e lidar com a alta dimensionalidade dos dados. |
| id |
USP_25a79776dd3df30c07875baa3c27fe45 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-12072024-113349 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Seleção de genes para a predição da sobrevida em pacientes com câncer de mamaGene selection for predicting survival in breast cancer patientsAnálise da sobrevidaCox modelDimensionality reductionExpressão gênicaGene expressionModelo de CoxRedução de dimensionalidadeSurvival analysisMilhares de pessoas sofrem com o câncer, tornando-a uma das doenças que mais matam pessoas ao redor do mundo. Esta doença se carateriza por modificações na estrutura do DNA, o que impacta na produção descontrolada das células. Neste estudo abordamos uma predição da sobrevida para pacientes com câncer de mama nos estágios I, II e III, levando em consideração informações clinicas e genéticas. Para isto, o método de Cox, uma regressão capaz de estimar a função de risco, é usada para predizer a sobrevida dos pacientes. Devido a alta dimensionalidade da informação genética e as limitações do modelo Cox, são abordados métodos para a redução dos dados. Abordamos três maneiras para a redução de dimensionalidade, consistindo na penalização lasso na regressão de Cox, seleção por similaridade na expressão genética, com o algoritmo de agrupamento K-means, e a redução da dimensionalidade por meio da rede neural AutoEncoder, baseado nos grupos de similaridade. A partir dos experimentos, constatamos que a informação genética colabora para a criação de melhores preditores, em que as três abordagens de redução da dimensionalidade, apresentaram um melhor C-index, quando comparado ao método abordando apenas informações clinicas. Ao decorrer desta pesquisa, também verificamos que o material genético, além de aumentar o risco da sobrevida em alguns casos, há ocorrência do efeito de proteção. Ao final, propomos baseado nos resultados obtidos, uma possível evolução para a criação de um método capaz de otimizar o erro na predição da sobrevida, interpretar suas decisões e lidar com a alta dimensionalidade dos dados.Thousands of people suffer from cancer, making it one of the most deadly diseases worldwide. This disease is characterized by changes in the DNA structure, which impacts the uncontrolled production of cells. In this study, we approach a survival prediction for patients with breast cancer in stages I, II, and III, considering clinical and genetic information. For this, the Cox method, a regression capable of estimating the risk function, is used to predict patient survival. Due to the high dimensionality of the genetic information and the limitations of the Cox model, methods for data reduction are used. We approach three ways to reduce dimensionality: lasso penalty in Cox regression, selection for similarity in gene expression with the K-means clustering algorithm, and dimensionality reduction through the AutoEncoder neural network. From the experiments, we found that genetic information contributes to the creation of better predictors. The three approaches to dimensionality reduction presented a better C-index when compared to the method that addressed only clinical information. In the course of this research, we verified that the genetic material increases the risk of survival in some cases, but we found it also has a protective effect. Finally, based on the results, we propose a possible evolution towards creating a method capable of optimizing the error in survival prediction, interpreting their decisions, and dealing with the high dimensionality of the data.Biblioteca Digitais de Teses e Dissertações da USPCúri, MarianaSilva, Israel Tojal daSantos, Khennedy Bacule dos2024-05-10info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-12072024-113349/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-07-12T14:47:02Zoai:teses.usp.br:tde-12072024-113349Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-07-12T14:47:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Seleção de genes para a predição da sobrevida em pacientes com câncer de mama Gene selection for predicting survival in breast cancer patients |
| title |
Seleção de genes para a predição da sobrevida em pacientes com câncer de mama |
| spellingShingle |
Seleção de genes para a predição da sobrevida em pacientes com câncer de mama Santos, Khennedy Bacule dos Análise da sobrevida Cox model Dimensionality reduction Expressão gênica Gene expression Modelo de Cox Redução de dimensionalidade Survival analysis |
| title_short |
Seleção de genes para a predição da sobrevida em pacientes com câncer de mama |
| title_full |
Seleção de genes para a predição da sobrevida em pacientes com câncer de mama |
| title_fullStr |
Seleção de genes para a predição da sobrevida em pacientes com câncer de mama |
| title_full_unstemmed |
Seleção de genes para a predição da sobrevida em pacientes com câncer de mama |
| title_sort |
Seleção de genes para a predição da sobrevida em pacientes com câncer de mama |
| author |
Santos, Khennedy Bacule dos |
| author_facet |
Santos, Khennedy Bacule dos |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Cúri, Mariana Silva, Israel Tojal da |
| dc.contributor.author.fl_str_mv |
Santos, Khennedy Bacule dos |
| dc.subject.por.fl_str_mv |
Análise da sobrevida Cox model Dimensionality reduction Expressão gênica Gene expression Modelo de Cox Redução de dimensionalidade Survival analysis |
| topic |
Análise da sobrevida Cox model Dimensionality reduction Expressão gênica Gene expression Modelo de Cox Redução de dimensionalidade Survival analysis |
| description |
Milhares de pessoas sofrem com o câncer, tornando-a uma das doenças que mais matam pessoas ao redor do mundo. Esta doença se carateriza por modificações na estrutura do DNA, o que impacta na produção descontrolada das células. Neste estudo abordamos uma predição da sobrevida para pacientes com câncer de mama nos estágios I, II e III, levando em consideração informações clinicas e genéticas. Para isto, o método de Cox, uma regressão capaz de estimar a função de risco, é usada para predizer a sobrevida dos pacientes. Devido a alta dimensionalidade da informação genética e as limitações do modelo Cox, são abordados métodos para a redução dos dados. Abordamos três maneiras para a redução de dimensionalidade, consistindo na penalização lasso na regressão de Cox, seleção por similaridade na expressão genética, com o algoritmo de agrupamento K-means, e a redução da dimensionalidade por meio da rede neural AutoEncoder, baseado nos grupos de similaridade. A partir dos experimentos, constatamos que a informação genética colabora para a criação de melhores preditores, em que as três abordagens de redução da dimensionalidade, apresentaram um melhor C-index, quando comparado ao método abordando apenas informações clinicas. Ao decorrer desta pesquisa, também verificamos que o material genético, além de aumentar o risco da sobrevida em alguns casos, há ocorrência do efeito de proteção. Ao final, propomos baseado nos resultados obtidos, uma possível evolução para a criação de um método capaz de otimizar o erro na predição da sobrevida, interpretar suas decisões e lidar com a alta dimensionalidade dos dados. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-05-10 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-12072024-113349/ |
| url |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-12072024-113349/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1815258062744715264 |