Análise in silico de variantes não sinônimas para priorizar o estudo de genes candidatos para frequência cardíaca

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Bertoline, Letícia Machado Favery
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/5/5166/tde-30052023-164253/
Resumo: A frequência cardíaca é um fator de risco independente para doenças cardiovasculares que são responsáveis por 30% das mortes no país e no mundo. A herdabilidade da frequência cardíaca de repouso (RHR) é significativa, estimando-se a sua contribuição em 25% da variação do fenótipo. Estudos de associação ampla do genoma identificaram 64 loci associados a RHR, que juntos explicam apenas 2,5% da variação total do fenótipo. Portanto, há duas importantes lacunas de conhecimento a serem superadas: identificar genes candidatos que influenciam a regulação da frequência cardíaca e desenvolver estratégias eficientes para priorização daqueles que serão validados. Nosso grupo tem contribuído para a primeira identificando sistematicamente genes envolvidos com a frequência cardíaca por meio da estratégia de Forward Genetic Screening, onde os genes de camundongos são sistematicamente modificados para identificar aqueles que influenciam o RHR. Avaliamos nos últimos 5 anos cerca de 23% do genoma do camundongo e identificamos 129 candidatos associados à RHR. Somente 17 destes candidatos são conhecidos por influenciar o fenótipo, 47 mostraram evidências diretas de associação com o fenótipo, enquanto 65 estão em loci contendo mais de um gene candidato. Neste trabalho, propomos uma estratégia de priorização com base em abordagens computacionais in sílico. Avaliamos o efeito das alterações em genes/proteínas por meio da 1. conservação da sequência de nucleotídeos, aminoácidos e domínio proteico em três espécies (Mus musculus, Homo sapiens e Danio rerio), usando informações dos bancos de dados públicos Ensembl e Uniprot; e 2. na predição de danos na estrutura proteicas obtidas experimentalmente (proveniente do banco PDBe) ou por predição (provenientes do banco de dados do AlphaFold2 e do algoritmo Phyre²) e da ferramenta Missense3d. Finalmente, considerando proteínas selecionadas por ambas metodologias, utilizamos Simulação de Dinâmica Molecular (SDM) para acessar o impacto das trocas de aminoácidos em estruturas terciárias das proteínas julgadas afetadas que trariam danos funcionais. Em conjunto, a abordagem proposta permitiu priorizar 5 genes candidatos. Considerando os genes com associação direta com o fenótipo, selecionamos o Candidato 35, onde a alteração genética afeta aminoácido conservado na região do domínio e é predito de alterar a estrutura da proteína nas três espécies estudadas; e o Candidato 46 selecionado por ambas abordagens na espécie humana e em camundongo, já que este não apresenta ortólogo em no Danio rerio. A SDM das mutações em ambos candidatos demonstrou modificações conformacionais nas proteínas, sugerindo alterações em suas funções. Além disso, identificamos os candidatos 91, 99 e 106 dentre os genes em loci contendo mais de um candidato pelas duas abordagens em pelo menos duas espécies estudadas. As análises computacionais aplicadas criaram as bases para priorizar a caracterização de genes candidatos com base na predição de alterações com potencial de comprometer a função proteica conservada em pelo menos duas espécies diferentes. Se validada, esta abordagem será fundamental para aumentar a eficiência da validação in vivo dos genes candidatos para RHR
id USP_c3df3a49ce63414028ea34460ba9b508
oai_identifier_str oai:teses.usp.br:tde-30052023-164253
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Análise in silico de variantes não sinônimas para priorizar o estudo de genes candidatos para frequência cardíacaIn silico analysis of non-synonymous variants to prioritize the study of candidate genes for heart rateCandidate genes priorizationCardiovascular diseasesDano proteicoDoenças cardiovascularesFrequência cardíacaHeart rateMolecular dynamics simulationPotein structure predictionPredição de estrutura proteicaPriorização de genes candidatosProtein damageSimulação de dinâmica molecularA frequência cardíaca é um fator de risco independente para doenças cardiovasculares que são responsáveis por 30% das mortes no país e no mundo. A herdabilidade da frequência cardíaca de repouso (RHR) é significativa, estimando-se a sua contribuição em 25% da variação do fenótipo. Estudos de associação ampla do genoma identificaram 64 loci associados a RHR, que juntos explicam apenas 2,5% da variação total do fenótipo. Portanto, há duas importantes lacunas de conhecimento a serem superadas: identificar genes candidatos que influenciam a regulação da frequência cardíaca e desenvolver estratégias eficientes para priorização daqueles que serão validados. Nosso grupo tem contribuído para a primeira identificando sistematicamente genes envolvidos com a frequência cardíaca por meio da estratégia de Forward Genetic Screening, onde os genes de camundongos são sistematicamente modificados para identificar aqueles que influenciam o RHR. Avaliamos nos últimos 5 anos cerca de 23% do genoma do camundongo e identificamos 129 candidatos associados à RHR. Somente 17 destes candidatos são conhecidos por influenciar o fenótipo, 47 mostraram evidências diretas de associação com o fenótipo, enquanto 65 estão em loci contendo mais de um gene candidato. Neste trabalho, propomos uma estratégia de priorização com base em abordagens computacionais in sílico. Avaliamos o efeito das alterações em genes/proteínas por meio da 1. conservação da sequência de nucleotídeos, aminoácidos e domínio proteico em três espécies (Mus musculus, Homo sapiens e Danio rerio), usando informações dos bancos de dados públicos Ensembl e Uniprot; e 2. na predição de danos na estrutura proteicas obtidas experimentalmente (proveniente do banco PDBe) ou por predição (provenientes do banco de dados do AlphaFold2 e do algoritmo Phyre²) e da ferramenta Missense3d. Finalmente, considerando proteínas selecionadas por ambas metodologias, utilizamos Simulação de Dinâmica Molecular (SDM) para acessar o impacto das trocas de aminoácidos em estruturas terciárias das proteínas julgadas afetadas que trariam danos funcionais. Em conjunto, a abordagem proposta permitiu priorizar 5 genes candidatos. Considerando os genes com associação direta com o fenótipo, selecionamos o Candidato 35, onde a alteração genética afeta aminoácido conservado na região do domínio e é predito de alterar a estrutura da proteína nas três espécies estudadas; e o Candidato 46 selecionado por ambas abordagens na espécie humana e em camundongo, já que este não apresenta ortólogo em no Danio rerio. A SDM das mutações em ambos candidatos demonstrou modificações conformacionais nas proteínas, sugerindo alterações em suas funções. Além disso, identificamos os candidatos 91, 99 e 106 dentre os genes em loci contendo mais de um candidato pelas duas abordagens em pelo menos duas espécies estudadas. As análises computacionais aplicadas criaram as bases para priorizar a caracterização de genes candidatos com base na predição de alterações com potencial de comprometer a função proteica conservada em pelo menos duas espécies diferentes. Se validada, esta abordagem será fundamental para aumentar a eficiência da validação in vivo dos genes candidatos para RHRHeart rate is an independent risk factor for cardiovascular diseases that are responsible for 30% of deaths in the country and in the world. The heritability of resting heart rate (RHR) is significant, estimating its contribution to 25% of the phenotype variation. Genome-wide association studies have identified 64 RHR-associated loci, which together explain only 2.5% of the total phenotype variation. Therefore, there are two important knowledge gaps to be overcome: identifying candidate genes that influence heart rate regulation and developing efficient strategies for prioritizing those that will be validated. Our group has contributed to the first by identifying systematically genes involved in heart rate through the Forward Genetic Screening strategy, where mouse genes are systematically modified to identify those that influence the RHR. In the last 5 years, we evaluated about 23% of the mouse genome and identified 129 candidates associated with RHR. Only 17 of these candidates are known to influence the phenotype, 47 showed direct evidence of association with the phenotype, while 65 are at loci containing more than one candidate gene. In this work, we propose a prioritization strategy based on in silico computational approaches. We evaluated the effect of gene/protein alterations through 1. conservation of nucleotide, amino acid and protein domain sequence in three species (Mus musculus, Homo sapiens and Danio rerio), using information from public databases Ensembl and Uniprot; and 2. in the prediction of damage to protein structure obtained experimentally (from the PDBe database) or by prediction (from the AlphaFold2 database and the Phyre² algorithm) and the Missense3d tool. Finally, considering proteins selected by both methodologies, we used Molecular Dynamics Simulation (MDS) to assess the impact of amino acid changes on tertiary structures of proteins judged affected that would bring functional damage. Together, the proposed approach allowed prioritizing 5 candidate genes. Considering the genes with direct association with the phenotype, we selected Candidate 35, where the genetic alteration affects conserved amino acid in the domain region and is predicted to alter the structure of the protein in the three studied species; and Candidate 46 selected by both approaches in humans and in mice, since it does not have an ortholog in in Danio rerio. The MDS of the mutations in both candidates showed conformational changes in the proteins, suggesting alterations in their functions. Furthermore, we identified candidates 91, 99 and 106 among genes at loci containing more than one candidate by both approaches in at least two species studied. The applied computational analyzes created the bases to prioritize the characterization of candidate genes based on the prediction of changes with the potential to compromise the conserved protein function in at least two different species. If validated, this approach will be essential to increase the efficiency of in vivo validation of candidate genes for RHRBiblioteca Digitais de Teses e Dissertações da USPKrieger, Jose EduardoBertoline, Letícia Machado Favery2023-02-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/5/5166/tde-30052023-164253/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-06-06T18:03:39Zoai:teses.usp.br:tde-30052023-164253Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-06-06T18:03:39Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Análise in silico de variantes não sinônimas para priorizar o estudo de genes candidatos para frequência cardíaca
In silico analysis of non-synonymous variants to prioritize the study of candidate genes for heart rate
title Análise in silico de variantes não sinônimas para priorizar o estudo de genes candidatos para frequência cardíaca
spellingShingle Análise in silico de variantes não sinônimas para priorizar o estudo de genes candidatos para frequência cardíaca
Bertoline, Letícia Machado Favery
Candidate genes priorization
Cardiovascular diseases
Dano proteico
Doenças cardiovasculares
Frequência cardíaca
Heart rate
Molecular dynamics simulation
Potein structure prediction
Predição de estrutura proteica
Priorização de genes candidatos
Protein damage
Simulação de dinâmica molecular
title_short Análise in silico de variantes não sinônimas para priorizar o estudo de genes candidatos para frequência cardíaca
title_full Análise in silico de variantes não sinônimas para priorizar o estudo de genes candidatos para frequência cardíaca
title_fullStr Análise in silico de variantes não sinônimas para priorizar o estudo de genes candidatos para frequência cardíaca
title_full_unstemmed Análise in silico de variantes não sinônimas para priorizar o estudo de genes candidatos para frequência cardíaca
title_sort Análise in silico de variantes não sinônimas para priorizar o estudo de genes candidatos para frequência cardíaca
author Bertoline, Letícia Machado Favery
author_facet Bertoline, Letícia Machado Favery
author_role author
dc.contributor.none.fl_str_mv Krieger, Jose Eduardo
dc.contributor.author.fl_str_mv Bertoline, Letícia Machado Favery
dc.subject.por.fl_str_mv Candidate genes priorization
Cardiovascular diseases
Dano proteico
Doenças cardiovasculares
Frequência cardíaca
Heart rate
Molecular dynamics simulation
Potein structure prediction
Predição de estrutura proteica
Priorização de genes candidatos
Protein damage
Simulação de dinâmica molecular
topic Candidate genes priorization
Cardiovascular diseases
Dano proteico
Doenças cardiovasculares
Frequência cardíaca
Heart rate
Molecular dynamics simulation
Potein structure prediction
Predição de estrutura proteica
Priorização de genes candidatos
Protein damage
Simulação de dinâmica molecular
description A frequência cardíaca é um fator de risco independente para doenças cardiovasculares que são responsáveis por 30% das mortes no país e no mundo. A herdabilidade da frequência cardíaca de repouso (RHR) é significativa, estimando-se a sua contribuição em 25% da variação do fenótipo. Estudos de associação ampla do genoma identificaram 64 loci associados a RHR, que juntos explicam apenas 2,5% da variação total do fenótipo. Portanto, há duas importantes lacunas de conhecimento a serem superadas: identificar genes candidatos que influenciam a regulação da frequência cardíaca e desenvolver estratégias eficientes para priorização daqueles que serão validados. Nosso grupo tem contribuído para a primeira identificando sistematicamente genes envolvidos com a frequência cardíaca por meio da estratégia de Forward Genetic Screening, onde os genes de camundongos são sistematicamente modificados para identificar aqueles que influenciam o RHR. Avaliamos nos últimos 5 anos cerca de 23% do genoma do camundongo e identificamos 129 candidatos associados à RHR. Somente 17 destes candidatos são conhecidos por influenciar o fenótipo, 47 mostraram evidências diretas de associação com o fenótipo, enquanto 65 estão em loci contendo mais de um gene candidato. Neste trabalho, propomos uma estratégia de priorização com base em abordagens computacionais in sílico. Avaliamos o efeito das alterações em genes/proteínas por meio da 1. conservação da sequência de nucleotídeos, aminoácidos e domínio proteico em três espécies (Mus musculus, Homo sapiens e Danio rerio), usando informações dos bancos de dados públicos Ensembl e Uniprot; e 2. na predição de danos na estrutura proteicas obtidas experimentalmente (proveniente do banco PDBe) ou por predição (provenientes do banco de dados do AlphaFold2 e do algoritmo Phyre²) e da ferramenta Missense3d. Finalmente, considerando proteínas selecionadas por ambas metodologias, utilizamos Simulação de Dinâmica Molecular (SDM) para acessar o impacto das trocas de aminoácidos em estruturas terciárias das proteínas julgadas afetadas que trariam danos funcionais. Em conjunto, a abordagem proposta permitiu priorizar 5 genes candidatos. Considerando os genes com associação direta com o fenótipo, selecionamos o Candidato 35, onde a alteração genética afeta aminoácido conservado na região do domínio e é predito de alterar a estrutura da proteína nas três espécies estudadas; e o Candidato 46 selecionado por ambas abordagens na espécie humana e em camundongo, já que este não apresenta ortólogo em no Danio rerio. A SDM das mutações em ambos candidatos demonstrou modificações conformacionais nas proteínas, sugerindo alterações em suas funções. Além disso, identificamos os candidatos 91, 99 e 106 dentre os genes em loci contendo mais de um candidato pelas duas abordagens em pelo menos duas espécies estudadas. As análises computacionais aplicadas criaram as bases para priorizar a caracterização de genes candidatos com base na predição de alterações com potencial de comprometer a função proteica conservada em pelo menos duas espécies diferentes. Se validada, esta abordagem será fundamental para aumentar a eficiência da validação in vivo dos genes candidatos para RHR
publishDate 2023
dc.date.none.fl_str_mv 2023-02-09
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/5/5166/tde-30052023-164253/
url https://www.teses.usp.br/teses/disponiveis/5/5166/tde-30052023-164253/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815258593034764288