Construção e validação computacional de um conjunto de marcadores multi-InDels autossômicos para identificação humana

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Ramos, Livia Carla [UNESP]
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/11449/315231
Resumo: Os marcadores genéticos STRs (do inglês, short tandem repeats) são considerados padrão-ouro para as análises forenses. Apesar de amplamente utilizados, os STRs apresentam limitações relevantes especialmente em casos complexos, tais como amostras degradadas ou compostas por múltiplos perfis genéticos. Dessa forma, outros marcadores têm despertado interesse na genética forense, com o objetivo de serem complementares aos STRs e superar suas limitações. Os polimorfismos de inserção/deleção, ou InDels, estão amplamente presentes no genoma humano e reúnem algumas características importantes e vantajosas. Eles podem ser amplificados por reação em cadeia da polimerase (PCR) e detectados por eletroforese capilar (CE), tecnologias amplamente presentes nos laboratórios forenses, e podem ser organizados em sistema multiplex. Além de apresentarem baixa taxa de mutação, favorável para análises de vínculo genético e da possibilidade de gerar produtos de amplificação (amplicons) menores, facilitando a análise de amostras degradadas. Ademais, os InDels não produzem artefatos de amplificação denominados stutters, sendo favorável para casos contendo misturas de perfis genéticos de dois ou mais indivíduos. Entretanto, a maioria dos InDels são bi-alélicos, o que reduz seu poder de discriminação. Para contornar essa limitação, novos marcadores genéticos, como os multi-InDels, têm ganhado destaque, pois, preservam as características individuais dos InDels e ainda proporcionam um aumento do polimorfismo. Os marcadores multi-InDels são classificados de forma generalizada como microhaplótipos, constituídos por dois ou mais loci InDels, localizados em um segmento curto de DNA. Atualmente, há painéis de multi-InDels propostos na literatura, todos validados apenas em populações asiáticas. O objetivo deste trabalho foi construir e validar, por meio de abordagens computacionais, um novo conjunto de marcadores multi-InDels autossômicos, que seja capaz identificar os indivíduos da população brasileira e de outras populações do mundo. Previamente, nós avaliamos três conjuntos anteriormente propostos e validados em populações asiáticas, com o objetivo de verificar a sua aplicabilidade em indivíduos brasileiros. Foram utilizados dados públicos de sequenciamento de alta cobertura de genoma completo do projeto 1000 Genomes, que compreende 26 populações mundiais, e a amostras de brasileiros (Projeto Saúde, Bem-estar e Envelhecimento - SABE), tanto para avaliar os painéis existentes quanto para selecionar novos marcadores. Concluiu-se que a maioria dos marcadores anteriormente propostos é informativa para indivíduos brasileiros, uma vez que apresentam mais de três haplótipos frequentes com diferentes tamanhos. Entretanto, 64,8% destes marcadores são propensos a erros de amplificação e/ou sequenciamento, devido à presença de regiões repetitivas, de baixa complexidade, homopolimérica ou STRs. Desse modo, neste trabalho, selecionamos e propusemos um novo conjunto de marcadores multi-InDels para identificação humana, organizado em sistema multiplex e baseado na plataforma de CE, composto por 28 marcadores, além de dois marcadores para determinação do sexo. O painel apresentou alto polimorfismo em cinco superpopulações, bem como em indivíduos brasileiros. A probabilidade de match combinada (PMC) variou de 5,66 x 10-20 a 2,66 x 10-17, enquanto o poder de exclusão combinado (PEC) variou de 0,99958 a 0,99998. Além disso, 94,4% dos amplicons gerados foram menores que 250 pares de base (pb). Portanto, o painel proposto pode ser uma ferramenta complementar útil para a identificação humana, aplicável para população brasileira e em outras populações ao redor do mundo, especialmente em casos complexos.
id UNSP_ea9336fc82590ff7aa34c080c3b58c39
oai_identifier_str oai:repositorio.unesp.br:11449/315231
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str
spelling Construção e validação computacional de um conjunto de marcadores multi-InDels autossômicos para identificação humanaComputational Construction and Validation of an Autosomal Multi-InDel Marker Set for Human IdentificationGenética HumanaBiologia forenseMarcadores genéticosMicrohaplótipoMulti-InDelMicrohaplotypeOs marcadores genéticos STRs (do inglês, short tandem repeats) são considerados padrão-ouro para as análises forenses. Apesar de amplamente utilizados, os STRs apresentam limitações relevantes especialmente em casos complexos, tais como amostras degradadas ou compostas por múltiplos perfis genéticos. Dessa forma, outros marcadores têm despertado interesse na genética forense, com o objetivo de serem complementares aos STRs e superar suas limitações. Os polimorfismos de inserção/deleção, ou InDels, estão amplamente presentes no genoma humano e reúnem algumas características importantes e vantajosas. Eles podem ser amplificados por reação em cadeia da polimerase (PCR) e detectados por eletroforese capilar (CE), tecnologias amplamente presentes nos laboratórios forenses, e podem ser organizados em sistema multiplex. Além de apresentarem baixa taxa de mutação, favorável para análises de vínculo genético e da possibilidade de gerar produtos de amplificação (amplicons) menores, facilitando a análise de amostras degradadas. Ademais, os InDels não produzem artefatos de amplificação denominados stutters, sendo favorável para casos contendo misturas de perfis genéticos de dois ou mais indivíduos. Entretanto, a maioria dos InDels são bi-alélicos, o que reduz seu poder de discriminação. Para contornar essa limitação, novos marcadores genéticos, como os multi-InDels, têm ganhado destaque, pois, preservam as características individuais dos InDels e ainda proporcionam um aumento do polimorfismo. Os marcadores multi-InDels são classificados de forma generalizada como microhaplótipos, constituídos por dois ou mais loci InDels, localizados em um segmento curto de DNA. Atualmente, há painéis de multi-InDels propostos na literatura, todos validados apenas em populações asiáticas. O objetivo deste trabalho foi construir e validar, por meio de abordagens computacionais, um novo conjunto de marcadores multi-InDels autossômicos, que seja capaz identificar os indivíduos da população brasileira e de outras populações do mundo. Previamente, nós avaliamos três conjuntos anteriormente propostos e validados em populações asiáticas, com o objetivo de verificar a sua aplicabilidade em indivíduos brasileiros. Foram utilizados dados públicos de sequenciamento de alta cobertura de genoma completo do projeto 1000 Genomes, que compreende 26 populações mundiais, e a amostras de brasileiros (Projeto Saúde, Bem-estar e Envelhecimento - SABE), tanto para avaliar os painéis existentes quanto para selecionar novos marcadores. Concluiu-se que a maioria dos marcadores anteriormente propostos é informativa para indivíduos brasileiros, uma vez que apresentam mais de três haplótipos frequentes com diferentes tamanhos. Entretanto, 64,8% destes marcadores são propensos a erros de amplificação e/ou sequenciamento, devido à presença de regiões repetitivas, de baixa complexidade, homopolimérica ou STRs. Desse modo, neste trabalho, selecionamos e propusemos um novo conjunto de marcadores multi-InDels para identificação humana, organizado em sistema multiplex e baseado na plataforma de CE, composto por 28 marcadores, além de dois marcadores para determinação do sexo. O painel apresentou alto polimorfismo em cinco superpopulações, bem como em indivíduos brasileiros. A probabilidade de match combinada (PMC) variou de 5,66 x 10-20 a 2,66 x 10-17, enquanto o poder de exclusão combinado (PEC) variou de 0,99958 a 0,99998. Além disso, 94,4% dos amplicons gerados foram menores que 250 pares de base (pb). Portanto, o painel proposto pode ser uma ferramenta complementar útil para a identificação humana, aplicável para população brasileira e em outras populações ao redor do mundo, especialmente em casos complexos.Short tandem repeat (STR) markers are considered the gold standard in forensic genetics. Although widely used, STRs present relevant limitations, especially in complex cases involving degraded samples or mixtures of multiple genetic profiles. Therefore, alternative genetic markers have gained interest in forensic applications, aiming to complement STRs and overcome their limitations. Insertion/deletion polymorphisms (InDels) are widely distributed throughout the human genome and exhibit several advantageous characteristics. They can be amplified by polymerase chain reaction (PCR) and detected by capillary electrophoresis (CE), both techniques routinely available in forensic laboratories, and can be organized into multiplex systems. InDels also display low mutation rates, which is favorable for kinship analyses, and can generate short amplification products (amplicons), facilitating the analysis of degraded samples. Moreover, InDels do not produce stutter artifacts, which is advantageous in the analysis of mixtures containing DNA from two or more contributors. However, most InDels are biallelic, which limits their discrimination power. To overcome this limitation, new genetic markers such as multi-InDels have gained prominence, as they preserve the individual characteristics of InDels while providing increased polymorphism. Multi-InDels are generally classified as microhaplotypes, consisting of two or more closely linked InDel loci within a short DNA segment. Currently, all multi-InDel panels described in the literature have been validated only in Asian populations. The aim of this study was to develop and validate, through computational approaches, a novel set of autosomal multi-InDel markers capable of distinguishing individuals from the Brazilian population as well as from other global populations. Previously, we evaluated three panels proposed and validated in Asian populations to assess their applicability to individuals from Brazil. Public high-coverage whole-genome sequencing data from the 1000 Genomes Project, which encompasses 26 worldwide populations, and from Brazilian individuals (Projeto Saúde, Bem-estar e Envelhecimento - SABE) were utilized to both evaluate existing panels and select new markers. Our results showed that most previously proposed markers were informative for the Brazilian population, as they presented more than three frequent haplotypes of different lengths. However, 64.8% of these markers were prone to amplification and/or sequencing errors due to the presence of repetitive, low-complexity, homopolymeric, or STR-like regions. Thus, in this study, we propose a new multiplex CE-based panel composed of 28 autosomal multi-InDel markers and two sex-determination markers. The panel exhibited high polymorphism across five superpopulations, as well as in Brazilian individuals. The combined match probability (CMP) ranged from 5.66 x 10⁻²⁰ to 2.66 x 10⁻¹⁷, while the combined power of exclusion (CPE) ranged from 0.99958 to 0.99998. Additionally, 94.4% of the generated amplicons were shorter than 250 base pairs (bp). Therefore, the proposed panel represents a useful complementary tool for human identification, suitable for the Brazilian population and globally, particularly in complex forensic cases.Universidade Estadual Paulista (Unesp)Castelli, Erick da CruzUniversidade Estadual Paulista (Unesp)Ramos, Livia Carla [UNESP]2025-11-17T12:48:13Z2025-09-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfRAMOS, Livia Carla Ramos. Construção e validação computacional de um conjunto de marcadores multi-InDels autossômicos para identificação humana. 2025. Tese (Doutorado em Genética) – Instituto de Biociências, Universidade Estadual Paulista (UNESP), Botucatu, 2025.https://hdl.handle.net/11449/31523133004064026P904456087567376390000-0003-1385-6644porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2025-11-18T05:01:18Zoai:repositorio.unesp.br:11449/315231Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestrepositoriounesp@unesp.bropendoar:29462025-11-18T05:01:18Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Construção e validação computacional de um conjunto de marcadores multi-InDels autossômicos para identificação humana
Computational Construction and Validation of an Autosomal Multi-InDel Marker Set for Human Identification
title Construção e validação computacional de um conjunto de marcadores multi-InDels autossômicos para identificação humana
spellingShingle Construção e validação computacional de um conjunto de marcadores multi-InDels autossômicos para identificação humana
Ramos, Livia Carla [UNESP]
Genética Humana
Biologia forense
Marcadores genéticos
Microhaplótipo
Multi-InDel
Microhaplotype
title_short Construção e validação computacional de um conjunto de marcadores multi-InDels autossômicos para identificação humana
title_full Construção e validação computacional de um conjunto de marcadores multi-InDels autossômicos para identificação humana
title_fullStr Construção e validação computacional de um conjunto de marcadores multi-InDels autossômicos para identificação humana
title_full_unstemmed Construção e validação computacional de um conjunto de marcadores multi-InDels autossômicos para identificação humana
title_sort Construção e validação computacional de um conjunto de marcadores multi-InDels autossômicos para identificação humana
author Ramos, Livia Carla [UNESP]
author_facet Ramos, Livia Carla [UNESP]
author_role author
dc.contributor.none.fl_str_mv Castelli, Erick da Cruz
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Ramos, Livia Carla [UNESP]
dc.subject.por.fl_str_mv Genética Humana
Biologia forense
Marcadores genéticos
Microhaplótipo
Multi-InDel
Microhaplotype
topic Genética Humana
Biologia forense
Marcadores genéticos
Microhaplótipo
Multi-InDel
Microhaplotype
description Os marcadores genéticos STRs (do inglês, short tandem repeats) são considerados padrão-ouro para as análises forenses. Apesar de amplamente utilizados, os STRs apresentam limitações relevantes especialmente em casos complexos, tais como amostras degradadas ou compostas por múltiplos perfis genéticos. Dessa forma, outros marcadores têm despertado interesse na genética forense, com o objetivo de serem complementares aos STRs e superar suas limitações. Os polimorfismos de inserção/deleção, ou InDels, estão amplamente presentes no genoma humano e reúnem algumas características importantes e vantajosas. Eles podem ser amplificados por reação em cadeia da polimerase (PCR) e detectados por eletroforese capilar (CE), tecnologias amplamente presentes nos laboratórios forenses, e podem ser organizados em sistema multiplex. Além de apresentarem baixa taxa de mutação, favorável para análises de vínculo genético e da possibilidade de gerar produtos de amplificação (amplicons) menores, facilitando a análise de amostras degradadas. Ademais, os InDels não produzem artefatos de amplificação denominados stutters, sendo favorável para casos contendo misturas de perfis genéticos de dois ou mais indivíduos. Entretanto, a maioria dos InDels são bi-alélicos, o que reduz seu poder de discriminação. Para contornar essa limitação, novos marcadores genéticos, como os multi-InDels, têm ganhado destaque, pois, preservam as características individuais dos InDels e ainda proporcionam um aumento do polimorfismo. Os marcadores multi-InDels são classificados de forma generalizada como microhaplótipos, constituídos por dois ou mais loci InDels, localizados em um segmento curto de DNA. Atualmente, há painéis de multi-InDels propostos na literatura, todos validados apenas em populações asiáticas. O objetivo deste trabalho foi construir e validar, por meio de abordagens computacionais, um novo conjunto de marcadores multi-InDels autossômicos, que seja capaz identificar os indivíduos da população brasileira e de outras populações do mundo. Previamente, nós avaliamos três conjuntos anteriormente propostos e validados em populações asiáticas, com o objetivo de verificar a sua aplicabilidade em indivíduos brasileiros. Foram utilizados dados públicos de sequenciamento de alta cobertura de genoma completo do projeto 1000 Genomes, que compreende 26 populações mundiais, e a amostras de brasileiros (Projeto Saúde, Bem-estar e Envelhecimento - SABE), tanto para avaliar os painéis existentes quanto para selecionar novos marcadores. Concluiu-se que a maioria dos marcadores anteriormente propostos é informativa para indivíduos brasileiros, uma vez que apresentam mais de três haplótipos frequentes com diferentes tamanhos. Entretanto, 64,8% destes marcadores são propensos a erros de amplificação e/ou sequenciamento, devido à presença de regiões repetitivas, de baixa complexidade, homopolimérica ou STRs. Desse modo, neste trabalho, selecionamos e propusemos um novo conjunto de marcadores multi-InDels para identificação humana, organizado em sistema multiplex e baseado na plataforma de CE, composto por 28 marcadores, além de dois marcadores para determinação do sexo. O painel apresentou alto polimorfismo em cinco superpopulações, bem como em indivíduos brasileiros. A probabilidade de match combinada (PMC) variou de 5,66 x 10-20 a 2,66 x 10-17, enquanto o poder de exclusão combinado (PEC) variou de 0,99958 a 0,99998. Além disso, 94,4% dos amplicons gerados foram menores que 250 pares de base (pb). Portanto, o painel proposto pode ser uma ferramenta complementar útil para a identificação humana, aplicável para população brasileira e em outras populações ao redor do mundo, especialmente em casos complexos.
publishDate 2025
dc.date.none.fl_str_mv 2025-11-17T12:48:13Z
2025-09-18
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv RAMOS, Livia Carla Ramos. Construção e validação computacional de um conjunto de marcadores multi-InDels autossômicos para identificação humana. 2025. Tese (Doutorado em Genética) – Instituto de Biociências, Universidade Estadual Paulista (UNESP), Botucatu, 2025.
https://hdl.handle.net/11449/315231
33004064026P9
0445608756737639
0000-0003-1385-6644
identifier_str_mv RAMOS, Livia Carla Ramos. Construção e validação computacional de um conjunto de marcadores multi-InDels autossômicos para identificação humana. 2025. Tese (Doutorado em Genética) – Instituto de Biociências, Universidade Estadual Paulista (UNESP), Botucatu, 2025.
33004064026P9
0445608756737639
0000-0003-1385-6644
url https://hdl.handle.net/11449/315231
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv repositoriounesp@unesp.br
_version_ 1854954734435172352