Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Estadual Paulista (Unesp)
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://hdl.handle.net/11449/257428 |
Resumo: | Os avanços nas tecnologias de sequenciamento genômico nos últimos anos têm reduzido consideravelmente o custo desta técnica. No entanto, projetos de larga escala continuam apresentando custo elevado, muitas vezes impraticável. Uma das alternativas é o sequenciamento genômico de baixa cobertura (lcWGS). Este estudo teve como objetivo avaliar o desempenho da genotipagem em diversos cenários diferentes usando um programa específico para dados de lcWGS que foi desenvolvido contendo pipeline completo, otimizado para a genotipagem por sequenciamento de baixa cobertura. Foram testados parâmetros como profundidade de sequenciamento e tamanho amostral para avaliação do desempenho da genotipagem desta ferramenta. Os resultados demonstraram que dados de lcWGS processados adequadamente tem confiabilidade satisfatória e grande potencial no processo de genotipagem em larga escala. Subsequentemente, a ferramenta desenvolvida intitulada LCSeqTools foi aplicada em um segundo estudo, no qual foram utilizadas amostras de Nyssorhynchus darlingi coletados no município de Mâncio Lima, estado do Acre, para detecção de inversões cromossômicas. O objetivo foi testar a capacidade e precisão de detecção de inversões cromossômicas utilizando dados de lcWGS, além de contribuir para melhor entendimento das inversões do genoma de Ny. darlingi, bem como a estrutura e dinâmica do genoma dessa espécie. Dez inversões cromossômicas foram detectadas no genoma de Ny. darlingi e a análise de genômica comparativa revelou nenhuma inversão em sintenia com inversões conhecidas de Anopheles gambiae. |
| id |
UNSP_a70d569de7f2d1d446f5fc427b59a058 |
|---|---|
| oai_identifier_str |
oai:repositorio.unesp.br:11449/257428 |
| network_acronym_str |
UNSP |
| network_name_str |
Repositório Institucional da UNESP |
| repository_id_str |
|
| spelling |
Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populaçõesDevelopment of a user-friendly computational tool for analyzing low-coverage genomic sequencing data and application in population genetics studiesGenômicaBioinformáticaGenética de populaçõesInversões cromossômicasSNPsMosquitoGenomicsBioinformaticsPopulation geneticsChromosome inversionsSNPsMosquitoOs avanços nas tecnologias de sequenciamento genômico nos últimos anos têm reduzido consideravelmente o custo desta técnica. No entanto, projetos de larga escala continuam apresentando custo elevado, muitas vezes impraticável. Uma das alternativas é o sequenciamento genômico de baixa cobertura (lcWGS). Este estudo teve como objetivo avaliar o desempenho da genotipagem em diversos cenários diferentes usando um programa específico para dados de lcWGS que foi desenvolvido contendo pipeline completo, otimizado para a genotipagem por sequenciamento de baixa cobertura. Foram testados parâmetros como profundidade de sequenciamento e tamanho amostral para avaliação do desempenho da genotipagem desta ferramenta. Os resultados demonstraram que dados de lcWGS processados adequadamente tem confiabilidade satisfatória e grande potencial no processo de genotipagem em larga escala. Subsequentemente, a ferramenta desenvolvida intitulada LCSeqTools foi aplicada em um segundo estudo, no qual foram utilizadas amostras de Nyssorhynchus darlingi coletados no município de Mâncio Lima, estado do Acre, para detecção de inversões cromossômicas. O objetivo foi testar a capacidade e precisão de detecção de inversões cromossômicas utilizando dados de lcWGS, além de contribuir para melhor entendimento das inversões do genoma de Ny. darlingi, bem como a estrutura e dinâmica do genoma dessa espécie. Dez inversões cromossômicas foram detectadas no genoma de Ny. darlingi e a análise de genômica comparativa revelou nenhuma inversão em sintenia com inversões conhecidas de Anopheles gambiae.Advances in genomic sequencing technologies in recent years have significantly reduced the cost of this technique. However, large-scale projects still present high costs, often impractical. An alternative strategy is low-coverage whole-genome sequencing (lcWGS). This study aimed to evaluate the genotyping performance in various scenarios using a specific program for lcWGS data that was developed with a complete workflow optimized for low- coverage sequencing genotyping. Parameters such as sequencing depth and sample size were tested to evaluate the performance of this tool. The results demonstrated that properly processed lcWGS data have satisfactory genotyping reliability and great potential for large- scale genotyping studies. Subsequently, the developed tool, entitled LCSeqTools, was applied in a second study, in which samples of Nyssorhynchus darlingi collected in the municipality of Mâncio Lima, Acre state, were used to detect chromosome inversions. The objective was to test the capacity and accuracy of detecting chromosome inversions using lcWGS data, as well as to contribute to a better understanding of the inversions in the genome of Ny. darlingi, as well as the structure and dynamics of this species genome. Ten chromosome inversions were detected in the genome of Ny. darlingi, and comparative genomic analysis revealed no inversions in synteny with known inversions of Anopheles gambiae.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)CAPES: 88887.817610/2023-00Universidade Estadual Paulista (Unesp)Ribolla, Paulo Eduardo Martins [UNESP]Universidade Estadual Paulista (Unesp)Alvarez, Marcus Vinicius Niz [UNESP]2024-09-16T19:58:03Z2024-09-16T19:58:03Z2024-07-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfALVAREZ, Marcus Vinicius Niz. Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações. 2024. Tese (Doutor em Ciências Biológicas (Genética). Universidade Estadual Paulista, Instituto de Biociências de Botucatu, Botucatu, 2024.https://hdl.handle.net/11449/25742810.5281/zenodo.1376888933004064026P921248671807258010000-0001-7104-3954porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2025-10-23T14:26:28Zoai:repositorio.unesp.br:11449/257428Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestrepositoriounesp@unesp.bropendoar:29462025-10-23T14:26:28Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false |
| dc.title.none.fl_str_mv |
Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações Development of a user-friendly computational tool for analyzing low-coverage genomic sequencing data and application in population genetics studies |
| title |
Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações |
| spellingShingle |
Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações Alvarez, Marcus Vinicius Niz [UNESP] Genômica Bioinformática Genética de populações Inversões cromossômicas SNPs Mosquito Genomics Bioinformatics Population genetics Chromosome inversions SNPs Mosquito |
| title_short |
Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações |
| title_full |
Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações |
| title_fullStr |
Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações |
| title_full_unstemmed |
Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações |
| title_sort |
Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações |
| author |
Alvarez, Marcus Vinicius Niz [UNESP] |
| author_facet |
Alvarez, Marcus Vinicius Niz [UNESP] |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Ribolla, Paulo Eduardo Martins [UNESP] Universidade Estadual Paulista (Unesp) |
| dc.contributor.author.fl_str_mv |
Alvarez, Marcus Vinicius Niz [UNESP] |
| dc.subject.por.fl_str_mv |
Genômica Bioinformática Genética de populações Inversões cromossômicas SNPs Mosquito Genomics Bioinformatics Population genetics Chromosome inversions SNPs Mosquito |
| topic |
Genômica Bioinformática Genética de populações Inversões cromossômicas SNPs Mosquito Genomics Bioinformatics Population genetics Chromosome inversions SNPs Mosquito |
| description |
Os avanços nas tecnologias de sequenciamento genômico nos últimos anos têm reduzido consideravelmente o custo desta técnica. No entanto, projetos de larga escala continuam apresentando custo elevado, muitas vezes impraticável. Uma das alternativas é o sequenciamento genômico de baixa cobertura (lcWGS). Este estudo teve como objetivo avaliar o desempenho da genotipagem em diversos cenários diferentes usando um programa específico para dados de lcWGS que foi desenvolvido contendo pipeline completo, otimizado para a genotipagem por sequenciamento de baixa cobertura. Foram testados parâmetros como profundidade de sequenciamento e tamanho amostral para avaliação do desempenho da genotipagem desta ferramenta. Os resultados demonstraram que dados de lcWGS processados adequadamente tem confiabilidade satisfatória e grande potencial no processo de genotipagem em larga escala. Subsequentemente, a ferramenta desenvolvida intitulada LCSeqTools foi aplicada em um segundo estudo, no qual foram utilizadas amostras de Nyssorhynchus darlingi coletados no município de Mâncio Lima, estado do Acre, para detecção de inversões cromossômicas. O objetivo foi testar a capacidade e precisão de detecção de inversões cromossômicas utilizando dados de lcWGS, além de contribuir para melhor entendimento das inversões do genoma de Ny. darlingi, bem como a estrutura e dinâmica do genoma dessa espécie. Dez inversões cromossômicas foram detectadas no genoma de Ny. darlingi e a análise de genômica comparativa revelou nenhuma inversão em sintenia com inversões conhecidas de Anopheles gambiae. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-09-16T19:58:03Z 2024-09-16T19:58:03Z 2024-07-29 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
ALVAREZ, Marcus Vinicius Niz. Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações. 2024. Tese (Doutor em Ciências Biológicas (Genética). Universidade Estadual Paulista, Instituto de Biociências de Botucatu, Botucatu, 2024. https://hdl.handle.net/11449/257428 10.5281/zenodo.13768889 33004064026P9 2124867180725801 0000-0001-7104-3954 |
| identifier_str_mv |
ALVAREZ, Marcus Vinicius Niz. Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações. 2024. Tese (Doutor em Ciências Biológicas (Genética). Universidade Estadual Paulista, Instituto de Biociências de Botucatu, Botucatu, 2024. 10.5281/zenodo.13768889 33004064026P9 2124867180725801 0000-0001-7104-3954 |
| url |
https://hdl.handle.net/11449/257428 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
| publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNESP instname:Universidade Estadual Paulista (UNESP) instacron:UNESP |
| instname_str |
Universidade Estadual Paulista (UNESP) |
| instacron_str |
UNESP |
| institution |
UNESP |
| reponame_str |
Repositório Institucional da UNESP |
| collection |
Repositório Institucional da UNESP |
| repository.name.fl_str_mv |
Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP) |
| repository.mail.fl_str_mv |
repositoriounesp@unesp.br |
| _version_ |
1854954353376362496 |