Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Alvarez, Marcus Vinicius Niz [UNESP]
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/11449/257428
Resumo: Os avanços nas tecnologias de sequenciamento genômico nos últimos anos têm reduzido consideravelmente o custo desta técnica. No entanto, projetos de larga escala continuam apresentando custo elevado, muitas vezes impraticável. Uma das alternativas é o sequenciamento genômico de baixa cobertura (lcWGS). Este estudo teve como objetivo avaliar o desempenho da genotipagem em diversos cenários diferentes usando um programa específico para dados de lcWGS que foi desenvolvido contendo pipeline completo, otimizado para a genotipagem por sequenciamento de baixa cobertura. Foram testados parâmetros como profundidade de sequenciamento e tamanho amostral para avaliação do desempenho da genotipagem desta ferramenta. Os resultados demonstraram que dados de lcWGS processados adequadamente tem confiabilidade satisfatória e grande potencial no processo de genotipagem em larga escala. Subsequentemente, a ferramenta desenvolvida intitulada LCSeqTools foi aplicada em um segundo estudo, no qual foram utilizadas amostras de Nyssorhynchus darlingi coletados no município de Mâncio Lima, estado do Acre, para detecção de inversões cromossômicas. O objetivo foi testar a capacidade e precisão de detecção de inversões cromossômicas utilizando dados de lcWGS, além de contribuir para melhor entendimento das inversões do genoma de Ny. darlingi, bem como a estrutura e dinâmica do genoma dessa espécie. Dez inversões cromossômicas foram detectadas no genoma de Ny. darlingi e a análise de genômica comparativa revelou nenhuma inversão em sintenia com inversões conhecidas de Anopheles gambiae.
id UNSP_a70d569de7f2d1d446f5fc427b59a058
oai_identifier_str oai:repositorio.unesp.br:11449/257428
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str
spelling Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populaçõesDevelopment of a user-friendly computational tool for analyzing low-coverage genomic sequencing data and application in population genetics studiesGenômicaBioinformáticaGenética de populaçõesInversões cromossômicasSNPsMosquitoGenomicsBioinformaticsPopulation geneticsChromosome inversionsSNPsMosquitoOs avanços nas tecnologias de sequenciamento genômico nos últimos anos têm reduzido consideravelmente o custo desta técnica. No entanto, projetos de larga escala continuam apresentando custo elevado, muitas vezes impraticável. Uma das alternativas é o sequenciamento genômico de baixa cobertura (lcWGS). Este estudo teve como objetivo avaliar o desempenho da genotipagem em diversos cenários diferentes usando um programa específico para dados de lcWGS que foi desenvolvido contendo pipeline completo, otimizado para a genotipagem por sequenciamento de baixa cobertura. Foram testados parâmetros como profundidade de sequenciamento e tamanho amostral para avaliação do desempenho da genotipagem desta ferramenta. Os resultados demonstraram que dados de lcWGS processados adequadamente tem confiabilidade satisfatória e grande potencial no processo de genotipagem em larga escala. Subsequentemente, a ferramenta desenvolvida intitulada LCSeqTools foi aplicada em um segundo estudo, no qual foram utilizadas amostras de Nyssorhynchus darlingi coletados no município de Mâncio Lima, estado do Acre, para detecção de inversões cromossômicas. O objetivo foi testar a capacidade e precisão de detecção de inversões cromossômicas utilizando dados de lcWGS, além de contribuir para melhor entendimento das inversões do genoma de Ny. darlingi, bem como a estrutura e dinâmica do genoma dessa espécie. Dez inversões cromossômicas foram detectadas no genoma de Ny. darlingi e a análise de genômica comparativa revelou nenhuma inversão em sintenia com inversões conhecidas de Anopheles gambiae.Advances in genomic sequencing technologies in recent years have significantly reduced the cost of this technique. However, large-scale projects still present high costs, often impractical. An alternative strategy is low-coverage whole-genome sequencing (lcWGS). This study aimed to evaluate the genotyping performance in various scenarios using a specific program for lcWGS data that was developed with a complete workflow optimized for low- coverage sequencing genotyping. Parameters such as sequencing depth and sample size were tested to evaluate the performance of this tool. The results demonstrated that properly processed lcWGS data have satisfactory genotyping reliability and great potential for large- scale genotyping studies. Subsequently, the developed tool, entitled LCSeqTools, was applied in a second study, in which samples of Nyssorhynchus darlingi collected in the municipality of Mâncio Lima, Acre state, were used to detect chromosome inversions. The objective was to test the capacity and accuracy of detecting chromosome inversions using lcWGS data, as well as to contribute to a better understanding of the inversions in the genome of Ny. darlingi, as well as the structure and dynamics of this species genome. Ten chromosome inversions were detected in the genome of Ny. darlingi, and comparative genomic analysis revealed no inversions in synteny with known inversions of Anopheles gambiae.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)CAPES: 88887.817610/2023-00Universidade Estadual Paulista (Unesp)Ribolla, Paulo Eduardo Martins [UNESP]Universidade Estadual Paulista (Unesp)Alvarez, Marcus Vinicius Niz [UNESP]2024-09-16T19:58:03Z2024-09-16T19:58:03Z2024-07-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfALVAREZ, Marcus Vinicius Niz. Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações. 2024. Tese (Doutor em Ciências Biológicas (Genética). Universidade Estadual Paulista, Instituto de Biociências de Botucatu, Botucatu, 2024.https://hdl.handle.net/11449/25742810.5281/zenodo.1376888933004064026P921248671807258010000-0001-7104-3954porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2025-10-23T14:26:28Zoai:repositorio.unesp.br:11449/257428Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestrepositoriounesp@unesp.bropendoar:29462025-10-23T14:26:28Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações
Development of a user-friendly computational tool for analyzing low-coverage genomic sequencing data and application in population genetics studies
title Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações
spellingShingle Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações
Alvarez, Marcus Vinicius Niz [UNESP]
Genômica
Bioinformática
Genética de populações
Inversões cromossômicas
SNPs
Mosquito
Genomics
Bioinformatics
Population genetics
Chromosome inversions
SNPs
Mosquito
title_short Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações
title_full Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações
title_fullStr Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações
title_full_unstemmed Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações
title_sort Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações
author Alvarez, Marcus Vinicius Niz [UNESP]
author_facet Alvarez, Marcus Vinicius Niz [UNESP]
author_role author
dc.contributor.none.fl_str_mv Ribolla, Paulo Eduardo Martins [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Alvarez, Marcus Vinicius Niz [UNESP]
dc.subject.por.fl_str_mv Genômica
Bioinformática
Genética de populações
Inversões cromossômicas
SNPs
Mosquito
Genomics
Bioinformatics
Population genetics
Chromosome inversions
SNPs
Mosquito
topic Genômica
Bioinformática
Genética de populações
Inversões cromossômicas
SNPs
Mosquito
Genomics
Bioinformatics
Population genetics
Chromosome inversions
SNPs
Mosquito
description Os avanços nas tecnologias de sequenciamento genômico nos últimos anos têm reduzido consideravelmente o custo desta técnica. No entanto, projetos de larga escala continuam apresentando custo elevado, muitas vezes impraticável. Uma das alternativas é o sequenciamento genômico de baixa cobertura (lcWGS). Este estudo teve como objetivo avaliar o desempenho da genotipagem em diversos cenários diferentes usando um programa específico para dados de lcWGS que foi desenvolvido contendo pipeline completo, otimizado para a genotipagem por sequenciamento de baixa cobertura. Foram testados parâmetros como profundidade de sequenciamento e tamanho amostral para avaliação do desempenho da genotipagem desta ferramenta. Os resultados demonstraram que dados de lcWGS processados adequadamente tem confiabilidade satisfatória e grande potencial no processo de genotipagem em larga escala. Subsequentemente, a ferramenta desenvolvida intitulada LCSeqTools foi aplicada em um segundo estudo, no qual foram utilizadas amostras de Nyssorhynchus darlingi coletados no município de Mâncio Lima, estado do Acre, para detecção de inversões cromossômicas. O objetivo foi testar a capacidade e precisão de detecção de inversões cromossômicas utilizando dados de lcWGS, além de contribuir para melhor entendimento das inversões do genoma de Ny. darlingi, bem como a estrutura e dinâmica do genoma dessa espécie. Dez inversões cromossômicas foram detectadas no genoma de Ny. darlingi e a análise de genômica comparativa revelou nenhuma inversão em sintenia com inversões conhecidas de Anopheles gambiae.
publishDate 2024
dc.date.none.fl_str_mv 2024-09-16T19:58:03Z
2024-09-16T19:58:03Z
2024-07-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv ALVAREZ, Marcus Vinicius Niz. Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações. 2024. Tese (Doutor em Ciências Biológicas (Genética). Universidade Estadual Paulista, Instituto de Biociências de Botucatu, Botucatu, 2024.
https://hdl.handle.net/11449/257428
10.5281/zenodo.13768889
33004064026P9
2124867180725801
0000-0001-7104-3954
identifier_str_mv ALVAREZ, Marcus Vinicius Niz. Desenvolvimento de uma ferramenta computacional amigável para análise de dados de sequenciamento genômico de baixa cobertura e aplicação em estudo de genética de populações. 2024. Tese (Doutor em Ciências Biológicas (Genética). Universidade Estadual Paulista, Instituto de Biociências de Botucatu, Botucatu, 2024.
10.5281/zenodo.13768889
33004064026P9
2124867180725801
0000-0001-7104-3954
url https://hdl.handle.net/11449/257428
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv repositoriounesp@unesp.br
_version_ 1854954353376362496