Characterization and annotation of archaeal promoter sequences

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Martinez, Gustavo Sganzerla
Orientador(a): Silva, Sheila de Avila e
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
DNA
Palavras-chave em Inglês:
Link de acesso: https://repositorio.ucs.br/11338/10023
Resumo: As arqueas foram incluídas como um domínio particular da árvore da vida há pouco tempo. Esse vasto e inexplorado domínio requer várias técnicas voltadas a produzir inferências confiáveis uma vex que não há muita informação anotada. O objetivo dessa tese é criar uma pipeline de bioinformática que encontra promotores nos genomas não anotados de arqueas. Para tal, a conservação reportada nos sítios de ligação de proteínas de fatores de transcrição é considerado para desenhar um perfil de sequências promotoras derivado de promotores experimentalmente dos organismos Haloferax volcanii, Thermococus kodakarensis, Sulfolobus solfataricus. Além disso, o aspecto conservado desses organismo é aplicado em uma tarefa classificatória baseada em redes neurais artificiais e estatística. Os resultados obtidos nessa tese são demonstrados através de dois artigos científicos. No primeiro, o sítio de ligação de proteínas de fatores de transcrição que auxiliam a ligação da enzima RNAP foram localizados em sequências promotoras que carecem dos sítios de ligação tradicionais. Em segundo, uma combinação de estatística e redes neurais artificiais mostrou-se bem sucedido ao classificar promotores de arqueastes-vos em uma taxa > 90%, o que demonstra uma maneira satisfatória de entregar anotação genômica em sequências de organismos cujo o genoma ainda não está totalmente explorado. [resumo fornecido pelo autor]
id UCS_59aca83f5cbe6f29d0edbaa5c937eef3
oai_identifier_str oai:repositorio.ucs.br:11338/10023
network_acronym_str UCS
network_name_str Repositório Institucional da UCS
repository_id_str
spelling Martinez, Gustavo SganzerlaKumar, AdityaLaguna, Sergio EcheverrigarayYella, Venkata RejeshGálan Vásquez, EdgardoSilva, Sheila de Avila e2022-05-16T17:29:29Z2022-05-16T17:29:29Z2022-05-112021-11-05https://repositorio.ucs.br/11338/10023As arqueas foram incluídas como um domínio particular da árvore da vida há pouco tempo. Esse vasto e inexplorado domínio requer várias técnicas voltadas a produzir inferências confiáveis uma vex que não há muita informação anotada. O objetivo dessa tese é criar uma pipeline de bioinformática que encontra promotores nos genomas não anotados de arqueas. Para tal, a conservação reportada nos sítios de ligação de proteínas de fatores de transcrição é considerado para desenhar um perfil de sequências promotoras derivado de promotores experimentalmente dos organismos Haloferax volcanii, Thermococus kodakarensis, Sulfolobus solfataricus. Além disso, o aspecto conservado desses organismo é aplicado em uma tarefa classificatória baseada em redes neurais artificiais e estatística. Os resultados obtidos nessa tese são demonstrados através de dois artigos científicos. No primeiro, o sítio de ligação de proteínas de fatores de transcrição que auxiliam a ligação da enzima RNAP foram localizados em sequências promotoras que carecem dos sítios de ligação tradicionais. Em segundo, uma combinação de estatística e redes neurais artificiais mostrou-se bem sucedido ao classificar promotores de arqueastes-vos em uma taxa > 90%, o que demonstra uma maneira satisfatória de entregar anotação genômica em sequências de organismos cujo o genoma ainda não está totalmente explorado. [resumo fornecido pelo autor]Archaea were not long ago included as a particular domain in the tree of life. This vast and unexplored domain requires a plethora of techniques aimed to produce reliable inferences on it since not much information has been annotated. The objective of this thesis is to create a bioinformatics pipeline that encounters promoters in unannotated genomes of archaea. To perform such task, the conservation reported in the binding site of specific transcription factor proteins is considered in order to draw a profile of promoter-like sequences derived from experimentally validated promoters of the archaea H. volcanii, S. solfataricus, and T. kodakarensis. Additionally, the conserved aspect of these organisms is employed is a classification task based on statistics and artificial neural networks. The results obtained in this thesis are displayed in the form of two scientific articles. Where in the first, the binding site of transcription factor proteins that assist RNAP binding was located even in promoter sequences that lack the canonical binding sites as well as unannotated organisms. Secondly, a combination of statistics and artificial neural network classification has succeeded in classifying archaeal promoters in a rate > 90%, which has shown a satisfactory way to deliver annotation upon sequences whose genome is not fully explored. [resumo fornecido pelo autor]Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, CAPESDNAArchaeaDNABiotecnologiaArchaeaBiotechnologyCharacterization and annotation of archaeal promoter sequencesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisengreponame:Repositório Institucional da UCSinstname:Universidade de Caxias do Sul (UCS)instacron:UCSinfo:eu-repo/semantics/openAccessUniversidade de Caxias do Sulhttp://lattes.cnpq.br/9113021005582564Gustavo Sganzerla MartinezDoutorado em BiotecnologiaCampus Universitário de Caxias do SulTEXTTese Gustavo Sganzerla Martinez.pdf.txtTese Gustavo Sganzerla Martinez.pdf.txtExtracted texttext/plain194464https://repositorio.ucs.br/xmlui/bitstream/11338/10023/2/Tese%20Gustavo%20Sganzerla%20Martinez.pdf.txted26306c1da2ee3062f3162fd9bf98aeMD52THUMBNAILTese Gustavo Sganzerla Martinez.pdf.jpgTese Gustavo Sganzerla Martinez.pdf.jpgGenerated Thumbnailimage/jpeg1166https://repositorio.ucs.br/xmlui/bitstream/11338/10023/3/Tese%20Gustavo%20Sganzerla%20Martinez.pdf.jpg0f78f2f745fa86a8c02350ac972cd717MD53ORIGINALTese Gustavo Sganzerla Martinez.pdfTese Gustavo Sganzerla Martinez.pdfapplication/pdf6994679https://repositorio.ucs.br/xmlui/bitstream/11338/10023/1/Tese%20Gustavo%20Sganzerla%20Martinez.pdf87e3d9db5bf7f2317b1c6333a0577d5bMD5111338/100232022-10-18 17:43:33.81oai:repositorio.ucs.br:11338/10023Repositório de Publicaçõeshttp://repositorio.ucs.br/oai/requestopendoar:2024-05-06T10:00:34.895073Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)false
dc.title.en.fl_str_mv Characterization and annotation of archaeal promoter sequences
title Characterization and annotation of archaeal promoter sequences
spellingShingle Characterization and annotation of archaeal promoter sequences
Martinez, Gustavo Sganzerla
DNA
Archaea
DNA
Biotecnologia
Archaea
Biotechnology
title_short Characterization and annotation of archaeal promoter sequences
title_full Characterization and annotation of archaeal promoter sequences
title_fullStr Characterization and annotation of archaeal promoter sequences
title_full_unstemmed Characterization and annotation of archaeal promoter sequences
title_sort Characterization and annotation of archaeal promoter sequences
author Martinez, Gustavo Sganzerla
author_facet Martinez, Gustavo Sganzerla
author_role author
dc.contributor.other.none.fl_str_mv Kumar, Aditya
Laguna, Sergio Echeverrigaray
Yella, Venkata Rejesh
Gálan Vásquez, Edgardo
dc.contributor.author.fl_str_mv Martinez, Gustavo Sganzerla
dc.contributor.advisor1.fl_str_mv Silva, Sheila de Avila e
contributor_str_mv Silva, Sheila de Avila e
dc.subject.e.fl_str_mv DNA
topic DNA
Archaea
DNA
Biotecnologia
Archaea
Biotechnology
dc.subject.por.fl_str_mv Archaea
DNA
Biotecnologia
dc.subject.eng.fl_str_mv Archaea
Biotechnology
description As arqueas foram incluídas como um domínio particular da árvore da vida há pouco tempo. Esse vasto e inexplorado domínio requer várias técnicas voltadas a produzir inferências confiáveis uma vex que não há muita informação anotada. O objetivo dessa tese é criar uma pipeline de bioinformática que encontra promotores nos genomas não anotados de arqueas. Para tal, a conservação reportada nos sítios de ligação de proteínas de fatores de transcrição é considerado para desenhar um perfil de sequências promotoras derivado de promotores experimentalmente dos organismos Haloferax volcanii, Thermococus kodakarensis, Sulfolobus solfataricus. Além disso, o aspecto conservado desses organismo é aplicado em uma tarefa classificatória baseada em redes neurais artificiais e estatística. Os resultados obtidos nessa tese são demonstrados através de dois artigos científicos. No primeiro, o sítio de ligação de proteínas de fatores de transcrição que auxiliam a ligação da enzima RNAP foram localizados em sequências promotoras que carecem dos sítios de ligação tradicionais. Em segundo, uma combinação de estatística e redes neurais artificiais mostrou-se bem sucedido ao classificar promotores de arqueastes-vos em uma taxa > 90%, o que demonstra uma maneira satisfatória de entregar anotação genômica em sequências de organismos cujo o genoma ainda não está totalmente explorado. [resumo fornecido pelo autor]
publishDate 2021
dc.date.submitted.none.fl_str_mv 2021-11-05
dc.date.accessioned.fl_str_mv 2022-05-16T17:29:29Z
dc.date.available.fl_str_mv 2022-05-16T17:29:29Z
dc.date.issued.fl_str_mv 2022-05-11
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ucs.br/11338/10023
url https://repositorio.ucs.br/11338/10023
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UCS
instname:Universidade de Caxias do Sul (UCS)
instacron:UCS
instname_str Universidade de Caxias do Sul (UCS)
instacron_str UCS
institution UCS
reponame_str Repositório Institucional da UCS
collection Repositório Institucional da UCS
bitstream.url.fl_str_mv https://repositorio.ucs.br/xmlui/bitstream/11338/10023/2/Tese%20Gustavo%20Sganzerla%20Martinez.pdf.txt
https://repositorio.ucs.br/xmlui/bitstream/11338/10023/3/Tese%20Gustavo%20Sganzerla%20Martinez.pdf.jpg
https://repositorio.ucs.br/xmlui/bitstream/11338/10023/1/Tese%20Gustavo%20Sganzerla%20Martinez.pdf
bitstream.checksum.fl_str_mv ed26306c1da2ee3062f3162fd9bf98ae
0f78f2f745fa86a8c02350ac972cd717
87e3d9db5bf7f2317b1c6333a0577d5b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)
repository.mail.fl_str_mv
_version_ 1813262237284958208