De Supergrupos a Superfamílias, um estudo de homologia em protozoários
Ano de defesa: | 2018 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Link de acesso: | https://www.arca.fiocruz.br/handle/icict/30225 |
Resumo: | Protozoários patogênicos causam doenças importantes em países tropicais, como malária, doença do sono, doença de Chagas, leishmaniose, amebíase e giardíase, que em conjunto ameaçam milhões de pessoas em todo o mundo. Além disso, a maioria das doenças parasitárias causadas por protozoários são zoonóticas. Compreender a biologia desses organismos é crucial para combater as doenças que eles causam e estudos de genômica comparativa podem ser úteis para entender a relação evolutiva entre eles. Usando inferência de genômica comparativa e homologia, o presente estudo contemplou três espécies de protozoários de diferentes filos: Cryptosporidium muris (Apicomplexa), Entamoeba invadens (Amoebozoa) e Trypanosoma grayi (Euglenozoa), escolhidos por serem patógenos ainda pouco estudados e pela distância genética entre eles. A tese pode ser dividida em 3 partes. Numa primeira parte os programas de inferência de homologia OMA e OrthoMCL foram utilizados para inferir genes homólogos e seus resultados foram comparados e separados em 3 categorias de acordo com o nível de concordância entre eles, com ênfase na identificação de grupos homólogos com maior distância evolutiva e na identificação de multidomínios CDD (Conserved Domain Database) e Pfam-A (Pfam protein families database) Na segunda parte, propomos uma nova abordagem para a identificação de homólogos, com base na definição de "Supergrupos" homólogos, formados pela reconciliação dos resultados de ambos os programas; usando como critério para inferência a interseção de proteínas e para sua validação critérios de alta estringência, onde todas as proteínas (100%) do Supergrupo devem (a) ter o mesmo domínio conservado (CDD) identificado ou (b) pertencerem à mesma família de proteínas (Pfam-A). Na terceira e última parte, foi feita uma busca por genes homólogos distantes entre os mesmos protozoários de diferentes filos utilizados no primeiro e no segundo estudo utilizando comparação entre perfis do Modelo Oculto de Markov (pHMM - pHMM) com o programa de inferência de homologia COMA, visando a identificação de superfamílias de proteínas utilizando a base de dados de famílias e superfamílias de proteínas SUPERFAMILY. Nossos resultados mostraram que foi possível inferir novos grupos de proteínas homólogas utilizando as abordagens de reconciliação (Supergrupos homólogos) e de comparação pHMM \2013 pHMM (Novos grupos homólogos distantes). |
id |
CRUZ_feb83fd47c9da0c7755a80c5c783b803 |
---|---|
oai_identifier_str |
oai:www.arca.fiocruz.br:icict/30225 |
network_acronym_str |
CRUZ |
network_name_str |
Repositório Institucional da FIOCRUZ (ARCA) |
repository_id_str |
|
spelling |
Campos, Darueck AcácioRivera Davila, Alberto Martin2018-11-27T10:24:23Z2018-11-27T10:24:23Z2018CAMPOS, Darueck Acácio. De Supergrupos a Superfamílias, um estudo de homologia em protozoários. 2018. 132 f. Tese (Doutorado em Biologia Computacional e Sistemas)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, 2018.https://www.arca.fiocruz.br/handle/icict/30225Protozoários patogênicos causam doenças importantes em países tropicais, como malária, doença do sono, doença de Chagas, leishmaniose, amebíase e giardíase, que em conjunto ameaçam milhões de pessoas em todo o mundo. Além disso, a maioria das doenças parasitárias causadas por protozoários são zoonóticas. Compreender a biologia desses organismos é crucial para combater as doenças que eles causam e estudos de genômica comparativa podem ser úteis para entender a relação evolutiva entre eles. Usando inferência de genômica comparativa e homologia, o presente estudo contemplou três espécies de protozoários de diferentes filos: Cryptosporidium muris (Apicomplexa), Entamoeba invadens (Amoebozoa) e Trypanosoma grayi (Euglenozoa), escolhidos por serem patógenos ainda pouco estudados e pela distância genética entre eles. A tese pode ser dividida em 3 partes. Numa primeira parte os programas de inferência de homologia OMA e OrthoMCL foram utilizados para inferir genes homólogos e seus resultados foram comparados e separados em 3 categorias de acordo com o nível de concordância entre eles, com ênfase na identificação de grupos homólogos com maior distância evolutiva e na identificação de multidomínios CDD (Conserved Domain Database) e Pfam-A (Pfam protein families database) Na segunda parte, propomos uma nova abordagem para a identificação de homólogos, com base na definição de "Supergrupos" homólogos, formados pela reconciliação dos resultados de ambos os programas; usando como critério para inferência a interseção de proteínas e para sua validação critérios de alta estringência, onde todas as proteínas (100%) do Supergrupo devem (a) ter o mesmo domínio conservado (CDD) identificado ou (b) pertencerem à mesma família de proteínas (Pfam-A). Na terceira e última parte, foi feita uma busca por genes homólogos distantes entre os mesmos protozoários de diferentes filos utilizados no primeiro e no segundo estudo utilizando comparação entre perfis do Modelo Oculto de Markov (pHMM - pHMM) com o programa de inferência de homologia COMA, visando a identificação de superfamílias de proteínas utilizando a base de dados de famílias e superfamílias de proteínas SUPERFAMILY. Nossos resultados mostraram que foi possível inferir novos grupos de proteínas homólogas utilizando as abordagens de reconciliação (Supergrupos homólogos) e de comparação pHMM \2013 pHMM (Novos grupos homólogos distantes).Pathogenic protozoa cause major diseases in tropical countries, such as malaria, sleeping sickness, Chagas disease, leishmaniasis, amebiasis and giardiasis, which together threaten millions of people worldwide. In addition, most parasitic diseases caused by protozoa are zoonotic. Understanding the biology of these organisms is crucial in combating the diseases they cause, and studies of comparative genomics may be helpful in understanding the evolutionary relationship between them. Using comparative genomic inference and homology, the present study aimed at three protozoan species of different phyla: Cryptosporidium muris (Apicomplexa), Entamoeba invadens (Amoebozoa) and Trypanosoma grayi (Euglenozoa), chosen as pathogens that have not yet been studied and the genetic distance between them. The thesis can be divided into 3 parts. In a first part the inference programs OMA and OrthoMCL were used to infer homologous genes and their results were compared and separated into 3 categories according to the level of agreement between them, with emphasis on the identification of homologous groups with greater evolutionary distance and in the CDD (Conserved Domain Database) and Pfam-A (Pfam protein families database) multidomain identification In the second part, we propose a new approach for the identification of homologues, based on the definition of homologous "Supergroups", formed by the reconciliation of the results of both programs; Using as criterion for inference the intersection of proteins and for their validation criteria of high stringency, where all proteins (100%) of the Supergroup must (a) have the same conserved domain (CDD) identified or (b) belong to the same protein family (Pfam-A). In the third and final part, a search was made for distant homologous genes between the same protozoa of different phyla used in the first and second studies using a comparison of profiles of the Occult Markov Model (pHMM - pHMM), with the inference program COMA, aiming at the identification of superfamilies of proteins using the database of families and superfamilies of proteins SUPERFAMILY. Our results showed that it was possible to infer new groups of homologous proteins using the reconciliation (Supergroup homologous) and the pHMM - pHMM (New distant homologous groups) approaches.Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ, Brasil.porHomologia de GenesGenômicaGenoma de ProtozoárioMetodologias ComputacionaisDe Supergrupos a Superfamílias, um estudo de homologia em protozoáriosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis2018Instituto Oswaldo CruzFundação Oswaldo CruzRio de JaneiroPrograma de Pós-Graduação em Biologia Computacional e Sistemasinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da FIOCRUZ (ARCA)instname:Fundação Oswaldo Cruz (FIOCRUZ)instacron:FIOCRUZLICENSElicense.txttext/plain1748https://www.arca.fiocruz.br/bitstream/icict/30225/1/license.txt8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINALdarueck_campos_ioc_dout_2018.pdfapplication/pdf11019587https://www.arca.fiocruz.br/bitstream/icict/30225/2/darueck_campos_ioc_dout_2018.pdfcd288d029fb3cca6d2e3e6fd9d29ecfbMD52TEXTdarueck_campos_ioc_dout_2018.pdf.txtdarueck_campos_ioc_dout_2018.pdf.txtExtracted texttext/plain182012https://www.arca.fiocruz.br/bitstream/icict/30225/3/darueck_campos_ioc_dout_2018.pdf.txt1a067679a6fd42dad67475a248a34453MD53icict/302252022-06-24 12:17:43.129oai:www.arca.fiocruz.br:icict/30225Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.arca.fiocruz.br/oai/requestrepositorio.arca@fiocruz.bropendoar:21352022-06-24T15:17:43Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)false |
dc.title.pt_BR.fl_str_mv |
De Supergrupos a Superfamílias, um estudo de homologia em protozoários |
title |
De Supergrupos a Superfamílias, um estudo de homologia em protozoários |
spellingShingle |
De Supergrupos a Superfamílias, um estudo de homologia em protozoários Campos, Darueck Acácio Homologia de Genes Genômica Genoma de Protozoário Metodologias Computacionais |
title_short |
De Supergrupos a Superfamílias, um estudo de homologia em protozoários |
title_full |
De Supergrupos a Superfamílias, um estudo de homologia em protozoários |
title_fullStr |
De Supergrupos a Superfamílias, um estudo de homologia em protozoários |
title_full_unstemmed |
De Supergrupos a Superfamílias, um estudo de homologia em protozoários |
title_sort |
De Supergrupos a Superfamílias, um estudo de homologia em protozoários |
author |
Campos, Darueck Acácio |
author_facet |
Campos, Darueck Acácio |
author_role |
author |
dc.contributor.author.fl_str_mv |
Campos, Darueck Acácio |
dc.contributor.advisor1.fl_str_mv |
Rivera Davila, Alberto Martin |
contributor_str_mv |
Rivera Davila, Alberto Martin |
dc.subject.other.pt_BR.fl_str_mv |
Homologia de Genes Genômica Genoma de Protozoário |
topic |
Homologia de Genes Genômica Genoma de Protozoário Metodologias Computacionais |
dc.subject.decs.pt_BR.fl_str_mv |
Metodologias Computacionais |
description |
Protozoários patogênicos causam doenças importantes em países tropicais, como malária, doença do sono, doença de Chagas, leishmaniose, amebíase e giardíase, que em conjunto ameaçam milhões de pessoas em todo o mundo. Além disso, a maioria das doenças parasitárias causadas por protozoários são zoonóticas. Compreender a biologia desses organismos é crucial para combater as doenças que eles causam e estudos de genômica comparativa podem ser úteis para entender a relação evolutiva entre eles. Usando inferência de genômica comparativa e homologia, o presente estudo contemplou três espécies de protozoários de diferentes filos: Cryptosporidium muris (Apicomplexa), Entamoeba invadens (Amoebozoa) e Trypanosoma grayi (Euglenozoa), escolhidos por serem patógenos ainda pouco estudados e pela distância genética entre eles. A tese pode ser dividida em 3 partes. Numa primeira parte os programas de inferência de homologia OMA e OrthoMCL foram utilizados para inferir genes homólogos e seus resultados foram comparados e separados em 3 categorias de acordo com o nível de concordância entre eles, com ênfase na identificação de grupos homólogos com maior distância evolutiva e na identificação de multidomínios CDD (Conserved Domain Database) e Pfam-A (Pfam protein families database) Na segunda parte, propomos uma nova abordagem para a identificação de homólogos, com base na definição de "Supergrupos" homólogos, formados pela reconciliação dos resultados de ambos os programas; usando como critério para inferência a interseção de proteínas e para sua validação critérios de alta estringência, onde todas as proteínas (100%) do Supergrupo devem (a) ter o mesmo domínio conservado (CDD) identificado ou (b) pertencerem à mesma família de proteínas (Pfam-A). Na terceira e última parte, foi feita uma busca por genes homólogos distantes entre os mesmos protozoários de diferentes filos utilizados no primeiro e no segundo estudo utilizando comparação entre perfis do Modelo Oculto de Markov (pHMM - pHMM) com o programa de inferência de homologia COMA, visando a identificação de superfamílias de proteínas utilizando a base de dados de famílias e superfamílias de proteínas SUPERFAMILY. Nossos resultados mostraram que foi possível inferir novos grupos de proteínas homólogas utilizando as abordagens de reconciliação (Supergrupos homólogos) e de comparação pHMM \2013 pHMM (Novos grupos homólogos distantes). |
publishDate |
2018 |
dc.date.accessioned.fl_str_mv |
2018-11-27T10:24:23Z |
dc.date.available.fl_str_mv |
2018-11-27T10:24:23Z |
dc.date.issued.fl_str_mv |
2018 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
CAMPOS, Darueck Acácio. De Supergrupos a Superfamílias, um estudo de homologia em protozoários. 2018. 132 f. Tese (Doutorado em Biologia Computacional e Sistemas)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, 2018. |
dc.identifier.uri.fl_str_mv |
https://www.arca.fiocruz.br/handle/icict/30225 |
identifier_str_mv |
CAMPOS, Darueck Acácio. De Supergrupos a Superfamílias, um estudo de homologia em protozoários. 2018. 132 f. Tese (Doutorado em Biologia Computacional e Sistemas)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, 2018. |
url |
https://www.arca.fiocruz.br/handle/icict/30225 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da FIOCRUZ (ARCA) instname:Fundação Oswaldo Cruz (FIOCRUZ) instacron:FIOCRUZ |
instname_str |
Fundação Oswaldo Cruz (FIOCRUZ) |
instacron_str |
FIOCRUZ |
institution |
FIOCRUZ |
reponame_str |
Repositório Institucional da FIOCRUZ (ARCA) |
collection |
Repositório Institucional da FIOCRUZ (ARCA) |
bitstream.url.fl_str_mv |
https://www.arca.fiocruz.br/bitstream/icict/30225/1/license.txt https://www.arca.fiocruz.br/bitstream/icict/30225/2/darueck_campos_ioc_dout_2018.pdf https://www.arca.fiocruz.br/bitstream/icict/30225/3/darueck_campos_ioc_dout_2018.pdf.txt |
bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 cd288d029fb3cca6d2e3e6fd9d29ecfb 1a067679a6fd42dad67475a248a34453 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ) |
repository.mail.fl_str_mv |
repositorio.arca@fiocruz.br |
_version_ |
1798325762589196288 |