Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina

Detalhes bibliográficos
Ano de defesa: 2005
Autor(a) principal: Monteiro, Meika Iwata
Orientador(a): Gonçalves, Luiz Marcos Garcia
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Rio Grande do Norte
Programa de Pós-Graduação: Programa de Pós-Graduação em Engenharia Elétrica
Departamento: Automação e Sistemas; Engenharia de Computação; Telecomunicações
País: BR
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufrn.br/jspui/handle/123456789/15416
Resumo: One of the most important goals of bioinformatics is the ability to identify genes in uncharacterized DNA sequences on world wide database. Gene expression on prokaryotes initiates when the RNA-polymerase enzyme interacts with DNA regions called promoters. In these regions are located the main regulatory elements of the transcription process. Despite the improvement of in vitro techniques for molecular biology analysis, characterizing and identifying a great number of promoters on a genome is a complex task. Nevertheless, the main drawback is the absence of a large set of promoters to identify conserved patterns among the species. Hence, a in silico method to predict them on any species is a challenge. Improved promoter prediction methods can be one step towards developing more reliable ab initio gene prediction methods. In this work, we present an empirical comparison of Machine Learning (ML) techniques such as Na¨ýve Bayes, Decision Trees, Support Vector Machines and Neural Networks, Voted Perceptron, PART, k-NN and and ensemble approaches (Bagging and Boosting) to the task of predicting Bacillus subtilis. In order to do so, we first built two data set of promoter and nonpromoter sequences for B. subtilis and a hybrid one. In order to evaluate of ML methods a cross-validation procedure is applied. Good results were obtained with methods of ML like SVM and Naïve Bayes using B. subtilis. However, we have not reached good results on hybrid database
id UFRN_1aec0b9587723f45fab4006ba35031ba
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/15416
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Monteiro, Meika Iwatahttp://lattes.cnpq.br/6479379685092821http://lattes.cnpq.br/1562357566810393Souto, Marcílio Carlos Pereira dehttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790032E1Oliveira, Jauvane Cavalcante dehttp://lattes.cnpq.br/4054756781423727Dória Neto, Adrião Duartehttp://lattes.cnpq.br/1987295209521433Gonçalves, Luiz Marcos Garcia2014-12-17T14:56:02Z2007-02-122014-12-17T14:56:02Z2005-12-13MONTEIRO, Meika Iwata. Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina. 2005. 92 f. Dissertação (Mestrado em Automação e Sistemas; Engenharia de Computação; Telecomunicações) - Universidade Federal do Rio Grande do Norte, Natal, 2005.https://repositorio.ufrn.br/jspui/handle/123456789/15416One of the most important goals of bioinformatics is the ability to identify genes in uncharacterized DNA sequences on world wide database. Gene expression on prokaryotes initiates when the RNA-polymerase enzyme interacts with DNA regions called promoters. In these regions are located the main regulatory elements of the transcription process. Despite the improvement of in vitro techniques for molecular biology analysis, characterizing and identifying a great number of promoters on a genome is a complex task. Nevertheless, the main drawback is the absence of a large set of promoters to identify conserved patterns among the species. Hence, a in silico method to predict them on any species is a challenge. Improved promoter prediction methods can be one step towards developing more reliable ab initio gene prediction methods. In this work, we present an empirical comparison of Machine Learning (ML) techniques such as Na¨ýve Bayes, Decision Trees, Support Vector Machines and Neural Networks, Voted Perceptron, PART, k-NN and and ensemble approaches (Bagging and Boosting) to the task of predicting Bacillus subtilis. In order to do so, we first built two data set of promoter and nonpromoter sequences for B. subtilis and a hybrid one. In order to evaluate of ML methods a cross-validation procedure is applied. Good results were obtained with methods of ML like SVM and Naïve Bayes using B. subtilis. However, we have not reached good results on hybrid databaseUm dos grandes desafios da Bioinformática é manipular e analisar os dados acumulados nas bases de dados mundiais. A expressão dos genes em procariotos é iniciada quando a enzima RNA polimerase une-se com uma região próxima ao gene, chamada de promotor, onde é localizado os principais elementos regulatórios do processo de transcrição. Apesar do crescente avanço das técnicas experimentais (in vitro) em biologia molecular, caracterizar e identificar um número significante de promotores ainda é uma tarefa difícil. Os métodos computacionais existentes enfrentam a falta de um número adequado de promotores conhecidos para identificar padrões conservados entre as espécies. Logo, um método para predizê-los em qualquer organismo procariótico ainda é um desafio. Neste trabalho, apresentamos uma comparação empírica de técnicas individuais de aprendizado de máquina, tais como: Classificador Bayesiano Ingênuo, Árvores de Decisão, Máquinas de Vetores de Suporte, Redes Neurais do tipo VotedPerceptron, PART e k-Vizinhos Mais Próximos e sistemas multiclassificadores (Bagging e Adaboosting) e Modelo Oculto de Markov à tarefa de predição de promotores procariotos em Bacilos subtilis. Utilizamos a validação cruzada para avaliar todos os métodos de AM. Para esses testes, foram construídas base de dados com seqüências de promotores e não-promotores do Bacillus subtilis e uma base de dados híbrida. Os métodos de AM obtiveram bons resultados com o SVM e o Naïve Bayes. Não conseguimos entretanto, obter resultados relevantes para a base de dados híbridaapplication/pdfporUniversidade Federal do Rio Grande do NortePrograma de Pós-Graduação em Engenharia ElétricaUFRNBRAutomação e Sistemas; Engenharia de Computação; TelecomunicaçõesAprendizado de MáquinaReconhecimento de PromotoresBioinformáticaLearning MachinePromoters identificationBioinformaticsCNPQ::ENGENHARIAS::ENGENHARIA ELETRICAPredição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquinainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALMeikaIM.pdfapplication/pdf766418https://repositorio.ufrn.br/bitstream/123456789/15416/1/MeikaIM.pdf87a604688aa5cd2c4f6aba8237c67210MD51TEXTMeikaIM.pdf.txtMeikaIM.pdf.txtExtracted texttext/plain126348https://repositorio.ufrn.br/bitstream/123456789/15416/6/MeikaIM.pdf.txt0cbe216fbefbd6e311a02cb8efecc101MD56THUMBNAILMeikaIM.pdf.jpgMeikaIM.pdf.jpgIM Thumbnailimage/jpeg2163https://repositorio.ufrn.br/bitstream/123456789/15416/7/MeikaIM.pdf.jpgf66e63616a4d4568b8e4b93f9b60cc03MD57123456789/154162017-11-02 09:43:39.154oai:https://repositorio.ufrn.br:123456789/15416Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2017-11-02T12:43:39Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.por.fl_str_mv Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina
title Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina
spellingShingle Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina
Monteiro, Meika Iwata
Aprendizado de Máquina
Reconhecimento de Promotores
Bioinformática
Learning Machine
Promoters identification
Bioinformatics
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
title_short Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina
title_full Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina
title_fullStr Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina
title_full_unstemmed Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina
title_sort Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina
author Monteiro, Meika Iwata
author_facet Monteiro, Meika Iwata
author_role author
dc.contributor.authorID.por.fl_str_mv
dc.contributor.authorLattes.por.fl_str_mv http://lattes.cnpq.br/6479379685092821
dc.contributor.advisorID.por.fl_str_mv
dc.contributor.advisorLattes.por.fl_str_mv http://lattes.cnpq.br/1562357566810393
dc.contributor.advisor-co1ID.por.fl_str_mv
dc.contributor.referees1.pt_BR.fl_str_mv Oliveira, Jauvane Cavalcante de
dc.contributor.referees1ID.por.fl_str_mv
dc.contributor.referees1Lattes.por.fl_str_mv http://lattes.cnpq.br/4054756781423727
dc.contributor.referees2.pt_BR.fl_str_mv Dória Neto, Adrião Duarte
dc.contributor.referees2ID.por.fl_str_mv
dc.contributor.referees2Lattes.por.fl_str_mv http://lattes.cnpq.br/1987295209521433
dc.contributor.author.fl_str_mv Monteiro, Meika Iwata
dc.contributor.advisor-co1.fl_str_mv Souto, Marcílio Carlos Pereira de
dc.contributor.advisor-co1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790032E1
dc.contributor.advisor1.fl_str_mv Gonçalves, Luiz Marcos Garcia
contributor_str_mv Souto, Marcílio Carlos Pereira de
Gonçalves, Luiz Marcos Garcia
dc.subject.por.fl_str_mv Aprendizado de Máquina
Reconhecimento de Promotores
Bioinformática
topic Aprendizado de Máquina
Reconhecimento de Promotores
Bioinformática
Learning Machine
Promoters identification
Bioinformatics
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
dc.subject.eng.fl_str_mv Learning Machine
Promoters identification
Bioinformatics
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
description One of the most important goals of bioinformatics is the ability to identify genes in uncharacterized DNA sequences on world wide database. Gene expression on prokaryotes initiates when the RNA-polymerase enzyme interacts with DNA regions called promoters. In these regions are located the main regulatory elements of the transcription process. Despite the improvement of in vitro techniques for molecular biology analysis, characterizing and identifying a great number of promoters on a genome is a complex task. Nevertheless, the main drawback is the absence of a large set of promoters to identify conserved patterns among the species. Hence, a in silico method to predict them on any species is a challenge. Improved promoter prediction methods can be one step towards developing more reliable ab initio gene prediction methods. In this work, we present an empirical comparison of Machine Learning (ML) techniques such as Na¨ýve Bayes, Decision Trees, Support Vector Machines and Neural Networks, Voted Perceptron, PART, k-NN and and ensemble approaches (Bagging and Boosting) to the task of predicting Bacillus subtilis. In order to do so, we first built two data set of promoter and nonpromoter sequences for B. subtilis and a hybrid one. In order to evaluate of ML methods a cross-validation procedure is applied. Good results were obtained with methods of ML like SVM and Naïve Bayes using B. subtilis. However, we have not reached good results on hybrid database
publishDate 2005
dc.date.issued.fl_str_mv 2005-12-13
dc.date.available.fl_str_mv 2007-02-12
2014-12-17T14:56:02Z
dc.date.accessioned.fl_str_mv 2014-12-17T14:56:02Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv MONTEIRO, Meika Iwata. Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina. 2005. 92 f. Dissertação (Mestrado em Automação e Sistemas; Engenharia de Computação; Telecomunicações) - Universidade Federal do Rio Grande do Norte, Natal, 2005.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/jspui/handle/123456789/15416
identifier_str_mv MONTEIRO, Meika Iwata. Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina. 2005. 92 f. Dissertação (Mestrado em Automação e Sistemas; Engenharia de Computação; Telecomunicações) - Universidade Federal do Rio Grande do Norte, Natal, 2005.
url https://repositorio.ufrn.br/jspui/handle/123456789/15416
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia Elétrica
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Automação e Sistemas; Engenharia de Computação; Telecomunicações
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/15416/1/MeikaIM.pdf
https://repositorio.ufrn.br/bitstream/123456789/15416/6/MeikaIM.pdf.txt
https://repositorio.ufrn.br/bitstream/123456789/15416/7/MeikaIM.pdf.jpg
bitstream.checksum.fl_str_mv 87a604688aa5cd2c4f6aba8237c67210
0cbe216fbefbd6e311a02cb8efecc101
f66e63616a4d4568b8e4b93f9b60cc03
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1797777758941609984