Sistema computacional baseado em aprendizado de maquina para posicionamento taxonômico de bactérias utilizando dados fenotípicos

Detalhes bibliográficos
Ano de defesa: 2013
Autor(a) principal: Santana, Julio Galvão
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/1884/36136
Resumo: Orientadora : Profª. Drª. Maria Berenice Steffens
id UFPR_5dd5e39bc454dfc41d46a176748c3e2a
oai_identifier_str oai:acervodigital.ufpr.br:1884/36136
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str
spelling Santana, Julio GalvãoSteffens, Maria Berenice ReynaudRaittz, Roberto TadeuUniversidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática2014-10-14T21:10:59Z2014-10-14T21:10:59Z2013http://hdl.handle.net/1884/36136Orientadora : Profª. Drª. Maria Berenice SteffensCoorientador : Prof. Dr. Roberto Tadeu RaittzDissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 16/05/2013Inclui referênciasAs bactérias são organismos unicelulares que apresentam ampla diversidade morfológica, metabólica e ecológica. Estes microrganismos pertencem ao Domínio Bactéria que, atualmente, conta com 52 Filos. A taxonomia bacteriana inclui a descolberta, descrição e classificaçãode acordo com normas e princípios, o processo formal de atribuição de nome e a identificação propriamente dita, de um organismo desconhecido. Historicamente, a identificação e classificação de bactérias tem se baseado principlamente na morfologia, composição e meio de cultuvo, potencial de patogenicidade, fisiologia e bioquímica. atualmente, são também utilizadas informações de ordem fenotípica, genotípica, ecológica e filogenética para produzir uma taxonomia multidimensional. A proposta deste trabalho foi auxiliar na aplicação dos métodos convencionais atraés da associação da abordagem computacional ao processo de identificação e classificação de bactécrias. Foi aplicado o conceito de aprendizado de máquina no desenvolvimento de uma ferramenta que permite realizar o posicionamento taxonômico de bactérias baseado em ensaios bioquímicos e fisiológicos. O sistema apresenta funcionalidades que permitem ao usuário cadastrar artigos científicos e espécies bacterianas; cadastrar diferentes categorias de testes e os respectivos resultados (características) disponíveis na literatura ou obtidos no laboratório; obter relatórios referentes aos resultados cadastrados e, finalmente extrair características a serem utilizadas no treinamento da rede neural FAN (módulo integrado), para então obter o posicionamento taxonômico, em nível de gênero, de uma dada bactéria. Um protótipo foi construído com dados coletados de artigos que descrevem novas espécies de bactérias e o conjunto contem 228 espécies pertencentes a 10 gêneros. Em paralelo, foi estruturado um banco de dados para armazenamento e consula dos artigos. O treinamento da rede foi validado pelo Cross-validation ( Leave one out) com uma taxa de acerto de 93%. Isto indica que é possível obter a calssificação de bactérias utilizando somente resultados de ensaios bioquímicos e fisológicos. Palavras chaves: Taxonimia de bactérias, rede neural, bioinformáticaAbstract: Bacteria are unicellular organisms that display a wide morphological, metabolic and ecological diversity. These microorganisms belong to the domain Bacteria, which currently has 52 phyla. Bacterial taxonomy includes the discovery, description and classification according to rules and principles, the formal process of naming and identification, strictly speaking, an unknown organism. Historically, the identification and classification of bacteria has been mainly based on the morphology, composition of the culture medium, potential pathogenicity, physiology and biochemistry. Currently, phenotypic, genotypic, phylogenetic and ecological information is also used to produce a multidimensional taxonomy. The purpose of this study was to assist in the application of conventional methods by combining the computational approach to the identification and classification of bacteria process. The concept of machine learning as a tool which allows the taxonomic position of bacteria based on biochemical and physiological tests was applied in the development. The system displays features that allow the user to register scientific articles and bacterial species; to register different categories of tests and results (features) available in the literature or obtained in the laboratory; to obtain reports on the results registered and finally to extract features to be used in the FAN neural network training (integrated module), and then to obtain the taxonomic position of the genus of a certain bacterium. A prototype was built with data collected from articles describing new species of bacteria and the set contained 228 species belonging to 10 genera. In parallel, it was created a database for storage and retrieval of articles. Network training was validated by cross-validation (leave one out) with an accuracy rate of 93%. This indicates that it is possible to obtain the classification of bacteria using only results from biochemical and physiological tests. Key words: Taxonomy of bacteria, neural network, bioinformatics108p. : il. algumas color., tabs., grafs.application/pdfDisponível em formato digitalDissertaçõesCiencia da computaçãoSistema computacional baseado em aprendizado de maquina para posicionamento taxonômico de bactérias utilizando dados fenotípicosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - D - JULIO GALVAO SANTANA.pdfapplication/pdf2958261https://acervodigital.ufpr.br/bitstream/1884/36136/1/R%20-%20D%20-%20JULIO%20GALVAO%20SANTANA.pdf78be6c084d2871cd862b7387ee0a790bMD51open accessTEXTR - D - JULIO GALVAO SANTANA.pdf.txtR - D - JULIO GALVAO SANTANA.pdf.txtExtracted Texttext/plain171210https://acervodigital.ufpr.br/bitstream/1884/36136/2/R%20-%20D%20-%20JULIO%20GALVAO%20SANTANA.pdf.txt97ce7e28620192a838250354f583fff8MD52open accessTHUMBNAILR - D - JULIO GALVAO SANTANA.pdf.jpgR - D - JULIO GALVAO SANTANA.pdf.jpgGenerated Thumbnailimage/jpeg1345https://acervodigital.ufpr.br/bitstream/1884/36136/3/R%20-%20D%20-%20JULIO%20GALVAO%20SANTANA.pdf.jpgcaacb5b83797fdcd999031689d0162d0MD53open access1884/361362016-04-08 03:05:47.233open accessoai:acervodigital.ufpr.br:1884/36136Repositório InstitucionalPUBhttp://acervodigital.ufpr.br/oai/requestinformacaodigital@ufpr.bropendoar:3082016-04-08T06:05:47Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Sistema computacional baseado em aprendizado de maquina para posicionamento taxonômico de bactérias utilizando dados fenotípicos
title Sistema computacional baseado em aprendizado de maquina para posicionamento taxonômico de bactérias utilizando dados fenotípicos
spellingShingle Sistema computacional baseado em aprendizado de maquina para posicionamento taxonômico de bactérias utilizando dados fenotípicos
Santana, Julio Galvão
Dissertações
Ciencia da computação
title_short Sistema computacional baseado em aprendizado de maquina para posicionamento taxonômico de bactérias utilizando dados fenotípicos
title_full Sistema computacional baseado em aprendizado de maquina para posicionamento taxonômico de bactérias utilizando dados fenotípicos
title_fullStr Sistema computacional baseado em aprendizado de maquina para posicionamento taxonômico de bactérias utilizando dados fenotípicos
title_full_unstemmed Sistema computacional baseado em aprendizado de maquina para posicionamento taxonômico de bactérias utilizando dados fenotípicos
title_sort Sistema computacional baseado em aprendizado de maquina para posicionamento taxonômico de bactérias utilizando dados fenotípicos
author Santana, Julio Galvão
author_facet Santana, Julio Galvão
author_role author
dc.contributor.other.pt_BR.fl_str_mv Steffens, Maria Berenice Reynaud
Raittz, Roberto Tadeu
Universidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática
dc.contributor.author.fl_str_mv Santana, Julio Galvão
dc.subject.por.fl_str_mv Dissertações
Ciencia da computação
topic Dissertações
Ciencia da computação
description Orientadora : Profª. Drª. Maria Berenice Steffens
publishDate 2013
dc.date.issued.fl_str_mv 2013
dc.date.accessioned.fl_str_mv 2014-10-14T21:10:59Z
dc.date.available.fl_str_mv 2014-10-14T21:10:59Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1884/36136
url http://hdl.handle.net/1884/36136
dc.language.iso.fl_str_mv por
language por
dc.relation.pt_BR.fl_str_mv Disponível em formato digital
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 108p. : il. algumas color., tabs., grafs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/36136/1/R%20-%20D%20-%20JULIO%20GALVAO%20SANTANA.pdf
https://acervodigital.ufpr.br/bitstream/1884/36136/2/R%20-%20D%20-%20JULIO%20GALVAO%20SANTANA.pdf.txt
https://acervodigital.ufpr.br/bitstream/1884/36136/3/R%20-%20D%20-%20JULIO%20GALVAO%20SANTANA.pdf.jpg
bitstream.checksum.fl_str_mv 78be6c084d2871cd862b7387ee0a790b
97ce7e28620192a838250354f583fff8
caacb5b83797fdcd999031689d0162d0
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv informacaodigital@ufpr.br
_version_ 1847526258525601792