Uma abordagem baseada em ontologias e conectores para a integração semântica de ferramentas de análise de expressão gênica

As pesquisas em biologia molecular têm produzido uma grande quantidade de dados, os quais embutem informações sobre diferentes fenômenos biológicos. Neste sentido, a bioinformática se destaca como uma área de pesquisa multidisciplinar que visa, principalmente, o desenvolvimento de ferramentas (siste...

Nível de Acesso:openAccess
Publication Date:2011
Main Author: Flavia Akemi Miyazaki
Orientador/a: Clever Ricardo Guareis de Farias
Co-advisor: Ricardo Zorzetto Nicoliello Vencio
Banca: Angela Kaysel Cruz, Agma Juci Machado Traina
Format: Dissertação
Language:por
Published: Universidade de São Paulo
Programa: Bioinformática
Assuntos em Português:
Assuntos em Inglês:
Online Access:http://www.teses.usp.br/teses/disponiveis/95/95131/tde-22062012-150304/
Resumo Português:As pesquisas em biologia molecular têm produzido uma grande quantidade de dados, os quais embutem informações sobre diferentes fenômenos biológicos. Neste sentido, a bioinformática se destaca como uma área de pesquisa multidisciplinar que visa, principalmente, o desenvolvimento de ferramentas (sistemas) computacionais para auxiliar na descoberta de conhecimento a partir de dados biológicos. Dentro da bioinformática, a área de genômica funcional procura estudar as funções gênicas através da medição simultânea e em larga escala dos níveis de expressão gênica de um genoma. Diferentes ferramentas são utilizadas no processo de análise de expressão gênica, cada qual provê suporte a uma atividade de análise específica. Embora alguns ambientes de descoberta de conhecimento ofereçam suporte integrado a este processo de análise e exploração de dados, a maior parte das ferramentas de análise é desenvolvida independentemente de outras ferramentas e ambientes de descoberta de conhecimento. Este cenário representa um desafio para biologistas que precisam combinar e integrar diferentes ferramentas, muitas vezes de forma ad hoc, custosa e sujeita a erros. Modelos conceituais, tais como ontologias, têm contribuído para o sucesso do desenvolvimento de sistemas computacionais em diferentes domínios de aplicação. O desenvolvimento de tais modelos tem por objetivo representar corretamente, em alto nível de abstração, conceitos e situações pertinentes a um dado domínio de interesse. Esta representação abstrata facilita não apenas o entendimento de um dado domínio, mas também serve como base para o processo de desenvolvimento do sistema como um todo. O objetivo deste trabalho é investigar o desenvolvimento e o uso de modelos conceituais em geral e ontologias em particular, na integração de ferramentas na área de análise de expressão gênica. De forma específica, este trabalho tem por objetivo propor uma abordagem para a integração semântica de ferramentas de análise de expressão gênica a partir do uso de conectores e de uma ontologia de domínio. Essa abordagem foi aplicada no desenvolvimento de estudos de caso envolvendo a criação de diferentes ambientes integrados para a análise de expressão gênica e mostrou-se eficaz.
Resumo inglês:Molecular biology researches are increasingly producing large amounts of data regarding underlying biological phenomena. Bioinformatics is a multidisciplinary research field whose main objective is the development of theories and information systems to help the process of knowledge discovery from biological data. Functional genomics is a field of study bioinformatics concerned with the study of gene function through parallel and large scale expression measurements of a genome. A variety of software tools are usually combined and used in a knowledge discovery process, each providing support for a specific data analysis task. Although some tools are already provided as part of an integrated knowledge discovery environment, most of them are developed independently of other software tools and knowledge discovery environments. This scenario poses a problem and a challenge for biologists that need to combine and integrate different tools in an ad hoc, time consuming and error prone process. Conceptual models, such as ontologies, have contributed to the successful development of information systems in different application domains. The development of such models aims at creating a clear and precise description of the elements of a given domain at a high abstraction level. This abstract and high level description not only promotes a shared understanding of the domain, but also serves as basis for the development process of supporting applications in the domain. This work aims at investigating the development and use of conceptual models in general and ontologies in particular to support the integration of gene expression data analysis systems. Specifically, this work proposes an approach for the semantic integration of gene expression analysis tools using connectors and a domain ontology. This approach was applied in the development of a number of case studies aiming at creating integrated environments for gene expression analysis and proved its effectiveness.