Suporte à geração de dados abertos ligados em bioinformática
Ano de defesa: | 2019 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | , , |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade de São Paulo
|
Programa de Pós-Graduação: |
Computação Aplicada
|
Departamento: |
Não Informado pela instituição
|
País: |
BR
|
Link de acesso: | https://doi.org/10.11606/D.59.2020.tde-21012020-225928 |
Resumo: | Diferentes conjuntos de dados na web encontram-se em formatos que dificultam o processamento e a extração automática de informação. A transformação desses dados em Dados Abertos Ligados (DAL) pode facilitar o processamento e a obtenção de novos conhecimentos. DAL define um conjunto de dados compreendido/interpretável por computadores, interconectado e semanticamente anotado. Diversos domínios de conhecimento podem ser beneficiados com o uso de DAL, dentre os quais destaca-se a bioinformática. A bioinformática é caracterizada pelo uso e a disponibilização de grandes quantidades de dados na web, normalmente armazenados em arquivos texto semiestruturados. Existem diferentes abordagens de transformação de dados estruturados e semiestruturados para DAL no domínio biomédico. Porém, essas abordagens não podem ser facilmente estendidas para a bioinformática. Este trabalho teve por objetivo propor uma abordagem de transformação de dados semiestruturados de bioinformática para DAL, chamada de SSD2LOD Transformation Approach. Esta abordagem é composta por quatro atividades, as quais orientam a definição de questões de competência (perguntas de interesse), a especificação de regras de transformação, a transformação dos dados, e, finalmente, a exploração do conjunto DAL resultante. Adicionamente, desenvolvemos um conjunto de ferramentas de suporte para executar o processo de transformação e exploração dos dados, de modo a facilitar a aplicação da abordagem. Na sequência, aplicamos a abordagem proposta em uma prova de conceito utilizando dados de um experimento de genômica funcional disponibilizado na plataforma ArrayExpress. A abordagem SSD2LOD Transformation Approach representa uma solução adequada para a transformação de dados de bioinformática em DAL, permitindo alcançar os benefícios da web semântica neste domínio. |
id |
USP_d8adb7e2e02925a127934c25cf4400be |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-21012020-225928 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
|
spelling |
info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis Suporte à geração de dados abertos ligados em bioinformática Support for the generation of linked open data in bioinformatics 2019-11-20Clever Ricardo Guareis de FariasJose Eduardo Santarem SegundoMarilde Terezinha Prado SantosRicardo Zorzetto Nicoliello VencioGabriel do Couto Seabra Gusmão de PaulaUniversidade de São PauloComputação AplicadaUSPBR Bioinformática Bioinformatics Dados abertos ligados Dados semiestruturados Linked open data Regras de transformação Semi-structured data Transformation rules Diferentes conjuntos de dados na web encontram-se em formatos que dificultam o processamento e a extração automática de informação. A transformação desses dados em Dados Abertos Ligados (DAL) pode facilitar o processamento e a obtenção de novos conhecimentos. DAL define um conjunto de dados compreendido/interpretável por computadores, interconectado e semanticamente anotado. Diversos domínios de conhecimento podem ser beneficiados com o uso de DAL, dentre os quais destaca-se a bioinformática. A bioinformática é caracterizada pelo uso e a disponibilização de grandes quantidades de dados na web, normalmente armazenados em arquivos texto semiestruturados. Existem diferentes abordagens de transformação de dados estruturados e semiestruturados para DAL no domínio biomédico. Porém, essas abordagens não podem ser facilmente estendidas para a bioinformática. Este trabalho teve por objetivo propor uma abordagem de transformação de dados semiestruturados de bioinformática para DAL, chamada de SSD2LOD Transformation Approach. Esta abordagem é composta por quatro atividades, as quais orientam a definição de questões de competência (perguntas de interesse), a especificação de regras de transformação, a transformação dos dados, e, finalmente, a exploração do conjunto DAL resultante. Adicionamente, desenvolvemos um conjunto de ferramentas de suporte para executar o processo de transformação e exploração dos dados, de modo a facilitar a aplicação da abordagem. Na sequência, aplicamos a abordagem proposta em uma prova de conceito utilizando dados de um experimento de genômica funcional disponibilizado na plataforma ArrayExpress. A abordagem SSD2LOD Transformation Approach representa uma solução adequada para a transformação de dados de bioinformática em DAL, permitindo alcançar os benefícios da web semântica neste domínio. Data on the web are frequently stored in formats that hinder the automatic processing and extraction of knowledge. However, the transformation of those data into Linked Open Data (LOD) may facilitate the discovery of new knowledge. LOD defines a machinereadable, interconnected and semantically annotated dataset. The bioinformatics domain may benefit from the use of LOD, since it is characterized by the use and availability of large amounts of data on the web, usually stored in semi-structured text files. There are different approaches to support the transformation of structured and semi-structured data into LOD in the biomedical domain. However, these approaches are not easily applied to the bioinformatics domain. This work aimed at developing a transformation approach from semi-structured bioinformatics data into LOD, called SSD2LOD Transformation Approach. The proposed approach consists of four activities, which guide the definition of competency questions (questions of interest), specification of transformation rules, data transformation, and, finally, exploration of the produced LOD set. Additionally, we have developed a toolset to support the process of data transformation and exploration of our LOD transformation approach. Next, we have applied the proposed approach in a proof of concept using source data from a functional genomics experiment available at ArrayExpress. Our approach supports the transformation of bioinformatics data into LOD, thus enabling the benefits of the semantic web in this domain. https://doi.org/10.11606/D.59.2020.tde-21012020-225928info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2023-12-21T19:45:21Zoai:teses.usp.br:tde-21012020-225928Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-05-15T00:05:01Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.pt.fl_str_mv |
Suporte à geração de dados abertos ligados em bioinformática |
dc.title.alternative.en.fl_str_mv |
Support for the generation of linked open data in bioinformatics |
title |
Suporte à geração de dados abertos ligados em bioinformática |
spellingShingle |
Suporte à geração de dados abertos ligados em bioinformática Gabriel do Couto Seabra Gusmão de Paula |
title_short |
Suporte à geração de dados abertos ligados em bioinformática |
title_full |
Suporte à geração de dados abertos ligados em bioinformática |
title_fullStr |
Suporte à geração de dados abertos ligados em bioinformática |
title_full_unstemmed |
Suporte à geração de dados abertos ligados em bioinformática |
title_sort |
Suporte à geração de dados abertos ligados em bioinformática |
author |
Gabriel do Couto Seabra Gusmão de Paula |
author_facet |
Gabriel do Couto Seabra Gusmão de Paula |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Clever Ricardo Guareis de Farias |
dc.contributor.referee1.fl_str_mv |
Jose Eduardo Santarem Segundo |
dc.contributor.referee2.fl_str_mv |
Marilde Terezinha Prado Santos |
dc.contributor.referee3.fl_str_mv |
Ricardo Zorzetto Nicoliello Vencio |
dc.contributor.author.fl_str_mv |
Gabriel do Couto Seabra Gusmão de Paula |
contributor_str_mv |
Clever Ricardo Guareis de Farias Jose Eduardo Santarem Segundo Marilde Terezinha Prado Santos Ricardo Zorzetto Nicoliello Vencio |
description |
Diferentes conjuntos de dados na web encontram-se em formatos que dificultam o processamento e a extração automática de informação. A transformação desses dados em Dados Abertos Ligados (DAL) pode facilitar o processamento e a obtenção de novos conhecimentos. DAL define um conjunto de dados compreendido/interpretável por computadores, interconectado e semanticamente anotado. Diversos domínios de conhecimento podem ser beneficiados com o uso de DAL, dentre os quais destaca-se a bioinformática. A bioinformática é caracterizada pelo uso e a disponibilização de grandes quantidades de dados na web, normalmente armazenados em arquivos texto semiestruturados. Existem diferentes abordagens de transformação de dados estruturados e semiestruturados para DAL no domínio biomédico. Porém, essas abordagens não podem ser facilmente estendidas para a bioinformática. Este trabalho teve por objetivo propor uma abordagem de transformação de dados semiestruturados de bioinformática para DAL, chamada de SSD2LOD Transformation Approach. Esta abordagem é composta por quatro atividades, as quais orientam a definição de questões de competência (perguntas de interesse), a especificação de regras de transformação, a transformação dos dados, e, finalmente, a exploração do conjunto DAL resultante. Adicionamente, desenvolvemos um conjunto de ferramentas de suporte para executar o processo de transformação e exploração dos dados, de modo a facilitar a aplicação da abordagem. Na sequência, aplicamos a abordagem proposta em uma prova de conceito utilizando dados de um experimento de genômica funcional disponibilizado na plataforma ArrayExpress. A abordagem SSD2LOD Transformation Approach representa uma solução adequada para a transformação de dados de bioinformática em DAL, permitindo alcançar os benefícios da web semântica neste domínio. |
publishDate |
2019 |
dc.date.issued.fl_str_mv |
2019-11-20 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://doi.org/10.11606/D.59.2020.tde-21012020-225928 |
url |
https://doi.org/10.11606/D.59.2020.tde-21012020-225928 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade de São Paulo |
dc.publisher.program.fl_str_mv |
Computação Aplicada |
dc.publisher.initials.fl_str_mv |
USP |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
Universidade de São Paulo |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1786377026865725440 |