Interpretação ontológica de bancos de dados biomédicos: modelos de interpretação e enriquecimento axiomático

Detalhes bibliográficos
Ano de defesa: 2016
Autor(a) principal: SILVA, Filipe Santana da
Orientador(a): FREITAS, Frederico Luiz Gonçalves de
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/21010
Resumo: Com o crescimento em quantidade e dimensão dos bancos de dados (BDs) biomédicos, ontologias foram incorporadas para anotá-los semanticamente, facilitando a interpretação, acesso, recuperação e processamento dos dados. Entretanto, como ontologias e BDs são criados com propósitos diferentes, não é possível interpretar registros de BDs de forma clara e definida. Ontologias supradomínio podem ser empregadas para fornecer classes e relações, de maneira que o conteúdo de BDs anotados seja representado e interpretado adequadamente. A representação das anotações evita ambiguidades, mantendo o engajamento ontológico e permitindo consultar os dados utilizando raciocínio. Nossa hipótese é de que é possível interpretar ontologicamente o conteúdo de um ou mais BDs anotados, determinando como as entidades anotadas dos BDs se relacionam. O objetivo deste trabalho é avaliar e propor estratégias que auxiliem o usuário no processo de interpretação ontológica de registros de BDs biomédicos como indivíduos, classes e disposições, a partir de ontologias formais. A interpretação ontológica é construída ao empregar classes e relações da BioTopLite2 (BTL2), organizando e estendendo ontologias utilizadas como anotação, e.g. GO, ChEBI, SNOMED e PRO; provenientes dos BDs UniProt, Ensembl e NCBI Taxonomy. São investigadas quatro formas de interpretação, viz. quando as anotações são: indivíduos, subclasses, incluem disposições, e um híbrido entre subclasses e disposições. A interpretação como subclasses é a mais indicada ao comparar questões de desempenho, expressividade e capacidade de consultar, utilizando raciocínio e integração semântica. Demonstramos que esse tipo de interpretação é aplicável na prática, apresentando bom desempenho para consultas utilizando raciocínio. Foi desenvolvido um protótipo integrativO CBR para automatizar a interpretação ontológica como subclasses. A ferramenta é responsável por reconstruir o processo de interpretação ontológica, recuperando indivíduos, identificando classes e gerando uma ontologia como modelo de interpretação. A interpretação ontológica de anotações apresenta benefícios: verificar a consistência do BD, e.g. se existem anotações contraditórias; representação formal e ontológica da organização dos dados; a análise do engajamento ontológico dos dados anotados; e, a criação de consultas que utilizam raciocínio para explorar os dados interpretados.
id UFPE_c1ac4b81b5a9ff7155cd5b538dd987d5
oai_identifier_str oai:repositorio.ufpe.br:123456789/21010
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling SILVA, Filipe Santana dahttp://lattes.cnpq.br/8268902147804566http://lattes.cnpq.br/6195215666638965FREITAS, Frederico Luiz Gonçalves deSCHULZ, Stefan P.2017-08-30T12:02:06Z2017-08-30T12:02:06Z2016-07-18https://repositorio.ufpe.br/handle/123456789/21010Com o crescimento em quantidade e dimensão dos bancos de dados (BDs) biomédicos, ontologias foram incorporadas para anotá-los semanticamente, facilitando a interpretação, acesso, recuperação e processamento dos dados. Entretanto, como ontologias e BDs são criados com propósitos diferentes, não é possível interpretar registros de BDs de forma clara e definida. Ontologias supradomínio podem ser empregadas para fornecer classes e relações, de maneira que o conteúdo de BDs anotados seja representado e interpretado adequadamente. A representação das anotações evita ambiguidades, mantendo o engajamento ontológico e permitindo consultar os dados utilizando raciocínio. Nossa hipótese é de que é possível interpretar ontologicamente o conteúdo de um ou mais BDs anotados, determinando como as entidades anotadas dos BDs se relacionam. O objetivo deste trabalho é avaliar e propor estratégias que auxiliem o usuário no processo de interpretação ontológica de registros de BDs biomédicos como indivíduos, classes e disposições, a partir de ontologias formais. A interpretação ontológica é construída ao empregar classes e relações da BioTopLite2 (BTL2), organizando e estendendo ontologias utilizadas como anotação, e.g. GO, ChEBI, SNOMED e PRO; provenientes dos BDs UniProt, Ensembl e NCBI Taxonomy. São investigadas quatro formas de interpretação, viz. quando as anotações são: indivíduos, subclasses, incluem disposições, e um híbrido entre subclasses e disposições. A interpretação como subclasses é a mais indicada ao comparar questões de desempenho, expressividade e capacidade de consultar, utilizando raciocínio e integração semântica. Demonstramos que esse tipo de interpretação é aplicável na prática, apresentando bom desempenho para consultas utilizando raciocínio. Foi desenvolvido um protótipo integrativO CBR para automatizar a interpretação ontológica como subclasses. A ferramenta é responsável por reconstruir o processo de interpretação ontológica, recuperando indivíduos, identificando classes e gerando uma ontologia como modelo de interpretação. A interpretação ontológica de anotações apresenta benefícios: verificar a consistência do BD, e.g. se existem anotações contraditórias; representação formal e ontológica da organização dos dados; a análise do engajamento ontológico dos dados anotados; e, a criação de consultas que utilizam raciocínio para explorar os dados interpretados.CNPQCAPESWith the growth of data bases (DBs) in number and size, ontologies have been incorporated to annotate DBs semantically, facilitating the record interpretation, access, retrieval and methods for querying data. However, as ontologies and DBs are designed with different purposes, it is not possible to interpret DB annotated DB records in a clear and defined way. Upper-domain ontologies can be used as provider of classes and relations whether the annotated content of annotated entities from DBs are adequately interpreted and represented. The representation ensure that ambiguities are avoided by keeping the ontological commitment and allowing queries supported by reasoning. Our hypothesis is that it is possible to interpret ontologically annotated content from one or more DBs, determining how annotated entities relate to each other. The aim of this work is to evaluate and propose strategies to assist the user in the ontological interpretation process of Biological DBs as individuals, classes and dispositions. The ontological interpretation of Biological DBs is created by reusing classes and relations from BTL2, organizing and extending ontologies used to annotate data, e.g. GO, ChEBI, SNOMED and PRO; from UniProt, Ensembl and NCBI Taxonomy DBs. Four ways of interpreting annotated data are investigated, viz. as ontology individuals; subclasses; dispositions; and, a hybrid among classes and dispositions. Interpretation as subclasses was identified as the appropriate choice when considering: reasoning performance; expressiveness; and, querying with reasoning and ontology-based data integration approaches are taken into account. It has been shown that this type of interpretation is useful in practice, with a good performance for (both) reasoning and querying. A prototype called integrativO CBR was created in order to automate interpretation as subclasses. This tool is responsible for recreating the process of applying the ontological interpretation, enabling the retrieval of individuals from data, referent classes identification, and generation of an interpretation model. The ontological interpretation of annotations has several benefits, such as: DB consistency evaluation for conflicting annotations; formal and ontological representation of how data is organized; verifying the ontological commitment of annotated data; and, the ability to create queries to explore reasoning.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessOntologiaInterpretaçãoBanco de dados biológicosAnotaçãoRepresentaçãoInterpretação ontológica de bancos de dados biomédicos: modelos de interpretação e enriquecimento axiomáticoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisdoutoradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILTESE - FILIPE SANTANA DA SILVA.pdf.jpgTESE - FILIPE SANTANA DA SILVA.pdf.jpgGenerated Thumbnailimage/jpeg1311https://repositorio.ufpe.br/bitstream/123456789/21010/5/TESE%20-%20FILIPE%20SANTANA%20DA%20SILVA.pdf.jpg478944e7794deadc76bc2fe780226fe6MD55ORIGINALTESE - FILIPE SANTANA DA SILVA.pdfTESE - FILIPE SANTANA DA SILVA.pdfapplication/pdf5962947https://repositorio.ufpe.br/bitstream/123456789/21010/1/TESE%20-%20FILIPE%20SANTANA%20DA%20SILVA.pdf59a26fcd52c6403dbc9319ff678eaf81MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/21010/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82311https://repositorio.ufpe.br/bitstream/123456789/21010/3/license.txt4b8a02c7f2818eaf00dcf2260dd5eb08MD53TEXTTESE - FILIPE SANTANA DA SILVA.pdf.txtTESE - FILIPE SANTANA DA SILVA.pdf.txtExtracted texttext/plain602012https://repositorio.ufpe.br/bitstream/123456789/21010/4/TESE%20-%20FILIPE%20SANTANA%20DA%20SILVA.pdf.txt7d06a87380de7623084908ca4fc2f896MD54123456789/210102019-10-25 12:56:56.35oai:repositorio.ufpe.br:123456789/21010TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLMKgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUEUgaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8ocykgbm9tZShzKSBkbyhzKSBhdXRvciAoZXMpIGRvcyBkaXJlaXRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRvIHByZXZpc3RvIG5hIGFsw61uZWEgYykuCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T15:56:56Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Interpretação ontológica de bancos de dados biomédicos: modelos de interpretação e enriquecimento axiomático
title Interpretação ontológica de bancos de dados biomédicos: modelos de interpretação e enriquecimento axiomático
spellingShingle Interpretação ontológica de bancos de dados biomédicos: modelos de interpretação e enriquecimento axiomático
SILVA, Filipe Santana da
Ontologia
Interpretação
Banco de dados biológicos
Anotação
Representação
title_short Interpretação ontológica de bancos de dados biomédicos: modelos de interpretação e enriquecimento axiomático
title_full Interpretação ontológica de bancos de dados biomédicos: modelos de interpretação e enriquecimento axiomático
title_fullStr Interpretação ontológica de bancos de dados biomédicos: modelos de interpretação e enriquecimento axiomático
title_full_unstemmed Interpretação ontológica de bancos de dados biomédicos: modelos de interpretação e enriquecimento axiomático
title_sort Interpretação ontológica de bancos de dados biomédicos: modelos de interpretação e enriquecimento axiomático
author SILVA, Filipe Santana da
author_facet SILVA, Filipe Santana da
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/8268902147804566
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/6195215666638965
dc.contributor.author.fl_str_mv SILVA, Filipe Santana da
dc.contributor.advisor1.fl_str_mv FREITAS, Frederico Luiz Gonçalves de
dc.contributor.advisor-co1.fl_str_mv SCHULZ, Stefan P.
contributor_str_mv FREITAS, Frederico Luiz Gonçalves de
SCHULZ, Stefan P.
dc.subject.por.fl_str_mv Ontologia
Interpretação
Banco de dados biológicos
Anotação
Representação
topic Ontologia
Interpretação
Banco de dados biológicos
Anotação
Representação
description Com o crescimento em quantidade e dimensão dos bancos de dados (BDs) biomédicos, ontologias foram incorporadas para anotá-los semanticamente, facilitando a interpretação, acesso, recuperação e processamento dos dados. Entretanto, como ontologias e BDs são criados com propósitos diferentes, não é possível interpretar registros de BDs de forma clara e definida. Ontologias supradomínio podem ser empregadas para fornecer classes e relações, de maneira que o conteúdo de BDs anotados seja representado e interpretado adequadamente. A representação das anotações evita ambiguidades, mantendo o engajamento ontológico e permitindo consultar os dados utilizando raciocínio. Nossa hipótese é de que é possível interpretar ontologicamente o conteúdo de um ou mais BDs anotados, determinando como as entidades anotadas dos BDs se relacionam. O objetivo deste trabalho é avaliar e propor estratégias que auxiliem o usuário no processo de interpretação ontológica de registros de BDs biomédicos como indivíduos, classes e disposições, a partir de ontologias formais. A interpretação ontológica é construída ao empregar classes e relações da BioTopLite2 (BTL2), organizando e estendendo ontologias utilizadas como anotação, e.g. GO, ChEBI, SNOMED e PRO; provenientes dos BDs UniProt, Ensembl e NCBI Taxonomy. São investigadas quatro formas de interpretação, viz. quando as anotações são: indivíduos, subclasses, incluem disposições, e um híbrido entre subclasses e disposições. A interpretação como subclasses é a mais indicada ao comparar questões de desempenho, expressividade e capacidade de consultar, utilizando raciocínio e integração semântica. Demonstramos que esse tipo de interpretação é aplicável na prática, apresentando bom desempenho para consultas utilizando raciocínio. Foi desenvolvido um protótipo integrativO CBR para automatizar a interpretação ontológica como subclasses. A ferramenta é responsável por reconstruir o processo de interpretação ontológica, recuperando indivíduos, identificando classes e gerando uma ontologia como modelo de interpretação. A interpretação ontológica de anotações apresenta benefícios: verificar a consistência do BD, e.g. se existem anotações contraditórias; representação formal e ontológica da organização dos dados; a análise do engajamento ontológico dos dados anotados; e, a criação de consultas que utilizam raciocínio para explorar os dados interpretados.
publishDate 2016
dc.date.issued.fl_str_mv 2016-07-18
dc.date.accessioned.fl_str_mv 2017-08-30T12:02:06Z
dc.date.available.fl_str_mv 2017-08-30T12:02:06Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/21010
url https://repositorio.ufpe.br/handle/123456789/21010
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Computacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/21010/5/TESE%20-%20FILIPE%20SANTANA%20DA%20SILVA.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/21010/1/TESE%20-%20FILIPE%20SANTANA%20DA%20SILVA.pdf
https://repositorio.ufpe.br/bitstream/123456789/21010/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/21010/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/21010/4/TESE%20-%20FILIPE%20SANTANA%20DA%20SILVA.pdf.txt
bitstream.checksum.fl_str_mv 478944e7794deadc76bc2fe780226fe6
59a26fcd52c6403dbc9319ff678eaf81
e39d27027a6cc9cb039ad269a5db8e34
4b8a02c7f2818eaf00dcf2260dd5eb08
7d06a87380de7623084908ca4fc2f896
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1862742051328622592