Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais

Detalhes bibliográficos
Ano de defesa: 2001
Autor(a) principal: Silveira, Iraci Cristina da
Orientador(a): Heuser, Carlos Alberto
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/10183/2178
Resumo: Existe uma necessidade latente de pesquisar, filtrar e manipular informações disponíveis em diversos formatos irregulares, entre elas as informações distribuídas na WWW (World Wide Web). Esses tipos de dados são semi-estruturados, pois não possuem uma estrutura explícita e regular, o que dificulta sua manipulação. Este trabalho apresenta como proposta o projeto de uma ferramenta para realizar a extração semântica e semi-automática de dados semi-estruturados. O usuário especifica, através de uma interface visual, um exemplo da estrutura hierárquica do documento e de seu relacionamento com os conceitos da ontologia, gerando uma gramática descritiva da estrutura implícita do mesmo. A partir dessa gramática, a ferramenta realiza a extração dos próximos documentos de forma automática, reestruturando o resultado em um formato regular de dados, neste caso, XML (eXtensible Markup Language). Além da conceituação do método de extração, são apresentados os experimentos realizados com o protótipo da ferramenta, bem como, os resultados obtidos nestes experimentos. Para a construção desta ferramenta, são analisadas características de outros métodos que constituem o estado da arte em extração de dados semi-estruturados.
id URGS_11648ac19062180268942d5bbcd60be4
oai_identifier_str oai:www.lume.ufrgs.br:10183/2178
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Silveira, Iraci Cristina daHeuser, Carlos Alberto2007-06-06T17:20:39Z2001http://hdl.handle.net/10183/2178000315470Existe uma necessidade latente de pesquisar, filtrar e manipular informações disponíveis em diversos formatos irregulares, entre elas as informações distribuídas na WWW (World Wide Web). Esses tipos de dados são semi-estruturados, pois não possuem uma estrutura explícita e regular, o que dificulta sua manipulação. Este trabalho apresenta como proposta o projeto de uma ferramenta para realizar a extração semântica e semi-automática de dados semi-estruturados. O usuário especifica, através de uma interface visual, um exemplo da estrutura hierárquica do documento e de seu relacionamento com os conceitos da ontologia, gerando uma gramática descritiva da estrutura implícita do mesmo. A partir dessa gramática, a ferramenta realiza a extração dos próximos documentos de forma automática, reestruturando o resultado em um formato regular de dados, neste caso, XML (eXtensible Markup Language). Além da conceituação do método de extração, são apresentados os experimentos realizados com o protótipo da ferramenta, bem como, os resultados obtidos nestes experimentos. Para a construção desta ferramenta, são analisadas características de outros métodos que constituem o estado da arte em extração de dados semi-estruturados.application/pdfporArmazenamento : DadosRecuperacao : InformacaoBanco : Dados semi-estruturadosExtração semânticaExtração semântica de dados semi-estruturados através de exemplos e ferramentas visuaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2001mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000315470.pdf000315470.pdfTexto completoapplication/pdf2498463http://www.lume.ufrgs.br/bitstream/10183/2178/1/000315470.pdfbe5f84a4d3bf2059088438885250827cMD51TEXT000315470.pdf.txt000315470.pdf.txtExtracted Texttext/plain243540http://www.lume.ufrgs.br/bitstream/10183/2178/2/000315470.pdf.txt7729d11932e71aa0eb61c71d8d8bfd1eMD52THUMBNAIL000315470.pdf.jpg000315470.pdf.jpgGenerated Thumbnailimage/jpeg1160http://www.lume.ufrgs.br/bitstream/10183/2178/3/000315470.pdf.jpg68e552d20c836950077ab588c1e1d38bMD5310183/21782018-10-15 09:01:18.785oai:www.lume.ufrgs.br:10183/2178Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532018-10-15T12:01:18Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais
title Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais
spellingShingle Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais
Silveira, Iraci Cristina da
Armazenamento : Dados
Recuperacao : Informacao
Banco : Dados semi-estruturados
Extração semântica
title_short Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais
title_full Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais
title_fullStr Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais
title_full_unstemmed Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais
title_sort Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais
author Silveira, Iraci Cristina da
author_facet Silveira, Iraci Cristina da
author_role author
dc.contributor.author.fl_str_mv Silveira, Iraci Cristina da
dc.contributor.advisor1.fl_str_mv Heuser, Carlos Alberto
contributor_str_mv Heuser, Carlos Alberto
dc.subject.por.fl_str_mv Armazenamento : Dados
Recuperacao : Informacao
Banco : Dados semi-estruturados
Extração semântica
topic Armazenamento : Dados
Recuperacao : Informacao
Banco : Dados semi-estruturados
Extração semântica
description Existe uma necessidade latente de pesquisar, filtrar e manipular informações disponíveis em diversos formatos irregulares, entre elas as informações distribuídas na WWW (World Wide Web). Esses tipos de dados são semi-estruturados, pois não possuem uma estrutura explícita e regular, o que dificulta sua manipulação. Este trabalho apresenta como proposta o projeto de uma ferramenta para realizar a extração semântica e semi-automática de dados semi-estruturados. O usuário especifica, através de uma interface visual, um exemplo da estrutura hierárquica do documento e de seu relacionamento com os conceitos da ontologia, gerando uma gramática descritiva da estrutura implícita do mesmo. A partir dessa gramática, a ferramenta realiza a extração dos próximos documentos de forma automática, reestruturando o resultado em um formato regular de dados, neste caso, XML (eXtensible Markup Language). Além da conceituação do método de extração, são apresentados os experimentos realizados com o protótipo da ferramenta, bem como, os resultados obtidos nestes experimentos. Para a construção desta ferramenta, são analisadas características de outros métodos que constituem o estado da arte em extração de dados semi-estruturados.
publishDate 2001
dc.date.issued.fl_str_mv 2001
dc.date.accessioned.fl_str_mv 2007-06-06T17:20:39Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/2178
dc.identifier.nrb.pt_BR.fl_str_mv 000315470
url http://hdl.handle.net/10183/2178
identifier_str_mv 000315470
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/2178/1/000315470.pdf
http://www.lume.ufrgs.br/bitstream/10183/2178/2/000315470.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/2178/3/000315470.pdf.jpg
bitstream.checksum.fl_str_mv be5f84a4d3bf2059088438885250827c
7729d11932e71aa0eb61c71d8d8bfd1e
68e552d20c836950077ab588c1e1d38b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1797064854229483520