Preenchimento automático de formulários na web oculta

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: Kantorski, Gustavo Zanini
Orientador(a): Heuser, Carlos Alberto
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/107988
Resumo: Muitas informações disponíveis na Web estão armazenadas em bancos de dados on-line e são acessíveis somente após um usuário enviar uma consulta por meio de uma interface de busca. Essas informações estão localizadas em uma parte da Web conhecida como Web Oculta ou Web Profunda e, geralmente, são inacessíveis por máquinas de busca tradicionais. Uma vez que a forma de acessar os dados na Web Oculta se dá por intermédio de submissões de consultas, muitos trabalhos têm focado em como preencher automaticamente campos de formulários. Esta tese apresenta uma metodologia para o preenchimento de formulários na Web Oculta. Além disso, descreve uma categorização das técnicas de preenchimento de formulários existentes no estado da arte de coleta na Web Oculta, produzindo uma análise comparativa entre elas. A solução proposta descreve um método automático para seleção de valores para campos de formulários combinando heurísticas e técnicas de aprendizagem de máquina. Experimentos foram realizados em formulários reais da Web, de vários domínios, e os resultados indicam que a abordagem proposta apresenta desempenho comparável aos obtidos pelas técnicas do estado da arte, sendo inclusive significativamente diferente com base em avaliação estatística.
id URGS_c15b34088ea71a70108a642f4b8a362a
oai_identifier_str oai:www.lume.ufrgs.br:10183/107988
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Kantorski, Gustavo ZaniniHeuser, Carlos AlbertoMoreira, Viviane Pereira2014-12-10T02:19:39Z2014http://hdl.handle.net/10183/107988000947618Muitas informações disponíveis na Web estão armazenadas em bancos de dados on-line e são acessíveis somente após um usuário enviar uma consulta por meio de uma interface de busca. Essas informações estão localizadas em uma parte da Web conhecida como Web Oculta ou Web Profunda e, geralmente, são inacessíveis por máquinas de busca tradicionais. Uma vez que a forma de acessar os dados na Web Oculta se dá por intermédio de submissões de consultas, muitos trabalhos têm focado em como preencher automaticamente campos de formulários. Esta tese apresenta uma metodologia para o preenchimento de formulários na Web Oculta. Além disso, descreve uma categorização das técnicas de preenchimento de formulários existentes no estado da arte de coleta na Web Oculta, produzindo uma análise comparativa entre elas. A solução proposta descreve um método automático para seleção de valores para campos de formulários combinando heurísticas e técnicas de aprendizagem de máquina. Experimentos foram realizados em formulários reais da Web, de vários domínios, e os resultados indicam que a abordagem proposta apresenta desempenho comparável aos obtidos pelas técnicas do estado da arte, sendo inclusive significativamente diferente com base em avaliação estatística.A large portion of the information on the Web is stored inside online databases. Such information is accessible only after the users submit a query through a search interface. TheWeb portion in which that information is located is called HiddenWeb or DeepWeb, and generally this part is inaccessible by traditional search engines crawlers. Since the only way to access the Hidden Web pages is through the query submissions, many works have focused on how to fill in form fields automatically, aiming at enhancing the amount of distinct information hidden behind Web forms. This thesis presents an automatic solution to value selection for fields in Web forms. The solution combines heuristics and machine learning techniques for improving the selection of values. Furthermore, this proposal also describes a categorization of form filling techniques and a comparative analysis between works in the state of the art. Experiments were conducted on real Web sites and the results indicated that our approach significantly outperforms a baseline method in terms of coverage without additional computational cost.application/pdfporRecuperacao : InformacaoBanco : DadosServiços WebCrawlingDeep webFilling web formsHidden webPreenchimento automático de formulários na web ocultaAutomatically filling in hiddenweb forms info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2014doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000947618.pdf000947618.pdfTexto completoapplication/pdf4242634http://www.lume.ufrgs.br/bitstream/10183/107988/1/000947618.pdf69c4159d6c2fe32be1149c804268bafeMD51TEXT000947618.pdf.txt000947618.pdf.txtExtracted Texttext/plain217052http://www.lume.ufrgs.br/bitstream/10183/107988/2/000947618.pdf.txte41f118a174c068328085e1fbaed7f10MD52THUMBNAIL000947618.pdf.jpg000947618.pdf.jpgGenerated Thumbnailimage/jpeg1041http://www.lume.ufrgs.br/bitstream/10183/107988/3/000947618.pdf.jpg76e378152141bf4ba90435bd9363a8a2MD5310183/1079882018-10-22 08:36:35.488oai:www.lume.ufrgs.br:10183/107988Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532018-10-22T11:36:35Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Preenchimento automático de formulários na web oculta
dc.title.alternative.en.fl_str_mv Automatically filling in hiddenweb forms
title Preenchimento automático de formulários na web oculta
spellingShingle Preenchimento automático de formulários na web oculta
Kantorski, Gustavo Zanini
Recuperacao : Informacao
Banco : Dados
Serviços Web
Crawling
Deep web
Filling web forms
Hidden web
title_short Preenchimento automático de formulários na web oculta
title_full Preenchimento automático de formulários na web oculta
title_fullStr Preenchimento automático de formulários na web oculta
title_full_unstemmed Preenchimento automático de formulários na web oculta
title_sort Preenchimento automático de formulários na web oculta
author Kantorski, Gustavo Zanini
author_facet Kantorski, Gustavo Zanini
author_role author
dc.contributor.author.fl_str_mv Kantorski, Gustavo Zanini
dc.contributor.advisor1.fl_str_mv Heuser, Carlos Alberto
dc.contributor.advisor-co1.fl_str_mv Moreira, Viviane Pereira
contributor_str_mv Heuser, Carlos Alberto
Moreira, Viviane Pereira
dc.subject.por.fl_str_mv Recuperacao : Informacao
Banco : Dados
Serviços Web
topic Recuperacao : Informacao
Banco : Dados
Serviços Web
Crawling
Deep web
Filling web forms
Hidden web
dc.subject.eng.fl_str_mv Crawling
Deep web
Filling web forms
Hidden web
description Muitas informações disponíveis na Web estão armazenadas em bancos de dados on-line e são acessíveis somente após um usuário enviar uma consulta por meio de uma interface de busca. Essas informações estão localizadas em uma parte da Web conhecida como Web Oculta ou Web Profunda e, geralmente, são inacessíveis por máquinas de busca tradicionais. Uma vez que a forma de acessar os dados na Web Oculta se dá por intermédio de submissões de consultas, muitos trabalhos têm focado em como preencher automaticamente campos de formulários. Esta tese apresenta uma metodologia para o preenchimento de formulários na Web Oculta. Além disso, descreve uma categorização das técnicas de preenchimento de formulários existentes no estado da arte de coleta na Web Oculta, produzindo uma análise comparativa entre elas. A solução proposta descreve um método automático para seleção de valores para campos de formulários combinando heurísticas e técnicas de aprendizagem de máquina. Experimentos foram realizados em formulários reais da Web, de vários domínios, e os resultados indicam que a abordagem proposta apresenta desempenho comparável aos obtidos pelas técnicas do estado da arte, sendo inclusive significativamente diferente com base em avaliação estatística.
publishDate 2014
dc.date.accessioned.fl_str_mv 2014-12-10T02:19:39Z
dc.date.issued.fl_str_mv 2014
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/107988
dc.identifier.nrb.pt_BR.fl_str_mv 000947618
url http://hdl.handle.net/10183/107988
identifier_str_mv 000947618
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/107988/1/000947618.pdf
http://www.lume.ufrgs.br/bitstream/10183/107988/2/000947618.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/107988/3/000947618.pdf.jpg
bitstream.checksum.fl_str_mv 69c4159d6c2fe32be1149c804268bafe
e41f118a174c068328085e1fbaed7f10
76e378152141bf4ba90435bd9363a8a2
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1831315957291679744