Preenchimento automático de formulários na web oculta
| Ano de defesa: | 2014 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Link de acesso: | http://hdl.handle.net/10183/107988 |
Resumo: | Muitas informações disponíveis na Web estão armazenadas em bancos de dados on-line e são acessíveis somente após um usuário enviar uma consulta por meio de uma interface de busca. Essas informações estão localizadas em uma parte da Web conhecida como Web Oculta ou Web Profunda e, geralmente, são inacessíveis por máquinas de busca tradicionais. Uma vez que a forma de acessar os dados na Web Oculta se dá por intermédio de submissões de consultas, muitos trabalhos têm focado em como preencher automaticamente campos de formulários. Esta tese apresenta uma metodologia para o preenchimento de formulários na Web Oculta. Além disso, descreve uma categorização das técnicas de preenchimento de formulários existentes no estado da arte de coleta na Web Oculta, produzindo uma análise comparativa entre elas. A solução proposta descreve um método automático para seleção de valores para campos de formulários combinando heurísticas e técnicas de aprendizagem de máquina. Experimentos foram realizados em formulários reais da Web, de vários domínios, e os resultados indicam que a abordagem proposta apresenta desempenho comparável aos obtidos pelas técnicas do estado da arte, sendo inclusive significativamente diferente com base em avaliação estatística. |
| id |
URGS_c15b34088ea71a70108a642f4b8a362a |
|---|---|
| oai_identifier_str |
oai:www.lume.ufrgs.br:10183/107988 |
| network_acronym_str |
URGS |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| repository_id_str |
|
| spelling |
Kantorski, Gustavo ZaniniHeuser, Carlos AlbertoMoreira, Viviane Pereira2014-12-10T02:19:39Z2014http://hdl.handle.net/10183/107988000947618Muitas informações disponíveis na Web estão armazenadas em bancos de dados on-line e são acessíveis somente após um usuário enviar uma consulta por meio de uma interface de busca. Essas informações estão localizadas em uma parte da Web conhecida como Web Oculta ou Web Profunda e, geralmente, são inacessíveis por máquinas de busca tradicionais. Uma vez que a forma de acessar os dados na Web Oculta se dá por intermédio de submissões de consultas, muitos trabalhos têm focado em como preencher automaticamente campos de formulários. Esta tese apresenta uma metodologia para o preenchimento de formulários na Web Oculta. Além disso, descreve uma categorização das técnicas de preenchimento de formulários existentes no estado da arte de coleta na Web Oculta, produzindo uma análise comparativa entre elas. A solução proposta descreve um método automático para seleção de valores para campos de formulários combinando heurísticas e técnicas de aprendizagem de máquina. Experimentos foram realizados em formulários reais da Web, de vários domínios, e os resultados indicam que a abordagem proposta apresenta desempenho comparável aos obtidos pelas técnicas do estado da arte, sendo inclusive significativamente diferente com base em avaliação estatística.A large portion of the information on the Web is stored inside online databases. Such information is accessible only after the users submit a query through a search interface. TheWeb portion in which that information is located is called HiddenWeb or DeepWeb, and generally this part is inaccessible by traditional search engines crawlers. Since the only way to access the Hidden Web pages is through the query submissions, many works have focused on how to fill in form fields automatically, aiming at enhancing the amount of distinct information hidden behind Web forms. This thesis presents an automatic solution to value selection for fields in Web forms. The solution combines heuristics and machine learning techniques for improving the selection of values. Furthermore, this proposal also describes a categorization of form filling techniques and a comparative analysis between works in the state of the art. Experiments were conducted on real Web sites and the results indicated that our approach significantly outperforms a baseline method in terms of coverage without additional computational cost.application/pdfporRecuperacao : InformacaoBanco : DadosServiços WebCrawlingDeep webFilling web formsHidden webPreenchimento automático de formulários na web ocultaAutomatically filling in hiddenweb forms info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2014doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000947618.pdf000947618.pdfTexto completoapplication/pdf4242634http://www.lume.ufrgs.br/bitstream/10183/107988/1/000947618.pdf69c4159d6c2fe32be1149c804268bafeMD51TEXT000947618.pdf.txt000947618.pdf.txtExtracted Texttext/plain217052http://www.lume.ufrgs.br/bitstream/10183/107988/2/000947618.pdf.txte41f118a174c068328085e1fbaed7f10MD52THUMBNAIL000947618.pdf.jpg000947618.pdf.jpgGenerated Thumbnailimage/jpeg1041http://www.lume.ufrgs.br/bitstream/10183/107988/3/000947618.pdf.jpg76e378152141bf4ba90435bd9363a8a2MD5310183/1079882018-10-22 08:36:35.488oai:www.lume.ufrgs.br:10183/107988Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532018-10-22T11:36:35Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
| dc.title.pt_BR.fl_str_mv |
Preenchimento automático de formulários na web oculta |
| dc.title.alternative.en.fl_str_mv |
Automatically filling in hiddenweb forms |
| title |
Preenchimento automático de formulários na web oculta |
| spellingShingle |
Preenchimento automático de formulários na web oculta Kantorski, Gustavo Zanini Recuperacao : Informacao Banco : Dados Serviços Web Crawling Deep web Filling web forms Hidden web |
| title_short |
Preenchimento automático de formulários na web oculta |
| title_full |
Preenchimento automático de formulários na web oculta |
| title_fullStr |
Preenchimento automático de formulários na web oculta |
| title_full_unstemmed |
Preenchimento automático de formulários na web oculta |
| title_sort |
Preenchimento automático de formulários na web oculta |
| author |
Kantorski, Gustavo Zanini |
| author_facet |
Kantorski, Gustavo Zanini |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Kantorski, Gustavo Zanini |
| dc.contributor.advisor1.fl_str_mv |
Heuser, Carlos Alberto |
| dc.contributor.advisor-co1.fl_str_mv |
Moreira, Viviane Pereira |
| contributor_str_mv |
Heuser, Carlos Alberto Moreira, Viviane Pereira |
| dc.subject.por.fl_str_mv |
Recuperacao : Informacao Banco : Dados Serviços Web |
| topic |
Recuperacao : Informacao Banco : Dados Serviços Web Crawling Deep web Filling web forms Hidden web |
| dc.subject.eng.fl_str_mv |
Crawling Deep web Filling web forms Hidden web |
| description |
Muitas informações disponíveis na Web estão armazenadas em bancos de dados on-line e são acessíveis somente após um usuário enviar uma consulta por meio de uma interface de busca. Essas informações estão localizadas em uma parte da Web conhecida como Web Oculta ou Web Profunda e, geralmente, são inacessíveis por máquinas de busca tradicionais. Uma vez que a forma de acessar os dados na Web Oculta se dá por intermédio de submissões de consultas, muitos trabalhos têm focado em como preencher automaticamente campos de formulários. Esta tese apresenta uma metodologia para o preenchimento de formulários na Web Oculta. Além disso, descreve uma categorização das técnicas de preenchimento de formulários existentes no estado da arte de coleta na Web Oculta, produzindo uma análise comparativa entre elas. A solução proposta descreve um método automático para seleção de valores para campos de formulários combinando heurísticas e técnicas de aprendizagem de máquina. Experimentos foram realizados em formulários reais da Web, de vários domínios, e os resultados indicam que a abordagem proposta apresenta desempenho comparável aos obtidos pelas técnicas do estado da arte, sendo inclusive significativamente diferente com base em avaliação estatística. |
| publishDate |
2014 |
| dc.date.accessioned.fl_str_mv |
2014-12-10T02:19:39Z |
| dc.date.issued.fl_str_mv |
2014 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/107988 |
| dc.identifier.nrb.pt_BR.fl_str_mv |
000947618 |
| url |
http://hdl.handle.net/10183/107988 |
| identifier_str_mv |
000947618 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
| instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
| instacron_str |
UFRGS |
| institution |
UFRGS |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/107988/1/000947618.pdf http://www.lume.ufrgs.br/bitstream/10183/107988/2/000947618.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/107988/3/000947618.pdf.jpg |
| bitstream.checksum.fl_str_mv |
69c4159d6c2fe32be1149c804268bafe e41f118a174c068328085e1fbaed7f10 76e378152141bf4ba90435bd9363a8a2 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
| repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
| _version_ |
1831315957291679744 |