Programação genética aplicada à busca de imagens

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: Saraiva, Patrícia Correia
Outros Autores: http://lattes.cnpq.br/3817196969731871
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://tede.ufam.edu.br/handle/tede/4149
Resumo: O volume de informação codificada sob a forma de imagens tem aumentado de forma significativa nas últimas décadas. O uso cada vez mais frequente de tablets, smartphones, câmeras digitais e notebooks com suporte à aquisição de imagens e a facilidade para tornar essas imagens disponíveis publicamente em repositórios compartilhados, são fatores que contribuem ainda mais para este cenário. Atualmente, imagens são usadas nas mais diversas aplicações, seja para registrar momentos e ações em jornais e revistas eletrônicas, ou redes sociais, ou ainda para divulgar produtos em aplicações de comércio eletrônico. Na medida em que cresce o volume de imagens, cresce também o interesse por sistemas capazes de realizar busca em bases de dados de imagem. O objetivo principal desta tese é investigar o impacto do uso de programação genética (GP - Genetic Progamming) como ferramenta para combinar diferentes fontes de informação disponíveis durante a busca de imagens. Mais especificamente, foram abordados dois contextos distintos como estudos de caso: a busca de imagens na Web utilizando informação textual extraída automaticamente das páginas Web e, a busca visual por meio da expansão da imagem de consulta utilizando informação derivadas de diferentes modalidades de dados, como texto e conteúdo visual. Para avaliar as estratégias propostas para o contexto de busca visual, escolheu-se como estudo de caso a busca visual de produtos em lojas de comércio eletrônico voltadas para o segmento de moda. Os experimentos realizados no contexto de busca de imagens na Web mostraram que a abordagem evolucionária superou a melhor abordagem utilizada como baseline, com ganhos de 22,36% em termos de MAP. No cenário de busca visual de produtos em lojas de comércio eletrônico, os resultados experimentais mostraram que a expansão automática baseada em GP é uma alternativa efetiva para melhorar a qualidade dos resultados de um sistema de busca de imagens. Quando comparado a uma abordagem baseada somente em propriedades visuais, a expansão multimodal obteve ganhos de pelo menos 19% em todos os cenários de busca considerados. Quando comparado a uma abordagem similar, mas completamente ad hoc, o arcabouço baseado em GP obteve ganhos de até 54% em termos de MAP.
id UFAM_540aff5816bcd7e7be6505a0992d9f3f
oai_identifier_str oai:https://tede.ufam.edu.br/handle/:tede/4149
network_acronym_str UFAM
network_name_str Biblioteca Digital de Teses e Dissertações da UFAM
repository_id_str
spelling Programação genética aplicada à busca de imagensRecuperação de imagensProgramação genéticaExpansão multimodalImages recoveryGenetic programmingMultimodal expansionCIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃOO volume de informação codificada sob a forma de imagens tem aumentado de forma significativa nas últimas décadas. O uso cada vez mais frequente de tablets, smartphones, câmeras digitais e notebooks com suporte à aquisição de imagens e a facilidade para tornar essas imagens disponíveis publicamente em repositórios compartilhados, são fatores que contribuem ainda mais para este cenário. Atualmente, imagens são usadas nas mais diversas aplicações, seja para registrar momentos e ações em jornais e revistas eletrônicas, ou redes sociais, ou ainda para divulgar produtos em aplicações de comércio eletrônico. Na medida em que cresce o volume de imagens, cresce também o interesse por sistemas capazes de realizar busca em bases de dados de imagem. O objetivo principal desta tese é investigar o impacto do uso de programação genética (GP - Genetic Progamming) como ferramenta para combinar diferentes fontes de informação disponíveis durante a busca de imagens. Mais especificamente, foram abordados dois contextos distintos como estudos de caso: a busca de imagens na Web utilizando informação textual extraída automaticamente das páginas Web e, a busca visual por meio da expansão da imagem de consulta utilizando informação derivadas de diferentes modalidades de dados, como texto e conteúdo visual. Para avaliar as estratégias propostas para o contexto de busca visual, escolheu-se como estudo de caso a busca visual de produtos em lojas de comércio eletrônico voltadas para o segmento de moda. Os experimentos realizados no contexto de busca de imagens na Web mostraram que a abordagem evolucionária superou a melhor abordagem utilizada como baseline, com ganhos de 22,36% em termos de MAP. No cenário de busca visual de produtos em lojas de comércio eletrônico, os resultados experimentais mostraram que a expansão automática baseada em GP é uma alternativa efetiva para melhorar a qualidade dos resultados de um sistema de busca de imagens. Quando comparado a uma abordagem baseada somente em propriedades visuais, a expansão multimodal obteve ganhos de pelo menos 19% em todos os cenários de busca considerados. Quando comparado a uma abordagem similar, mas completamente ad hoc, o arcabouço baseado em GP obteve ganhos de até 54% em termos de MAP.The volume of information encoded in the form of images has increased significantly in the last decades. Contributing to this scenario, the wide-spread use of mobile devices, such as tablets and smartphones, and even notebooks, which not only can take photos, but also easily send them to connected applications, such as web services and social networks. Nowadays, images are used in several applications, such as to record personal moments of people’s life or showing products in e-commerce online stores. As a consequence, not only does the volume of images increase, but also the interest in solutions able to retrieve these images. The main goal of this thesis is to investigate the impact of using genetic programming (GP) as a tool for combining different sources of evidence available when retrieving images. As case studies, we considered the application of GP in two different contexts: image retrieval on the Web using textual information automatically extracted from Web pages, and visual search by expanding the image query using information derived from different types of data, such as text and visual content. We evaluate the proposed expansion strategies in an application of visual search for products focused on e-commerce stores for the fashion domain. Experiments performed in the context of image retrieval on the Web showed that the evolutionary approach outperformed the best baseline with gains of 22.36% in terms of MAP. In the context of visual search for e-commerce applications, experimental results indicated that automatic expansion based on genetic programming is an effective alternative for improving the quality of image search results. When compared to a genetic programming system based only on visual information, the multimodal expansion achieved gains of at least 19% in all scenarios considered. When compared to a similar approach, but completely ad hoc, the GP framework achieved gains of up to 54% in terms of MAP.FAPEAM - Fundação de Amparo à Pesquisa do Estado do AmazonasUniversidade Federal do AmazonasInstituto de ComputaçãoBrasilUFAMPrograma de Pós-graduação em InformáticaCavalcanti, João Marcos Bastoshttp://lattes.cnpq.br/3537707069694606Saraiva, Patrícia Correiahttp://lattes.cnpq.br/38171969697318712015-06-24T14:29:41Z2014-02-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfSARAIVA, Patrícia Correia. Programação genética aplicada à busca de imagens. 2014. 89 f. Tese (Doutorado em Informática) - Universidade Federal do Amazonas, Manaus, 2014.http://tede.ufam.edu.br/handle/tede/4149porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2016-05-11T14:34:37Zoai:https://tede.ufam.edu.br/handle/:tede/4149Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br||ddbc@ufam.edu.bropendoar:65922016-05-11T14:34:37Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false
dc.title.none.fl_str_mv Programação genética aplicada à busca de imagens
title Programação genética aplicada à busca de imagens
spellingShingle Programação genética aplicada à busca de imagens
Saraiva, Patrícia Correia
Recuperação de imagens
Programação genética
Expansão multimodal
Images recovery
Genetic programming
Multimodal expansion
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
title_short Programação genética aplicada à busca de imagens
title_full Programação genética aplicada à busca de imagens
title_fullStr Programação genética aplicada à busca de imagens
title_full_unstemmed Programação genética aplicada à busca de imagens
title_sort Programação genética aplicada à busca de imagens
author Saraiva, Patrícia Correia
author_facet Saraiva, Patrícia Correia
http://lattes.cnpq.br/3817196969731871
author_role author
author2 http://lattes.cnpq.br/3817196969731871
author2_role author
dc.contributor.none.fl_str_mv Cavalcanti, João Marcos Bastos
http://lattes.cnpq.br/3537707069694606
dc.contributor.author.fl_str_mv Saraiva, Patrícia Correia
http://lattes.cnpq.br/3817196969731871
dc.subject.por.fl_str_mv Recuperação de imagens
Programação genética
Expansão multimodal
Images recovery
Genetic programming
Multimodal expansion
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
topic Recuperação de imagens
Programação genética
Expansão multimodal
Images recovery
Genetic programming
Multimodal expansion
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
description O volume de informação codificada sob a forma de imagens tem aumentado de forma significativa nas últimas décadas. O uso cada vez mais frequente de tablets, smartphones, câmeras digitais e notebooks com suporte à aquisição de imagens e a facilidade para tornar essas imagens disponíveis publicamente em repositórios compartilhados, são fatores que contribuem ainda mais para este cenário. Atualmente, imagens são usadas nas mais diversas aplicações, seja para registrar momentos e ações em jornais e revistas eletrônicas, ou redes sociais, ou ainda para divulgar produtos em aplicações de comércio eletrônico. Na medida em que cresce o volume de imagens, cresce também o interesse por sistemas capazes de realizar busca em bases de dados de imagem. O objetivo principal desta tese é investigar o impacto do uso de programação genética (GP - Genetic Progamming) como ferramenta para combinar diferentes fontes de informação disponíveis durante a busca de imagens. Mais especificamente, foram abordados dois contextos distintos como estudos de caso: a busca de imagens na Web utilizando informação textual extraída automaticamente das páginas Web e, a busca visual por meio da expansão da imagem de consulta utilizando informação derivadas de diferentes modalidades de dados, como texto e conteúdo visual. Para avaliar as estratégias propostas para o contexto de busca visual, escolheu-se como estudo de caso a busca visual de produtos em lojas de comércio eletrônico voltadas para o segmento de moda. Os experimentos realizados no contexto de busca de imagens na Web mostraram que a abordagem evolucionária superou a melhor abordagem utilizada como baseline, com ganhos de 22,36% em termos de MAP. No cenário de busca visual de produtos em lojas de comércio eletrônico, os resultados experimentais mostraram que a expansão automática baseada em GP é uma alternativa efetiva para melhorar a qualidade dos resultados de um sistema de busca de imagens. Quando comparado a uma abordagem baseada somente em propriedades visuais, a expansão multimodal obteve ganhos de pelo menos 19% em todos os cenários de busca considerados. Quando comparado a uma abordagem similar, mas completamente ad hoc, o arcabouço baseado em GP obteve ganhos de até 54% em termos de MAP.
publishDate 2014
dc.date.none.fl_str_mv 2014-02-28
2015-06-24T14:29:41Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SARAIVA, Patrícia Correia. Programação genética aplicada à busca de imagens. 2014. 89 f. Tese (Doutorado em Informática) - Universidade Federal do Amazonas, Manaus, 2014.
http://tede.ufam.edu.br/handle/tede/4149
identifier_str_mv SARAIVA, Patrícia Correia. Programação genética aplicada à busca de imagens. 2014. 89 f. Tese (Doutorado em Informática) - Universidade Federal do Amazonas, Manaus, 2014.
url http://tede.ufam.edu.br/handle/tede/4149
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFAM
instname:Universidade Federal do Amazonas (UFAM)
instacron:UFAM
instname_str Universidade Federal do Amazonas (UFAM)
instacron_str UFAM
institution UFAM
reponame_str Biblioteca Digital de Teses e Dissertações da UFAM
collection Biblioteca Digital de Teses e Dissertações da UFAM
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)
repository.mail.fl_str_mv ddbc@ufam.edu.br||ddbc@ufam.edu.br
_version_ 1851781271542300672