Exportação concluída — 

Aprendizado de representações vetoriais de imagens com redes neurais artificiais para recuperação de produtos do varejo

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Lima, Gustavo Ramos
Orientador(a): Mutz, Filipe
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Serra
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ifes.edu.br/handle/123456789/3644
Resumo: A recuperação de produtos a partir de imagens tem múltiplas aplicações, desde o fornecimento de informações e recomendações para clientes em supermercados até a geração automática de faturas em lojas inteligentes. No entanto, esta tarefa apresenta desafios importantes, como o grande número de produtos, a escassez de imagens dos itens, diferenças entre as imagens dos produtos utilizadas durante o treinamento e teste dos modelos e as constantes mudanças no portfólio devido à adição ou remoção de produtos. Trabalhos recentes têm alcançado bons resultados na tarefa de recuperação de imagens com o uso de redes neurais profundas para produzir representações vetoriais de imagens que posteriormente são utilizadas para treinar outros algoritmos de aprendizado de máquina. Contudo, os modelos tendem a sofrer com overfitting quando existem poucas imagens de treinamento para cada classe e, além disso, em alguns casos, os modelos podem precisar ser retreinados sempre que produtos são adicionados ou removidos da base de dados. Assim, este trabalho investiga maneiras de gerar representações vetoriais de imagens usando redes neurais profundas de forma que essas representações possam ser usadas para recuperação de produtos mesmo diante dos desafios supracitados. Foram utilizadas as bases de dados de produtos de mercado Grocery Products, contendo 3287 imagens com qualidade de estúdio para o treinamento e 948 imagens de teste com menor qualidade, e Grocery Store, que possui 81 imagens icônicas de produtos e 2485 imagens de teste em ambiente real. Análises experimentais avaliaram o efeito que a arquitetura de rede, as técnicas de aumento de dados e as funções objetivo usadas durante o treinamento têm na qualidade da representação. A melhor configuração foi obtida com o ajuste fino da arquitetura Densenet-201 na tarefa de classificar produtos usando os métodos Randaugment e Augmix para aumentos de dados, e com o Hierarchical Triplet Loss como uma função de regularização. As representações construídas usando este modelo, levaram a uma acurácia Top-1 de 86,81% e acurácia Top-5 de 93,35% no conjunto de dados Grocery Products e acurácia Top-1 de 21,77% e Top-5 de 49,22% na base de dados Grocery Store.
id IFES-2_0ca89d2a1d990dbfdedd7b03ed97bd83
oai_identifier_str oai:repositorio.ifes.edu.br:123456789/3644
network_acronym_str IFES-2
network_name_str Repositório Institucional do IFES
repository_id_str
spelling Lima, Gustavo RamosUniversidade Federal do Espírito Santo (Ufes)Ciarelli, PatrickOliveira-Santos, ThiagoOliveira, HilárioBoldt, FranciscoMutz, Filipe2023-09-12T23:32:56Z2023-09-12T23:32:56Z2023Lima, Gustavo Ramos. Aprendizado de representações vetoriais de imagens com redes neurais artificiais para recuperação de produtos do varejo. 2023. 60 f. Dissertação (Mestrado em Computação Aplicada) - Instituto Federal do Espírito Santo, Campus Serra, Serra, 2023.https://repositorio.ifes.edu.br/handle/123456789/364430004012075P4A recuperação de produtos a partir de imagens tem múltiplas aplicações, desde o fornecimento de informações e recomendações para clientes em supermercados até a geração automática de faturas em lojas inteligentes. No entanto, esta tarefa apresenta desafios importantes, como o grande número de produtos, a escassez de imagens dos itens, diferenças entre as imagens dos produtos utilizadas durante o treinamento e teste dos modelos e as constantes mudanças no portfólio devido à adição ou remoção de produtos. Trabalhos recentes têm alcançado bons resultados na tarefa de recuperação de imagens com o uso de redes neurais profundas para produzir representações vetoriais de imagens que posteriormente são utilizadas para treinar outros algoritmos de aprendizado de máquina. Contudo, os modelos tendem a sofrer com overfitting quando existem poucas imagens de treinamento para cada classe e, além disso, em alguns casos, os modelos podem precisar ser retreinados sempre que produtos são adicionados ou removidos da base de dados. Assim, este trabalho investiga maneiras de gerar representações vetoriais de imagens usando redes neurais profundas de forma que essas representações possam ser usadas para recuperação de produtos mesmo diante dos desafios supracitados. Foram utilizadas as bases de dados de produtos de mercado Grocery Products, contendo 3287 imagens com qualidade de estúdio para o treinamento e 948 imagens de teste com menor qualidade, e Grocery Store, que possui 81 imagens icônicas de produtos e 2485 imagens de teste em ambiente real. Análises experimentais avaliaram o efeito que a arquitetura de rede, as técnicas de aumento de dados e as funções objetivo usadas durante o treinamento têm na qualidade da representação. A melhor configuração foi obtida com o ajuste fino da arquitetura Densenet-201 na tarefa de classificar produtos usando os métodos Randaugment e Augmix para aumentos de dados, e com o Hierarchical Triplet Loss como uma função de regularização. As representações construídas usando este modelo, levaram a uma acurácia Top-1 de 86,81% e acurácia Top-5 de 93,35% no conjunto de dados Grocery Products e acurácia Top-1 de 21,77% e Top-5 de 49,22% na base de dados Grocery Store.Product retrieval from images has multiple applications ranging from providing information and recommendations for supermarket customers to automatic invoice generation in smart stores. However, this task presents important challenges such as large number of products, the scarcity of images of items, differences between real and iconic images of the products, and the constant changes in the portfolio due to the addition or removal of products. Models tend to suffer from overfitting when there are too few training images for each class, and in some cases, traditional models need to be retrained whenever products are added or removed from the database. Hence, this work investigates ways of generating vector representations of images using deep neural networks such that these representations can be used for product retrieval even in the face of these challenges. Two datasets were used, Grocery Products containing 3287 studio-quality images for training and 948 lower-quality images for testing and the Grocery Store dataset, with 81 iconic product images and 2485 test images. Experimental analysis evaluated the effect of network architecture, data augmentation techniques and objective functions used during training on representation quality. The best configuration was obtained after fine-tuning the Densenet-201 architecture for classifying products using a mixture of Randaugment and Augmix data augmentations, with Hierarchical Triplet Loss as a regularization function. The representations built using this model led to a Top-1 accuracy of 86.81% and Top-5 accuracy of 93.35% in the dataset Grocery Products and a Top-1 accuracy of 21.77% and Top-5 of 49.22% in the Grocery Store database.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Fundação de Apoio à Pesquisa do Espírito Santo (FAPES)Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)60 f.Inteligência artificialRedes neurais (computação)Imagens - detecçãoVarejoAprendizado de representações vetoriais de imagens com redes neurais artificiais para recuperação de produtos do varejoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisSerraPrograma de pós-graduação em computação aplicadainfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional do IFESinstname:Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)instacron:IFESCampus Serrahttp://lattes.cnpq.br/3123292310632540https://orcid.org/0000-0002-2951-9207Mestrado em Computação Aplicadahttp://lattes.cnpq.br/8980213630090119http://lattes.cnpq.br/0385991152092556https://orcid.org/0000-0003-0643-7206https://orcid.org/0000-0001-6919-5377ORIGINAL12092023_MESTRADO_APRENDIZADO DE REPRESENTACOES_VETORIAIS_DE_IMAGENS.pdf12092023_MESTRADO_APRENDIZADO DE REPRESENTACOES_VETORIAIS_DE_IMAGENS.pdfapplication/pdf19241369https://repositorio.ifes.edu.br/bitstreams/d7eefb58-6fb1-4c75-9481-4ae3149661f3/download86a3b792b0db8c9190a86b59180ca560MD51trueAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-8934https://repositorio.ifes.edu.br/bitstreams/1f132425-5af7-44d6-b383-4c652da2fd27/downloadac7cb971050ed632be934da23d966924MD52falseAnonymousREADTEXT12092023_MESTRADO_APRENDIZADO DE REPRESENTACOES_VETORIAIS_DE_IMAGENS.pdf.txt12092023_MESTRADO_APRENDIZADO DE REPRESENTACOES_VETORIAIS_DE_IMAGENS.pdf.txtExtracted texttext/plain102548https://repositorio.ifes.edu.br/bitstreams/8aeb9217-06a6-4a2a-a7de-208af4a8f8ed/download5cd561e7bf0a45aa2351b8389ac1543eMD55falseAnonymousREADTHUMBNAIL12092023_MESTRADO_APRENDIZADO DE REPRESENTACOES_VETORIAIS_DE_IMAGENS.pdf.jpg12092023_MESTRADO_APRENDIZADO DE REPRESENTACOES_VETORIAIS_DE_IMAGENS.pdf.jpgGenerated Thumbnailimage/jpeg2600https://repositorio.ifes.edu.br/bitstreams/c66ef4e2-dec0-4fb2-87f1-99accc1fb568/download09cbe9625336c1b385246ad6ca8734e7MD56falseAnonymousREAD123456789/36442026-01-26T15:55:20.919772Zopen.accessoai:repositorio.ifes.edu.br:123456789/3644https://repositorio.ifes.edu.brRepositório InstitucionalPUBhttps://repositorio.ifes.edu.br/server/oai/requestrepositorio@ifes.edu.bropendoar:2026-01-26T15:55:20Repositório Institucional do IFES - Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)falseQXV0b3JlcyBxdWUgc3VibWV0ZW0gYSBlc3RhIGNvbmZlcsOqbmNpYSBjb25jb3JkYW0gY29tIG9zIHNlZ3VpbnRlcyB0ZXJtb3M6CmEpIEF1dG9yZXMgbWFudMOpbSBvcyBkaXJlaXRvcyBhdXRvcmFpcyBzb2JyZSBvIHRyYWJhbGhvLCBwZXJtaXRpbmRvIMOgIGNvbmZlcsOqbmNpYSBjb2xvY8OhLWxvIHNvYiB1bWEgbGljZW7Dp2EgTGljZW7Dp2EgQ3JlYXRpdmUgQ29tbW9ucyBBdHRyaWJ1dGlvbiwgcXVlIHBlcm1pdGUgbGl2cmVtZW50ZSBhIG91dHJvcyBhY2Vzc2FyLCB1c2FyIGUgY29tcGFydGlsaGFyIG8gdHJhYmFsaG8gY29tIG8gY3LDqWRpdG8gZGUgYXV0b3JpYSBlIGFwcmVzZW50YcOnw6NvIGluaWNpYWwgbmVzdGEgY29uZmVyw6puY2lhLgpiKSBBdXRvcmVzIHBvZGVtIGFicmlyIG3Do28gZG9zIHRlcm1vcyBkYSBsaWNlbsOnYSBDQyBlIGRlZmluaXIgY29udHJhdG9zIGFkaWNpb25haXMgcGFyYSBhIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhIGUgc3Vic2Vxw7xlbnRlIHB1YmxpY2HDp8OjbyBkZXN0ZSB0cmFiYWxobyAoZXguOiBwdWJsaWNhciB1bWEgdmVyc8OjbyBhdHVhbGl6YWRhIGVtIHVtIHBlcmnDs2RpY28sIGRpc3BvbmliaWxpemFyIGVtIHJlcG9zaXTDs3JpbyBpbnN0aXR1Y2lvbmFsLCBvdSBwdWJsaWPDoS1sbyBlbSBsaXZybyksIGNvbSBvIGNyw6lkaXRvIGRlIGF1dG9yaWEgZSBhcHJlc2VudGHDp8OjbyBpbmljaWFsIG5lc3RhIGNvbmZlcsOqbmNpYS4KYykgQWzDqW0gZGlzc28sIGF1dG9yZXMgc8OjbyBpbmNlbnRpdmFkb3MgYSBwdWJsaWNhciBlIGNvbXBhcnRpbGhhciBzZXVzIHRyYWJhbGhvcyBvbmxpbmUgKGV4LjogZW0gcmVwb3NpdMOzcmlvIGluc3RpdHVjaW9uYWwgb3UgZW0gc3VhIHDDoWdpbmEgcGVzc29hbCkgYSBxdWFscXVlciBtb21lbnRvIGFudGVzIGUgZGVwb2lzIGRhIGNvbmZlcsOqCg==
dc.title.pt_BR.fl_str_mv Aprendizado de representações vetoriais de imagens com redes neurais artificiais para recuperação de produtos do varejo
title Aprendizado de representações vetoriais de imagens com redes neurais artificiais para recuperação de produtos do varejo
spellingShingle Aprendizado de representações vetoriais de imagens com redes neurais artificiais para recuperação de produtos do varejo
Lima, Gustavo Ramos
Inteligência artificial
Redes neurais (computação)
Imagens - detecção
Varejo
title_short Aprendizado de representações vetoriais de imagens com redes neurais artificiais para recuperação de produtos do varejo
title_full Aprendizado de representações vetoriais de imagens com redes neurais artificiais para recuperação de produtos do varejo
title_fullStr Aprendizado de representações vetoriais de imagens com redes neurais artificiais para recuperação de produtos do varejo
title_full_unstemmed Aprendizado de representações vetoriais de imagens com redes neurais artificiais para recuperação de produtos do varejo
title_sort Aprendizado de representações vetoriais de imagens com redes neurais artificiais para recuperação de produtos do varejo
author Lima, Gustavo Ramos
author_facet Lima, Gustavo Ramos
author_role author
dc.contributor.institution.pt_BR.fl_str_mv Universidade Federal do Espírito Santo (Ufes)
dc.contributor.member.none.fl_str_mv Ciarelli, Patrick
Oliveira-Santos, Thiago
Oliveira, Hilário
Boldt, Francisco
dc.contributor.author.fl_str_mv Lima, Gustavo Ramos
dc.contributor.advisor1.fl_str_mv Mutz, Filipe
contributor_str_mv Mutz, Filipe
dc.subject.por.fl_str_mv Inteligência artificial
Redes neurais (computação)
Imagens - detecção
Varejo
topic Inteligência artificial
Redes neurais (computação)
Imagens - detecção
Varejo
description A recuperação de produtos a partir de imagens tem múltiplas aplicações, desde o fornecimento de informações e recomendações para clientes em supermercados até a geração automática de faturas em lojas inteligentes. No entanto, esta tarefa apresenta desafios importantes, como o grande número de produtos, a escassez de imagens dos itens, diferenças entre as imagens dos produtos utilizadas durante o treinamento e teste dos modelos e as constantes mudanças no portfólio devido à adição ou remoção de produtos. Trabalhos recentes têm alcançado bons resultados na tarefa de recuperação de imagens com o uso de redes neurais profundas para produzir representações vetoriais de imagens que posteriormente são utilizadas para treinar outros algoritmos de aprendizado de máquina. Contudo, os modelos tendem a sofrer com overfitting quando existem poucas imagens de treinamento para cada classe e, além disso, em alguns casos, os modelos podem precisar ser retreinados sempre que produtos são adicionados ou removidos da base de dados. Assim, este trabalho investiga maneiras de gerar representações vetoriais de imagens usando redes neurais profundas de forma que essas representações possam ser usadas para recuperação de produtos mesmo diante dos desafios supracitados. Foram utilizadas as bases de dados de produtos de mercado Grocery Products, contendo 3287 imagens com qualidade de estúdio para o treinamento e 948 imagens de teste com menor qualidade, e Grocery Store, que possui 81 imagens icônicas de produtos e 2485 imagens de teste em ambiente real. Análises experimentais avaliaram o efeito que a arquitetura de rede, as técnicas de aumento de dados e as funções objetivo usadas durante o treinamento têm na qualidade da representação. A melhor configuração foi obtida com o ajuste fino da arquitetura Densenet-201 na tarefa de classificar produtos usando os métodos Randaugment e Augmix para aumentos de dados, e com o Hierarchical Triplet Loss como uma função de regularização. As representações construídas usando este modelo, levaram a uma acurácia Top-1 de 86,81% e acurácia Top-5 de 93,35% no conjunto de dados Grocery Products e acurácia Top-1 de 21,77% e Top-5 de 49,22% na base de dados Grocery Store.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-09-12T23:32:56Z
dc.date.available.fl_str_mv 2023-09-12T23:32:56Z
dc.date.issued.fl_str_mv 2023
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv Lima, Gustavo Ramos. Aprendizado de representações vetoriais de imagens com redes neurais artificiais para recuperação de produtos do varejo. 2023. 60 f. Dissertação (Mestrado em Computação Aplicada) - Instituto Federal do Espírito Santo, Campus Serra, Serra, 2023.
dc.identifier.uri.fl_str_mv https://repositorio.ifes.edu.br/handle/123456789/3644
dc.identifier.capes.pt_BR.fl_str_mv 30004012075P4
identifier_str_mv Lima, Gustavo Ramos. Aprendizado de representações vetoriais de imagens com redes neurais artificiais para recuperação de produtos do varejo. 2023. 60 f. Dissertação (Mestrado em Computação Aplicada) - Instituto Federal do Espírito Santo, Campus Serra, Serra, 2023.
30004012075P4
url https://repositorio.ifes.edu.br/handle/123456789/3644
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 60 f.
dc.publisher.none.fl_str_mv Serra
publisher.none.fl_str_mv Serra
dc.source.none.fl_str_mv reponame:Repositório Institucional do IFES
instname:Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)
instacron:IFES
instname_str Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)
instacron_str IFES
institution IFES
reponame_str Repositório Institucional do IFES
collection Repositório Institucional do IFES
bitstream.url.fl_str_mv https://repositorio.ifes.edu.br/bitstreams/d7eefb58-6fb1-4c75-9481-4ae3149661f3/download
https://repositorio.ifes.edu.br/bitstreams/1f132425-5af7-44d6-b383-4c652da2fd27/download
https://repositorio.ifes.edu.br/bitstreams/8aeb9217-06a6-4a2a-a7de-208af4a8f8ed/download
https://repositorio.ifes.edu.br/bitstreams/c66ef4e2-dec0-4fb2-87f1-99accc1fb568/download
bitstream.checksum.fl_str_mv 86a3b792b0db8c9190a86b59180ca560
ac7cb971050ed632be934da23d966924
5cd561e7bf0a45aa2351b8389ac1543e
09cbe9625336c1b385246ad6ca8734e7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional do IFES - Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)
repository.mail.fl_str_mv repositorio@ifes.edu.br
_version_ 1865654632239333376