Multimodal classification for detecting products that do not comply with the Americanas S.A.'s marketplace sales policies

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Romualdo, Alan da Silva
Orientador(a): Caseli, Helena de Medeiros lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação - PPGCC
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/20.500.14289/16443
Resumo: Multimodal learning for the e-commerce domain, some classification methods are ne- eded for categorization, information retrieval and product recommendations, which are generally composed of different modalities: images and texts. Due to large diversification in the characteristics of these modalities or the absence/incompleteness of information (for example, incomplete product attributes), classification methods face many difficulties in dealing with this information in order to improve their classification. Thus, this work was carried out to investigate the multimodal learning in visual and textual modalities for e-commerce. Our experiments show good results for classification of products from “Adult” and “Illegal Devices” categories, which is part of the dataset provided by the partner company of this project. In these experiments, training was carried out for the specific modalities, deriving text and image models, as well as the fusion of the two mo- dalities in a multimodal model. The best models were the binary textual models trained taking into account product titles and descriptions: TD bin-adult (with a recall of 98%) and TD bin-illegal (with a recall of 95 %). We have some insights about the multimo- dal classification, mainly for the visual modality which, regarding its nature, could not capture patterns as well as textual models.
id SCAR_c48da621ef2a86371ed8abd0b0748ae8
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/16443
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Romualdo, Alan da SilvaCaseli, Helena de Medeiroshttp://lattes.cnpq.br/6608582057810385http://lattes.cnpq.br/600999152543294622d4a38e-f18c-4a88-bda2-87ef518b3fe92022-08-02T12:25:42Z2022-08-02T12:25:42Z2022-04-19ROMUALDO, Alan da Silva. Multimodal classification for detecting products that do not comply with the Americanas S.A.'s marketplace sales policies. 2022. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/16443.https://repositorio.ufscar.br/handle/20.500.14289/16443Multimodal learning for the e-commerce domain, some classification methods are ne- eded for categorization, information retrieval and product recommendations, which are generally composed of different modalities: images and texts. Due to large diversification in the characteristics of these modalities or the absence/incompleteness of information (for example, incomplete product attributes), classification methods face many difficulties in dealing with this information in order to improve their classification. Thus, this work was carried out to investigate the multimodal learning in visual and textual modalities for e-commerce. Our experiments show good results for classification of products from “Adult” and “Illegal Devices” categories, which is part of the dataset provided by the partner company of this project. In these experiments, training was carried out for the specific modalities, deriving text and image models, as well as the fusion of the two mo- dalities in a multimodal model. The best models were the binary textual models trained taking into account product titles and descriptions: TD bin-adult (with a recall of 98%) and TD bin-illegal (with a recall of 95 %). We have some insights about the multimo- dal classification, mainly for the visual modality which, regarding its nature, could not capture patterns as well as textual models.O aprendizado multimodal para o domínio do e-commerce possui alguns métodos de classificação para categorização, recuperação de informação e recomendações de produ- tos, que geralmente são compostos por modalidades diferentes: imagens e textos. Devido a grandes variações das características dessas modalidades nos produtos, a ausência ou incompletude de informações (por exemplo, atributos de produtos incompletos), há uma dificuldade de métodos de classificação de trabalhar essas informações para melhorar sua classificação, utilizando então a fusão dos recursos em nível de decisão para classificadores específicos de cada modalidade. Assim, este trabalho foi realizado com o objetivo de in- vestigar o aprendizado multimodal entre modalidades visual e textual para o domínio do e-commerce. Os experimentos descritos neste documento apresentaram bons resultados para classificação de produtos das categorias “Adulto” e “Dispositivos Ilegais”, que fazem parte do conjunto de dados fornecido pela empresa parceira deste projeto. Nesses expe- rimentos, realizou-se o treinamento para as modalidades específicas, com modelos para texto e para imagem, bem como a fusão das duas modalidades em um modelo multimo- dal. Os melhores modelos foram os textuais de classificação binária produzidos levando em consideração títulos e descrições de produtos: TD bin-adult (com recall de 98%) e TD bin-illegal (com um recall de 95%). Temos alguns insights sobre a classificação mul- timodal das classes principalmente para a modalidade visual que, devido à sua natureza, não pode capturar padrões tão bem quanto os modelos textuais.OutraengUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessClassificação multimodalTextoImagemProdutosE-commerceMultimodal classificationTextImageProductsCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOMultimodal classification for detecting products that do not comply with the Americanas S.A.'s marketplace sales policiesClassificação multimodal para detecção de produtos em discordância com a política de vendas do marketplace da Americanasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis600600e36d4e63-960d-4f5c-9c93-f8b7f5f93d65reponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufscar.br/bitstreams/efa7112c-391a-443c-9d25-2f10a983452a/downloade39d27027a6cc9cb039ad269a5db8e34MD56falseAnonymousREADORIGINALMulti_Disserta__o (2).pdfMulti_Disserta__o (2).pdfDissertação da Defesa Corrigidaapplication/pdf5683631https://repositorio.ufscar.br/bitstreams/fa70325d-eeb0-4fcb-b1e7-ef570dd7f0e5/download6819177c4541626dabf3ec1daeff080cMD55trueAnonymousREADMulti - Carta comprovante da versão final de teses e dissertações - Alan.pdfMulti - Carta comprovante da versão final de teses e dissertações - Alan.pdfCarta de autorização de publicaçãoapplication/pdf109990https://repositorio.ufscar.br/bitstreams/183a77ba-e079-497e-90a0-23587d84af60/download19d29fd697855a6a15097b91bb9fbb60MD53falseTEXTMulti_Disserta__o (2).pdf.txtMulti_Disserta__o (2).pdf.txtExtracted texttext/plain117138https://repositorio.ufscar.br/bitstreams/2486232b-40ec-4d7e-9e3c-d7131043cf98/download7d56ea8dfed2e4624a47988137d87adfMD57falseAnonymousREADMulti - Carta comprovante da versão final de teses e dissertações - Alan.pdf.txtMulti - Carta comprovante da versão final de teses e dissertações - Alan.pdf.txtExtracted texttext/plain1558https://repositorio.ufscar.br/bitstreams/6e2df987-9372-4f6c-980f-8eec01f2c2ff/download396006f39cf2e1b51c140653a604769cMD59falseTHUMBNAILMulti_Disserta__o (2).pdf.jpgMulti_Disserta__o (2).pdf.jpgIM Thumbnailimage/jpeg2920https://repositorio.ufscar.br/bitstreams/178d7459-72e0-4bec-a04d-0fd565e2890a/download89c8556201035bdad03e5b132aaeba68MD58falseAnonymousREADMulti - Carta comprovante da versão final de teses e dissertações - Alan.pdf.jpgMulti - Carta comprovante da versão final de teses e dissertações - Alan.pdf.jpgIM Thumbnailimage/jpeg13329https://repositorio.ufscar.br/bitstreams/39a384d6-777c-4872-b1d9-9ea810b05c8e/download97796ae04afc5a815ca6df0854e7598dMD510false20.500.14289/164432025-02-05 21:40:20.867http://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/16443https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-06T00:40:20Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.eng.fl_str_mv Multimodal classification for detecting products that do not comply with the Americanas S.A.'s marketplace sales policies
dc.title.alternative.por.fl_str_mv Classificação multimodal para detecção de produtos em discordância com a política de vendas do marketplace da Americanas
title Multimodal classification for detecting products that do not comply with the Americanas S.A.'s marketplace sales policies
spellingShingle Multimodal classification for detecting products that do not comply with the Americanas S.A.'s marketplace sales policies
Romualdo, Alan da Silva
Classificação multimodal
Texto
Imagem
Produtos
E-commerce
Multimodal classification
Text
Image
Products
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Multimodal classification for detecting products that do not comply with the Americanas S.A.'s marketplace sales policies
title_full Multimodal classification for detecting products that do not comply with the Americanas S.A.'s marketplace sales policies
title_fullStr Multimodal classification for detecting products that do not comply with the Americanas S.A.'s marketplace sales policies
title_full_unstemmed Multimodal classification for detecting products that do not comply with the Americanas S.A.'s marketplace sales policies
title_sort Multimodal classification for detecting products that do not comply with the Americanas S.A.'s marketplace sales policies
author Romualdo, Alan da Silva
author_facet Romualdo, Alan da Silva
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/6009991525432946
dc.contributor.author.fl_str_mv Romualdo, Alan da Silva
dc.contributor.advisor1.fl_str_mv Caseli, Helena de Medeiros
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6608582057810385
dc.contributor.authorID.fl_str_mv 22d4a38e-f18c-4a88-bda2-87ef518b3fe9
contributor_str_mv Caseli, Helena de Medeiros
dc.subject.por.fl_str_mv Classificação multimodal
Texto
Imagem
Produtos
topic Classificação multimodal
Texto
Imagem
Produtos
E-commerce
Multimodal classification
Text
Image
Products
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv E-commerce
Multimodal classification
Text
Image
Products
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Multimodal learning for the e-commerce domain, some classification methods are ne- eded for categorization, information retrieval and product recommendations, which are generally composed of different modalities: images and texts. Due to large diversification in the characteristics of these modalities or the absence/incompleteness of information (for example, incomplete product attributes), classification methods face many difficulties in dealing with this information in order to improve their classification. Thus, this work was carried out to investigate the multimodal learning in visual and textual modalities for e-commerce. Our experiments show good results for classification of products from “Adult” and “Illegal Devices” categories, which is part of the dataset provided by the partner company of this project. In these experiments, training was carried out for the specific modalities, deriving text and image models, as well as the fusion of the two mo- dalities in a multimodal model. The best models were the binary textual models trained taking into account product titles and descriptions: TD bin-adult (with a recall of 98%) and TD bin-illegal (with a recall of 95 %). We have some insights about the multimo- dal classification, mainly for the visual modality which, regarding its nature, could not capture patterns as well as textual models.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-08-02T12:25:42Z
dc.date.available.fl_str_mv 2022-08-02T12:25:42Z
dc.date.issued.fl_str_mv 2022-04-19
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ROMUALDO, Alan da Silva. Multimodal classification for detecting products that do not comply with the Americanas S.A.'s marketplace sales policies. 2022. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/16443.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/20.500.14289/16443
identifier_str_mv ROMUALDO, Alan da Silva. Multimodal classification for detecting products that do not comply with the Americanas S.A.'s marketplace sales policies. 2022. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2022. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/16443.
url https://repositorio.ufscar.br/handle/20.500.14289/16443
dc.language.iso.fl_str_mv eng
language eng
dc.relation.confidence.fl_str_mv 600
600
dc.relation.authority.fl_str_mv e36d4e63-960d-4f5c-9c93-f8b7f5f93d65
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/efa7112c-391a-443c-9d25-2f10a983452a/download
https://repositorio.ufscar.br/bitstreams/fa70325d-eeb0-4fcb-b1e7-ef570dd7f0e5/download
https://repositorio.ufscar.br/bitstreams/183a77ba-e079-497e-90a0-23587d84af60/download
https://repositorio.ufscar.br/bitstreams/2486232b-40ec-4d7e-9e3c-d7131043cf98/download
https://repositorio.ufscar.br/bitstreams/6e2df987-9372-4f6c-980f-8eec01f2c2ff/download
https://repositorio.ufscar.br/bitstreams/178d7459-72e0-4bec-a04d-0fd565e2890a/download
https://repositorio.ufscar.br/bitstreams/39a384d6-777c-4872-b1d9-9ea810b05c8e/download
bitstream.checksum.fl_str_mv e39d27027a6cc9cb039ad269a5db8e34
6819177c4541626dabf3ec1daeff080c
19d29fd697855a6a15097b91bb9fbb60
7d56ea8dfed2e4624a47988137d87adf
396006f39cf2e1b51c140653a604769c
89c8556201035bdad03e5b132aaeba68
97796ae04afc5a815ca6df0854e7598d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688898324856832