Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Fontes, Juliana de Abreu
Orientador(a): Anzanello, Michel José
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/280733
Resumo: A gestão e análise de grandes volumes de dados são desafios complexos impulsionados pelo avanço tecnológico no monitoramento de processos e produtos. Neste contexto, destaca-se a relevância da seleção criteriosa de variáveis e de estratégias avançadas de pré-processamento, como fusão de dados e engenharia de variáveis, para aprimorar o desempenho dos modelos de aprendizado de máquina. A presente tese apresenta proposições inovadoras para otimizar o controle da qualidade e autenticidade de produtos, reduzindo custos operacionais e melhorando a performance dos modelos analíticos. O primeiro artigo visa identificar as técnicas analíticas e variáveis mais relevantes para avaliar a autenticidade de amostras de Cialis® e Viagra®. Para tanto, integra a estratégia de fusão de dados de baixo nível (LLDF) com o algoritmo de classificação XGBoost. Na sequência, é realizada uma análise descritiva detalhada dos achados, evidenciando como a combinação dessas técnicas não apenas proporciona resultados numéricos precisos, mas também direciona a análise para uma interpretação mais detalhada do problema. O segundo artigo propõe uma estrutura de duas fases que incorpora uma etapa inicial de pré- seleção de comprimentos de onda (COs) orientada por agrupamento de CO, integrada a uma abordagem baseada em wrapper. A proposta foi aplicada a 11 conjuntos de dados FTIR/NIR de diferentes domínios, com o objetivo de classificar amostras em níveis de qualidade e autenticidade. Por fim, o terceiro artigo aborda o desenvolvimento e implementação de um método que combina etapas de seleção e de engenharia de variáveis. O estudo avalia a contribuição de cada etapa do método proposto no aprimoramento da eficácia dos modelos de aprendizado de máquina. A proposta foi validada em 8 conjuntos de dados FTIR/NIR de diferentes domínios com o objetivo de classificar amostras em níveis de qualidade e autenticidade.
id URGS_7fb1ef1af08bc53dbd8eeee49a45bb36
oai_identifier_str oai:www.lume.ufrgs.br:10183/280733
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Fontes, Juliana de AbreuAnzanello, Michel José2024-11-01T06:47:17Z2024http://hdl.handle.net/10183/280733001212743A gestão e análise de grandes volumes de dados são desafios complexos impulsionados pelo avanço tecnológico no monitoramento de processos e produtos. Neste contexto, destaca-se a relevância da seleção criteriosa de variáveis e de estratégias avançadas de pré-processamento, como fusão de dados e engenharia de variáveis, para aprimorar o desempenho dos modelos de aprendizado de máquina. A presente tese apresenta proposições inovadoras para otimizar o controle da qualidade e autenticidade de produtos, reduzindo custos operacionais e melhorando a performance dos modelos analíticos. O primeiro artigo visa identificar as técnicas analíticas e variáveis mais relevantes para avaliar a autenticidade de amostras de Cialis® e Viagra®. Para tanto, integra a estratégia de fusão de dados de baixo nível (LLDF) com o algoritmo de classificação XGBoost. Na sequência, é realizada uma análise descritiva detalhada dos achados, evidenciando como a combinação dessas técnicas não apenas proporciona resultados numéricos precisos, mas também direciona a análise para uma interpretação mais detalhada do problema. O segundo artigo propõe uma estrutura de duas fases que incorpora uma etapa inicial de pré- seleção de comprimentos de onda (COs) orientada por agrupamento de CO, integrada a uma abordagem baseada em wrapper. A proposta foi aplicada a 11 conjuntos de dados FTIR/NIR de diferentes domínios, com o objetivo de classificar amostras em níveis de qualidade e autenticidade. Por fim, o terceiro artigo aborda o desenvolvimento e implementação de um método que combina etapas de seleção e de engenharia de variáveis. O estudo avalia a contribuição de cada etapa do método proposto no aprimoramento da eficácia dos modelos de aprendizado de máquina. A proposta foi validada em 8 conjuntos de dados FTIR/NIR de diferentes domínios com o objetivo de classificar amostras em níveis de qualidade e autenticidade.The management and analysis of large data volumes are complex challenges driven by technological advancements in the collection and monitoring of processes and products. Emphasizing the importance of careful feature selection and advanced preprocessing strategies, such as data fusion and feature engineering, enhances machine learning model performance. This thesis presents innovative propositions to optimize product quality and authenticity control, reduce operational costs, and improve analytical model performance. The first article aims to identify the most relevant analytical techniques and variables for evaluating the authenticity of Cialis® and Viagra® samples. It integrates the low-level data fusion (LLDF) strategy with the XGBoost classification algorithm and provides a detailed descriptive analysis of the findings. This combination not only delivers precise numerical results but also guides a more detailed interpretation of the problem. The second article proposes a two-phase framework that incorporates an initial pre-selection stage of wavelengths (COs) guided by wavelength clustering, integrated with a wrapper-based approach. The proposal was applied to 11 FTIR/NIR datasets from different domains to classify samples into quality and authenticity levels. Finally, the third article addresses the development and implementation of a method combining feature selection and feature engineering stages. The study evaluates the impact of the proposed approach and the contribution of each stage to the efficacy of machine learning models. The proposal was validated on 8 FTIR/NIR datasets from different domains to classify samples into quality and authenticity levels.application/pdfengGestão da qualidadeAprendizado de máquinaSeleção de variáveisFeature selectionAnalytical technique selectionFeature engineeringClassificationVariable clusteringEstratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPrograma de Pós-Graduação em Engenharia de Produção e TransportesPorto Alegre, BR-RS2024doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001212743.pdf.txt001212743.pdf.txtExtracted Texttext/plain52931http://www.lume.ufrgs.br/bitstream/10183/280733/2/001212743.pdf.txt60044a711830f7beaa725346284559caMD52ORIGINAL001212743.pdfTexto parcialapplication/pdf429318http://www.lume.ufrgs.br/bitstream/10183/280733/1/001212743.pdf037eb075dab282045f9ca7c2aec796b0MD5110183/2807332024-12-19 07:55:46.221412oai:www.lume.ufrgs.br:10183/280733Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532024-12-19T09:55:46Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos
title Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos
spellingShingle Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos
Fontes, Juliana de Abreu
Gestão da qualidade
Aprendizado de máquina
Seleção de variáveis
Feature selection
Analytical technique selection
Feature engineering
Classification
Variable clustering
title_short Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos
title_full Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos
title_fullStr Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos
title_full_unstemmed Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos
title_sort Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos
author Fontes, Juliana de Abreu
author_facet Fontes, Juliana de Abreu
author_role author
dc.contributor.author.fl_str_mv Fontes, Juliana de Abreu
dc.contributor.advisor1.fl_str_mv Anzanello, Michel José
contributor_str_mv Anzanello, Michel José
dc.subject.por.fl_str_mv Gestão da qualidade
Aprendizado de máquina
Seleção de variáveis
topic Gestão da qualidade
Aprendizado de máquina
Seleção de variáveis
Feature selection
Analytical technique selection
Feature engineering
Classification
Variable clustering
dc.subject.eng.fl_str_mv Feature selection
Analytical technique selection
Feature engineering
Classification
Variable clustering
description A gestão e análise de grandes volumes de dados são desafios complexos impulsionados pelo avanço tecnológico no monitoramento de processos e produtos. Neste contexto, destaca-se a relevância da seleção criteriosa de variáveis e de estratégias avançadas de pré-processamento, como fusão de dados e engenharia de variáveis, para aprimorar o desempenho dos modelos de aprendizado de máquina. A presente tese apresenta proposições inovadoras para otimizar o controle da qualidade e autenticidade de produtos, reduzindo custos operacionais e melhorando a performance dos modelos analíticos. O primeiro artigo visa identificar as técnicas analíticas e variáveis mais relevantes para avaliar a autenticidade de amostras de Cialis® e Viagra®. Para tanto, integra a estratégia de fusão de dados de baixo nível (LLDF) com o algoritmo de classificação XGBoost. Na sequência, é realizada uma análise descritiva detalhada dos achados, evidenciando como a combinação dessas técnicas não apenas proporciona resultados numéricos precisos, mas também direciona a análise para uma interpretação mais detalhada do problema. O segundo artigo propõe uma estrutura de duas fases que incorpora uma etapa inicial de pré- seleção de comprimentos de onda (COs) orientada por agrupamento de CO, integrada a uma abordagem baseada em wrapper. A proposta foi aplicada a 11 conjuntos de dados FTIR/NIR de diferentes domínios, com o objetivo de classificar amostras em níveis de qualidade e autenticidade. Por fim, o terceiro artigo aborda o desenvolvimento e implementação de um método que combina etapas de seleção e de engenharia de variáveis. O estudo avalia a contribuição de cada etapa do método proposto no aprimoramento da eficácia dos modelos de aprendizado de máquina. A proposta foi validada em 8 conjuntos de dados FTIR/NIR de diferentes domínios com o objetivo de classificar amostras em níveis de qualidade e autenticidade.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-11-01T06:47:17Z
dc.date.issued.fl_str_mv 2024
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/280733
dc.identifier.nrb.pt_BR.fl_str_mv 001212743
url http://hdl.handle.net/10183/280733
identifier_str_mv 001212743
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/280733/2/001212743.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/280733/1/001212743.pdf
bitstream.checksum.fl_str_mv 60044a711830f7beaa725346284559ca
037eb075dab282045f9ca7c2aec796b0
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1831316188497444864