Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Link de acesso: | http://hdl.handle.net/10183/280733 |
Resumo: | A gestão e análise de grandes volumes de dados são desafios complexos impulsionados pelo avanço tecnológico no monitoramento de processos e produtos. Neste contexto, destaca-se a relevância da seleção criteriosa de variáveis e de estratégias avançadas de pré-processamento, como fusão de dados e engenharia de variáveis, para aprimorar o desempenho dos modelos de aprendizado de máquina. A presente tese apresenta proposições inovadoras para otimizar o controle da qualidade e autenticidade de produtos, reduzindo custos operacionais e melhorando a performance dos modelos analíticos. O primeiro artigo visa identificar as técnicas analíticas e variáveis mais relevantes para avaliar a autenticidade de amostras de Cialis® e Viagra®. Para tanto, integra a estratégia de fusão de dados de baixo nível (LLDF) com o algoritmo de classificação XGBoost. Na sequência, é realizada uma análise descritiva detalhada dos achados, evidenciando como a combinação dessas técnicas não apenas proporciona resultados numéricos precisos, mas também direciona a análise para uma interpretação mais detalhada do problema. O segundo artigo propõe uma estrutura de duas fases que incorpora uma etapa inicial de pré- seleção de comprimentos de onda (COs) orientada por agrupamento de CO, integrada a uma abordagem baseada em wrapper. A proposta foi aplicada a 11 conjuntos de dados FTIR/NIR de diferentes domínios, com o objetivo de classificar amostras em níveis de qualidade e autenticidade. Por fim, o terceiro artigo aborda o desenvolvimento e implementação de um método que combina etapas de seleção e de engenharia de variáveis. O estudo avalia a contribuição de cada etapa do método proposto no aprimoramento da eficácia dos modelos de aprendizado de máquina. A proposta foi validada em 8 conjuntos de dados FTIR/NIR de diferentes domínios com o objetivo de classificar amostras em níveis de qualidade e autenticidade. |
| id |
URGS_7fb1ef1af08bc53dbd8eeee49a45bb36 |
|---|---|
| oai_identifier_str |
oai:www.lume.ufrgs.br:10183/280733 |
| network_acronym_str |
URGS |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| repository_id_str |
|
| spelling |
Fontes, Juliana de AbreuAnzanello, Michel José2024-11-01T06:47:17Z2024http://hdl.handle.net/10183/280733001212743A gestão e análise de grandes volumes de dados são desafios complexos impulsionados pelo avanço tecnológico no monitoramento de processos e produtos. Neste contexto, destaca-se a relevância da seleção criteriosa de variáveis e de estratégias avançadas de pré-processamento, como fusão de dados e engenharia de variáveis, para aprimorar o desempenho dos modelos de aprendizado de máquina. A presente tese apresenta proposições inovadoras para otimizar o controle da qualidade e autenticidade de produtos, reduzindo custos operacionais e melhorando a performance dos modelos analíticos. O primeiro artigo visa identificar as técnicas analíticas e variáveis mais relevantes para avaliar a autenticidade de amostras de Cialis® e Viagra®. Para tanto, integra a estratégia de fusão de dados de baixo nível (LLDF) com o algoritmo de classificação XGBoost. Na sequência, é realizada uma análise descritiva detalhada dos achados, evidenciando como a combinação dessas técnicas não apenas proporciona resultados numéricos precisos, mas também direciona a análise para uma interpretação mais detalhada do problema. O segundo artigo propõe uma estrutura de duas fases que incorpora uma etapa inicial de pré- seleção de comprimentos de onda (COs) orientada por agrupamento de CO, integrada a uma abordagem baseada em wrapper. A proposta foi aplicada a 11 conjuntos de dados FTIR/NIR de diferentes domínios, com o objetivo de classificar amostras em níveis de qualidade e autenticidade. Por fim, o terceiro artigo aborda o desenvolvimento e implementação de um método que combina etapas de seleção e de engenharia de variáveis. O estudo avalia a contribuição de cada etapa do método proposto no aprimoramento da eficácia dos modelos de aprendizado de máquina. A proposta foi validada em 8 conjuntos de dados FTIR/NIR de diferentes domínios com o objetivo de classificar amostras em níveis de qualidade e autenticidade.The management and analysis of large data volumes are complex challenges driven by technological advancements in the collection and monitoring of processes and products. Emphasizing the importance of careful feature selection and advanced preprocessing strategies, such as data fusion and feature engineering, enhances machine learning model performance. This thesis presents innovative propositions to optimize product quality and authenticity control, reduce operational costs, and improve analytical model performance. The first article aims to identify the most relevant analytical techniques and variables for evaluating the authenticity of Cialis® and Viagra® samples. It integrates the low-level data fusion (LLDF) strategy with the XGBoost classification algorithm and provides a detailed descriptive analysis of the findings. This combination not only delivers precise numerical results but also guides a more detailed interpretation of the problem. The second article proposes a two-phase framework that incorporates an initial pre-selection stage of wavelengths (COs) guided by wavelength clustering, integrated with a wrapper-based approach. The proposal was applied to 11 FTIR/NIR datasets from different domains to classify samples into quality and authenticity levels. Finally, the third article addresses the development and implementation of a method combining feature selection and feature engineering stages. The study evaluates the impact of the proposed approach and the contribution of each stage to the efficacy of machine learning models. The proposal was validated on 8 FTIR/NIR datasets from different domains to classify samples into quality and authenticity levels.application/pdfengGestão da qualidadeAprendizado de máquinaSeleção de variáveisFeature selectionAnalytical technique selectionFeature engineeringClassificationVariable clusteringEstratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPrograma de Pós-Graduação em Engenharia de Produção e TransportesPorto Alegre, BR-RS2024doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001212743.pdf.txt001212743.pdf.txtExtracted Texttext/plain52931http://www.lume.ufrgs.br/bitstream/10183/280733/2/001212743.pdf.txt60044a711830f7beaa725346284559caMD52ORIGINAL001212743.pdfTexto parcialapplication/pdf429318http://www.lume.ufrgs.br/bitstream/10183/280733/1/001212743.pdf037eb075dab282045f9ca7c2aec796b0MD5110183/2807332024-12-19 07:55:46.221412oai:www.lume.ufrgs.br:10183/280733Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532024-12-19T09:55:46Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
| dc.title.pt_BR.fl_str_mv |
Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos |
| title |
Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos |
| spellingShingle |
Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos Fontes, Juliana de Abreu Gestão da qualidade Aprendizado de máquina Seleção de variáveis Feature selection Analytical technique selection Feature engineering Classification Variable clustering |
| title_short |
Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos |
| title_full |
Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos |
| title_fullStr |
Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos |
| title_full_unstemmed |
Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos |
| title_sort |
Estratégias de aprendizado de máquina para aperfeiçoamento do controle de qualidade de produtos |
| author |
Fontes, Juliana de Abreu |
| author_facet |
Fontes, Juliana de Abreu |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Fontes, Juliana de Abreu |
| dc.contributor.advisor1.fl_str_mv |
Anzanello, Michel José |
| contributor_str_mv |
Anzanello, Michel José |
| dc.subject.por.fl_str_mv |
Gestão da qualidade Aprendizado de máquina Seleção de variáveis |
| topic |
Gestão da qualidade Aprendizado de máquina Seleção de variáveis Feature selection Analytical technique selection Feature engineering Classification Variable clustering |
| dc.subject.eng.fl_str_mv |
Feature selection Analytical technique selection Feature engineering Classification Variable clustering |
| description |
A gestão e análise de grandes volumes de dados são desafios complexos impulsionados pelo avanço tecnológico no monitoramento de processos e produtos. Neste contexto, destaca-se a relevância da seleção criteriosa de variáveis e de estratégias avançadas de pré-processamento, como fusão de dados e engenharia de variáveis, para aprimorar o desempenho dos modelos de aprendizado de máquina. A presente tese apresenta proposições inovadoras para otimizar o controle da qualidade e autenticidade de produtos, reduzindo custos operacionais e melhorando a performance dos modelos analíticos. O primeiro artigo visa identificar as técnicas analíticas e variáveis mais relevantes para avaliar a autenticidade de amostras de Cialis® e Viagra®. Para tanto, integra a estratégia de fusão de dados de baixo nível (LLDF) com o algoritmo de classificação XGBoost. Na sequência, é realizada uma análise descritiva detalhada dos achados, evidenciando como a combinação dessas técnicas não apenas proporciona resultados numéricos precisos, mas também direciona a análise para uma interpretação mais detalhada do problema. O segundo artigo propõe uma estrutura de duas fases que incorpora uma etapa inicial de pré- seleção de comprimentos de onda (COs) orientada por agrupamento de CO, integrada a uma abordagem baseada em wrapper. A proposta foi aplicada a 11 conjuntos de dados FTIR/NIR de diferentes domínios, com o objetivo de classificar amostras em níveis de qualidade e autenticidade. Por fim, o terceiro artigo aborda o desenvolvimento e implementação de um método que combina etapas de seleção e de engenharia de variáveis. O estudo avalia a contribuição de cada etapa do método proposto no aprimoramento da eficácia dos modelos de aprendizado de máquina. A proposta foi validada em 8 conjuntos de dados FTIR/NIR de diferentes domínios com o objetivo de classificar amostras em níveis de qualidade e autenticidade. |
| publishDate |
2024 |
| dc.date.accessioned.fl_str_mv |
2024-11-01T06:47:17Z |
| dc.date.issued.fl_str_mv |
2024 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/280733 |
| dc.identifier.nrb.pt_BR.fl_str_mv |
001212743 |
| url |
http://hdl.handle.net/10183/280733 |
| identifier_str_mv |
001212743 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
| instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
| instacron_str |
UFRGS |
| institution |
UFRGS |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/280733/2/001212743.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/280733/1/001212743.pdf |
| bitstream.checksum.fl_str_mv |
60044a711830f7beaa725346284559ca 037eb075dab282045f9ca7c2aec796b0 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
| repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
| _version_ |
1831316188497444864 |