Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Leite, Débora Pompilio
Orientador(a): Anzanello, Michel José
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/289502
Resumo: A aplicação de técnicas multivariadas é essencial na análise de dados de espectroscopia do tipo infravermelho devido ao alto volume de variáveis ruidosas e elevada colinearidade presente nestes dados. Esta dissertação aplica técnicas multivariadas em dados espectrais de café para identificar os comprimentos de onda mais informativos com dois objetivos: (i) prever notas de degustadores, e (ii) classificar amostras em categorias de qualidade. Com vistas à previsão das notas atribuídas por degustadores, inicialmente utiliza-se mRMR, Relief e coeficientes da regressão PLS para quantificar a importância dos comprimentos de onda. Em seguida, aplicase um processo iterativo de remoção baseado no índice de importância atribuído por essas técnicas de seleção, comparando-se as técnicas PLS (Partial Least Squares) e XGBoost (Extreme Gradient Boosting) na previsão das notas dos degustadores de café. O desempenho preditivo é avaliado utilizando-se o RMSE (Root Mean Squared Error) e o desvio padrão dos resíduos. Já para a classificação das amostras em duas categorias de qualidade, analisa-se o desempenho de combinações das técnicas mRMR e Relief com três técnicas de classificação - kNN (k-Nearest Neighbors), Naive Bayes e SVM (Support Vector Machine). O desempenho dos modelos de classificação foi avaliado pelas métricas de acurácia, sensibilidade e especificidade. Nesse processo, também foi aplicada uma remoção iterativa backward para eliminar os comprimentos de onda menos relevantes. Com a aplicação dessas técnicas, foi possível realizar predições e classificações mais precisas, ao mesmo tempo que se reduziu o número de comprimentos de onda não relevantes para os modelos.
id UFRGS-2_00a022525201308511b194b932190a39
oai_identifier_str oai:www.lume.ufrgs.br:10183/289502
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Leite, Débora PompilioAnzanello, Michel José2025-04-08T06:55:31Z2024http://hdl.handle.net/10183/289502001241408A aplicação de técnicas multivariadas é essencial na análise de dados de espectroscopia do tipo infravermelho devido ao alto volume de variáveis ruidosas e elevada colinearidade presente nestes dados. Esta dissertação aplica técnicas multivariadas em dados espectrais de café para identificar os comprimentos de onda mais informativos com dois objetivos: (i) prever notas de degustadores, e (ii) classificar amostras em categorias de qualidade. Com vistas à previsão das notas atribuídas por degustadores, inicialmente utiliza-se mRMR, Relief e coeficientes da regressão PLS para quantificar a importância dos comprimentos de onda. Em seguida, aplicase um processo iterativo de remoção baseado no índice de importância atribuído por essas técnicas de seleção, comparando-se as técnicas PLS (Partial Least Squares) e XGBoost (Extreme Gradient Boosting) na previsão das notas dos degustadores de café. O desempenho preditivo é avaliado utilizando-se o RMSE (Root Mean Squared Error) e o desvio padrão dos resíduos. Já para a classificação das amostras em duas categorias de qualidade, analisa-se o desempenho de combinações das técnicas mRMR e Relief com três técnicas de classificação - kNN (k-Nearest Neighbors), Naive Bayes e SVM (Support Vector Machine). O desempenho dos modelos de classificação foi avaliado pelas métricas de acurácia, sensibilidade e especificidade. Nesse processo, também foi aplicada uma remoção iterativa backward para eliminar os comprimentos de onda menos relevantes. Com a aplicação dessas técnicas, foi possível realizar predições e classificações mais precisas, ao mesmo tempo que se reduziu o número de comprimentos de onda não relevantes para os modelos.The application of multivariate techniques is essential in analyzing infrared spectroscopy data due to the high volume of noisy variables and elevated collinearity in these datasets. This dissertation aims to apply multivariate techniques to coffee spectral data and identify the most informative wavelengths for two distinct objectives: (i) to predict taster scores and (ii) to classify samples into quality categories. To predict the taster scores, mRMR, Relief, and PLS regression coefficients are initially used to quantify the importance of the wavelengths. Next, an iterative removal process based on the importance index assigned by these selection techniques is applied, comparing the performance of PLS (Partial Least Squares) and XGBoost (Extreme Gradient Boosting) in predicting the scores of the coffee tasters. Predictive performance was evaluated using RMSE (Root Mean Squared Error) and the standard deviation of the residuals. For classifying the samples into two quality categories, the performance of combinations of mRMR and Relief with three classification techniques—kNN (k-Nearest Neighbors), Naive Bayes, and SVM (Support Vector Machine)—is analyzed. The classification models were evaluated using accuracy, sensitivity, and specificity metrics. A backward iterative removal process was also applied to eliminate less relevant wavelengths. Applying these techniques allows more accurate predictions and classifications to be achieved while also reducing the number of irrelevant wavelengths in the models.application/pdfporControle de qualidadeAnálise multivariadaSeleção de comprimentos de ondaCaféMultivariate techniquesWavelength selectionPredictionClassificationAplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de caféApplication of multivariate techniques to characterize quality in coffee spectral data info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPrograma de Pós-Graduação em Engenharia de Produção e TransportesPorto Alegre, BR-RS2024mestradoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001241408.pdf.txt001241408.pdf.txtExtracted Texttext/plain137362http://www.lume.ufrgs.br/bitstream/10183/289502/2/001241408.pdf.txt3d7d942aae92ccc7fc26262edb81e877MD52ORIGINAL001241408.pdfTexto completoapplication/pdf884388http://www.lume.ufrgs.br/bitstream/10183/289502/1/001241408.pdfd44d034069147e0b0c53f37ecafad392MD5110183/2895022025-04-11 15:48:18.507133oai:www.lume.ufrgs.br:10183/289502Repositório InstitucionalPUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.bropendoar:2025-04-11T18:48:18Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café
dc.title.alternative.en.fl_str_mv Application of multivariate techniques to characterize quality in coffee spectral data
title Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café
spellingShingle Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café
Leite, Débora Pompilio
Controle de qualidade
Análise multivariada
Seleção de comprimentos de onda
Café
Multivariate techniques
Wavelength selection
Prediction
Classification
title_short Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café
title_full Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café
title_fullStr Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café
title_full_unstemmed Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café
title_sort Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café
author Leite, Débora Pompilio
author_facet Leite, Débora Pompilio
author_role author
dc.contributor.author.fl_str_mv Leite, Débora Pompilio
dc.contributor.advisor1.fl_str_mv Anzanello, Michel José
contributor_str_mv Anzanello, Michel José
dc.subject.por.fl_str_mv Controle de qualidade
Análise multivariada
Seleção de comprimentos de onda
Café
topic Controle de qualidade
Análise multivariada
Seleção de comprimentos de onda
Café
Multivariate techniques
Wavelength selection
Prediction
Classification
dc.subject.eng.fl_str_mv Multivariate techniques
Wavelength selection
Prediction
Classification
description A aplicação de técnicas multivariadas é essencial na análise de dados de espectroscopia do tipo infravermelho devido ao alto volume de variáveis ruidosas e elevada colinearidade presente nestes dados. Esta dissertação aplica técnicas multivariadas em dados espectrais de café para identificar os comprimentos de onda mais informativos com dois objetivos: (i) prever notas de degustadores, e (ii) classificar amostras em categorias de qualidade. Com vistas à previsão das notas atribuídas por degustadores, inicialmente utiliza-se mRMR, Relief e coeficientes da regressão PLS para quantificar a importância dos comprimentos de onda. Em seguida, aplicase um processo iterativo de remoção baseado no índice de importância atribuído por essas técnicas de seleção, comparando-se as técnicas PLS (Partial Least Squares) e XGBoost (Extreme Gradient Boosting) na previsão das notas dos degustadores de café. O desempenho preditivo é avaliado utilizando-se o RMSE (Root Mean Squared Error) e o desvio padrão dos resíduos. Já para a classificação das amostras em duas categorias de qualidade, analisa-se o desempenho de combinações das técnicas mRMR e Relief com três técnicas de classificação - kNN (k-Nearest Neighbors), Naive Bayes e SVM (Support Vector Machine). O desempenho dos modelos de classificação foi avaliado pelas métricas de acurácia, sensibilidade e especificidade. Nesse processo, também foi aplicada uma remoção iterativa backward para eliminar os comprimentos de onda menos relevantes. Com a aplicação dessas técnicas, foi possível realizar predições e classificações mais precisas, ao mesmo tempo que se reduziu o número de comprimentos de onda não relevantes para os modelos.
publishDate 2024
dc.date.issued.fl_str_mv 2024
dc.date.accessioned.fl_str_mv 2025-04-08T06:55:31Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/289502
dc.identifier.nrb.pt_BR.fl_str_mv 001241408
url http://hdl.handle.net/10183/289502
identifier_str_mv 001241408
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/289502/2/001241408.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/289502/1/001241408.pdf
bitstream.checksum.fl_str_mv 3d7d942aae92ccc7fc26262edb81e877
d44d034069147e0b0c53f37ecafad392
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br
_version_ 1864542914816770048