Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Link de acesso: | http://hdl.handle.net/10183/289502 |
Resumo: | A aplicação de técnicas multivariadas é essencial na análise de dados de espectroscopia do tipo infravermelho devido ao alto volume de variáveis ruidosas e elevada colinearidade presente nestes dados. Esta dissertação aplica técnicas multivariadas em dados espectrais de café para identificar os comprimentos de onda mais informativos com dois objetivos: (i) prever notas de degustadores, e (ii) classificar amostras em categorias de qualidade. Com vistas à previsão das notas atribuídas por degustadores, inicialmente utiliza-se mRMR, Relief e coeficientes da regressão PLS para quantificar a importância dos comprimentos de onda. Em seguida, aplicase um processo iterativo de remoção baseado no índice de importância atribuído por essas técnicas de seleção, comparando-se as técnicas PLS (Partial Least Squares) e XGBoost (Extreme Gradient Boosting) na previsão das notas dos degustadores de café. O desempenho preditivo é avaliado utilizando-se o RMSE (Root Mean Squared Error) e o desvio padrão dos resíduos. Já para a classificação das amostras em duas categorias de qualidade, analisa-se o desempenho de combinações das técnicas mRMR e Relief com três técnicas de classificação - kNN (k-Nearest Neighbors), Naive Bayes e SVM (Support Vector Machine). O desempenho dos modelos de classificação foi avaliado pelas métricas de acurácia, sensibilidade e especificidade. Nesse processo, também foi aplicada uma remoção iterativa backward para eliminar os comprimentos de onda menos relevantes. Com a aplicação dessas técnicas, foi possível realizar predições e classificações mais precisas, ao mesmo tempo que se reduziu o número de comprimentos de onda não relevantes para os modelos. |
| id |
UFRGS-2_00a022525201308511b194b932190a39 |
|---|---|
| oai_identifier_str |
oai:www.lume.ufrgs.br:10183/289502 |
| network_acronym_str |
UFRGS-2 |
| network_name_str |
Repositório Institucional da UFRGS |
| repository_id_str |
|
| spelling |
Leite, Débora PompilioAnzanello, Michel José2025-04-08T06:55:31Z2024http://hdl.handle.net/10183/289502001241408A aplicação de técnicas multivariadas é essencial na análise de dados de espectroscopia do tipo infravermelho devido ao alto volume de variáveis ruidosas e elevada colinearidade presente nestes dados. Esta dissertação aplica técnicas multivariadas em dados espectrais de café para identificar os comprimentos de onda mais informativos com dois objetivos: (i) prever notas de degustadores, e (ii) classificar amostras em categorias de qualidade. Com vistas à previsão das notas atribuídas por degustadores, inicialmente utiliza-se mRMR, Relief e coeficientes da regressão PLS para quantificar a importância dos comprimentos de onda. Em seguida, aplicase um processo iterativo de remoção baseado no índice de importância atribuído por essas técnicas de seleção, comparando-se as técnicas PLS (Partial Least Squares) e XGBoost (Extreme Gradient Boosting) na previsão das notas dos degustadores de café. O desempenho preditivo é avaliado utilizando-se o RMSE (Root Mean Squared Error) e o desvio padrão dos resíduos. Já para a classificação das amostras em duas categorias de qualidade, analisa-se o desempenho de combinações das técnicas mRMR e Relief com três técnicas de classificação - kNN (k-Nearest Neighbors), Naive Bayes e SVM (Support Vector Machine). O desempenho dos modelos de classificação foi avaliado pelas métricas de acurácia, sensibilidade e especificidade. Nesse processo, também foi aplicada uma remoção iterativa backward para eliminar os comprimentos de onda menos relevantes. Com a aplicação dessas técnicas, foi possível realizar predições e classificações mais precisas, ao mesmo tempo que se reduziu o número de comprimentos de onda não relevantes para os modelos.The application of multivariate techniques is essential in analyzing infrared spectroscopy data due to the high volume of noisy variables and elevated collinearity in these datasets. This dissertation aims to apply multivariate techniques to coffee spectral data and identify the most informative wavelengths for two distinct objectives: (i) to predict taster scores and (ii) to classify samples into quality categories. To predict the taster scores, mRMR, Relief, and PLS regression coefficients are initially used to quantify the importance of the wavelengths. Next, an iterative removal process based on the importance index assigned by these selection techniques is applied, comparing the performance of PLS (Partial Least Squares) and XGBoost (Extreme Gradient Boosting) in predicting the scores of the coffee tasters. Predictive performance was evaluated using RMSE (Root Mean Squared Error) and the standard deviation of the residuals. For classifying the samples into two quality categories, the performance of combinations of mRMR and Relief with three classification techniques—kNN (k-Nearest Neighbors), Naive Bayes, and SVM (Support Vector Machine)—is analyzed. The classification models were evaluated using accuracy, sensitivity, and specificity metrics. A backward iterative removal process was also applied to eliminate less relevant wavelengths. Applying these techniques allows more accurate predictions and classifications to be achieved while also reducing the number of irrelevant wavelengths in the models.application/pdfporControle de qualidadeAnálise multivariadaSeleção de comprimentos de ondaCaféMultivariate techniquesWavelength selectionPredictionClassificationAplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de caféApplication of multivariate techniques to characterize quality in coffee spectral data info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPrograma de Pós-Graduação em Engenharia de Produção e TransportesPorto Alegre, BR-RS2024mestradoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001241408.pdf.txt001241408.pdf.txtExtracted Texttext/plain137362http://www.lume.ufrgs.br/bitstream/10183/289502/2/001241408.pdf.txt3d7d942aae92ccc7fc26262edb81e877MD52ORIGINAL001241408.pdfTexto completoapplication/pdf884388http://www.lume.ufrgs.br/bitstream/10183/289502/1/001241408.pdfd44d034069147e0b0c53f37ecafad392MD5110183/2895022025-04-11 15:48:18.507133oai:www.lume.ufrgs.br:10183/289502Repositório InstitucionalPUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.bropendoar:2025-04-11T18:48:18Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
| dc.title.pt_BR.fl_str_mv |
Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café |
| dc.title.alternative.en.fl_str_mv |
Application of multivariate techniques to characterize quality in coffee spectral data |
| title |
Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café |
| spellingShingle |
Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café Leite, Débora Pompilio Controle de qualidade Análise multivariada Seleção de comprimentos de onda Café Multivariate techniques Wavelength selection Prediction Classification |
| title_short |
Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café |
| title_full |
Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café |
| title_fullStr |
Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café |
| title_full_unstemmed |
Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café |
| title_sort |
Aplicação de técnicas multivariadas para caracterização de qualidade em dados espectrais de café |
| author |
Leite, Débora Pompilio |
| author_facet |
Leite, Débora Pompilio |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Leite, Débora Pompilio |
| dc.contributor.advisor1.fl_str_mv |
Anzanello, Michel José |
| contributor_str_mv |
Anzanello, Michel José |
| dc.subject.por.fl_str_mv |
Controle de qualidade Análise multivariada Seleção de comprimentos de onda Café |
| topic |
Controle de qualidade Análise multivariada Seleção de comprimentos de onda Café Multivariate techniques Wavelength selection Prediction Classification |
| dc.subject.eng.fl_str_mv |
Multivariate techniques Wavelength selection Prediction Classification |
| description |
A aplicação de técnicas multivariadas é essencial na análise de dados de espectroscopia do tipo infravermelho devido ao alto volume de variáveis ruidosas e elevada colinearidade presente nestes dados. Esta dissertação aplica técnicas multivariadas em dados espectrais de café para identificar os comprimentos de onda mais informativos com dois objetivos: (i) prever notas de degustadores, e (ii) classificar amostras em categorias de qualidade. Com vistas à previsão das notas atribuídas por degustadores, inicialmente utiliza-se mRMR, Relief e coeficientes da regressão PLS para quantificar a importância dos comprimentos de onda. Em seguida, aplicase um processo iterativo de remoção baseado no índice de importância atribuído por essas técnicas de seleção, comparando-se as técnicas PLS (Partial Least Squares) e XGBoost (Extreme Gradient Boosting) na previsão das notas dos degustadores de café. O desempenho preditivo é avaliado utilizando-se o RMSE (Root Mean Squared Error) e o desvio padrão dos resíduos. Já para a classificação das amostras em duas categorias de qualidade, analisa-se o desempenho de combinações das técnicas mRMR e Relief com três técnicas de classificação - kNN (k-Nearest Neighbors), Naive Bayes e SVM (Support Vector Machine). O desempenho dos modelos de classificação foi avaliado pelas métricas de acurácia, sensibilidade e especificidade. Nesse processo, também foi aplicada uma remoção iterativa backward para eliminar os comprimentos de onda menos relevantes. Com a aplicação dessas técnicas, foi possível realizar predições e classificações mais precisas, ao mesmo tempo que se reduziu o número de comprimentos de onda não relevantes para os modelos. |
| publishDate |
2024 |
| dc.date.issued.fl_str_mv |
2024 |
| dc.date.accessioned.fl_str_mv |
2025-04-08T06:55:31Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/289502 |
| dc.identifier.nrb.pt_BR.fl_str_mv |
001241408 |
| url |
http://hdl.handle.net/10183/289502 |
| identifier_str_mv |
001241408 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
| instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
| instacron_str |
UFRGS |
| institution |
UFRGS |
| reponame_str |
Repositório Institucional da UFRGS |
| collection |
Repositório Institucional da UFRGS |
| bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/289502/2/001241408.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/289502/1/001241408.pdf |
| bitstream.checksum.fl_str_mv |
3d7d942aae92ccc7fc26262edb81e877 d44d034069147e0b0c53f37ecafad392 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
| repository.mail.fl_str_mv |
lume@ufrgs.br |
| _version_ |
1864542914816770048 |