Classificação de genótipos de café arábica usando espectroscopia de infravermelho próximo

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: Marquetti, Izabele
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Tecnológica Federal do Paraná
Campo Mourao
Medianeira
Programa de Pós-Graduação em Tecnologia de Alimentos
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.utfpr.edu.br/jspui/handle/1/1133
Resumo: The environmental conditions in coffee cultivation, such as climate, soil type and altitude, associated with agronomic practices, are responsible for influence the final chemical composition of the bean. They directly influence the essential features of the beverage, increasing its aggregate price. Proof of geographic and genotypic origin of the coffee genotypes must be done using reliable methods. Thus, the near infrared spectroscopy (NIRS), in the 1100 to 2498nm range, was used for analyze different coffee genotypes that were cultivated in different cities (Brazil - Paraná State). As first approach linear methods, principal components analysis (PCA) and partial least squares with discriminant analysis (PLS-DA), were used for data interpretation due to the high complexity and amount of information contained in the spectra. The obtained PLS-DA models had an average sensitivity of 93.75% and a specificity of 100% for the geographical classification. While for genopyte classification, the PLS-DA performance was 93.75% for sensitivity and 97.13% for specificity. In an attempt to improve the performance and reliability of the developed classifiers, both the PCA scores and the PLS-DA latent variables were fed into two artificial neural networks, the multilayer perceptron (MLP) and radial basis function network (RBF), that are nonlinear models. The architecture parameters of these networks were optimized using the sequential simplex method. The two-stage models, linear with PLS-DA and nonlinear with RBF, were able to classify geographically and genotypically with 100% of selectivity and specificity all the training and test samples. The latent variables of the PLS-DA are determined by taking into account the desired response, so it contains more information than the scores of the PCA. While the RBF network, by having fewer free parameters and a simpler architecture compared to the MLP, has a faster and covergente training. The spectra analysis in near-infrared region showed better results than mid-infrared spectra. These results indicate that NIRS spectra contain important information that, combined with appropriate methods of pattern recognition, allow the classification of green arabica coffee samples by genotype and growing region. Besides, the PLS-DA loadings analysis allows associating which NIRS bands are specific of each class. This information can be correlated with the samples chemical composition, providing preliminary data to evaluate the effect of growing region and genotype in the selected green coffee chemical composition.
id UTFPR-12_fb99c8009cead1a85953f4b99998da9a
oai_identifier_str oai:repositorio.utfpr.edu.br:1/1133
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Classificação de genótipos de café arábica usando espectroscopia de infravermelho próximoCafé - CultivoInteração genótipo-ambienteCaféCoffee plantationsGenotype-environment interactionCoffeeThe environmental conditions in coffee cultivation, such as climate, soil type and altitude, associated with agronomic practices, are responsible for influence the final chemical composition of the bean. They directly influence the essential features of the beverage, increasing its aggregate price. Proof of geographic and genotypic origin of the coffee genotypes must be done using reliable methods. Thus, the near infrared spectroscopy (NIRS), in the 1100 to 2498nm range, was used for analyze different coffee genotypes that were cultivated in different cities (Brazil - Paraná State). As first approach linear methods, principal components analysis (PCA) and partial least squares with discriminant analysis (PLS-DA), were used for data interpretation due to the high complexity and amount of information contained in the spectra. The obtained PLS-DA models had an average sensitivity of 93.75% and a specificity of 100% for the geographical classification. While for genopyte classification, the PLS-DA performance was 93.75% for sensitivity and 97.13% for specificity. In an attempt to improve the performance and reliability of the developed classifiers, both the PCA scores and the PLS-DA latent variables were fed into two artificial neural networks, the multilayer perceptron (MLP) and radial basis function network (RBF), that are nonlinear models. The architecture parameters of these networks were optimized using the sequential simplex method. The two-stage models, linear with PLS-DA and nonlinear with RBF, were able to classify geographically and genotypically with 100% of selectivity and specificity all the training and test samples. The latent variables of the PLS-DA are determined by taking into account the desired response, so it contains more information than the scores of the PCA. While the RBF network, by having fewer free parameters and a simpler architecture compared to the MLP, has a faster and covergente training. The spectra analysis in near-infrared region showed better results than mid-infrared spectra. These results indicate that NIRS spectra contain important information that, combined with appropriate methods of pattern recognition, allow the classification of green arabica coffee samples by genotype and growing region. Besides, the PLS-DA loadings analysis allows associating which NIRS bands are specific of each class. This information can be correlated with the samples chemical composition, providing preliminary data to evaluate the effect of growing region and genotype in the selected green coffee chemical composition.Capes; CNPq; Fundação AraucáriaAs condições ambientais do cultivo do café, como clima, tipo de solo e altitude, associadas a práticas agrícolas, são responsáveis pela composição química final do grão. Além disso, o genótipo cultivado também influencia diretamente nas características essenciais da bebida, aumentando o seu valor agregado. Portanto, comprovações da origem geográfica e genotípica da genótipo do café devem ser realizadas utilizando métodos confiáveis. A espectroscopia no infravermelho próximo (NIRS), na região de 1100 a 2498 nm, foi utilizada na análise de genótipos de café arábica, cultivadas em diferentes cidades do estado do Paraná, Brasil. Como primeira aproximação, os métodos lineares, análise de componentes principais (ACP) e mínimos quadrados parciais com análise discriminante (PLS-DA), foram utilizados para a interpretação dos dados devido à complexidade e elevada quantidade de informação contida nos espectros. Os modelos PLS-DA obtidos para a classificação geográfica apresentaram uma sensibilidade média de 93,75% e uma especificidade de 100%. Já para a classificação dos genótipos a performance do PLS- DA foi de 93,75% para sensibilidade e 97,13% para a especificidade. Na tentativa de melhorar a performance e a confiabilidade de classificação foram desenvolvidos modelos de dois estágios. Tanto os scores da ACP como as variáveis latentes do PLS-DA foram alimentados em dois tipos diferentes de redes neurais artificiais, o perceptron de múltiplas camadas (MLP) e a rede de funções de base radial (RBF) que são modelos inerentemente não-lineares. Os respectivos parâmetros de arquitetura dessas redes foram otimizados através do método de busca direta simplex sequencial. Os modelos de dois estágios, linear com PLS-DA e não-linear com RBF, foram capazes de classificar geograficamente e genotipicamente com 100% de seletividade e especificidade todas as amostras de treinamento e de teste. As variáveis latentes do PLS-DA por serem determinadas levando-se em consideração a resposta desejada contêm mais informação que os scores da ACP. Já a rede RBF, por possuir um número menor de parâmetros livres e uma estrutura mais simples quando comparada à MLP, possui um treinamento mais rápido e convergente. Quando comparados com os resultados obtidos na espectroscopia de infravermelho médio (FTIR), os modelos obtidos usando os espectros NIRS apresentaram uma performance melhor e mais confiável. Estes resultados indicam que os espectros NIRS contêm informações importantes que aliadas a métodos adequados de reconhecimento de padrões resultam em uma classificação eficiente de amostras de café arábica verde por genótipo e local de cultivo. Além disso, uma análise dos loadings das variáveis latentes do PLS-DA permite associar quais bandas são características em cada classe. Essa informação pode ser correlacionada com a composição química das amostras fornecendo, assim, dados preliminares para avaliar o efeito da região de cultivo e do tipo de genótipo selecionado nas características químicas do grão de café verde.Universidade Tecnológica Federal do ParanáCampo MouraoMedianeiraPrograma de Pós-Graduação em Tecnologia de AlimentosBona, EvandroValderrama, PatríciaMarquetti, Izabele2015-05-15T15:39:13Z2015-05-15T15:39:13Z2014-06-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfMARQUETTI, Izabele. Classificação de genótipos de café arábica usando espectroscopia de infravermelho próximo. 2014. 79 f. Dissertação (Mestrado em Tecnologia de Alimentos) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2014.http://repositorio.utfpr.edu.br/jspui/handle/1/1133porreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRinfo:eu-repo/semantics/openAccess2015-05-20T12:54:19Zoai:repositorio.utfpr.edu.br:1/1133Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2015-05-20T12:54:19Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Classificação de genótipos de café arábica usando espectroscopia de infravermelho próximo
title Classificação de genótipos de café arábica usando espectroscopia de infravermelho próximo
spellingShingle Classificação de genótipos de café arábica usando espectroscopia de infravermelho próximo
Marquetti, Izabele
Café - Cultivo
Interação genótipo-ambiente
Café
Coffee plantations
Genotype-environment interaction
Coffee
title_short Classificação de genótipos de café arábica usando espectroscopia de infravermelho próximo
title_full Classificação de genótipos de café arábica usando espectroscopia de infravermelho próximo
title_fullStr Classificação de genótipos de café arábica usando espectroscopia de infravermelho próximo
title_full_unstemmed Classificação de genótipos de café arábica usando espectroscopia de infravermelho próximo
title_sort Classificação de genótipos de café arábica usando espectroscopia de infravermelho próximo
author Marquetti, Izabele
author_facet Marquetti, Izabele
author_role author
dc.contributor.none.fl_str_mv Bona, Evandro
Valderrama, Patrícia
dc.contributor.author.fl_str_mv Marquetti, Izabele
dc.subject.por.fl_str_mv Café - Cultivo
Interação genótipo-ambiente
Café
Coffee plantations
Genotype-environment interaction
Coffee
topic Café - Cultivo
Interação genótipo-ambiente
Café
Coffee plantations
Genotype-environment interaction
Coffee
description The environmental conditions in coffee cultivation, such as climate, soil type and altitude, associated with agronomic practices, are responsible for influence the final chemical composition of the bean. They directly influence the essential features of the beverage, increasing its aggregate price. Proof of geographic and genotypic origin of the coffee genotypes must be done using reliable methods. Thus, the near infrared spectroscopy (NIRS), in the 1100 to 2498nm range, was used for analyze different coffee genotypes that were cultivated in different cities (Brazil - Paraná State). As first approach linear methods, principal components analysis (PCA) and partial least squares with discriminant analysis (PLS-DA), were used for data interpretation due to the high complexity and amount of information contained in the spectra. The obtained PLS-DA models had an average sensitivity of 93.75% and a specificity of 100% for the geographical classification. While for genopyte classification, the PLS-DA performance was 93.75% for sensitivity and 97.13% for specificity. In an attempt to improve the performance and reliability of the developed classifiers, both the PCA scores and the PLS-DA latent variables were fed into two artificial neural networks, the multilayer perceptron (MLP) and radial basis function network (RBF), that are nonlinear models. The architecture parameters of these networks were optimized using the sequential simplex method. The two-stage models, linear with PLS-DA and nonlinear with RBF, were able to classify geographically and genotypically with 100% of selectivity and specificity all the training and test samples. The latent variables of the PLS-DA are determined by taking into account the desired response, so it contains more information than the scores of the PCA. While the RBF network, by having fewer free parameters and a simpler architecture compared to the MLP, has a faster and covergente training. The spectra analysis in near-infrared region showed better results than mid-infrared spectra. These results indicate that NIRS spectra contain important information that, combined with appropriate methods of pattern recognition, allow the classification of green arabica coffee samples by genotype and growing region. Besides, the PLS-DA loadings analysis allows associating which NIRS bands are specific of each class. This information can be correlated with the samples chemical composition, providing preliminary data to evaluate the effect of growing region and genotype in the selected green coffee chemical composition.
publishDate 2014
dc.date.none.fl_str_mv 2014-06-09
2015-05-15T15:39:13Z
2015-05-15T15:39:13Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv MARQUETTI, Izabele. Classificação de genótipos de café arábica usando espectroscopia de infravermelho próximo. 2014. 79 f. Dissertação (Mestrado em Tecnologia de Alimentos) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2014.
http://repositorio.utfpr.edu.br/jspui/handle/1/1133
identifier_str_mv MARQUETTI, Izabele. Classificação de genótipos de café arábica usando espectroscopia de infravermelho próximo. 2014. 79 f. Dissertação (Mestrado em Tecnologia de Alimentos) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2014.
url http://repositorio.utfpr.edu.br/jspui/handle/1/1133
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Campo Mourao
Medianeira
Programa de Pós-Graduação em Tecnologia de Alimentos
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Campo Mourao
Medianeira
Programa de Pós-Graduação em Tecnologia de Alimentos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850498291549077504