Espectroscopia NIR e algorítmos de seleção de variáveis para determinação de teor de água e classificação de sementes de algodão

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Cordeiro, Maria Barbosa da Silva lattes
Orientador(a): Simões, Simone da Silva
Banca de defesa: Diniz, Paulo Henrique Gonçalves Dias, Vilar, Welma Thaíse Silva
Tipo de documento: Dissertação
Tipo de acesso: Acesso embargado
Idioma: por
Instituição de defesa: Universidade Estadual da Paraíba
Programa de Pós-Graduação: Programa de Pós-Graduação em Química - PPGQ
Departamento: Pró-Reitoria de Pós-Graduação e Pesquisa - PRPGP
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: http://tede.bc.uepb.edu.br/jspui/handle/tede/4724
Resumo: The differentiation between genetically modified seeds (GMOs) and conventional ones is essential for agro-environmental viability in the different existing crops, as it can avoid contamination of conventional seeds or extinction of native species, elimination of plants and insects, as well as their resistance within the production environment itself. The methods used for the identification of GMOs are based on DNA analysis, which despite being accurate and reliable, are generally expensive, time-consuming and not readily available. On the other hand, spectroscopic techniques, widely used in the agricultural area, for determining quality requirements in seeds, demonstrate better performance for this purpose. The use of algorithms for the selection of variables generates a subset containing the variables that best relate to the properties of interest and contribute to the development of simple and robust models. In recent decades, studies using bioinspired algorithms have been explored in several areas of study, especially in chemistry. Bioinspiration consists of seeking to understand the mechanisms based on the behavior of animal or plant species. Given the above, this work studied the performance of some bioinspired algorithms for selection of variables applied to NIR data for the distinction between conventional and transgenic cotton seeds. Some works have already demonstrated the success of pattern recognition (RP) models built using full NIR spectra to solve this analytical problem. The objective of this work was the application of algorithms to evaluate the predictive capacity of least squares regression models (PLS) built with the whole spectrum and with spectral intervals (iSPA-PLS and i-PLS) for the quantification of water content in cotton seeds. Furthermore, discriminant analysis models constructed with NIR spectral variables selected by variable selection algorithms were constructed and validated. For this, the deterministic algorithm of successive projections (SPA) and also bioinspired algorithms such as ant colony (AOC) and genetic (GA) were tested. The set of samples for the quantification of moisture content was composed of 30 seed genotypes. The data set for the PR methods was composed of 1195 transgenic seeds and 1195 conventional seeds. All samples were provided by EMBRAPA cotton. The predictive capacity of the quantification models was evaluated based on the values of figures of merit such as REP and RMSE. PR models considered sensitivity, selectivity and correct classification rate. The models built with the selected variables obtained comparable results to the models with full spectrum both for the quantification models and for the classification models. However, for the quantification of water content in seeds, iPLS proved to be a more robust model, presenting RMSEP = 0.20% and REP = 2.17%. Regarding the LDA models built with the selected variables, all achieved correct classification rates greater than 95%. The AOC-LDA bioinspired algorithm provided the best performance with 97% correct classification. Given the above, it is concluded that the use of variable selection algorithms combined with multivariate methods of quantification or classification, when applied to NIR data, are efficient. Being able to quantify water content or classify conventional and transgenic cotton seeds quickly and non-destructively.
id UEPB_b3e8a60857e9b3d72f839b4006464b02
oai_identifier_str oai:tede.bc.uepb.edu.br:tede/4724
network_acronym_str UEPB
network_name_str Biblioteca Digital de Teses e Dissertações da UEPB
repository_id_str
spelling Simões, Simone da SilvaMedeiros, Everaldo Paulo deDiniz, Paulo Henrique Gonçalves DiasVilar, Welma Thaíse Silvahttp://lattes.cnpq.br/1770442136356504Cordeiro, Maria Barbosa da Silva2023-08-22T11:14:22Z2999-12-312023-07-25CORDEIRO, M. B. da S. Espectroscopia NIR e algoritmos de seleção de variáveis para determinação de teor de água e classificação de sementes de algodão. 2023. 72 f. Dissertação (Programa de Pós-Graduação em Química - PPGQ) - Universidade Estadual da Paraíba, Campina Grande, 2023.http://tede.bc.uepb.edu.br/jspui/handle/tede/4724The differentiation between genetically modified seeds (GMOs) and conventional ones is essential for agro-environmental viability in the different existing crops, as it can avoid contamination of conventional seeds or extinction of native species, elimination of plants and insects, as well as their resistance within the production environment itself. The methods used for the identification of GMOs are based on DNA analysis, which despite being accurate and reliable, are generally expensive, time-consuming and not readily available. On the other hand, spectroscopic techniques, widely used in the agricultural area, for determining quality requirements in seeds, demonstrate better performance for this purpose. The use of algorithms for the selection of variables generates a subset containing the variables that best relate to the properties of interest and contribute to the development of simple and robust models. In recent decades, studies using bioinspired algorithms have been explored in several areas of study, especially in chemistry. Bioinspiration consists of seeking to understand the mechanisms based on the behavior of animal or plant species. Given the above, this work studied the performance of some bioinspired algorithms for selection of variables applied to NIR data for the distinction between conventional and transgenic cotton seeds. Some works have already demonstrated the success of pattern recognition (RP) models built using full NIR spectra to solve this analytical problem. The objective of this work was the application of algorithms to evaluate the predictive capacity of least squares regression models (PLS) built with the whole spectrum and with spectral intervals (iSPA-PLS and i-PLS) for the quantification of water content in cotton seeds. Furthermore, discriminant analysis models constructed with NIR spectral variables selected by variable selection algorithms were constructed and validated. For this, the deterministic algorithm of successive projections (SPA) and also bioinspired algorithms such as ant colony (AOC) and genetic (GA) were tested. The set of samples for the quantification of moisture content was composed of 30 seed genotypes. The data set for the PR methods was composed of 1195 transgenic seeds and 1195 conventional seeds. All samples were provided by EMBRAPA cotton. The predictive capacity of the quantification models was evaluated based on the values of figures of merit such as REP and RMSE. PR models considered sensitivity, selectivity and correct classification rate. The models built with the selected variables obtained comparable results to the models with full spectrum both for the quantification models and for the classification models. However, for the quantification of water content in seeds, iPLS proved to be a more robust model, presenting RMSEP = 0.20% and REP = 2.17%. Regarding the LDA models built with the selected variables, all achieved correct classification rates greater than 95%. The AOC-LDA bioinspired algorithm provided the best performance with 97% correct classification. Given the above, it is concluded that the use of variable selection algorithms combined with multivariate methods of quantification or classification, when applied to NIR data, are efficient. Being able to quantify water content or classify conventional and transgenic cotton seeds quickly and non-destructively.A diferenciação entre sementes geneticamente modificadas (OGM´s) e convencionais é essencial a viabilidade agroambiental nos diferentes cultivos existentes, pois pode evitar a contaminação de sementes convencionais ou extinção de espécies nativas, eliminação de plantas e insetos, assim como a resistências desses dentro do próprio ambiente produtivo. Os métodos usados para a identificação de OGMs são baseados em análises de DNA, que apesar de serem precisas e confiáveis, geralmente são caras, demoradas e pouco disponíveis. Por outro lado, as técnicas espectroscópicas, bastante utilizadas na área agrícola, para a determinação de requisitos de qualidade em sementes demonstram melhor desempenho para este fim. O uso de algoritmos para a seleção de variáveis gera um subconjunto contendo as variáveis que melhor se relacionam às propriedades de interesse e contribuem para o desenvolvimento de modelos simples e robustos. Nas últimas décadas estudo utilizando algoritmos bionspirados, tem sido explorado em diversas áreas de estudo e em especial na química. A bioinspiração consiste na busca da compreensão dos mecanismos baseados no comportamento de espécies animais ou vegetais. Diante do exposto, neste trabalho estudou-se o desempenho de alguns algoritmos bioinspirados para seleção de varáveis aplicados a dados NIR para a distinção entre sementes convencionais e transgênicas de algodão. Alguns trabalhos já demonstraram o sucesso de modelos de reconhecimento de padrões (RP) construídos utilizando os espectros completos NIR para a solução deste problema analítico. Objetivou-se nesse trabalho, a aplicação de algoritmos para avaliar a capacidade preditiva de modelos de regressão em mínimos quadrados (PLS) construídos com todo o espectro e com intervalos espectrais (iSPA-PLS e i-PLS) para a quantificação de teor de água em sementes de algodão. Além disso, modelos de análise discriminante construídos com as variáveis espectrais NIR selecionadas por algoritmos de seleção de varáveis foram construídos e validados. Para isso foram testados o algoritmo determinístico das projeções sucessivas (SPA) e também, algoritmos bioinspirados como o de colônia de formigas (AOC) e o genético (GA). O conjunto de amostras para a quantificação do teor de umidade foi composto por 30 genótipos de sementes. Já o conjunto de dados destinado aos métodos de RP foi composto por 1195 sementes transgênicas e 1195 sementes convencionais. Todas as amostras foram cedidas pela EMBRAPA algodão. A capacidade preditiva dos modelos de quantificação foi avaliada com base nos valores de figuras de mérito como REP e RMSE. Os modelos de RP consideraram a sensibilidade, seletividade e taxa de classificação correta. Os modelos construídos com as variáveis selecionadas obtiveram resultados comparáveis aos modelos com espectro completo tanto para os modelos de quantificação quanto para os modelos de classificação. No entanto, para a quantificação do teor de água em sementes o iPLS se mostrou um modelo mais robusto apresentando RMSEP = 0,20% e REP = 2,17%. Em relação aos modelos LDA construídos com as variáveis selecionadas, todos alcançaram taxas de classificação corretas superiores a 95%. O algoritmo bioinspirado AOC-LDA forneceu a melhor performance com 97% de classificação correta. Diante do exposto, conclui-se que o uso de algoritmos de seleção de variáveis aliados a métodos multivariados de quantificação ou classificação, quando aplicados a dados NIR, são eficientes. Sendo capazes de quantificar teor de água ou classificar sementes de algodão convencionais e transgênicas de forma rápida e não destrutiva.Submitted by Maria Barbosa da Silva Cordeiro (maria.barbosa.silva.cordeiro@aluno.uepb.edu.br) on 2023-08-17T15:14:54Z No. of bitstreams: 1 ESPECTROSCOPIA NIR E ALGORÍTMOS DE SELEÇÃO DE VARIÁVEIS PARA DETERMINAÇÃO DE TEOR DE AGUA E CLASSIFICAÇÃO DE SEMENTES DE ALGODÃO.pdf: 2757996 bytes, checksum: cf4b992abc31810f2afefec9ec3e2c0d (MD5)Rejected by Jean Medeiros (jeanletras@uepb.edu.br), reason: Bom dia, a sua submissão de dissertação na BDTD da UEPB foi recusada pelos motivos abaixo: 1. A dissertação está com problemas de paginação. Faça o seguinte: a) A página da introdução deve estar paginada com 12. A capa e a ficha catalográfica não são contadas. A última página deve ser a 72, como você pediu na ficha catalográfica. 2. Palavras-chave são separadas entre si por ponto-e-vírgula (;). Atualização recente da ABNT. 3. Além do TCC, você precisa fazer o upload do Termo de Depósito (em anexo) em PDF preenchido e assinado pelo seu orientador e por você. 4. A folha de aprovação precisa estar com a natureza do trabalho. Depois de corrigir estes problemas, basta você fazer uma nova submissão na BDTD. Grato pela atenção, Jean Azevedo Auxiliar de Biblioteca Biblioteca Central – UEPB on 2023-08-17T15:27:07Z (GMT)Submitted by Maria Barbosa da Silva Cordeiro (maria.barbosa.silva.cordeiro@aluno.uepb.edu.br) on 2023-08-17T20:50:32Z No. of bitstreams: 2 ESPECTROSCOPIA NIR E ALGORÍTMOS DE SELEÇÃO DE VARIÁVEIS PARA DETERMINAÇÃO DE TEOR DE AGUA E CLASSIFICAÇÃO DE SEMENTES DE ALGODÃO (1).pdf: 2788069 bytes, checksum: eea7581bc9b3f15996c604114fb54df6 (MD5) Termo_de_Deposito_BDTD_292929_assinado.pdf: 275477 bytes, checksum: 7408ab6fc67933496c8745c4c33687cc (MD5)Approved for entry into archive by Jean Medeiros (jeanletras@uepb.edu.br) on 2023-08-18T14:56:24Z (GMT) No. of bitstreams: 2 ESPECTROSCOPIA NIR E ALGORÍTMOS DE SELEÇÃO DE VARIÁVEIS PARA DETERMINAÇÃO DE TEOR DE AGUA E CLASSIFICAÇÃO DE SEMENTES DE ALGODÃO (1).pdf: 2788069 bytes, checksum: eea7581bc9b3f15996c604114fb54df6 (MD5) Termo_de_Deposito_BDTD_292929_assinado.pdf: 275477 bytes, checksum: 7408ab6fc67933496c8745c4c33687cc (MD5)Made available in DSpace on 2023-08-22T11:14:22Z (GMT). No. of bitstreams: 2 ESPECTROSCOPIA NIR E ALGORÍTMOS DE SELEÇÃO DE VARIÁVEIS PARA DETERMINAÇÃO DE TEOR DE AGUA E CLASSIFICAÇÃO DE SEMENTES DE ALGODÃO (1).pdf: 2788069 bytes, checksum: eea7581bc9b3f15996c604114fb54df6 (MD5) Termo_de_Deposito_BDTD_292929_assinado.pdf: 275477 bytes, checksum: 7408ab6fc67933496c8745c4c33687cc (MD5) Previous issue date: 2023-07-25application/pdfporUniversidade Estadual da ParaíbaPrograma de Pós-Graduação em Química - PPGQUEPBBrasilPró-Reitoria de Pós-Graduação e Pesquisa - PRPGPQuimiometriaAnálise discriminanteSementes transgênicasAlgodãoSementes convencionaisChemometricsDiscriminant analysisQUIMICA::QUIMICA ANALITICAEspectroscopia NIR e algorítmos de seleção de variáveis para determinação de teor de água e classificação de sementes de algodãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-7931787842344471966600600600524871450381110278-8661602105461439549info:eu-repo/semantics/embargoedAccessreponame:Biblioteca Digital de Teses e Dissertações da UEPBinstname:Universidade Estadual da Paraíba (UEPB)instacron:UEPBORIGINALDS - Maria Barbosa da Silva Cordeiro.pdfDS - Maria Barbosa da Silva Cordeiro.pdfapplication/pdf2788069http://tede.bc.uepb.edu.br/jspui/bitstream/tede/4724/4/DS+-+Maria+Barbosa+da+Silva+Cordeiro.pdfeea7581bc9b3f15996c604114fb54df6MD54Termo de Depósito BDTD.pdfTermo de Depósito BDTD.pdfapplication/pdf275477http://tede.bc.uepb.edu.br/jspui/bitstream/tede/4724/5/Termo+de+Dep%C3%B3sito+BDTD.pdf7408ab6fc67933496c8745c4c33687ccMD55LICENSElicense.txtlicense.txttext/plain; charset=utf-81960http://tede.bc.uepb.edu.br/jspui/bitstream/tede/4724/3/license.txt6052ae61e77222b2086e666b7ae213ceMD53tede/47242023-08-22 08:15:02.181oai:tede.bc.uepb.edu.br:tede/4724TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIApFc3RhZHVhbCBkYSBQYXJhw61iYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVFUEIgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAKcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVFUEIgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRhIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIApuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldSAKY29uaGVjaW1lbnRvLCBpbmZyaW5nZSBkaXJlaXRvcyBhdXRvcmFpcyBkZSBuaW5ndcOpbS4KCkNhc28gYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIGNvbnRlbmhhIG1hdGVyaWFsIHF1ZSB2b2PDqiBuw6NvIHBvc3N1aSBhIHRpdHVsYXJpZGFkZSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIHZvY8OqIApkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVUVQQiAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIAppZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFRFU0UgT1UgRElTU0VSVEHDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSAKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRVBCLCAKVk9Dw4ogREVDTEFSQSBRVUUgUkVTUEVJVE9VIFRPRE9TIEUgUVVBSVNRVUVSIERJUkVJVE9TIERFIFJFVklTw4NPIENPTU8gVEFNQsOJTSBBUyAKREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVRVBCIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSAKZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSB0ZXNlIG91IGRpc3NlcnRhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgCmNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Biblioteca Digital de Teses e Dissertaçõeshttp://tede.bc.uepb.edu.br/jspui/PUBhttp://tede.bc.uepb.edu.br/oai/requestbc@uepb.edu.br||opendoar:2023-08-22T11:15:02Biblioteca Digital de Teses e Dissertações da UEPB - Universidade Estadual da Paraíba (UEPB)false
dc.title.por.fl_str_mv Espectroscopia NIR e algorítmos de seleção de variáveis para determinação de teor de água e classificação de sementes de algodão
title Espectroscopia NIR e algorítmos de seleção de variáveis para determinação de teor de água e classificação de sementes de algodão
spellingShingle Espectroscopia NIR e algorítmos de seleção de variáveis para determinação de teor de água e classificação de sementes de algodão
Cordeiro, Maria Barbosa da Silva
Quimiometria
Análise discriminante
Sementes transgênicas
Algodão
Sementes convencionais
Chemometrics
Discriminant analysis
QUIMICA::QUIMICA ANALITICA
title_short Espectroscopia NIR e algorítmos de seleção de variáveis para determinação de teor de água e classificação de sementes de algodão
title_full Espectroscopia NIR e algorítmos de seleção de variáveis para determinação de teor de água e classificação de sementes de algodão
title_fullStr Espectroscopia NIR e algorítmos de seleção de variáveis para determinação de teor de água e classificação de sementes de algodão
title_full_unstemmed Espectroscopia NIR e algorítmos de seleção de variáveis para determinação de teor de água e classificação de sementes de algodão
title_sort Espectroscopia NIR e algorítmos de seleção de variáveis para determinação de teor de água e classificação de sementes de algodão
author Cordeiro, Maria Barbosa da Silva
author_facet Cordeiro, Maria Barbosa da Silva
author_role author
dc.contributor.advisor1.fl_str_mv Simões, Simone da Silva
dc.contributor.advisor-co1.fl_str_mv Medeiros, Everaldo Paulo de
dc.contributor.referee1.fl_str_mv Diniz, Paulo Henrique Gonçalves Dias
dc.contributor.referee2.fl_str_mv Vilar, Welma Thaíse Silva
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/1770442136356504
dc.contributor.author.fl_str_mv Cordeiro, Maria Barbosa da Silva
contributor_str_mv Simões, Simone da Silva
Medeiros, Everaldo Paulo de
Diniz, Paulo Henrique Gonçalves Dias
Vilar, Welma Thaíse Silva
dc.subject.por.fl_str_mv Quimiometria
Análise discriminante
Sementes transgênicas
Algodão
Sementes convencionais
topic Quimiometria
Análise discriminante
Sementes transgênicas
Algodão
Sementes convencionais
Chemometrics
Discriminant analysis
QUIMICA::QUIMICA ANALITICA
dc.subject.eng.fl_str_mv Chemometrics
Discriminant analysis
dc.subject.cnpq.fl_str_mv QUIMICA::QUIMICA ANALITICA
description The differentiation between genetically modified seeds (GMOs) and conventional ones is essential for agro-environmental viability in the different existing crops, as it can avoid contamination of conventional seeds or extinction of native species, elimination of plants and insects, as well as their resistance within the production environment itself. The methods used for the identification of GMOs are based on DNA analysis, which despite being accurate and reliable, are generally expensive, time-consuming and not readily available. On the other hand, spectroscopic techniques, widely used in the agricultural area, for determining quality requirements in seeds, demonstrate better performance for this purpose. The use of algorithms for the selection of variables generates a subset containing the variables that best relate to the properties of interest and contribute to the development of simple and robust models. In recent decades, studies using bioinspired algorithms have been explored in several areas of study, especially in chemistry. Bioinspiration consists of seeking to understand the mechanisms based on the behavior of animal or plant species. Given the above, this work studied the performance of some bioinspired algorithms for selection of variables applied to NIR data for the distinction between conventional and transgenic cotton seeds. Some works have already demonstrated the success of pattern recognition (RP) models built using full NIR spectra to solve this analytical problem. The objective of this work was the application of algorithms to evaluate the predictive capacity of least squares regression models (PLS) built with the whole spectrum and with spectral intervals (iSPA-PLS and i-PLS) for the quantification of water content in cotton seeds. Furthermore, discriminant analysis models constructed with NIR spectral variables selected by variable selection algorithms were constructed and validated. For this, the deterministic algorithm of successive projections (SPA) and also bioinspired algorithms such as ant colony (AOC) and genetic (GA) were tested. The set of samples for the quantification of moisture content was composed of 30 seed genotypes. The data set for the PR methods was composed of 1195 transgenic seeds and 1195 conventional seeds. All samples were provided by EMBRAPA cotton. The predictive capacity of the quantification models was evaluated based on the values of figures of merit such as REP and RMSE. PR models considered sensitivity, selectivity and correct classification rate. The models built with the selected variables obtained comparable results to the models with full spectrum both for the quantification models and for the classification models. However, for the quantification of water content in seeds, iPLS proved to be a more robust model, presenting RMSEP = 0.20% and REP = 2.17%. Regarding the LDA models built with the selected variables, all achieved correct classification rates greater than 95%. The AOC-LDA bioinspired algorithm provided the best performance with 97% correct classification. Given the above, it is concluded that the use of variable selection algorithms combined with multivariate methods of quantification or classification, when applied to NIR data, are efficient. Being able to quantify water content or classify conventional and transgenic cotton seeds quickly and non-destructively.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-08-22T11:14:22Z
dc.date.issued.fl_str_mv 2023-07-25
dc.date.available.fl_str_mv 2999-12-31
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv CORDEIRO, M. B. da S. Espectroscopia NIR e algoritmos de seleção de variáveis para determinação de teor de água e classificação de sementes de algodão. 2023. 72 f. Dissertação (Programa de Pós-Graduação em Química - PPGQ) - Universidade Estadual da Paraíba, Campina Grande, 2023.
dc.identifier.uri.fl_str_mv http://tede.bc.uepb.edu.br/jspui/handle/tede/4724
identifier_str_mv CORDEIRO, M. B. da S. Espectroscopia NIR e algoritmos de seleção de variáveis para determinação de teor de água e classificação de sementes de algodão. 2023. 72 f. Dissertação (Programa de Pós-Graduação em Química - PPGQ) - Universidade Estadual da Paraíba, Campina Grande, 2023.
url http://tede.bc.uepb.edu.br/jspui/handle/tede/4724
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv -7931787842344471966
dc.relation.confidence.fl_str_mv 600
600
600
dc.relation.department.fl_str_mv 524871450381110278
dc.relation.cnpq.fl_str_mv -8661602105461439549
dc.rights.driver.fl_str_mv info:eu-repo/semantics/embargoedAccess
eu_rights_str_mv embargoedAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual da Paraíba
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Química - PPGQ
dc.publisher.initials.fl_str_mv UEPB
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Pró-Reitoria de Pós-Graduação e Pesquisa - PRPGP
publisher.none.fl_str_mv Universidade Estadual da Paraíba
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UEPB
instname:Universidade Estadual da Paraíba (UEPB)
instacron:UEPB
instname_str Universidade Estadual da Paraíba (UEPB)
instacron_str UEPB
institution UEPB
reponame_str Biblioteca Digital de Teses e Dissertações da UEPB
collection Biblioteca Digital de Teses e Dissertações da UEPB
bitstream.url.fl_str_mv http://tede.bc.uepb.edu.br/jspui/bitstream/tede/4724/4/DS+-+Maria+Barbosa+da+Silva+Cordeiro.pdf
http://tede.bc.uepb.edu.br/jspui/bitstream/tede/4724/5/Termo+de+Dep%C3%B3sito+BDTD.pdf
http://tede.bc.uepb.edu.br/jspui/bitstream/tede/4724/3/license.txt
bitstream.checksum.fl_str_mv eea7581bc9b3f15996c604114fb54df6
7408ab6fc67933496c8745c4c33687cc
6052ae61e77222b2086e666b7ae213ce
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UEPB - Universidade Estadual da Paraíba (UEPB)
repository.mail.fl_str_mv bc@uepb.edu.br||
_version_ 1797038575078866944