Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: Milanez, Karla Danielle Tavares de Melo
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal da Paraíba
Brasil
Química
Programa de Pós-Graduação em Química
UFPB
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpb.br/jspui/handle/123456789/11879
Resumo: This work proposes two new criteria for selection of robust variables for classification transfer employing the successive projections algorithm (SPA). These variables are used to construct models based on linear discriminant analysis (LDA) that are robust to the differences between the responses of the instruments involved or to the experimental conditions. For this purpose, transfer samples are included in the calculation of the cost for each subset of variables under consideration. The proposed methods are evaluated for four datasets involving identification of adulteration of hydrated ethanol fuel (HEF) and extra virgin olive oil (EVOO). To investigate HEF, near infrared (NIR) spectroscopy was used. In the EVOO study, were used UV-Vis spectrometry, molecular fluorescence spectrometry and digital images. In all cases, better classification transfer results using the two criteria, obtained for a test set measured in the secondary instrument, were compared with direct standardization (DS) and piecewise direct standardization (PDS). When one of the criteria was applied to the test set measured in the secondary instrument, the accuracy of the model increased by about 50%, 33%, 3% and 12% for NIR, UV-Vis, fluorescence emission and digital imaging data, respectively. These results are compatible, sometimes superior to those obtained by the standardization methods, demonstrating that, when the differences between the instrumental responses did not present a drastically high magnitude (NIR and UV-Vis), either of the criteria proposed can be used for building robust models as an alternative to the standardization of spectral responses for transfer of classification. For the data with a large difference between the responses of each instrument (fluorescence and digital images), the spectra needed to be corrected with DS and PDS standardization to perform classification transfer effectively. The results suggest that the proposed approach is a promising alternative to full recalibration of the model or standardization methods, especially if the primary and secondary instruments are not located in the same laboratory, if the samples are deteriorated, when it is difficult to transport the samples or if the primary instrument is no longer available.
id UFPB_839f59c9ae7c0fb9cb6bd1563d0524d9
oai_identifier_str oai:repositorio.ufpb.br:123456789/11879
network_acronym_str UFPB
network_name_str Biblioteca Digital de Teses e Dissertações da UFPB
repository_id_str
spelling Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivasTransferência de classificação multivariadaModelagem robustaAlgoritmo das projeções sucessivasMétodos de padronizaçãoEtanol hidratado combustívelAzeite de oliva extra virgemMultivariate classification transferRobust modelingSuccessive projections algorithmStandardization methodsHydrated ethyl fuelExtra virgin olive oilCNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICAThis work proposes two new criteria for selection of robust variables for classification transfer employing the successive projections algorithm (SPA). These variables are used to construct models based on linear discriminant analysis (LDA) that are robust to the differences between the responses of the instruments involved or to the experimental conditions. For this purpose, transfer samples are included in the calculation of the cost for each subset of variables under consideration. The proposed methods are evaluated for four datasets involving identification of adulteration of hydrated ethanol fuel (HEF) and extra virgin olive oil (EVOO). To investigate HEF, near infrared (NIR) spectroscopy was used. In the EVOO study, were used UV-Vis spectrometry, molecular fluorescence spectrometry and digital images. In all cases, better classification transfer results using the two criteria, obtained for a test set measured in the secondary instrument, were compared with direct standardization (DS) and piecewise direct standardization (PDS). When one of the criteria was applied to the test set measured in the secondary instrument, the accuracy of the model increased by about 50%, 33%, 3% and 12% for NIR, UV-Vis, fluorescence emission and digital imaging data, respectively. These results are compatible, sometimes superior to those obtained by the standardization methods, demonstrating that, when the differences between the instrumental responses did not present a drastically high magnitude (NIR and UV-Vis), either of the criteria proposed can be used for building robust models as an alternative to the standardization of spectral responses for transfer of classification. For the data with a large difference between the responses of each instrument (fluorescence and digital images), the spectra needed to be corrected with DS and PDS standardization to perform classification transfer effectively. The results suggest that the proposed approach is a promising alternative to full recalibration of the model or standardization methods, especially if the primary and secondary instruments are not located in the same laboratory, if the samples are deteriorated, when it is difficult to transport the samples or if the primary instrument is no longer available.Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPqEste trabalho propõe dois novos critérios para a seleção de variáveis robustas para transferência de classificação empregando o algoritmo das projeções sucessivas (SPA). Estas variáveis são utilizadas para construir modelos baseados na análise discriminante linear (LDA) robustos às diferenças entre as respostas dos instrumentos envolvidos ou às condições experimentais. Para isso, amostras de transferência são incluídas no cálculo do custo para cada subconjunto de variáveis consideradas. Os métodos propostos são avaliados para quatro conjuntos de dados que envolvem identificação de adulteração de etanol hidratado combustível (EHC) e azeite de oliva extra virgem (AOEV). Para investigar EHC, foi utilizada espectroscopia na região do infravermelho próximo (NIR). No estudo do AOEV, foram utilizadas espectrometria UV-Vis, espectrometria de fluorescência molecular e imagens digitais. Em todos os casos, os melhores resultados de transferência de classificação empregando os dois critérios, obtidos para um conjunto de teste medido no instrumento secundário, foram comparados com a padronização direta (DS) e a padronização direta em etapas (PDS). Quando algum dos critérios foi aplicado ao conjunto de teste medido no instrumento secundário, a acurácia do modelo aumentou cerca de 50%, 33%, 3% e 12% para os dados NIR, UV-Vis, de emissão de fluorescência e de imagens digitais, respectivamente. Esses resultados são compatíveis, em algumas vezes superiores, àqueles obtidos pelos métodos de padronização, demonstrando que, quando as diferenças entre as respostas instrumentais não apresentavam magnitude drasticamente elevada (NIR e UV-Vis), um dos critérios propostos pode ser utilizado para construir modelos robustos como alternativa à padronização de respostas instrumentais para transferência de classificação. Para os dados com grande diferença entre as respostas de cada instrumento (fluorescência e imagens digitais), os espectros precisaram ser corrigidos por meio de padronização DS e PDS para realizar a transferência de classificação efetivamente. Os resultados sugerem que a abordagem proposta é uma alternativa promissora à recalibração completa do modelo ou métodos de padronização, especialmente se os instrumentos primário e secundário não estiverem localizados no mesmo laboratório, se as amostras estiverem deterioradas, quando se tem dificuldade no transporte das amostras ou se o instrumento principal não estiver mais disponível.Universidade Federal da ParaíbaBrasilQuímicaPrograma de Pós-Graduação em QuímicaUFPBPontes, Márcio Jose Coelho dehttp://lattes.cnpq.br/1685611433864910Milanez, Karla Danielle Tavares de Melo2018-10-03T20:36:16Z2018-10-032018-10-03T20:36:16Z2017-08-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttps://repositorio.ufpb.br/jspui/handle/123456789/11879porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPB2018-10-04T06:01:14Zoai:repositorio.ufpb.br:123456789/11879Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufpb.br/PUBhttp://tede.biblioteca.ufpb.br:8080/oai/requestdiretoria@ufpb.br|| diretoria@ufpb.bropendoar:2018-10-04T06:01:14Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)false
dc.title.none.fl_str_mv Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas
title Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas
spellingShingle Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas
Milanez, Karla Danielle Tavares de Melo
Transferência de classificação multivariada
Modelagem robusta
Algoritmo das projeções sucessivas
Métodos de padronização
Etanol hidratado combustível
Azeite de oliva extra virgem
Multivariate classification transfer
Robust modeling
Successive projections algorithm
Standardization methods
Hydrated ethyl fuel
Extra virgin olive oil
CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
title_short Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas
title_full Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas
title_fullStr Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas
title_full_unstemmed Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas
title_sort Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas
author Milanez, Karla Danielle Tavares de Melo
author_facet Milanez, Karla Danielle Tavares de Melo
author_role author
dc.contributor.none.fl_str_mv Pontes, Márcio Jose Coelho de
http://lattes.cnpq.br/1685611433864910
dc.contributor.author.fl_str_mv Milanez, Karla Danielle Tavares de Melo
dc.subject.por.fl_str_mv Transferência de classificação multivariada
Modelagem robusta
Algoritmo das projeções sucessivas
Métodos de padronização
Etanol hidratado combustível
Azeite de oliva extra virgem
Multivariate classification transfer
Robust modeling
Successive projections algorithm
Standardization methods
Hydrated ethyl fuel
Extra virgin olive oil
CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
topic Transferência de classificação multivariada
Modelagem robusta
Algoritmo das projeções sucessivas
Métodos de padronização
Etanol hidratado combustível
Azeite de oliva extra virgem
Multivariate classification transfer
Robust modeling
Successive projections algorithm
Standardization methods
Hydrated ethyl fuel
Extra virgin olive oil
CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA
description This work proposes two new criteria for selection of robust variables for classification transfer employing the successive projections algorithm (SPA). These variables are used to construct models based on linear discriminant analysis (LDA) that are robust to the differences between the responses of the instruments involved or to the experimental conditions. For this purpose, transfer samples are included in the calculation of the cost for each subset of variables under consideration. The proposed methods are evaluated for four datasets involving identification of adulteration of hydrated ethanol fuel (HEF) and extra virgin olive oil (EVOO). To investigate HEF, near infrared (NIR) spectroscopy was used. In the EVOO study, were used UV-Vis spectrometry, molecular fluorescence spectrometry and digital images. In all cases, better classification transfer results using the two criteria, obtained for a test set measured in the secondary instrument, were compared with direct standardization (DS) and piecewise direct standardization (PDS). When one of the criteria was applied to the test set measured in the secondary instrument, the accuracy of the model increased by about 50%, 33%, 3% and 12% for NIR, UV-Vis, fluorescence emission and digital imaging data, respectively. These results are compatible, sometimes superior to those obtained by the standardization methods, demonstrating that, when the differences between the instrumental responses did not present a drastically high magnitude (NIR and UV-Vis), either of the criteria proposed can be used for building robust models as an alternative to the standardization of spectral responses for transfer of classification. For the data with a large difference between the responses of each instrument (fluorescence and digital images), the spectra needed to be corrected with DS and PDS standardization to perform classification transfer effectively. The results suggest that the proposed approach is a promising alternative to full recalibration of the model or standardization methods, especially if the primary and secondary instruments are not located in the same laboratory, if the samples are deteriorated, when it is difficult to transport the samples or if the primary instrument is no longer available.
publishDate 2017
dc.date.none.fl_str_mv 2017-08-25
2018-10-03T20:36:16Z
2018-10-03
2018-10-03T20:36:16Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpb.br/jspui/handle/123456789/11879
url https://repositorio.ufpb.br/jspui/handle/123456789/11879
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Química
Programa de Pós-Graduação em Química
UFPB
publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Química
Programa de Pós-Graduação em Química
UFPB
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFPB
instname:Universidade Federal da Paraíba (UFPB)
instacron:UFPB
instname_str Universidade Federal da Paraíba (UFPB)
instacron_str UFPB
institution UFPB
reponame_str Biblioteca Digital de Teses e Dissertações da UFPB
collection Biblioteca Digital de Teses e Dissertações da UFPB
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)
repository.mail.fl_str_mv diretoria@ufpb.br|| diretoria@ufpb.br
_version_ 1797057842442665984