Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas
Ano de defesa: | 2017 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal da Paraíba
Brasil Química Programa de Pós-Graduação em Química UFPB |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://repositorio.ufpb.br/jspui/handle/123456789/11879 |
Resumo: | This work proposes two new criteria for selection of robust variables for classification transfer employing the successive projections algorithm (SPA). These variables are used to construct models based on linear discriminant analysis (LDA) that are robust to the differences between the responses of the instruments involved or to the experimental conditions. For this purpose, transfer samples are included in the calculation of the cost for each subset of variables under consideration. The proposed methods are evaluated for four datasets involving identification of adulteration of hydrated ethanol fuel (HEF) and extra virgin olive oil (EVOO). To investigate HEF, near infrared (NIR) spectroscopy was used. In the EVOO study, were used UV-Vis spectrometry, molecular fluorescence spectrometry and digital images. In all cases, better classification transfer results using the two criteria, obtained for a test set measured in the secondary instrument, were compared with direct standardization (DS) and piecewise direct standardization (PDS). When one of the criteria was applied to the test set measured in the secondary instrument, the accuracy of the model increased by about 50%, 33%, 3% and 12% for NIR, UV-Vis, fluorescence emission and digital imaging data, respectively. These results are compatible, sometimes superior to those obtained by the standardization methods, demonstrating that, when the differences between the instrumental responses did not present a drastically high magnitude (NIR and UV-Vis), either of the criteria proposed can be used for building robust models as an alternative to the standardization of spectral responses for transfer of classification. For the data with a large difference between the responses of each instrument (fluorescence and digital images), the spectra needed to be corrected with DS and PDS standardization to perform classification transfer effectively. The results suggest that the proposed approach is a promising alternative to full recalibration of the model or standardization methods, especially if the primary and secondary instruments are not located in the same laboratory, if the samples are deteriorated, when it is difficult to transport the samples or if the primary instrument is no longer available. |
id |
UFPB_839f59c9ae7c0fb9cb6bd1563d0524d9 |
---|---|
oai_identifier_str |
oai:repositorio.ufpb.br:123456789/11879 |
network_acronym_str |
UFPB |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFPB |
repository_id_str |
|
spelling |
Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivasTransferência de classificação multivariadaModelagem robustaAlgoritmo das projeções sucessivasMétodos de padronizaçãoEtanol hidratado combustívelAzeite de oliva extra virgemMultivariate classification transferRobust modelingSuccessive projections algorithmStandardization methodsHydrated ethyl fuelExtra virgin olive oilCNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICAThis work proposes two new criteria for selection of robust variables for classification transfer employing the successive projections algorithm (SPA). These variables are used to construct models based on linear discriminant analysis (LDA) that are robust to the differences between the responses of the instruments involved or to the experimental conditions. For this purpose, transfer samples are included in the calculation of the cost for each subset of variables under consideration. The proposed methods are evaluated for four datasets involving identification of adulteration of hydrated ethanol fuel (HEF) and extra virgin olive oil (EVOO). To investigate HEF, near infrared (NIR) spectroscopy was used. In the EVOO study, were used UV-Vis spectrometry, molecular fluorescence spectrometry and digital images. In all cases, better classification transfer results using the two criteria, obtained for a test set measured in the secondary instrument, were compared with direct standardization (DS) and piecewise direct standardization (PDS). When one of the criteria was applied to the test set measured in the secondary instrument, the accuracy of the model increased by about 50%, 33%, 3% and 12% for NIR, UV-Vis, fluorescence emission and digital imaging data, respectively. These results are compatible, sometimes superior to those obtained by the standardization methods, demonstrating that, when the differences between the instrumental responses did not present a drastically high magnitude (NIR and UV-Vis), either of the criteria proposed can be used for building robust models as an alternative to the standardization of spectral responses for transfer of classification. For the data with a large difference between the responses of each instrument (fluorescence and digital images), the spectra needed to be corrected with DS and PDS standardization to perform classification transfer effectively. The results suggest that the proposed approach is a promising alternative to full recalibration of the model or standardization methods, especially if the primary and secondary instruments are not located in the same laboratory, if the samples are deteriorated, when it is difficult to transport the samples or if the primary instrument is no longer available.Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPqEste trabalho propõe dois novos critérios para a seleção de variáveis robustas para transferência de classificação empregando o algoritmo das projeções sucessivas (SPA). Estas variáveis são utilizadas para construir modelos baseados na análise discriminante linear (LDA) robustos às diferenças entre as respostas dos instrumentos envolvidos ou às condições experimentais. Para isso, amostras de transferência são incluídas no cálculo do custo para cada subconjunto de variáveis consideradas. Os métodos propostos são avaliados para quatro conjuntos de dados que envolvem identificação de adulteração de etanol hidratado combustível (EHC) e azeite de oliva extra virgem (AOEV). Para investigar EHC, foi utilizada espectroscopia na região do infravermelho próximo (NIR). No estudo do AOEV, foram utilizadas espectrometria UV-Vis, espectrometria de fluorescência molecular e imagens digitais. Em todos os casos, os melhores resultados de transferência de classificação empregando os dois critérios, obtidos para um conjunto de teste medido no instrumento secundário, foram comparados com a padronização direta (DS) e a padronização direta em etapas (PDS). Quando algum dos critérios foi aplicado ao conjunto de teste medido no instrumento secundário, a acurácia do modelo aumentou cerca de 50%, 33%, 3% e 12% para os dados NIR, UV-Vis, de emissão de fluorescência e de imagens digitais, respectivamente. Esses resultados são compatíveis, em algumas vezes superiores, àqueles obtidos pelos métodos de padronização, demonstrando que, quando as diferenças entre as respostas instrumentais não apresentavam magnitude drasticamente elevada (NIR e UV-Vis), um dos critérios propostos pode ser utilizado para construir modelos robustos como alternativa à padronização de respostas instrumentais para transferência de classificação. Para os dados com grande diferença entre as respostas de cada instrumento (fluorescência e imagens digitais), os espectros precisaram ser corrigidos por meio de padronização DS e PDS para realizar a transferência de classificação efetivamente. Os resultados sugerem que a abordagem proposta é uma alternativa promissora à recalibração completa do modelo ou métodos de padronização, especialmente se os instrumentos primário e secundário não estiverem localizados no mesmo laboratório, se as amostras estiverem deterioradas, quando se tem dificuldade no transporte das amostras ou se o instrumento principal não estiver mais disponível.Universidade Federal da ParaíbaBrasilQuímicaPrograma de Pós-Graduação em QuímicaUFPBPontes, Márcio Jose Coelho dehttp://lattes.cnpq.br/1685611433864910Milanez, Karla Danielle Tavares de Melo2018-10-03T20:36:16Z2018-10-032018-10-03T20:36:16Z2017-08-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttps://repositorio.ufpb.br/jspui/handle/123456789/11879porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPB2018-10-04T06:01:14Zoai:repositorio.ufpb.br:123456789/11879Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufpb.br/PUBhttp://tede.biblioteca.ufpb.br:8080/oai/requestdiretoria@ufpb.br|| diretoria@ufpb.bropendoar:2018-10-04T06:01:14Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)false |
dc.title.none.fl_str_mv |
Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas |
title |
Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas |
spellingShingle |
Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas Milanez, Karla Danielle Tavares de Melo Transferência de classificação multivariada Modelagem robusta Algoritmo das projeções sucessivas Métodos de padronização Etanol hidratado combustível Azeite de oliva extra virgem Multivariate classification transfer Robust modeling Successive projections algorithm Standardization methods Hydrated ethyl fuel Extra virgin olive oil CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA |
title_short |
Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas |
title_full |
Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas |
title_fullStr |
Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas |
title_full_unstemmed |
Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas |
title_sort |
Seleção de variáveis robustas para transferência de modelos de classificação empregando o algoritmo das projeções sucessivas |
author |
Milanez, Karla Danielle Tavares de Melo |
author_facet |
Milanez, Karla Danielle Tavares de Melo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Pontes, Márcio Jose Coelho de http://lattes.cnpq.br/1685611433864910 |
dc.contributor.author.fl_str_mv |
Milanez, Karla Danielle Tavares de Melo |
dc.subject.por.fl_str_mv |
Transferência de classificação multivariada Modelagem robusta Algoritmo das projeções sucessivas Métodos de padronização Etanol hidratado combustível Azeite de oliva extra virgem Multivariate classification transfer Robust modeling Successive projections algorithm Standardization methods Hydrated ethyl fuel Extra virgin olive oil CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA |
topic |
Transferência de classificação multivariada Modelagem robusta Algoritmo das projeções sucessivas Métodos de padronização Etanol hidratado combustível Azeite de oliva extra virgem Multivariate classification transfer Robust modeling Successive projections algorithm Standardization methods Hydrated ethyl fuel Extra virgin olive oil CNPQ::CIENCIAS EXATAS E DA TERRA::QUIMICA |
description |
This work proposes two new criteria for selection of robust variables for classification transfer employing the successive projections algorithm (SPA). These variables are used to construct models based on linear discriminant analysis (LDA) that are robust to the differences between the responses of the instruments involved or to the experimental conditions. For this purpose, transfer samples are included in the calculation of the cost for each subset of variables under consideration. The proposed methods are evaluated for four datasets involving identification of adulteration of hydrated ethanol fuel (HEF) and extra virgin olive oil (EVOO). To investigate HEF, near infrared (NIR) spectroscopy was used. In the EVOO study, were used UV-Vis spectrometry, molecular fluorescence spectrometry and digital images. In all cases, better classification transfer results using the two criteria, obtained for a test set measured in the secondary instrument, were compared with direct standardization (DS) and piecewise direct standardization (PDS). When one of the criteria was applied to the test set measured in the secondary instrument, the accuracy of the model increased by about 50%, 33%, 3% and 12% for NIR, UV-Vis, fluorescence emission and digital imaging data, respectively. These results are compatible, sometimes superior to those obtained by the standardization methods, demonstrating that, when the differences between the instrumental responses did not present a drastically high magnitude (NIR and UV-Vis), either of the criteria proposed can be used for building robust models as an alternative to the standardization of spectral responses for transfer of classification. For the data with a large difference between the responses of each instrument (fluorescence and digital images), the spectra needed to be corrected with DS and PDS standardization to perform classification transfer effectively. The results suggest that the proposed approach is a promising alternative to full recalibration of the model or standardization methods, especially if the primary and secondary instruments are not located in the same laboratory, if the samples are deteriorated, when it is difficult to transport the samples or if the primary instrument is no longer available. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-08-25 2018-10-03T20:36:16Z 2018-10-03 2018-10-03T20:36:16Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpb.br/jspui/handle/123456789/11879 |
url |
https://repositorio.ufpb.br/jspui/handle/123456789/11879 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal da Paraíba Brasil Química Programa de Pós-Graduação em Química UFPB |
publisher.none.fl_str_mv |
Universidade Federal da Paraíba Brasil Química Programa de Pós-Graduação em Química UFPB |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFPB instname:Universidade Federal da Paraíba (UFPB) instacron:UFPB |
instname_str |
Universidade Federal da Paraíba (UFPB) |
instacron_str |
UFPB |
institution |
UFPB |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFPB |
collection |
Biblioteca Digital de Teses e Dissertações da UFPB |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB) |
repository.mail.fl_str_mv |
diretoria@ufpb.br|| diretoria@ufpb.br |
_version_ |
1797057842442665984 |