Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Moro, Mariana Kuster
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Espírito Santo
BR
Doutorado em Química
Centro de Ciências Exatas
UFES
Programa de Pós-Graduação em Química
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
RMN
PLS
Link de acesso: http://repositorio.ufes.br/handle/10/15921
Resumo: Data fusion from different analytical sources can be a viable way to estimate physicochemical properties ou classificate crude oil samples, when compared to using a single analytical technique. This is because outputs from different instrumental techniques can carry additional information and act synergistically during calibration. In this work, the potential of data fusion strategies was investigated to estimate seven properties of crude oil: sulfur content (S), total nitrogen content (NT), basic nitrogen content (NB), total acid number (NAT), saturated (SAT), aromatic (ARO) and polar (POL) fractions. A total of 125 crude oil samples were available, divided into 70% for calibration and 30% for prediction. The physicochemical properties of the samples were determined using standardized experimental methods. Partial least squares (PLS) regression models were constructed from pre-treated mid-infrared spectroscopy (MIR) data and 1H and 13C nuclear magnetic resonance (RMN) spectroscopy data, using the data in individual form and also fused at low-level, mid-level with PCA and PLS and high-level in different combinations. The optimal number of latent variables was determined by cross-validation, using the Venetian Blind method. The results showed that, while mid-level data fusion by PLS increased the accuracy of some of the models, low, mid by PCA and high-level fusion provided negligible improvements. Using mid-level by PLS data fusion, the contents of S, NT, NB, NAT, SAT, ARO and POL were estimated, respectively, with RMSEP equal to 0,057 m/m%, 0,041 m/m%, 0,0067 m/m%, 0,16 mgKOHg –1 , 4,73 m/m%, 3,66 m/m% and 6,50 m/m% and coefficient of determination equal to 0,90, 0,83, 0,98, 0,91, 0,84, 0,67 and 0,66. Low and mid-level by PCA data fusion was also applied to near infrared (NIR) and MIR spectroscopy data for discrimination of crude oil samples into sweet/sour, poor/rich in nitrogen, non-acidic/acidic/highly acidic and light/ medium/heavy. The classification models were obtained through the method of discriminant analysis by partial least squares (PLS-DA). Classification models based on individual spectra and on the low and mid-level fused spectra were compared using the performance parameters sensitivity, specificity, efficiency, accuracy and total prediction error. Compared to the individual models, low and/or med-level data fusion provided greater accuracy and lower total prediction error rate in all four classifications proposed in this study. The classification models built from data fusion showed high accuracy, reaching values equal to or greater than 92%. These results demonstrate that the proposed spectroscopic techniques can complement each other, through the data fusion strategy, generating a greater synergistic effect and, consequently, producing models with greater predictive capacity.
id UFES_a6eb6d350b9c271f77822bd81f5e04be
oai_identifier_str oai:repositorio.ufes.br:10/15921
network_acronym_str UFES
network_name_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
repository_id_str
spelling Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleoSpectral data fusion in chemometric: An approach in petroleum chemistryFusão de dadosPetróleo brutoRMNPLSsubject.br-rjbnQuímicaData fusion from different analytical sources can be a viable way to estimate physicochemical properties ou classificate crude oil samples, when compared to using a single analytical technique. This is because outputs from different instrumental techniques can carry additional information and act synergistically during calibration. In this work, the potential of data fusion strategies was investigated to estimate seven properties of crude oil: sulfur content (S), total nitrogen content (NT), basic nitrogen content (NB), total acid number (NAT), saturated (SAT), aromatic (ARO) and polar (POL) fractions. A total of 125 crude oil samples were available, divided into 70% for calibration and 30% for prediction. The physicochemical properties of the samples were determined using standardized experimental methods. Partial least squares (PLS) regression models were constructed from pre-treated mid-infrared spectroscopy (MIR) data and 1H and 13C nuclear magnetic resonance (RMN) spectroscopy data, using the data in individual form and also fused at low-level, mid-level with PCA and PLS and high-level in different combinations. The optimal number of latent variables was determined by cross-validation, using the Venetian Blind method. The results showed that, while mid-level data fusion by PLS increased the accuracy of some of the models, low, mid by PCA and high-level fusion provided negligible improvements. Using mid-level by PLS data fusion, the contents of S, NT, NB, NAT, SAT, ARO and POL were estimated, respectively, with RMSEP equal to 0,057 m/m%, 0,041 m/m%, 0,0067 m/m%, 0,16 mgKOHg –1 , 4,73 m/m%, 3,66 m/m% and 6,50 m/m% and coefficient of determination equal to 0,90, 0,83, 0,98, 0,91, 0,84, 0,67 and 0,66. Low and mid-level by PCA data fusion was also applied to near infrared (NIR) and MIR spectroscopy data for discrimination of crude oil samples into sweet/sour, poor/rich in nitrogen, non-acidic/acidic/highly acidic and light/ medium/heavy. The classification models were obtained through the method of discriminant analysis by partial least squares (PLS-DA). Classification models based on individual spectra and on the low and mid-level fused spectra were compared using the performance parameters sensitivity, specificity, efficiency, accuracy and total prediction error. Compared to the individual models, low and/or med-level data fusion provided greater accuracy and lower total prediction error rate in all four classifications proposed in this study. The classification models built from data fusion showed high accuracy, reaching values equal to or greater than 92%. These results demonstrate that the proposed spectroscopic techniques can complement each other, through the data fusion strategy, generating a greater synergistic effect and, consequently, producing models with greater predictive capacity.A fusão de dados de diferentes fontes analíticas pode ser uma forma viável de estimar as propriedades físico-químicas do petróleo quando comparada ao uso de uma única técnica analítica. Isso ocorre porque saídas de diferentes fontes instrumentais podem transportar informações complementares e agir sinergicamente durante a calibração. Neste trabalho, foi investigado o potencial das estratégias de fusão de dados para estimar sete propriedades do petróleo bruto: teor de enxofre (S), teor de nitrogênio total (NT), teor de nitrogênio básico (NB), número de ácido total (NAT), frações de saturados (SAT), aromáticos (ARO) e polares (POL). Foram disponibilizadas 125 amostras de petróleo bruto, divididas em 70% para calibração e 30% para previsão. As propriedades físico-químicas das amostras foram determinadas por meio de métodos experimentais padronizados. Modelos de regressão por mínimos quadrados parciais (PLS) foram construídos a partir dos dados, previamente pré-tratados, de espectroscopia no infravermelho médio (MIR) com transformada de Fourier e de espectroscopia de ressonância magnética nuclear (RMN) de 1H e 13C, individuais e fundidos a nível baixo, médio por PCA e PLS e alto em diferentes combinações. O número ótimo de variáveis latentes foi determinado por validação cruzada, pelo método Venetian Blind. Os resultados mostraram que, enquanto a fusão de nível médio por PLS aumentou a exatidão de alguns dos modelos, a fusão de nível baixo, médio por PCA e alto proporcionou melhorias insignificantes. Aplicando a fusão de nível médio por PLS, os teores de S, NT, NB, NAT, SAT, ARO e POL foram estimados, respectivamente, com RMSEP iguais a 0,057 m/m%, 0,041 m/m%, 0,0067 m/m%, 0,16 mgKOHg –1 , 4,73 m/m%, 3,66 m/m% e 6,50 m/m% e coeficientes de determinação iguais a 0,90, 0,83, 0,98, 0,91, 0,84, 0,67 e 0,66, para o conjunto de amostras teste. A fusão de nível médio por PLS demonstrou, para estes casos, ser a melhor estratégia fusão entre as demais, melhorando a exatidão dos modelos. A fusão de dados a nível baixo e médio por PCA também foi aplicada em dados de espectroscopia no infravermelho próximo (NIR) e MIR para discriminação de amostras de petróleo bruto em doce/azedo, pobre/rico em nitrogênio, não ácido/ácido/altamente ácido e leve/médio/pesado. Os modelos de classificação foram obtidos por meio do método de análise discriminante por mínimos quadrados parciais (PLS-DA). Os modelos de classificação baseados nos espectros individuais e nos espectros fundidos a nível baixo e médio foram comparados utilizando os parâmetros de desempenho sensibilidade, especificidade, eficiência, acurácia e erro de predição total. Em comparação com os modelos individuais, a fusão de dados a nível baixo e/ou médio proporcionou uma maior acurácia e menor taxa de erro de predição total em todas as quatro classificações propostas neste estudo. Os modelos de classificação construídos a partir da fusão de dados apresentaram alta acurácia, atingindo valores iguais ou superiores a 92%. Esses resultados demonstraram que as técnicas espectroscópicas propostas podem se complementar, por meio da estratégia de fusão de dados, gerando maior efeito sinérgico e, conseqüentemente, produzindo modelos com maior capacidade de previsão.Universidade Federal do Espírito SantoBRDoutorado em QuímicaCentro de Ciências ExatasUFESPrograma de Pós-Graduação em QuímicaFilgueiras, Paulo Robertohttps://orcid.org/0000000326171601http://lattes.cnpq.br/1907915547207861http://lattes.cnpq.br/9789087871167165Romão, Wandersonhttps://orcid.org/0000000222546683http://lattes.cnpq.br/9121022613112821Cunha Neto, Alvarohttps://orcid.org/0000-0002-1814-6214http://lattes.cnpq.br/7448379486432052Borges Neto, Waldomirohttps://orcid.org/0000-0002-5808-5073http://lattes.cnpq.br/7646193734918354Duarte, Lucas MattosMoro, Mariana Kuster2024-05-30T00:53:17Z2024-05-30T00:53:17Z2022-02-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisTextapplication/pdfhttp://repositorio.ufes.br/handle/10/15921porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)instname:Universidade Federal do Espírito Santo (UFES)instacron:UFES2025-03-31T10:03:16Zoai:repositorio.ufes.br:10/15921Repositório InstitucionalPUBhttp://repositorio.ufes.br/oai/requestriufes@ufes.bropendoar:21082025-03-31T10:03:16Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)false
dc.title.none.fl_str_mv Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo
Spectral data fusion in chemometric: An approach in petroleum chemistry
title Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo
spellingShingle Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo
Moro, Mariana Kuster
Fusão de dados
Petróleo bruto
RMN
PLS
subject.br-rjbn
Química
title_short Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo
title_full Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo
title_fullStr Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo
title_full_unstemmed Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo
title_sort Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo
author Moro, Mariana Kuster
author_facet Moro, Mariana Kuster
author_role author
dc.contributor.none.fl_str_mv Filgueiras, Paulo Roberto
https://orcid.org/0000000326171601
http://lattes.cnpq.br/1907915547207861
http://lattes.cnpq.br/9789087871167165
Romão, Wanderson
https://orcid.org/0000000222546683
http://lattes.cnpq.br/9121022613112821
Cunha Neto, Alvaro
https://orcid.org/0000-0002-1814-6214
http://lattes.cnpq.br/7448379486432052
Borges Neto, Waldomiro
https://orcid.org/0000-0002-5808-5073
http://lattes.cnpq.br/7646193734918354
Duarte, Lucas Mattos
dc.contributor.author.fl_str_mv Moro, Mariana Kuster
dc.subject.por.fl_str_mv Fusão de dados
Petróleo bruto
RMN
PLS
subject.br-rjbn
Química
topic Fusão de dados
Petróleo bruto
RMN
PLS
subject.br-rjbn
Química
description Data fusion from different analytical sources can be a viable way to estimate physicochemical properties ou classificate crude oil samples, when compared to using a single analytical technique. This is because outputs from different instrumental techniques can carry additional information and act synergistically during calibration. In this work, the potential of data fusion strategies was investigated to estimate seven properties of crude oil: sulfur content (S), total nitrogen content (NT), basic nitrogen content (NB), total acid number (NAT), saturated (SAT), aromatic (ARO) and polar (POL) fractions. A total of 125 crude oil samples were available, divided into 70% for calibration and 30% for prediction. The physicochemical properties of the samples were determined using standardized experimental methods. Partial least squares (PLS) regression models were constructed from pre-treated mid-infrared spectroscopy (MIR) data and 1H and 13C nuclear magnetic resonance (RMN) spectroscopy data, using the data in individual form and also fused at low-level, mid-level with PCA and PLS and high-level in different combinations. The optimal number of latent variables was determined by cross-validation, using the Venetian Blind method. The results showed that, while mid-level data fusion by PLS increased the accuracy of some of the models, low, mid by PCA and high-level fusion provided negligible improvements. Using mid-level by PLS data fusion, the contents of S, NT, NB, NAT, SAT, ARO and POL were estimated, respectively, with RMSEP equal to 0,057 m/m%, 0,041 m/m%, 0,0067 m/m%, 0,16 mgKOHg –1 , 4,73 m/m%, 3,66 m/m% and 6,50 m/m% and coefficient of determination equal to 0,90, 0,83, 0,98, 0,91, 0,84, 0,67 and 0,66. Low and mid-level by PCA data fusion was also applied to near infrared (NIR) and MIR spectroscopy data for discrimination of crude oil samples into sweet/sour, poor/rich in nitrogen, non-acidic/acidic/highly acidic and light/ medium/heavy. The classification models were obtained through the method of discriminant analysis by partial least squares (PLS-DA). Classification models based on individual spectra and on the low and mid-level fused spectra were compared using the performance parameters sensitivity, specificity, efficiency, accuracy and total prediction error. Compared to the individual models, low and/or med-level data fusion provided greater accuracy and lower total prediction error rate in all four classifications proposed in this study. The classification models built from data fusion showed high accuracy, reaching values equal to or greater than 92%. These results demonstrate that the proposed spectroscopic techniques can complement each other, through the data fusion strategy, generating a greater synergistic effect and, consequently, producing models with greater predictive capacity.
publishDate 2022
dc.date.none.fl_str_mv 2022-02-18
2024-05-30T00:53:17Z
2024-05-30T00:53:17Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.ufes.br/handle/10/15921
url http://repositorio.ufes.br/handle/10/15921
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv Text
application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Espírito Santo
BR
Doutorado em Química
Centro de Ciências Exatas
UFES
Programa de Pós-Graduação em Química
publisher.none.fl_str_mv Universidade Federal do Espírito Santo
BR
Doutorado em Química
Centro de Ciências Exatas
UFES
Programa de Pós-Graduação em Química
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
instname:Universidade Federal do Espírito Santo (UFES)
instacron:UFES
instname_str Universidade Federal do Espírito Santo (UFES)
instacron_str UFES
institution UFES
reponame_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
collection Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)
repository.mail.fl_str_mv riufes@ufes.br
_version_ 1834479088899719168