Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo
| Ano de defesa: | 2022 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal do Espírito Santo
BR Doutorado em Química Centro de Ciências Exatas UFES Programa de Pós-Graduação em Química |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://repositorio.ufes.br/handle/10/15921 |
Resumo: | Data fusion from different analytical sources can be a viable way to estimate physicochemical properties ou classificate crude oil samples, when compared to using a single analytical technique. This is because outputs from different instrumental techniques can carry additional information and act synergistically during calibration. In this work, the potential of data fusion strategies was investigated to estimate seven properties of crude oil: sulfur content (S), total nitrogen content (NT), basic nitrogen content (NB), total acid number (NAT), saturated (SAT), aromatic (ARO) and polar (POL) fractions. A total of 125 crude oil samples were available, divided into 70% for calibration and 30% for prediction. The physicochemical properties of the samples were determined using standardized experimental methods. Partial least squares (PLS) regression models were constructed from pre-treated mid-infrared spectroscopy (MIR) data and 1H and 13C nuclear magnetic resonance (RMN) spectroscopy data, using the data in individual form and also fused at low-level, mid-level with PCA and PLS and high-level in different combinations. The optimal number of latent variables was determined by cross-validation, using the Venetian Blind method. The results showed that, while mid-level data fusion by PLS increased the accuracy of some of the models, low, mid by PCA and high-level fusion provided negligible improvements. Using mid-level by PLS data fusion, the contents of S, NT, NB, NAT, SAT, ARO and POL were estimated, respectively, with RMSEP equal to 0,057 m/m%, 0,041 m/m%, 0,0067 m/m%, 0,16 mgKOHg –1 , 4,73 m/m%, 3,66 m/m% and 6,50 m/m% and coefficient of determination equal to 0,90, 0,83, 0,98, 0,91, 0,84, 0,67 and 0,66. Low and mid-level by PCA data fusion was also applied to near infrared (NIR) and MIR spectroscopy data for discrimination of crude oil samples into sweet/sour, poor/rich in nitrogen, non-acidic/acidic/highly acidic and light/ medium/heavy. The classification models were obtained through the method of discriminant analysis by partial least squares (PLS-DA). Classification models based on individual spectra and on the low and mid-level fused spectra were compared using the performance parameters sensitivity, specificity, efficiency, accuracy and total prediction error. Compared to the individual models, low and/or med-level data fusion provided greater accuracy and lower total prediction error rate in all four classifications proposed in this study. The classification models built from data fusion showed high accuracy, reaching values equal to or greater than 92%. These results demonstrate that the proposed spectroscopic techniques can complement each other, through the data fusion strategy, generating a greater synergistic effect and, consequently, producing models with greater predictive capacity. |
| id |
UFES_a6eb6d350b9c271f77822bd81f5e04be |
|---|---|
| oai_identifier_str |
oai:repositorio.ufes.br:10/15921 |
| network_acronym_str |
UFES |
| network_name_str |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
| repository_id_str |
|
| spelling |
Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleoSpectral data fusion in chemometric: An approach in petroleum chemistryFusão de dadosPetróleo brutoRMNPLSsubject.br-rjbnQuímicaData fusion from different analytical sources can be a viable way to estimate physicochemical properties ou classificate crude oil samples, when compared to using a single analytical technique. This is because outputs from different instrumental techniques can carry additional information and act synergistically during calibration. In this work, the potential of data fusion strategies was investigated to estimate seven properties of crude oil: sulfur content (S), total nitrogen content (NT), basic nitrogen content (NB), total acid number (NAT), saturated (SAT), aromatic (ARO) and polar (POL) fractions. A total of 125 crude oil samples were available, divided into 70% for calibration and 30% for prediction. The physicochemical properties of the samples were determined using standardized experimental methods. Partial least squares (PLS) regression models were constructed from pre-treated mid-infrared spectroscopy (MIR) data and 1H and 13C nuclear magnetic resonance (RMN) spectroscopy data, using the data in individual form and also fused at low-level, mid-level with PCA and PLS and high-level in different combinations. The optimal number of latent variables was determined by cross-validation, using the Venetian Blind method. The results showed that, while mid-level data fusion by PLS increased the accuracy of some of the models, low, mid by PCA and high-level fusion provided negligible improvements. Using mid-level by PLS data fusion, the contents of S, NT, NB, NAT, SAT, ARO and POL were estimated, respectively, with RMSEP equal to 0,057 m/m%, 0,041 m/m%, 0,0067 m/m%, 0,16 mgKOHg –1 , 4,73 m/m%, 3,66 m/m% and 6,50 m/m% and coefficient of determination equal to 0,90, 0,83, 0,98, 0,91, 0,84, 0,67 and 0,66. Low and mid-level by PCA data fusion was also applied to near infrared (NIR) and MIR spectroscopy data for discrimination of crude oil samples into sweet/sour, poor/rich in nitrogen, non-acidic/acidic/highly acidic and light/ medium/heavy. The classification models were obtained through the method of discriminant analysis by partial least squares (PLS-DA). Classification models based on individual spectra and on the low and mid-level fused spectra were compared using the performance parameters sensitivity, specificity, efficiency, accuracy and total prediction error. Compared to the individual models, low and/or med-level data fusion provided greater accuracy and lower total prediction error rate in all four classifications proposed in this study. The classification models built from data fusion showed high accuracy, reaching values equal to or greater than 92%. These results demonstrate that the proposed spectroscopic techniques can complement each other, through the data fusion strategy, generating a greater synergistic effect and, consequently, producing models with greater predictive capacity.A fusão de dados de diferentes fontes analíticas pode ser uma forma viável de estimar as propriedades físico-químicas do petróleo quando comparada ao uso de uma única técnica analítica. Isso ocorre porque saídas de diferentes fontes instrumentais podem transportar informações complementares e agir sinergicamente durante a calibração. Neste trabalho, foi investigado o potencial das estratégias de fusão de dados para estimar sete propriedades do petróleo bruto: teor de enxofre (S), teor de nitrogênio total (NT), teor de nitrogênio básico (NB), número de ácido total (NAT), frações de saturados (SAT), aromáticos (ARO) e polares (POL). Foram disponibilizadas 125 amostras de petróleo bruto, divididas em 70% para calibração e 30% para previsão. As propriedades físico-químicas das amostras foram determinadas por meio de métodos experimentais padronizados. Modelos de regressão por mínimos quadrados parciais (PLS) foram construídos a partir dos dados, previamente pré-tratados, de espectroscopia no infravermelho médio (MIR) com transformada de Fourier e de espectroscopia de ressonância magnética nuclear (RMN) de 1H e 13C, individuais e fundidos a nível baixo, médio por PCA e PLS e alto em diferentes combinações. O número ótimo de variáveis latentes foi determinado por validação cruzada, pelo método Venetian Blind. Os resultados mostraram que, enquanto a fusão de nível médio por PLS aumentou a exatidão de alguns dos modelos, a fusão de nível baixo, médio por PCA e alto proporcionou melhorias insignificantes. Aplicando a fusão de nível médio por PLS, os teores de S, NT, NB, NAT, SAT, ARO e POL foram estimados, respectivamente, com RMSEP iguais a 0,057 m/m%, 0,041 m/m%, 0,0067 m/m%, 0,16 mgKOHg –1 , 4,73 m/m%, 3,66 m/m% e 6,50 m/m% e coeficientes de determinação iguais a 0,90, 0,83, 0,98, 0,91, 0,84, 0,67 e 0,66, para o conjunto de amostras teste. A fusão de nível médio por PLS demonstrou, para estes casos, ser a melhor estratégia fusão entre as demais, melhorando a exatidão dos modelos. A fusão de dados a nível baixo e médio por PCA também foi aplicada em dados de espectroscopia no infravermelho próximo (NIR) e MIR para discriminação de amostras de petróleo bruto em doce/azedo, pobre/rico em nitrogênio, não ácido/ácido/altamente ácido e leve/médio/pesado. Os modelos de classificação foram obtidos por meio do método de análise discriminante por mínimos quadrados parciais (PLS-DA). Os modelos de classificação baseados nos espectros individuais e nos espectros fundidos a nível baixo e médio foram comparados utilizando os parâmetros de desempenho sensibilidade, especificidade, eficiência, acurácia e erro de predição total. Em comparação com os modelos individuais, a fusão de dados a nível baixo e/ou médio proporcionou uma maior acurácia e menor taxa de erro de predição total em todas as quatro classificações propostas neste estudo. Os modelos de classificação construídos a partir da fusão de dados apresentaram alta acurácia, atingindo valores iguais ou superiores a 92%. Esses resultados demonstraram que as técnicas espectroscópicas propostas podem se complementar, por meio da estratégia de fusão de dados, gerando maior efeito sinérgico e, conseqüentemente, produzindo modelos com maior capacidade de previsão.Universidade Federal do Espírito SantoBRDoutorado em QuímicaCentro de Ciências ExatasUFESPrograma de Pós-Graduação em QuímicaFilgueiras, Paulo Robertohttps://orcid.org/0000000326171601http://lattes.cnpq.br/1907915547207861http://lattes.cnpq.br/9789087871167165Romão, Wandersonhttps://orcid.org/0000000222546683http://lattes.cnpq.br/9121022613112821Cunha Neto, Alvarohttps://orcid.org/0000-0002-1814-6214http://lattes.cnpq.br/7448379486432052Borges Neto, Waldomirohttps://orcid.org/0000-0002-5808-5073http://lattes.cnpq.br/7646193734918354Duarte, Lucas MattosMoro, Mariana Kuster2024-05-30T00:53:17Z2024-05-30T00:53:17Z2022-02-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisTextapplication/pdfhttp://repositorio.ufes.br/handle/10/15921porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)instname:Universidade Federal do Espírito Santo (UFES)instacron:UFES2025-03-31T10:03:16Zoai:repositorio.ufes.br:10/15921Repositório InstitucionalPUBhttp://repositorio.ufes.br/oai/requestriufes@ufes.bropendoar:21082025-03-31T10:03:16Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)false |
| dc.title.none.fl_str_mv |
Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo Spectral data fusion in chemometric: An approach in petroleum chemistry |
| title |
Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo |
| spellingShingle |
Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo Moro, Mariana Kuster Fusão de dados Petróleo bruto RMN PLS subject.br-rjbn Química |
| title_short |
Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo |
| title_full |
Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo |
| title_fullStr |
Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo |
| title_full_unstemmed |
Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo |
| title_sort |
Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo |
| author |
Moro, Mariana Kuster |
| author_facet |
Moro, Mariana Kuster |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Filgueiras, Paulo Roberto https://orcid.org/0000000326171601 http://lattes.cnpq.br/1907915547207861 http://lattes.cnpq.br/9789087871167165 Romão, Wanderson https://orcid.org/0000000222546683 http://lattes.cnpq.br/9121022613112821 Cunha Neto, Alvaro https://orcid.org/0000-0002-1814-6214 http://lattes.cnpq.br/7448379486432052 Borges Neto, Waldomiro https://orcid.org/0000-0002-5808-5073 http://lattes.cnpq.br/7646193734918354 Duarte, Lucas Mattos |
| dc.contributor.author.fl_str_mv |
Moro, Mariana Kuster |
| dc.subject.por.fl_str_mv |
Fusão de dados Petróleo bruto RMN PLS subject.br-rjbn Química |
| topic |
Fusão de dados Petróleo bruto RMN PLS subject.br-rjbn Química |
| description |
Data fusion from different analytical sources can be a viable way to estimate physicochemical properties ou classificate crude oil samples, when compared to using a single analytical technique. This is because outputs from different instrumental techniques can carry additional information and act synergistically during calibration. In this work, the potential of data fusion strategies was investigated to estimate seven properties of crude oil: sulfur content (S), total nitrogen content (NT), basic nitrogen content (NB), total acid number (NAT), saturated (SAT), aromatic (ARO) and polar (POL) fractions. A total of 125 crude oil samples were available, divided into 70% for calibration and 30% for prediction. The physicochemical properties of the samples were determined using standardized experimental methods. Partial least squares (PLS) regression models were constructed from pre-treated mid-infrared spectroscopy (MIR) data and 1H and 13C nuclear magnetic resonance (RMN) spectroscopy data, using the data in individual form and also fused at low-level, mid-level with PCA and PLS and high-level in different combinations. The optimal number of latent variables was determined by cross-validation, using the Venetian Blind method. The results showed that, while mid-level data fusion by PLS increased the accuracy of some of the models, low, mid by PCA and high-level fusion provided negligible improvements. Using mid-level by PLS data fusion, the contents of S, NT, NB, NAT, SAT, ARO and POL were estimated, respectively, with RMSEP equal to 0,057 m/m%, 0,041 m/m%, 0,0067 m/m%, 0,16 mgKOHg –1 , 4,73 m/m%, 3,66 m/m% and 6,50 m/m% and coefficient of determination equal to 0,90, 0,83, 0,98, 0,91, 0,84, 0,67 and 0,66. Low and mid-level by PCA data fusion was also applied to near infrared (NIR) and MIR spectroscopy data for discrimination of crude oil samples into sweet/sour, poor/rich in nitrogen, non-acidic/acidic/highly acidic and light/ medium/heavy. The classification models were obtained through the method of discriminant analysis by partial least squares (PLS-DA). Classification models based on individual spectra and on the low and mid-level fused spectra were compared using the performance parameters sensitivity, specificity, efficiency, accuracy and total prediction error. Compared to the individual models, low and/or med-level data fusion provided greater accuracy and lower total prediction error rate in all four classifications proposed in this study. The classification models built from data fusion showed high accuracy, reaching values equal to or greater than 92%. These results demonstrate that the proposed spectroscopic techniques can complement each other, through the data fusion strategy, generating a greater synergistic effect and, consequently, producing models with greater predictive capacity. |
| publishDate |
2022 |
| dc.date.none.fl_str_mv |
2022-02-18 2024-05-30T00:53:17Z 2024-05-30T00:53:17Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://repositorio.ufes.br/handle/10/15921 |
| url |
http://repositorio.ufes.br/handle/10/15921 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
Text application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal do Espírito Santo BR Doutorado em Química Centro de Ciências Exatas UFES Programa de Pós-Graduação em Química |
| publisher.none.fl_str_mv |
Universidade Federal do Espírito Santo BR Doutorado em Química Centro de Ciências Exatas UFES Programa de Pós-Graduação em Química |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) instname:Universidade Federal do Espírito Santo (UFES) instacron:UFES |
| instname_str |
Universidade Federal do Espírito Santo (UFES) |
| instacron_str |
UFES |
| institution |
UFES |
| reponame_str |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
| collection |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
| repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES) |
| repository.mail.fl_str_mv |
riufes@ufes.br |
| _version_ |
1834479088899719168 |