Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Lovatti, Betina Pires Oliveira
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Espírito Santo
BR
Doutorado em Química
Centro de Ciências Exatas
UFES
Programa de Pós-Graduação em Química
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
NMR
Link de acesso: http://repositorio.ufes.br/handle/10/13480
Resumo: Technological development has driven chemical laboratories with instruments capable of extracting more information from samples. This has especially affected the area of Analytical Chemistry. The use of multivariate statistical methods, which is part of a growing area of Analytical Chemistry, called Chemometrics, helps to explore the full potential of these new instruments. At the forefront of Chemometrics is the new machine learning method: Random Forest (RF). This method has its applications aimed at modeling complex matrices such as petroleum. The complexity of oil is due to the wide variation in the composition of its constituents, which gives it distinct physicochemical properties. These compositional variations can be observed by spectroscopic techniques such as Mid Infrared (MIR) spectroscopy, Hydrogen Nuclear Magnetic Resonance (1H NMR) and Carbon (13C NMR) that have the potential to extract information at the molecular level of petroleum. Through the application of chemometric methods, this chemical information can be related to the physicochemical properties of petroleum. Thus, the present work aims to classify petroleum samples using spectroscopic techniques associated with machine learning methods, as well as, to explore the potentiality of the RF when combined with variable selection methods, and to identify in this algorithm variables that most contribute for the classification of oil samples. The results showed that RF was able to discriminate petroleum samples according to the Maximum Pour Point (PFM) from 1H and 13C NMR data. Besides, was possible to identify the variables that most contributed to the modeling, in which a balance between aromatic and saturated compounds was observed. In a second application, RF was efficient in discriminating 1H and 13C NMR spectra in relation to the total acidy number (TAN) of oil, especially when associated with the Principal Component Analysis (PCA) and Fisher's Discriminant (FD). The identification of the most important variables for discrimination showed a subtly greater contribution from the aromatic region. In the third application, the pattern recognition methods: PCA and k-Nearest Neighbors were efficient to identify oil profiles from MIR data. This process provides information on the chemical similarity of oils without the need for complete oil characterization
id UFES_1f09819bd92017a1f8a952e71e8267f8
oai_identifier_str oai:repositorio.ufes.br:10/13480
network_acronym_str UFES
network_name_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
repository_id_str
spelling Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleoMachine learning methods in analytical chemistry: Random Forest applied in crude oil evaluationAprendizagem de máquinaFloresta RandômicaPetróleoReduçãoMachine learning methodRandom ForestCrude OilReduction of variablesNMRsubject.br-rjbnQuímicaTechnological development has driven chemical laboratories with instruments capable of extracting more information from samples. This has especially affected the area of Analytical Chemistry. The use of multivariate statistical methods, which is part of a growing area of Analytical Chemistry, called Chemometrics, helps to explore the full potential of these new instruments. At the forefront of Chemometrics is the new machine learning method: Random Forest (RF). This method has its applications aimed at modeling complex matrices such as petroleum. The complexity of oil is due to the wide variation in the composition of its constituents, which gives it distinct physicochemical properties. These compositional variations can be observed by spectroscopic techniques such as Mid Infrared (MIR) spectroscopy, Hydrogen Nuclear Magnetic Resonance (1H NMR) and Carbon (13C NMR) that have the potential to extract information at the molecular level of petroleum. Through the application of chemometric methods, this chemical information can be related to the physicochemical properties of petroleum. Thus, the present work aims to classify petroleum samples using spectroscopic techniques associated with machine learning methods, as well as, to explore the potentiality of the RF when combined with variable selection methods, and to identify in this algorithm variables that most contribute for the classification of oil samples. The results showed that RF was able to discriminate petroleum samples according to the Maximum Pour Point (PFM) from 1H and 13C NMR data. Besides, was possible to identify the variables that most contributed to the modeling, in which a balance between aromatic and saturated compounds was observed. In a second application, RF was efficient in discriminating 1H and 13C NMR spectra in relation to the total acidy number (TAN) of oil, especially when associated with the Principal Component Analysis (PCA) and Fisher's Discriminant (FD). The identification of the most important variables for discrimination showed a subtly greater contribution from the aromatic region. In the third application, the pattern recognition methods: PCA and k-Nearest Neighbors were efficient to identify oil profiles from MIR data. This process provides information on the chemical similarity of oils without the need for complete oil characterizationO desenvolvimento tecnológico impulsionou os laboratórios químicos com instrumentos capazes de extrair cada vez mais informações das amostras. Isto afetou especialmente a área de Química Analítica. A utilização de métodos de estatística multivariada, a qual está inserida dentro de uma crescente área da Química Analítica, denominada Quimiometria, auxilia a exploração de toda a potencialidade destes novos instrumentos. Na vanguarda da Quimiometria está o novo método de aprendizagem de máquina: Floresta Randômica (RF). Este método tem suas aplicações voltadas à modelagem de matrizes complexas tal como o petróleo. A complexidade do petróleo é devida à grande variação na composição de seus constituintes, o que lhe confere propriedades físico-químicas distintas. Essas variações composicionais podem ser observadas por meio de técnicas espectroscópicas tais como: espectroscopia na região do Infravermelho Médio (MIR), Ressonância Magnética Nuclear de Hidrogênio (RMN de 1H) e Carbono (RMN de 13C) que possuem potencialidade de extrair informações a nível molecular do petróleo. Através da aplicação de métodos quimiométricos essas informações químicas podem ser relacionadas a propriedades físico-químicas do petróleo. Assim, o presente trabalho visa a classificação de amostras petróleo utilizando técnicas espectroscópicas associada a métodos de aprendizagem de máquina, assim como, explorar a potencialidade da técnica de RF quando combinada a métodos de seleção de variáveis, além de identificar nesse algoritmo variáveis que mais contribuem para a classificação das amostras de petróleo. Os resultados mostraram que a RF foi capaz de discriminar amostras de petróleo quanto ao Ponto de Fluidez Máximo (PFM) a partir de dados de RMN de 1H e 13C. Ademais, foi possível identificar as variáveis de maior contribuição na modelagem, no qual foi observado um equilíbrio entre compostos aromáticos e saturados. Numa segunda aplicação, RF foi eficiente em discriminar espectros de RMN de 1H e 13C em relação ao Número de Acidez Total (NAT) de petróleo, especialmente, quando associada aos métodos: Análise de Componentes Principais (PCA) e Discriminante de Fisher (FD). A identificação das variáveis mais importantes para discriminação mostrou uma contribuição sutilmente maior da região de aromáticos. Na terceira aplicação, os métodos de reconhecimento de padrões: PCA e k-Vizinhos mais Próximos foram eficientes para identificar perfis de petróleo a partir de dados de MIR, possibilitando obter informações sobre similaridade química de óleos sem a necessidade de uma caracterização completa do óleo.Fundação de Amparo à Pesquisa do Espírito Santo (FAPES)Universidade Federal do Espírito SantoBRDoutorado em QuímicaCentro de Ciências ExatasUFESPrograma de Pós-Graduação em QuímicaFilgueiras, Paulo Robertohttps://orcid.org/0000000326171601http://lattes.cnpq.br/1907915547207861https://orcid.org/0000-0002-7401-2739http://lattes.cnpq.br/8227109432707028Almeida, Mariana Ramos dehttps://orcid.org/0000-0002-2612-068Xhttp://lattes.cnpq.br/6690913086860156Romao, Wandersonhttps://orcid.org/0000000222546683http://lattes.cnpq.br/9121022613112821Oliveira, Emanuele Catarina da Silvahttps://orcid.org/http://lattes.cnpq.br/1715851915787164Cunha Neto, Alvaro https://orcid.org/0000-0002-1814-6214http://lattes.cnpq.br/7448379486432052Lovatti, Betina Pires Oliveira2024-05-29T22:11:22Z2024-05-29T22:11:22Z2019-11-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisTextapplication/pdfhttp://repositorio.ufes.br/handle/10/13480porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)instname:Universidade Federal do Espírito Santo (UFES)instacron:UFES2025-03-27T19:00:43Zoai:repositorio.ufes.br:10/13480Repositório InstitucionalPUBhttp://repositorio.ufes.br/oai/requestriufes@ufes.bropendoar:21082025-03-27T19:00:43Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)false
dc.title.none.fl_str_mv Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo
Machine learning methods in analytical chemistry: Random Forest applied in crude oil evaluation
title Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo
spellingShingle Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo
Lovatti, Betina Pires Oliveira
Aprendizagem de máquina
Floresta Randômica
Petróleo
Redução
Machine learning method
Random Forest
Crude Oil
Reduction of variables
NMR
subject.br-rjbn
Química
title_short Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo
title_full Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo
title_fullStr Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo
title_full_unstemmed Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo
title_sort Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo
author Lovatti, Betina Pires Oliveira
author_facet Lovatti, Betina Pires Oliveira
author_role author
dc.contributor.none.fl_str_mv Filgueiras, Paulo Roberto
https://orcid.org/0000000326171601
http://lattes.cnpq.br/1907915547207861
https://orcid.org/0000-0002-7401-2739
http://lattes.cnpq.br/8227109432707028
Almeida, Mariana Ramos de
https://orcid.org/0000-0002-2612-068X
http://lattes.cnpq.br/6690913086860156
Romao, Wanderson
https://orcid.org/0000000222546683
http://lattes.cnpq.br/9121022613112821
Oliveira, Emanuele Catarina da Silva
https://orcid.org/
http://lattes.cnpq.br/1715851915787164
Cunha Neto, Alvaro
https://orcid.org/0000-0002-1814-6214
http://lattes.cnpq.br/7448379486432052
dc.contributor.author.fl_str_mv Lovatti, Betina Pires Oliveira
dc.subject.por.fl_str_mv Aprendizagem de máquina
Floresta Randômica
Petróleo
Redução
Machine learning method
Random Forest
Crude Oil
Reduction of variables
NMR
subject.br-rjbn
Química
topic Aprendizagem de máquina
Floresta Randômica
Petróleo
Redução
Machine learning method
Random Forest
Crude Oil
Reduction of variables
NMR
subject.br-rjbn
Química
description Technological development has driven chemical laboratories with instruments capable of extracting more information from samples. This has especially affected the area of Analytical Chemistry. The use of multivariate statistical methods, which is part of a growing area of Analytical Chemistry, called Chemometrics, helps to explore the full potential of these new instruments. At the forefront of Chemometrics is the new machine learning method: Random Forest (RF). This method has its applications aimed at modeling complex matrices such as petroleum. The complexity of oil is due to the wide variation in the composition of its constituents, which gives it distinct physicochemical properties. These compositional variations can be observed by spectroscopic techniques such as Mid Infrared (MIR) spectroscopy, Hydrogen Nuclear Magnetic Resonance (1H NMR) and Carbon (13C NMR) that have the potential to extract information at the molecular level of petroleum. Through the application of chemometric methods, this chemical information can be related to the physicochemical properties of petroleum. Thus, the present work aims to classify petroleum samples using spectroscopic techniques associated with machine learning methods, as well as, to explore the potentiality of the RF when combined with variable selection methods, and to identify in this algorithm variables that most contribute for the classification of oil samples. The results showed that RF was able to discriminate petroleum samples according to the Maximum Pour Point (PFM) from 1H and 13C NMR data. Besides, was possible to identify the variables that most contributed to the modeling, in which a balance between aromatic and saturated compounds was observed. In a second application, RF was efficient in discriminating 1H and 13C NMR spectra in relation to the total acidy number (TAN) of oil, especially when associated with the Principal Component Analysis (PCA) and Fisher's Discriminant (FD). The identification of the most important variables for discrimination showed a subtly greater contribution from the aromatic region. In the third application, the pattern recognition methods: PCA and k-Nearest Neighbors were efficient to identify oil profiles from MIR data. This process provides information on the chemical similarity of oils without the need for complete oil characterization
publishDate 2019
dc.date.none.fl_str_mv 2019-11-29
2024-05-29T22:11:22Z
2024-05-29T22:11:22Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.ufes.br/handle/10/13480
url http://repositorio.ufes.br/handle/10/13480
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv Text
application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Espírito Santo
BR
Doutorado em Química
Centro de Ciências Exatas
UFES
Programa de Pós-Graduação em Química
publisher.none.fl_str_mv Universidade Federal do Espírito Santo
BR
Doutorado em Química
Centro de Ciências Exatas
UFES
Programa de Pós-Graduação em Química
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
instname:Universidade Federal do Espírito Santo (UFES)
instacron:UFES
instname_str Universidade Federal do Espírito Santo (UFES)
instacron_str UFES
institution UFES
reponame_str Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
collection Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)
repository.mail.fl_str_mv riufes@ufes.br
_version_ 1834479147594809344