Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo
| Ano de defesa: | 2019 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal do Espírito Santo
BR Doutorado em Química Centro de Ciências Exatas UFES Programa de Pós-Graduação em Química |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://repositorio.ufes.br/handle/10/13480 |
Resumo: | Technological development has driven chemical laboratories with instruments capable of extracting more information from samples. This has especially affected the area of Analytical Chemistry. The use of multivariate statistical methods, which is part of a growing area of Analytical Chemistry, called Chemometrics, helps to explore the full potential of these new instruments. At the forefront of Chemometrics is the new machine learning method: Random Forest (RF). This method has its applications aimed at modeling complex matrices such as petroleum. The complexity of oil is due to the wide variation in the composition of its constituents, which gives it distinct physicochemical properties. These compositional variations can be observed by spectroscopic techniques such as Mid Infrared (MIR) spectroscopy, Hydrogen Nuclear Magnetic Resonance (1H NMR) and Carbon (13C NMR) that have the potential to extract information at the molecular level of petroleum. Through the application of chemometric methods, this chemical information can be related to the physicochemical properties of petroleum. Thus, the present work aims to classify petroleum samples using spectroscopic techniques associated with machine learning methods, as well as, to explore the potentiality of the RF when combined with variable selection methods, and to identify in this algorithm variables that most contribute for the classification of oil samples. The results showed that RF was able to discriminate petroleum samples according to the Maximum Pour Point (PFM) from 1H and 13C NMR data. Besides, was possible to identify the variables that most contributed to the modeling, in which a balance between aromatic and saturated compounds was observed. In a second application, RF was efficient in discriminating 1H and 13C NMR spectra in relation to the total acidy number (TAN) of oil, especially when associated with the Principal Component Analysis (PCA) and Fisher's Discriminant (FD). The identification of the most important variables for discrimination showed a subtly greater contribution from the aromatic region. In the third application, the pattern recognition methods: PCA and k-Nearest Neighbors were efficient to identify oil profiles from MIR data. This process provides information on the chemical similarity of oils without the need for complete oil characterization |
| id |
UFES_1f09819bd92017a1f8a952e71e8267f8 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufes.br:10/13480 |
| network_acronym_str |
UFES |
| network_name_str |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
| repository_id_str |
|
| spelling |
Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleoMachine learning methods in analytical chemistry: Random Forest applied in crude oil evaluationAprendizagem de máquinaFloresta RandômicaPetróleoReduçãoMachine learning methodRandom ForestCrude OilReduction of variablesNMRsubject.br-rjbnQuímicaTechnological development has driven chemical laboratories with instruments capable of extracting more information from samples. This has especially affected the area of Analytical Chemistry. The use of multivariate statistical methods, which is part of a growing area of Analytical Chemistry, called Chemometrics, helps to explore the full potential of these new instruments. At the forefront of Chemometrics is the new machine learning method: Random Forest (RF). This method has its applications aimed at modeling complex matrices such as petroleum. The complexity of oil is due to the wide variation in the composition of its constituents, which gives it distinct physicochemical properties. These compositional variations can be observed by spectroscopic techniques such as Mid Infrared (MIR) spectroscopy, Hydrogen Nuclear Magnetic Resonance (1H NMR) and Carbon (13C NMR) that have the potential to extract information at the molecular level of petroleum. Through the application of chemometric methods, this chemical information can be related to the physicochemical properties of petroleum. Thus, the present work aims to classify petroleum samples using spectroscopic techniques associated with machine learning methods, as well as, to explore the potentiality of the RF when combined with variable selection methods, and to identify in this algorithm variables that most contribute for the classification of oil samples. The results showed that RF was able to discriminate petroleum samples according to the Maximum Pour Point (PFM) from 1H and 13C NMR data. Besides, was possible to identify the variables that most contributed to the modeling, in which a balance between aromatic and saturated compounds was observed. In a second application, RF was efficient in discriminating 1H and 13C NMR spectra in relation to the total acidy number (TAN) of oil, especially when associated with the Principal Component Analysis (PCA) and Fisher's Discriminant (FD). The identification of the most important variables for discrimination showed a subtly greater contribution from the aromatic region. In the third application, the pattern recognition methods: PCA and k-Nearest Neighbors were efficient to identify oil profiles from MIR data. This process provides information on the chemical similarity of oils without the need for complete oil characterizationO desenvolvimento tecnológico impulsionou os laboratórios químicos com instrumentos capazes de extrair cada vez mais informações das amostras. Isto afetou especialmente a área de Química Analítica. A utilização de métodos de estatística multivariada, a qual está inserida dentro de uma crescente área da Química Analítica, denominada Quimiometria, auxilia a exploração de toda a potencialidade destes novos instrumentos. Na vanguarda da Quimiometria está o novo método de aprendizagem de máquina: Floresta Randômica (RF). Este método tem suas aplicações voltadas à modelagem de matrizes complexas tal como o petróleo. A complexidade do petróleo é devida à grande variação na composição de seus constituintes, o que lhe confere propriedades físico-químicas distintas. Essas variações composicionais podem ser observadas por meio de técnicas espectroscópicas tais como: espectroscopia na região do Infravermelho Médio (MIR), Ressonância Magnética Nuclear de Hidrogênio (RMN de 1H) e Carbono (RMN de 13C) que possuem potencialidade de extrair informações a nível molecular do petróleo. Através da aplicação de métodos quimiométricos essas informações químicas podem ser relacionadas a propriedades físico-químicas do petróleo. Assim, o presente trabalho visa a classificação de amostras petróleo utilizando técnicas espectroscópicas associada a métodos de aprendizagem de máquina, assim como, explorar a potencialidade da técnica de RF quando combinada a métodos de seleção de variáveis, além de identificar nesse algoritmo variáveis que mais contribuem para a classificação das amostras de petróleo. Os resultados mostraram que a RF foi capaz de discriminar amostras de petróleo quanto ao Ponto de Fluidez Máximo (PFM) a partir de dados de RMN de 1H e 13C. Ademais, foi possível identificar as variáveis de maior contribuição na modelagem, no qual foi observado um equilíbrio entre compostos aromáticos e saturados. Numa segunda aplicação, RF foi eficiente em discriminar espectros de RMN de 1H e 13C em relação ao Número de Acidez Total (NAT) de petróleo, especialmente, quando associada aos métodos: Análise de Componentes Principais (PCA) e Discriminante de Fisher (FD). A identificação das variáveis mais importantes para discriminação mostrou uma contribuição sutilmente maior da região de aromáticos. Na terceira aplicação, os métodos de reconhecimento de padrões: PCA e k-Vizinhos mais Próximos foram eficientes para identificar perfis de petróleo a partir de dados de MIR, possibilitando obter informações sobre similaridade química de óleos sem a necessidade de uma caracterização completa do óleo.Fundação de Amparo à Pesquisa do Espírito Santo (FAPES)Universidade Federal do Espírito SantoBRDoutorado em QuímicaCentro de Ciências ExatasUFESPrograma de Pós-Graduação em QuímicaFilgueiras, Paulo Robertohttps://orcid.org/0000000326171601http://lattes.cnpq.br/1907915547207861https://orcid.org/0000-0002-7401-2739http://lattes.cnpq.br/8227109432707028Almeida, Mariana Ramos dehttps://orcid.org/0000-0002-2612-068Xhttp://lattes.cnpq.br/6690913086860156Romao, Wandersonhttps://orcid.org/0000000222546683http://lattes.cnpq.br/9121022613112821Oliveira, Emanuele Catarina da Silvahttps://orcid.org/http://lattes.cnpq.br/1715851915787164Cunha Neto, Alvaro https://orcid.org/0000-0002-1814-6214http://lattes.cnpq.br/7448379486432052Lovatti, Betina Pires Oliveira2024-05-29T22:11:22Z2024-05-29T22:11:22Z2019-11-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisTextapplication/pdfhttp://repositorio.ufes.br/handle/10/13480porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes)instname:Universidade Federal do Espírito Santo (UFES)instacron:UFES2025-03-27T19:00:43Zoai:repositorio.ufes.br:10/13480Repositório InstitucionalPUBhttp://repositorio.ufes.br/oai/requestriufes@ufes.bropendoar:21082025-03-27T19:00:43Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES)false |
| dc.title.none.fl_str_mv |
Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo Machine learning methods in analytical chemistry: Random Forest applied in crude oil evaluation |
| title |
Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo |
| spellingShingle |
Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo Lovatti, Betina Pires Oliveira Aprendizagem de máquina Floresta Randômica Petróleo Redução Machine learning method Random Forest Crude Oil Reduction of variables NMR subject.br-rjbn Química |
| title_short |
Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo |
| title_full |
Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo |
| title_fullStr |
Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo |
| title_full_unstemmed |
Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo |
| title_sort |
Métodos de aprendizagem de máquina em química analítica: Floresta Randômica aplicada na avaliação de petróleo |
| author |
Lovatti, Betina Pires Oliveira |
| author_facet |
Lovatti, Betina Pires Oliveira |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Filgueiras, Paulo Roberto https://orcid.org/0000000326171601 http://lattes.cnpq.br/1907915547207861 https://orcid.org/0000-0002-7401-2739 http://lattes.cnpq.br/8227109432707028 Almeida, Mariana Ramos de https://orcid.org/0000-0002-2612-068X http://lattes.cnpq.br/6690913086860156 Romao, Wanderson https://orcid.org/0000000222546683 http://lattes.cnpq.br/9121022613112821 Oliveira, Emanuele Catarina da Silva https://orcid.org/ http://lattes.cnpq.br/1715851915787164 Cunha Neto, Alvaro https://orcid.org/0000-0002-1814-6214 http://lattes.cnpq.br/7448379486432052 |
| dc.contributor.author.fl_str_mv |
Lovatti, Betina Pires Oliveira |
| dc.subject.por.fl_str_mv |
Aprendizagem de máquina Floresta Randômica Petróleo Redução Machine learning method Random Forest Crude Oil Reduction of variables NMR subject.br-rjbn Química |
| topic |
Aprendizagem de máquina Floresta Randômica Petróleo Redução Machine learning method Random Forest Crude Oil Reduction of variables NMR subject.br-rjbn Química |
| description |
Technological development has driven chemical laboratories with instruments capable of extracting more information from samples. This has especially affected the area of Analytical Chemistry. The use of multivariate statistical methods, which is part of a growing area of Analytical Chemistry, called Chemometrics, helps to explore the full potential of these new instruments. At the forefront of Chemometrics is the new machine learning method: Random Forest (RF). This method has its applications aimed at modeling complex matrices such as petroleum. The complexity of oil is due to the wide variation in the composition of its constituents, which gives it distinct physicochemical properties. These compositional variations can be observed by spectroscopic techniques such as Mid Infrared (MIR) spectroscopy, Hydrogen Nuclear Magnetic Resonance (1H NMR) and Carbon (13C NMR) that have the potential to extract information at the molecular level of petroleum. Through the application of chemometric methods, this chemical information can be related to the physicochemical properties of petroleum. Thus, the present work aims to classify petroleum samples using spectroscopic techniques associated with machine learning methods, as well as, to explore the potentiality of the RF when combined with variable selection methods, and to identify in this algorithm variables that most contribute for the classification of oil samples. The results showed that RF was able to discriminate petroleum samples according to the Maximum Pour Point (PFM) from 1H and 13C NMR data. Besides, was possible to identify the variables that most contributed to the modeling, in which a balance between aromatic and saturated compounds was observed. In a second application, RF was efficient in discriminating 1H and 13C NMR spectra in relation to the total acidy number (TAN) of oil, especially when associated with the Principal Component Analysis (PCA) and Fisher's Discriminant (FD). The identification of the most important variables for discrimination showed a subtly greater contribution from the aromatic region. In the third application, the pattern recognition methods: PCA and k-Nearest Neighbors were efficient to identify oil profiles from MIR data. This process provides information on the chemical similarity of oils without the need for complete oil characterization |
| publishDate |
2019 |
| dc.date.none.fl_str_mv |
2019-11-29 2024-05-29T22:11:22Z 2024-05-29T22:11:22Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://repositorio.ufes.br/handle/10/13480 |
| url |
http://repositorio.ufes.br/handle/10/13480 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
Text application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal do Espírito Santo BR Doutorado em Química Centro de Ciências Exatas UFES Programa de Pós-Graduação em Química |
| publisher.none.fl_str_mv |
Universidade Federal do Espírito Santo BR Doutorado em Química Centro de Ciências Exatas UFES Programa de Pós-Graduação em Química |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) instname:Universidade Federal do Espírito Santo (UFES) instacron:UFES |
| instname_str |
Universidade Federal do Espírito Santo (UFES) |
| instacron_str |
UFES |
| institution |
UFES |
| reponame_str |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
| collection |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) |
| repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal do Espírito Santo (riUfes) - Universidade Federal do Espírito Santo (UFES) |
| repository.mail.fl_str_mv |
riufes@ufes.br |
| _version_ |
1834479147594809344 |