Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Mucelini, Johnatan
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/75/75134/tde-26112025-152937/
Resumo: O crescimento exponencial de dados de química quântica e os avanços em capacidade computacional impulsionam o desenvolvimento de métodos de análise estatisticamente embasados, capazes de superar as limitações dos métodos tradicionais, como subjetividade e falta de reprodutibilidade. Nesta tese, propõe-se a criação de métodos baseados em descritores AtoMF (Atomic to Molecular Featurization), desenvolvidos para representar propriedades atômicas em moleculares, empregando técnicas do campo da relação quantitativa estrutura-atividade (QSAR) para identificar tendências relevantes em nanoclusters. Modelos de regressão linear parcial (PLS) e ordinária (OLS), bem como redes neurais artificiais, foram testados, com seleção de descritores realizada tanto por filtros estatísticos quanto por algoritmos genéticos (OLS+GA). A confiabilidade dos coeficientes interpretados foi verificada por meio de análise de bootstrap. Apesar da multicolinearidade observada nos descritores AtoMF, foi possível estabelecer relações matemáticas robustas e interpretações químicas significativas. Os modelos indicaram tendências importantes dos materiais, corroborando conhecimentos prévios com maior evidência estatística. Os resultados mostraram que os modelos PLS apresentaram melhor desempenho para dois conjuntos de dados, enquanto o OLS+GA foi mais eficaz em outro, destacando a relevância de múltiplas abordagens metodológicas. Redes neurais artificiais também foram testadas, mas não apresentaram bom desempenho preditivo. Foram observadas limitações, como superajuste em alguns modelos, inconsistência nos resultados das redes neurais e dificuldades de interpretabilidade em determinados descritores AtoMFs. O conjunto de ferramentas empregado permitiu investigar, de forma objetiva, a relação entre propriedades atômicas e propriedades-alvo dos materiais, mostrando-se promissor para otimizar a descoberta de novos materiais e aprofundar a compreensão de propriedades em função das estruturas em nível atômico. As metodologias desenvolvidas estão sendo disponibilizadas como pacotes de código aberto, visando facilitar o acesso e a reprodutibilidade dos resultados, incentivando seu uso em futuras investigações em química computacional e ciência dos materiais. São também apresentadas sugestões para estudos futuros que explorem e expandam o uso dos descritores AtoMF.
id USP_b92dc47a4c5d467eeb76b525c601084d
oai_identifier_str oai:teses.usp.br:tde-26112025-152937
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividadeInterpreting quantum chemistry data through AtoMF descriptors and quantitative structure-activity relationship methodsaprendizado de máquinaAtoMFAtoMFmachine learningQSARQSARquantum chemistryquímica quânticaO crescimento exponencial de dados de química quântica e os avanços em capacidade computacional impulsionam o desenvolvimento de métodos de análise estatisticamente embasados, capazes de superar as limitações dos métodos tradicionais, como subjetividade e falta de reprodutibilidade. Nesta tese, propõe-se a criação de métodos baseados em descritores AtoMF (Atomic to Molecular Featurization), desenvolvidos para representar propriedades atômicas em moleculares, empregando técnicas do campo da relação quantitativa estrutura-atividade (QSAR) para identificar tendências relevantes em nanoclusters. Modelos de regressão linear parcial (PLS) e ordinária (OLS), bem como redes neurais artificiais, foram testados, com seleção de descritores realizada tanto por filtros estatísticos quanto por algoritmos genéticos (OLS+GA). A confiabilidade dos coeficientes interpretados foi verificada por meio de análise de bootstrap. Apesar da multicolinearidade observada nos descritores AtoMF, foi possível estabelecer relações matemáticas robustas e interpretações químicas significativas. Os modelos indicaram tendências importantes dos materiais, corroborando conhecimentos prévios com maior evidência estatística. Os resultados mostraram que os modelos PLS apresentaram melhor desempenho para dois conjuntos de dados, enquanto o OLS+GA foi mais eficaz em outro, destacando a relevância de múltiplas abordagens metodológicas. Redes neurais artificiais também foram testadas, mas não apresentaram bom desempenho preditivo. Foram observadas limitações, como superajuste em alguns modelos, inconsistência nos resultados das redes neurais e dificuldades de interpretabilidade em determinados descritores AtoMFs. O conjunto de ferramentas empregado permitiu investigar, de forma objetiva, a relação entre propriedades atômicas e propriedades-alvo dos materiais, mostrando-se promissor para otimizar a descoberta de novos materiais e aprofundar a compreensão de propriedades em função das estruturas em nível atômico. As metodologias desenvolvidas estão sendo disponibilizadas como pacotes de código aberto, visando facilitar o acesso e a reprodutibilidade dos resultados, incentivando seu uso em futuras investigações em química computacional e ciência dos materiais. São também apresentadas sugestões para estudos futuros que explorem e expandam o uso dos descritores AtoMF.The exponential growth of quantum chemistry data and advances in computational capacity are driving the development of statistically grounded analytical methods capable of overcoming the limitations of traditional approaches, such as subjectivity and lack of reproducibility. In this thesis, new methods based on AtoMF (Atomic to Molecular Featurization) descriptors - developed to represent atomic and molecular propertiesare proposed, employing techniques from the field of quantitative structure-activity relationship (QSAR) to identify relevant trends in nanoclusters. Partial Least Squares (PLS) and Ordinary Least Squares (OLS) regression models, as well as artificial neural networks, were tested, with descriptor selection performed using both statistical filters and genetic algorithms (OLS+GA). The reliability of the interpreted coefficients was verified by bootstrap analysis. Despite the multicollinearity observed among the AtoMF descriptors, it was possible to establish robust mathematical relationships and significant chemical interpretations. The models indicated important material trends, corroborating previous knowledge with greater statistical evidence. The results showed that the PLS models performed better for two data sets, while the OLS+GA approach was more effective in another, highlighting the relevance of multiple methodological strategies. Artificial neural networks were also tested but did not demonstrate good predictive performance. Limitations were observed, such as overfitting in some models, inconsistency in the neural network results, and difficulties in interpreting certain AtoMF descriptors. The set of tools employed allowed for an objective investigation of the relationship between atomic properties and target material properties, proving to be promising for optimizing the discovery of new materials and deepening the understanding of properties as a function of atomic-level structures. The developed methodologies are being made available as open-source packages, aiming to facilitate access and reproducibility of the results, thus encouraging their use in future research in computational chemistry and materials science. Suggestions for future studies that explore and expand the use of AtoMF descriptors are also presented.Biblioteca Digitais de Teses e Dissertações da USPSilva, Albérico Borges Ferreira daMucelini, Johnatan2025-09-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/75/75134/tde-26112025-152937/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-11-27T16:30:02Zoai:teses.usp.br:tde-26112025-152937Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-11-27T16:30:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade
Interpreting quantum chemistry data through AtoMF descriptors and quantitative structure-activity relationship methods
title Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade
spellingShingle Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade
Mucelini, Johnatan
aprendizado de máquina
AtoMF
AtoMF
machine learning
QSAR
QSAR
quantum chemistry
química quântica
title_short Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade
title_full Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade
title_fullStr Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade
title_full_unstemmed Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade
title_sort Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade
author Mucelini, Johnatan
author_facet Mucelini, Johnatan
author_role author
dc.contributor.none.fl_str_mv Silva, Albérico Borges Ferreira da
dc.contributor.author.fl_str_mv Mucelini, Johnatan
dc.subject.por.fl_str_mv aprendizado de máquina
AtoMF
AtoMF
machine learning
QSAR
QSAR
quantum chemistry
química quântica
topic aprendizado de máquina
AtoMF
AtoMF
machine learning
QSAR
QSAR
quantum chemistry
química quântica
description O crescimento exponencial de dados de química quântica e os avanços em capacidade computacional impulsionam o desenvolvimento de métodos de análise estatisticamente embasados, capazes de superar as limitações dos métodos tradicionais, como subjetividade e falta de reprodutibilidade. Nesta tese, propõe-se a criação de métodos baseados em descritores AtoMF (Atomic to Molecular Featurization), desenvolvidos para representar propriedades atômicas em moleculares, empregando técnicas do campo da relação quantitativa estrutura-atividade (QSAR) para identificar tendências relevantes em nanoclusters. Modelos de regressão linear parcial (PLS) e ordinária (OLS), bem como redes neurais artificiais, foram testados, com seleção de descritores realizada tanto por filtros estatísticos quanto por algoritmos genéticos (OLS+GA). A confiabilidade dos coeficientes interpretados foi verificada por meio de análise de bootstrap. Apesar da multicolinearidade observada nos descritores AtoMF, foi possível estabelecer relações matemáticas robustas e interpretações químicas significativas. Os modelos indicaram tendências importantes dos materiais, corroborando conhecimentos prévios com maior evidência estatística. Os resultados mostraram que os modelos PLS apresentaram melhor desempenho para dois conjuntos de dados, enquanto o OLS+GA foi mais eficaz em outro, destacando a relevância de múltiplas abordagens metodológicas. Redes neurais artificiais também foram testadas, mas não apresentaram bom desempenho preditivo. Foram observadas limitações, como superajuste em alguns modelos, inconsistência nos resultados das redes neurais e dificuldades de interpretabilidade em determinados descritores AtoMFs. O conjunto de ferramentas empregado permitiu investigar, de forma objetiva, a relação entre propriedades atômicas e propriedades-alvo dos materiais, mostrando-se promissor para otimizar a descoberta de novos materiais e aprofundar a compreensão de propriedades em função das estruturas em nível atômico. As metodologias desenvolvidas estão sendo disponibilizadas como pacotes de código aberto, visando facilitar o acesso e a reprodutibilidade dos resultados, incentivando seu uso em futuras investigações em química computacional e ciência dos materiais. São também apresentadas sugestões para estudos futuros que explorem e expandam o uso dos descritores AtoMF.
publishDate 2025
dc.date.none.fl_str_mv 2025-09-11
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/75/75134/tde-26112025-152937/
url https://www.teses.usp.br/teses/disponiveis/75/75134/tde-26112025-152937/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865492195747823616