Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/75/75134/tde-26112025-152937/ |
Resumo: | O crescimento exponencial de dados de química quântica e os avanços em capacidade computacional impulsionam o desenvolvimento de métodos de análise estatisticamente embasados, capazes de superar as limitações dos métodos tradicionais, como subjetividade e falta de reprodutibilidade. Nesta tese, propõe-se a criação de métodos baseados em descritores AtoMF (Atomic to Molecular Featurization), desenvolvidos para representar propriedades atômicas em moleculares, empregando técnicas do campo da relação quantitativa estrutura-atividade (QSAR) para identificar tendências relevantes em nanoclusters. Modelos de regressão linear parcial (PLS) e ordinária (OLS), bem como redes neurais artificiais, foram testados, com seleção de descritores realizada tanto por filtros estatísticos quanto por algoritmos genéticos (OLS+GA). A confiabilidade dos coeficientes interpretados foi verificada por meio de análise de bootstrap. Apesar da multicolinearidade observada nos descritores AtoMF, foi possível estabelecer relações matemáticas robustas e interpretações químicas significativas. Os modelos indicaram tendências importantes dos materiais, corroborando conhecimentos prévios com maior evidência estatística. Os resultados mostraram que os modelos PLS apresentaram melhor desempenho para dois conjuntos de dados, enquanto o OLS+GA foi mais eficaz em outro, destacando a relevância de múltiplas abordagens metodológicas. Redes neurais artificiais também foram testadas, mas não apresentaram bom desempenho preditivo. Foram observadas limitações, como superajuste em alguns modelos, inconsistência nos resultados das redes neurais e dificuldades de interpretabilidade em determinados descritores AtoMFs. O conjunto de ferramentas empregado permitiu investigar, de forma objetiva, a relação entre propriedades atômicas e propriedades-alvo dos materiais, mostrando-se promissor para otimizar a descoberta de novos materiais e aprofundar a compreensão de propriedades em função das estruturas em nível atômico. As metodologias desenvolvidas estão sendo disponibilizadas como pacotes de código aberto, visando facilitar o acesso e a reprodutibilidade dos resultados, incentivando seu uso em futuras investigações em química computacional e ciência dos materiais. São também apresentadas sugestões para estudos futuros que explorem e expandam o uso dos descritores AtoMF. |
| id |
USP_b92dc47a4c5d467eeb76b525c601084d |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-26112025-152937 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividadeInterpreting quantum chemistry data through AtoMF descriptors and quantitative structure-activity relationship methodsaprendizado de máquinaAtoMFAtoMFmachine learningQSARQSARquantum chemistryquímica quânticaO crescimento exponencial de dados de química quântica e os avanços em capacidade computacional impulsionam o desenvolvimento de métodos de análise estatisticamente embasados, capazes de superar as limitações dos métodos tradicionais, como subjetividade e falta de reprodutibilidade. Nesta tese, propõe-se a criação de métodos baseados em descritores AtoMF (Atomic to Molecular Featurization), desenvolvidos para representar propriedades atômicas em moleculares, empregando técnicas do campo da relação quantitativa estrutura-atividade (QSAR) para identificar tendências relevantes em nanoclusters. Modelos de regressão linear parcial (PLS) e ordinária (OLS), bem como redes neurais artificiais, foram testados, com seleção de descritores realizada tanto por filtros estatísticos quanto por algoritmos genéticos (OLS+GA). A confiabilidade dos coeficientes interpretados foi verificada por meio de análise de bootstrap. Apesar da multicolinearidade observada nos descritores AtoMF, foi possível estabelecer relações matemáticas robustas e interpretações químicas significativas. Os modelos indicaram tendências importantes dos materiais, corroborando conhecimentos prévios com maior evidência estatística. Os resultados mostraram que os modelos PLS apresentaram melhor desempenho para dois conjuntos de dados, enquanto o OLS+GA foi mais eficaz em outro, destacando a relevância de múltiplas abordagens metodológicas. Redes neurais artificiais também foram testadas, mas não apresentaram bom desempenho preditivo. Foram observadas limitações, como superajuste em alguns modelos, inconsistência nos resultados das redes neurais e dificuldades de interpretabilidade em determinados descritores AtoMFs. O conjunto de ferramentas empregado permitiu investigar, de forma objetiva, a relação entre propriedades atômicas e propriedades-alvo dos materiais, mostrando-se promissor para otimizar a descoberta de novos materiais e aprofundar a compreensão de propriedades em função das estruturas em nível atômico. As metodologias desenvolvidas estão sendo disponibilizadas como pacotes de código aberto, visando facilitar o acesso e a reprodutibilidade dos resultados, incentivando seu uso em futuras investigações em química computacional e ciência dos materiais. São também apresentadas sugestões para estudos futuros que explorem e expandam o uso dos descritores AtoMF.The exponential growth of quantum chemistry data and advances in computational capacity are driving the development of statistically grounded analytical methods capable of overcoming the limitations of traditional approaches, such as subjectivity and lack of reproducibility. In this thesis, new methods based on AtoMF (Atomic to Molecular Featurization) descriptors - developed to represent atomic and molecular propertiesare proposed, employing techniques from the field of quantitative structure-activity relationship (QSAR) to identify relevant trends in nanoclusters. Partial Least Squares (PLS) and Ordinary Least Squares (OLS) regression models, as well as artificial neural networks, were tested, with descriptor selection performed using both statistical filters and genetic algorithms (OLS+GA). The reliability of the interpreted coefficients was verified by bootstrap analysis. Despite the multicollinearity observed among the AtoMF descriptors, it was possible to establish robust mathematical relationships and significant chemical interpretations. The models indicated important material trends, corroborating previous knowledge with greater statistical evidence. The results showed that the PLS models performed better for two data sets, while the OLS+GA approach was more effective in another, highlighting the relevance of multiple methodological strategies. Artificial neural networks were also tested but did not demonstrate good predictive performance. Limitations were observed, such as overfitting in some models, inconsistency in the neural network results, and difficulties in interpreting certain AtoMF descriptors. The set of tools employed allowed for an objective investigation of the relationship between atomic properties and target material properties, proving to be promising for optimizing the discovery of new materials and deepening the understanding of properties as a function of atomic-level structures. The developed methodologies are being made available as open-source packages, aiming to facilitate access and reproducibility of the results, thus encouraging their use in future research in computational chemistry and materials science. Suggestions for future studies that explore and expand the use of AtoMF descriptors are also presented.Biblioteca Digitais de Teses e Dissertações da USPSilva, Albérico Borges Ferreira daMucelini, Johnatan2025-09-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/75/75134/tde-26112025-152937/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-11-27T16:30:02Zoai:teses.usp.br:tde-26112025-152937Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-11-27T16:30:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade Interpreting quantum chemistry data through AtoMF descriptors and quantitative structure-activity relationship methods |
| title |
Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade |
| spellingShingle |
Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade Mucelini, Johnatan aprendizado de máquina AtoMF AtoMF machine learning QSAR QSAR quantum chemistry química quântica |
| title_short |
Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade |
| title_full |
Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade |
| title_fullStr |
Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade |
| title_full_unstemmed |
Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade |
| title_sort |
Interpretando dados de química quântica através de descritores AtoMF e métodos de relações quantitativas estrutura-atividade |
| author |
Mucelini, Johnatan |
| author_facet |
Mucelini, Johnatan |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Silva, Albérico Borges Ferreira da |
| dc.contributor.author.fl_str_mv |
Mucelini, Johnatan |
| dc.subject.por.fl_str_mv |
aprendizado de máquina AtoMF AtoMF machine learning QSAR QSAR quantum chemistry química quântica |
| topic |
aprendizado de máquina AtoMF AtoMF machine learning QSAR QSAR quantum chemistry química quântica |
| description |
O crescimento exponencial de dados de química quântica e os avanços em capacidade computacional impulsionam o desenvolvimento de métodos de análise estatisticamente embasados, capazes de superar as limitações dos métodos tradicionais, como subjetividade e falta de reprodutibilidade. Nesta tese, propõe-se a criação de métodos baseados em descritores AtoMF (Atomic to Molecular Featurization), desenvolvidos para representar propriedades atômicas em moleculares, empregando técnicas do campo da relação quantitativa estrutura-atividade (QSAR) para identificar tendências relevantes em nanoclusters. Modelos de regressão linear parcial (PLS) e ordinária (OLS), bem como redes neurais artificiais, foram testados, com seleção de descritores realizada tanto por filtros estatísticos quanto por algoritmos genéticos (OLS+GA). A confiabilidade dos coeficientes interpretados foi verificada por meio de análise de bootstrap. Apesar da multicolinearidade observada nos descritores AtoMF, foi possível estabelecer relações matemáticas robustas e interpretações químicas significativas. Os modelos indicaram tendências importantes dos materiais, corroborando conhecimentos prévios com maior evidência estatística. Os resultados mostraram que os modelos PLS apresentaram melhor desempenho para dois conjuntos de dados, enquanto o OLS+GA foi mais eficaz em outro, destacando a relevância de múltiplas abordagens metodológicas. Redes neurais artificiais também foram testadas, mas não apresentaram bom desempenho preditivo. Foram observadas limitações, como superajuste em alguns modelos, inconsistência nos resultados das redes neurais e dificuldades de interpretabilidade em determinados descritores AtoMFs. O conjunto de ferramentas empregado permitiu investigar, de forma objetiva, a relação entre propriedades atômicas e propriedades-alvo dos materiais, mostrando-se promissor para otimizar a descoberta de novos materiais e aprofundar a compreensão de propriedades em função das estruturas em nível atômico. As metodologias desenvolvidas estão sendo disponibilizadas como pacotes de código aberto, visando facilitar o acesso e a reprodutibilidade dos resultados, incentivando seu uso em futuras investigações em química computacional e ciência dos materiais. São também apresentadas sugestões para estudos futuros que explorem e expandam o uso dos descritores AtoMF. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-09-11 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/75/75134/tde-26112025-152937/ |
| url |
https://www.teses.usp.br/teses/disponiveis/75/75134/tde-26112025-152937/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865492195747823616 |