Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Dantas, Juliana Arantes
Orientador(a): Ferreira, Marco Antonio Barbosa lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa de Pós-Graduação em Química - PPGQ
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
PCA
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/20.500.14289/18840
Resumo: The approach of statistical methods capable of accurately predicting the relationship between structure and reactivity represents a major impact on the development of reactions. Recently, machine learning tools have been guided and applied in synthesis design. In the context of the work described here, these methods provide rapid information and relevant estimates about the structure and respective activity of substrates that are summarized in structural descriptors that influence the desired activity. Here we list the main results obtained in the development and use of substrate parameterization in new methodologies. In the context of nucleopalladation reactions, we highlight Wacker-type reactions that employ carbonylation reactions of non-activated double bonds by CO capture in a palladium- catalyzed process. We present two new methodologies, one of them to obtain pyrazoline ester derivatives tolerant to different substitutions in strategic positions of the starting material as demonstrated by the scoping study. As well, a new methodology for obtaining pyrazolines with a ketone moiety using boronic acids which allowed access to structural diversity ketone derivatives not previously described guided by a virtual library of boronic acids. Analysis of the electronic and steric factors into the reactivity was fundamental for understanding the nucleophilicity necessary for boronic acids in the transmetalation step. In sequence, we report our efforts to integrate data science and computational chemistry tools to guide, predict and explain the reactivity of persistent radicals generated in the reduction of cyano-arenes in the electrophilic cross-coupling between cyano(hetero)arenes and alkyl halides. The selection of substrates was made from the construction of a virtual library of cyanoarenes via projection of the chemical space by UMAP based on the dimensionality reduction of DFT level physicochemical parameters, ensuring structural diversity in relation to the chemical space. A predictive univariate model could be generated by correlating an electronic parameter with yield.
id SCAR_f68e43b94dc8c693c2bcd8a41db03297
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/18840
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Dantas, Juliana ArantesFerreira, Marco Antonio Barbosahttp://lattes.cnpq.br/6874055640224407https://lattes.cnpq.br/3791522544686206https://orcid.org/0000-0003-2473-4167https://orcid.org/0000-0002-4954-6691c8dc87e1-b2af-4ec9-a65f-62a67b205e132023-10-30T13:12:55Z2023-10-30T13:12:55Z2023-10-06DANTAS, Juliana Arantes. Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica. 2023. Tese (Doutorado em Química) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/18840.https://repositorio.ufscar.br/handle/20.500.14289/18840The approach of statistical methods capable of accurately predicting the relationship between structure and reactivity represents a major impact on the development of reactions. Recently, machine learning tools have been guided and applied in synthesis design. In the context of the work described here, these methods provide rapid information and relevant estimates about the structure and respective activity of substrates that are summarized in structural descriptors that influence the desired activity. Here we list the main results obtained in the development and use of substrate parameterization in new methodologies. In the context of nucleopalladation reactions, we highlight Wacker-type reactions that employ carbonylation reactions of non-activated double bonds by CO capture in a palladium- catalyzed process. We present two new methodologies, one of them to obtain pyrazoline ester derivatives tolerant to different substitutions in strategic positions of the starting material as demonstrated by the scoping study. As well, a new methodology for obtaining pyrazolines with a ketone moiety using boronic acids which allowed access to structural diversity ketone derivatives not previously described guided by a virtual library of boronic acids. Analysis of the electronic and steric factors into the reactivity was fundamental for understanding the nucleophilicity necessary for boronic acids in the transmetalation step. In sequence, we report our efforts to integrate data science and computational chemistry tools to guide, predict and explain the reactivity of persistent radicals generated in the reduction of cyano-arenes in the electrophilic cross-coupling between cyano(hetero)arenes and alkyl halides. The selection of substrates was made from the construction of a virtual library of cyanoarenes via projection of the chemical space by UMAP based on the dimensionality reduction of DFT level physicochemical parameters, ensuring structural diversity in relation to the chemical space. A predictive univariate model could be generated by correlating an electronic parameter with yield.A abordagem de métodos estatísticos capazes de prever com precisão a relação entre estrutura e a reatividade representa um grande impacto no desenvolvimento de reações. Recentemente, métodos de aprendizado de máquina têm sido designados e aplicados para o planejamento de caminhos sintéticos. No contexto dos trabalhos descritos, esses métodos fornecem informações rápidas e estimativas relevantes sobre a estrutura e respectiva atividade de substratos que são resumidamente identificadas em descritores estruturais que influenciam na alta reatividade. Nesse sentido, no presente trabalho apresentam-se os principais resultados obtidos no desenvolvimento e uso da parametrização de substratos na criação de novas metodologias. No contexto de reações de nucleopaladação, destacam-se as reações do tipo Wacker que empregam reações de carbonilação de ligações duplas não ativadas por captura de CO em um processo catalisado por paládio. Duas novas metodologias são apresentadas, uma delas para obter derivados pirazolina com uma porção éster tolerante a diferentes substituições em posições estratégicas do material de partida conforme demonstrado pelo estudo de escopo. Assim como, uma nova metodologia para obtenção de pirazolinas com uma porção cetona ao se utilizar ácidos borônicos permitindo o acesso a uma gama estrutural diversificada não descrita anteriormente para derivados cetona. Análises univariadas de multivariada da reatividade via métodos estatísticos dos fatores eletrônicos e estéricos foi fundamental para o entendimento da nucleofilicidade necessária para os ácidos borônicos na etapa de transmetalação. Em sequência, relata-se os esforços para integrar ferramentas de ciência de dados e química computacional para orientar, prever e explicar a reatividade dos radicais persistentes gerados na redução de ciano-arenos na metodologia desenvolvida para acoplamento cruzado eletrofílico entre ciano(hetero)arenos e haletos de alquila. A seleção de substratos foi feita a partir da construção de uma biblioteca virtual de cianoarenos via projeção do espaço químico a partir de técnicas de redução de dimensionalidade dos parâmetros físico-químicos a nível DFT, garantindo diversidade estrutural. Um modelo univariado preditivo pôde ser gerado correlacionando um parâmetro eletrônico com rendimento.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Processo nº 88882.332787/2019-01, Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)porUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Química - PPGQUFSCarAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessSíntese orgânicaCatálise por paládioRegressão linear univariada/multivariadaPCAUMAPPirazolinaCarbonilaçãoAcoplamento cruzado convencionalAcoplamento cruzado entre eletrófilosHaletos de alquila terciáriosCianopiridinaÁrvore de decisaoÁcido borônicoAprendizado de máquinaCiência de dadosMachine learningDecision treeCyanopyridineTertiary alkyl halidesPyrazolinesOrganic synthesisPalladium catalystMultivariate/univariate linear regressionCarbonylationCross couplingCross-electrophile couplingBoronic acidData scienceCIENCIAS EXATAS E DA TERRA::QUIMICA::QUIMICA ORGANICA::SINTESE ORGANICADesenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálicaDevelopment of new C-C and/or C-N coupling methodologies: merging data science and metal catalysisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis60060031144104-e78d-4438-831f-39dae3ba73cdreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALTese_Juliana_Arantes_Dantas.pdfTese_Juliana_Arantes_Dantas.pdfapplication/pdf35210357https://repositorio.ufscar.br/bitstreams/1100cef3-f61b-4f0f-9469-97928738c306/download6c819edc3d07fff080df8d33966c5a49MD54trueAnonymousREAD2023-12-01CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8913https://repositorio.ufscar.br/bitstreams/74624eed-49c0-4139-9bec-892ac82eb74e/download3185b4de2190c2d366d1d324db01f8b8MD55falseAnonymousREAD2023-12-01TEXTTese_Juliana_Arantes_Dantas.pdf.txtTese_Juliana_Arantes_Dantas.pdf.txtExtracted texttext/plain386511https://repositorio.ufscar.br/bitstreams/9497aebd-adba-4c99-a33d-3f605306b6a0/download80adbb62ffd54c2545d1223968761e36MD56falseAnonymousREAD2023-12-01THUMBNAILTese_Juliana_Arantes_Dantas.pdf.jpgTese_Juliana_Arantes_Dantas.pdf.jpgIM Thumbnailimage/jpeg9190https://repositorio.ufscar.br/bitstreams/8fdae4d3-3859-4217-80ed-36ec8d08f614/downloadf05d94436061c36af966a06f3cc3a8ceMD57falseAnonymousREAD2023-12-0120.500.14289/188402025-02-06 00:41:25.123http://creativecommons.org/licenses/by/3.0/br/Attribution 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/18840https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-06T03:41:25Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica
dc.title.alternative.eng.fl_str_mv Development of new C-C and/or C-N coupling methodologies: merging data science and metal catalysis
title Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica
spellingShingle Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica
Dantas, Juliana Arantes
Síntese orgânica
Catálise por paládio
Regressão linear univariada/multivariada
PCA
UMAP
Pirazolina
Carbonilação
Acoplamento cruzado convencional
Acoplamento cruzado entre eletrófilos
Haletos de alquila terciários
Cianopiridina
Árvore de decisao
Ácido borônico
Aprendizado de máquina
Ciência de dados
Machine learning
Decision tree
Cyanopyridine
Tertiary alkyl halides
Pyrazolines
Organic synthesis
Palladium catalyst
Multivariate/univariate linear regression
Carbonylation
Cross coupling
Cross-electrophile coupling
Boronic acid
Data science
CIENCIAS EXATAS E DA TERRA::QUIMICA::QUIMICA ORGANICA::SINTESE ORGANICA
title_short Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica
title_full Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica
title_fullStr Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica
title_full_unstemmed Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica
title_sort Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica
author Dantas, Juliana Arantes
author_facet Dantas, Juliana Arantes
author_role author
dc.contributor.authorlattes.por.fl_str_mv https://lattes.cnpq.br/3791522544686206
dc.contributor.authororcid.por.fl_str_mv https://orcid.org/0000-0003-2473-4167
dc.contributor.advisor1orcid.por.fl_str_mv https://orcid.org/0000-0002-4954-6691
dc.contributor.author.fl_str_mv Dantas, Juliana Arantes
dc.contributor.advisor1.fl_str_mv Ferreira, Marco Antonio Barbosa
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6874055640224407
dc.contributor.authorID.fl_str_mv c8dc87e1-b2af-4ec9-a65f-62a67b205e13
contributor_str_mv Ferreira, Marco Antonio Barbosa
dc.subject.por.fl_str_mv Síntese orgânica
Catálise por paládio
Regressão linear univariada/multivariada
PCA
UMAP
Pirazolina
Carbonilação
Acoplamento cruzado convencional
Acoplamento cruzado entre eletrófilos
Haletos de alquila terciários
Cianopiridina
Árvore de decisao
Ácido borônico
Aprendizado de máquina
Ciência de dados
topic Síntese orgânica
Catálise por paládio
Regressão linear univariada/multivariada
PCA
UMAP
Pirazolina
Carbonilação
Acoplamento cruzado convencional
Acoplamento cruzado entre eletrófilos
Haletos de alquila terciários
Cianopiridina
Árvore de decisao
Ácido borônico
Aprendizado de máquina
Ciência de dados
Machine learning
Decision tree
Cyanopyridine
Tertiary alkyl halides
Pyrazolines
Organic synthesis
Palladium catalyst
Multivariate/univariate linear regression
Carbonylation
Cross coupling
Cross-electrophile coupling
Boronic acid
Data science
CIENCIAS EXATAS E DA TERRA::QUIMICA::QUIMICA ORGANICA::SINTESE ORGANICA
dc.subject.eng.fl_str_mv Machine learning
Decision tree
Cyanopyridine
Tertiary alkyl halides
Pyrazolines
Organic synthesis
Palladium catalyst
Multivariate/univariate linear regression
Carbonylation
Cross coupling
Cross-electrophile coupling
Boronic acid
Data science
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::QUIMICA::QUIMICA ORGANICA::SINTESE ORGANICA
description The approach of statistical methods capable of accurately predicting the relationship between structure and reactivity represents a major impact on the development of reactions. Recently, machine learning tools have been guided and applied in synthesis design. In the context of the work described here, these methods provide rapid information and relevant estimates about the structure and respective activity of substrates that are summarized in structural descriptors that influence the desired activity. Here we list the main results obtained in the development and use of substrate parameterization in new methodologies. In the context of nucleopalladation reactions, we highlight Wacker-type reactions that employ carbonylation reactions of non-activated double bonds by CO capture in a palladium- catalyzed process. We present two new methodologies, one of them to obtain pyrazoline ester derivatives tolerant to different substitutions in strategic positions of the starting material as demonstrated by the scoping study. As well, a new methodology for obtaining pyrazolines with a ketone moiety using boronic acids which allowed access to structural diversity ketone derivatives not previously described guided by a virtual library of boronic acids. Analysis of the electronic and steric factors into the reactivity was fundamental for understanding the nucleophilicity necessary for boronic acids in the transmetalation step. In sequence, we report our efforts to integrate data science and computational chemistry tools to guide, predict and explain the reactivity of persistent radicals generated in the reduction of cyano-arenes in the electrophilic cross-coupling between cyano(hetero)arenes and alkyl halides. The selection of substrates was made from the construction of a virtual library of cyanoarenes via projection of the chemical space by UMAP based on the dimensionality reduction of DFT level physicochemical parameters, ensuring structural diversity in relation to the chemical space. A predictive univariate model could be generated by correlating an electronic parameter with yield.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-10-30T13:12:55Z
dc.date.available.fl_str_mv 2023-10-30T13:12:55Z
dc.date.issued.fl_str_mv 2023-10-06
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv DANTAS, Juliana Arantes. Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica. 2023. Tese (Doutorado em Química) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/18840.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/20.500.14289/18840
identifier_str_mv DANTAS, Juliana Arantes. Desenvolvimento de novas metodologias de acoplamento C-C e/ou C-N: mesclando ciência de dados e catálise metálica. 2023. Tese (Doutorado em Química) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/18840.
url https://repositorio.ufscar.br/handle/20.500.14289/18840
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv 600
600
dc.relation.authority.fl_str_mv 31144104-e78d-4438-831f-39dae3ba73cd
dc.rights.driver.fl_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Química - PPGQ
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/1100cef3-f61b-4f0f-9469-97928738c306/download
https://repositorio.ufscar.br/bitstreams/74624eed-49c0-4139-9bec-892ac82eb74e/download
https://repositorio.ufscar.br/bitstreams/9497aebd-adba-4c99-a33d-3f605306b6a0/download
https://repositorio.ufscar.br/bitstreams/8fdae4d3-3859-4217-80ed-36ec8d08f614/download
bitstream.checksum.fl_str_mv 6c819edc3d07fff080df8d33966c5a49
3185b4de2190c2d366d1d324db01f8b8
80adbb62ffd54c2545d1223968761e36
f05d94436061c36af966a06f3cc3a8ce
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688835527737344