Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Gobato Souto, Hugo
Orientador(a): Louzada Neto, Francisco lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://hdl.handle.net/20.500.14289/22743
Resumo: Context: The robust and reliable estimation of Heterogeneous Treatment Effects (HTEs) is crucial across many scientific disciplines, yet it faces significant methodological challenges including model complexity, confounding, computational burden, and rigorous evaluation practices. Objectives: This thesis aimed to advance the field of HTE estimation by developing and critically evaluating methodologies that enhance the rigor, efficiency, and practical utility of causal inference techniques. Methodological Contributions: The work presents three primary contributions: (1) An empirical validation of the importance of ablation studies for complex nonparametric causal models, specifically examining the Bayesian Causal Forest (BCF) and the role of its propensity score component; (2) The development of the Test-Informed Simulation Count Algorithm (TISCA), a principled approach for determining the necessary number of replications in simulation studies for model evaluation using statistical principles; and (3) The introduction of the Differencein-Differences Bayesian Causal Forest (DiD-BCF), a novel non-parametric estimator for robust causal inference in DiD settings, particularly effectively addressing treatment effect heterogeneity through a Parallel Trends Assumption (PTA)-based reparameterization. Principal Findings: Ablation studies revealed that the propensity score component in BCF is not essential for performance and its omission can reduce computation time by approximately 21%. TISCA was shown to provide statistically justified simulation counts, promoting efficiency and enhancing the credibility of comparative model evaluations. DiDBCF demonstrated considerably superior performance over established benchmarks and uncovering nuanced conditional treatment effects in an empirical application to U.S. minimum wage policy. Overall Conclusion and Implications: This thesis collectively champions a paradigm of increased rigor, efficiency, and nuanced understanding in HTE estimation. It provides researchers with critically evaluated insights and novel tools— ablation study advocacy, a statistically grounded simulation design algorithm, and an advanced non-parametric DiD estimator—to generate more robust, reliable, and actionable causal evidence, thereby strengthening the foundation for evidence-based decision-making across various disciplines.
id SCAR_38e29a00d91793973e62a3fe850bfcf4
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/22743
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Gobato Souto, HugoLouzada Neto, Franciscohttp://lattes.cnpq.br/0994050156415890http://lattes.cnpq.br/6289579571895447https://orcid.org/0000-0002-7039-05722025-09-11T17:34:10Z2025-08-05GOBATO SOUTO, Hugo. Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas. 2025. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22743.https://hdl.handle.net/20.500.14289/22743Context: The robust and reliable estimation of Heterogeneous Treatment Effects (HTEs) is crucial across many scientific disciplines, yet it faces significant methodological challenges including model complexity, confounding, computational burden, and rigorous evaluation practices. Objectives: This thesis aimed to advance the field of HTE estimation by developing and critically evaluating methodologies that enhance the rigor, efficiency, and practical utility of causal inference techniques. Methodological Contributions: The work presents three primary contributions: (1) An empirical validation of the importance of ablation studies for complex nonparametric causal models, specifically examining the Bayesian Causal Forest (BCF) and the role of its propensity score component; (2) The development of the Test-Informed Simulation Count Algorithm (TISCA), a principled approach for determining the necessary number of replications in simulation studies for model evaluation using statistical principles; and (3) The introduction of the Differencein-Differences Bayesian Causal Forest (DiD-BCF), a novel non-parametric estimator for robust causal inference in DiD settings, particularly effectively addressing treatment effect heterogeneity through a Parallel Trends Assumption (PTA)-based reparameterization. Principal Findings: Ablation studies revealed that the propensity score component in BCF is not essential for performance and its omission can reduce computation time by approximately 21%. TISCA was shown to provide statistically justified simulation counts, promoting efficiency and enhancing the credibility of comparative model evaluations. DiDBCF demonstrated considerably superior performance over established benchmarks and uncovering nuanced conditional treatment effects in an empirical application to U.S. minimum wage policy. Overall Conclusion and Implications: This thesis collectively champions a paradigm of increased rigor, efficiency, and nuanced understanding in HTE estimation. It provides researchers with critically evaluated insights and novel tools— ablation study advocacy, a statistically grounded simulation design algorithm, and an advanced non-parametric DiD estimator—to generate more robust, reliable, and actionable causal evidence, thereby strengthening the foundation for evidence-based decision-making across various disciplines.Contexto: A estimação própria de Efeitos de Tratamento Heterogêneos (HTEs) é crucial em muitas disciplinas científicas, mas enfrenta desafios metodológicos significativos, incluindo complexidade do modelo, confounding e carga computacional. Objetivos: Esta tese teve como objetivo avançar o campo da estimação de HTEs, desenvolvendo e avaliando criticamente metodologias que aprimoram as técnicas e práticas de inferência causal. Contribuições Metodológicas: O trabalho apresenta três contribuições principais: (1) Uma validação empírica da importância de estudos de ablação para modelos causais nãoparamétricos complexos, examinando especificamente a Bayesian Causal Forest (BCF) e o papel de seu componente de propensity score; (2) O desenvolvimento do Test-Informed Simulation Count Algorithm (TISCA), uma abordagem para determinar o número necessário de replicações em estudos de simulação para avaliação de modelos usando princípios estatísticos; e (3) A introdução da Floresta Causal Bayesiana de Diferenças em Diferenças (DiD-BCF), um novo estimador não-paramétrico para inferência causal robusta em configurações de DiD, abordando particularmente de forma eficaz a heterogeneidade do efeito do tratamento por meio de uma reparametrização baseada na Parallel Trends Assumption (PTA). Principais Descobertas: Estudos de ablação revelaram que o componente de propensity score na BCF não é essencial para o desempenho e sua omissão pode reduzir o tempo de computação em aproximadamente 21%. O TISCA demonstrou fornecer contagens de simulação estatisticamente justificadas. O DiD-BCF demonstrou desempenho consideravelmente superior em relação aos benchmarks estabelecidos e revelou efeitos de tratamento condicionais sutis em uma aplicação empírica à política de salário mínimo dos EUA. Conclusão Geral e Implicações: Esta tese defende coletivamente um paradigma de maior rigor, eficiência e compreensão nuances na estimação de HTEs. Ela fornece aos pesquisadores insights criticamente avaliados e novas ferramentas — defesa de estudos de ablação, um algoritmo de design de simulação estatisticamente fundamentado e um estimador DiD não-paramétrico avançado — para gerar evidências causais mais robustas, confiáveis e acionáveis, fortalecendo assim a base para a tomada de decisões baseada em evidências em várias disciplinas.Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)2024/06274-088887.949149/2024-00engUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarAttribution-ShareAlike 3.0 Brazilhttp://creativecommons.org/licenses/by-sa/3.0/br/info:eu-repo/semantics/openAccessCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICAEfeitos de tratamento heterogêneosInferência causalMétodos não paramétricosEstudos de simulaçãoÁrvores BayesianasAvançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticasAdvancing robust and reliable estimation of heterogeneous treatment effects: methodological innovations and critical evaluationsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALorganized (1).pdforganized (1).pdfapplication/pdf4671424https://repositorio.ufscar.br/bitstreams/3a3fe90c-1a2f-4943-b8d0-7de3321e414c/downloadcb8b3f5b185b72a0335a3db0f0a38e14MD51trueAnonymousREADTEXTorganized (1).pdf.txtorganized (1).pdf.txtExtracted texttext/plain101569https://repositorio.ufscar.br/bitstreams/8fbc17e9-5a95-47bf-b959-e0ec3da81eb6/download82ee1d96ca929c1efcb8d2b3f9b2c5bdMD53falseAnonymousREADTHUMBNAILorganized (1).pdf.jpgorganized (1).pdf.jpgGenerated Thumbnailimage/jpeg6606https://repositorio.ufscar.br/bitstreams/d2233bd3-5e74-4aeb-8243-a7fc9c3a3c2d/download16a5ae587dc5030893ae7d967268972fMD54falseAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81161https://repositorio.ufscar.br/bitstreams/6d345036-e792-49eb-bc78-5243bef378f1/download84ecb9106b67bd4faec8d5cf76a31681MD52falseAnonymousREAD20.500.14289/227432025-09-12T03:15:28.492697Zhttp://creativecommons.org/licenses/by-sa/3.0/br/Attribution-ShareAlike 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/22743https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-09-12T03:15:28Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.none.fl_str_mv Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas
dc.title.alternative.eng.fl_str_mv Advancing robust and reliable estimation of heterogeneous treatment effects: methodological innovations and critical evaluations
title Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas
spellingShingle Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas
Gobato Souto, Hugo
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Efeitos de tratamento heterogêneos
Inferência causal
Métodos não paramétricos
Estudos de simulação
Árvores Bayesianas
title_short Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas
title_full Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas
title_fullStr Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas
title_full_unstemmed Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas
title_sort Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas
author Gobato Souto, Hugo
author_facet Gobato Souto, Hugo
author_role author
dc.contributor.authorlattes.none.fl_str_mv http://lattes.cnpq.br/6289579571895447
dc.contributor.authororcid.none.fl_str_mv https://orcid.org/0000-0002-7039-0572
dc.contributor.author.fl_str_mv Gobato Souto, Hugo
dc.contributor.advisor1.fl_str_mv Louzada Neto, Francisco
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/0994050156415890
contributor_str_mv Louzada Neto, Francisco
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
topic CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Efeitos de tratamento heterogêneos
Inferência causal
Métodos não paramétricos
Estudos de simulação
Árvores Bayesianas
dc.subject.por.fl_str_mv Efeitos de tratamento heterogêneos
Inferência causal
Métodos não paramétricos
Estudos de simulação
Árvores Bayesianas
description Context: The robust and reliable estimation of Heterogeneous Treatment Effects (HTEs) is crucial across many scientific disciplines, yet it faces significant methodological challenges including model complexity, confounding, computational burden, and rigorous evaluation practices. Objectives: This thesis aimed to advance the field of HTE estimation by developing and critically evaluating methodologies that enhance the rigor, efficiency, and practical utility of causal inference techniques. Methodological Contributions: The work presents three primary contributions: (1) An empirical validation of the importance of ablation studies for complex nonparametric causal models, specifically examining the Bayesian Causal Forest (BCF) and the role of its propensity score component; (2) The development of the Test-Informed Simulation Count Algorithm (TISCA), a principled approach for determining the necessary number of replications in simulation studies for model evaluation using statistical principles; and (3) The introduction of the Differencein-Differences Bayesian Causal Forest (DiD-BCF), a novel non-parametric estimator for robust causal inference in DiD settings, particularly effectively addressing treatment effect heterogeneity through a Parallel Trends Assumption (PTA)-based reparameterization. Principal Findings: Ablation studies revealed that the propensity score component in BCF is not essential for performance and its omission can reduce computation time by approximately 21%. TISCA was shown to provide statistically justified simulation counts, promoting efficiency and enhancing the credibility of comparative model evaluations. DiDBCF demonstrated considerably superior performance over established benchmarks and uncovering nuanced conditional treatment effects in an empirical application to U.S. minimum wage policy. Overall Conclusion and Implications: This thesis collectively champions a paradigm of increased rigor, efficiency, and nuanced understanding in HTE estimation. It provides researchers with critically evaluated insights and novel tools— ablation study advocacy, a statistically grounded simulation design algorithm, and an advanced non-parametric DiD estimator—to generate more robust, reliable, and actionable causal evidence, thereby strengthening the foundation for evidence-based decision-making across various disciplines.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-09-11T17:34:10Z
dc.date.issued.fl_str_mv 2025-08-05
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv GOBATO SOUTO, Hugo. Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas. 2025. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22743.
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.14289/22743
identifier_str_mv GOBATO SOUTO, Hugo. Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas. 2025. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22743.
url https://hdl.handle.net/20.500.14289/22743
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv Attribution-ShareAlike 3.0 Brazil
http://creativecommons.org/licenses/by-sa/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-ShareAlike 3.0 Brazil
http://creativecommons.org/licenses/by-sa/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/3a3fe90c-1a2f-4943-b8d0-7de3321e414c/download
https://repositorio.ufscar.br/bitstreams/8fbc17e9-5a95-47bf-b959-e0ec3da81eb6/download
https://repositorio.ufscar.br/bitstreams/d2233bd3-5e74-4aeb-8243-a7fc9c3a3c2d/download
https://repositorio.ufscar.br/bitstreams/6d345036-e792-49eb-bc78-5243bef378f1/download
bitstream.checksum.fl_str_mv cb8b3f5b185b72a0335a3db0f0a38e14
82ee1d96ca929c1efcb8d2b3f9b2c5bd
16a5ae587dc5030893ae7d967268972f
84ecb9106b67bd4faec8d5cf76a31681
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688849812488192