Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Universidade Federal de São Carlos
Câmpus São Carlos |
| Programa de Pós-Graduação: |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://hdl.handle.net/20.500.14289/22743 |
Resumo: | Context: The robust and reliable estimation of Heterogeneous Treatment Effects (HTEs) is crucial across many scientific disciplines, yet it faces significant methodological challenges including model complexity, confounding, computational burden, and rigorous evaluation practices. Objectives: This thesis aimed to advance the field of HTE estimation by developing and critically evaluating methodologies that enhance the rigor, efficiency, and practical utility of causal inference techniques. Methodological Contributions: The work presents three primary contributions: (1) An empirical validation of the importance of ablation studies for complex nonparametric causal models, specifically examining the Bayesian Causal Forest (BCF) and the role of its propensity score component; (2) The development of the Test-Informed Simulation Count Algorithm (TISCA), a principled approach for determining the necessary number of replications in simulation studies for model evaluation using statistical principles; and (3) The introduction of the Differencein-Differences Bayesian Causal Forest (DiD-BCF), a novel non-parametric estimator for robust causal inference in DiD settings, particularly effectively addressing treatment effect heterogeneity through a Parallel Trends Assumption (PTA)-based reparameterization. Principal Findings: Ablation studies revealed that the propensity score component in BCF is not essential for performance and its omission can reduce computation time by approximately 21%. TISCA was shown to provide statistically justified simulation counts, promoting efficiency and enhancing the credibility of comparative model evaluations. DiDBCF demonstrated considerably superior performance over established benchmarks and uncovering nuanced conditional treatment effects in an empirical application to U.S. minimum wage policy. Overall Conclusion and Implications: This thesis collectively champions a paradigm of increased rigor, efficiency, and nuanced understanding in HTE estimation. It provides researchers with critically evaluated insights and novel tools— ablation study advocacy, a statistically grounded simulation design algorithm, and an advanced non-parametric DiD estimator—to generate more robust, reliable, and actionable causal evidence, thereby strengthening the foundation for evidence-based decision-making across various disciplines. |
| id |
SCAR_38e29a00d91793973e62a3fe850bfcf4 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/22743 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
|
| spelling |
Gobato Souto, HugoLouzada Neto, Franciscohttp://lattes.cnpq.br/0994050156415890http://lattes.cnpq.br/6289579571895447https://orcid.org/0000-0002-7039-05722025-09-11T17:34:10Z2025-08-05GOBATO SOUTO, Hugo. Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas. 2025. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22743.https://hdl.handle.net/20.500.14289/22743Context: The robust and reliable estimation of Heterogeneous Treatment Effects (HTEs) is crucial across many scientific disciplines, yet it faces significant methodological challenges including model complexity, confounding, computational burden, and rigorous evaluation practices. Objectives: This thesis aimed to advance the field of HTE estimation by developing and critically evaluating methodologies that enhance the rigor, efficiency, and practical utility of causal inference techniques. Methodological Contributions: The work presents three primary contributions: (1) An empirical validation of the importance of ablation studies for complex nonparametric causal models, specifically examining the Bayesian Causal Forest (BCF) and the role of its propensity score component; (2) The development of the Test-Informed Simulation Count Algorithm (TISCA), a principled approach for determining the necessary number of replications in simulation studies for model evaluation using statistical principles; and (3) The introduction of the Differencein-Differences Bayesian Causal Forest (DiD-BCF), a novel non-parametric estimator for robust causal inference in DiD settings, particularly effectively addressing treatment effect heterogeneity through a Parallel Trends Assumption (PTA)-based reparameterization. Principal Findings: Ablation studies revealed that the propensity score component in BCF is not essential for performance and its omission can reduce computation time by approximately 21%. TISCA was shown to provide statistically justified simulation counts, promoting efficiency and enhancing the credibility of comparative model evaluations. DiDBCF demonstrated considerably superior performance over established benchmarks and uncovering nuanced conditional treatment effects in an empirical application to U.S. minimum wage policy. Overall Conclusion and Implications: This thesis collectively champions a paradigm of increased rigor, efficiency, and nuanced understanding in HTE estimation. It provides researchers with critically evaluated insights and novel tools— ablation study advocacy, a statistically grounded simulation design algorithm, and an advanced non-parametric DiD estimator—to generate more robust, reliable, and actionable causal evidence, thereby strengthening the foundation for evidence-based decision-making across various disciplines.Contexto: A estimação própria de Efeitos de Tratamento Heterogêneos (HTEs) é crucial em muitas disciplinas científicas, mas enfrenta desafios metodológicos significativos, incluindo complexidade do modelo, confounding e carga computacional. Objetivos: Esta tese teve como objetivo avançar o campo da estimação de HTEs, desenvolvendo e avaliando criticamente metodologias que aprimoram as técnicas e práticas de inferência causal. Contribuições Metodológicas: O trabalho apresenta três contribuições principais: (1) Uma validação empírica da importância de estudos de ablação para modelos causais nãoparamétricos complexos, examinando especificamente a Bayesian Causal Forest (BCF) e o papel de seu componente de propensity score; (2) O desenvolvimento do Test-Informed Simulation Count Algorithm (TISCA), uma abordagem para determinar o número necessário de replicações em estudos de simulação para avaliação de modelos usando princípios estatísticos; e (3) A introdução da Floresta Causal Bayesiana de Diferenças em Diferenças (DiD-BCF), um novo estimador não-paramétrico para inferência causal robusta em configurações de DiD, abordando particularmente de forma eficaz a heterogeneidade do efeito do tratamento por meio de uma reparametrização baseada na Parallel Trends Assumption (PTA). Principais Descobertas: Estudos de ablação revelaram que o componente de propensity score na BCF não é essencial para o desempenho e sua omissão pode reduzir o tempo de computação em aproximadamente 21%. O TISCA demonstrou fornecer contagens de simulação estatisticamente justificadas. O DiD-BCF demonstrou desempenho consideravelmente superior em relação aos benchmarks estabelecidos e revelou efeitos de tratamento condicionais sutis em uma aplicação empírica à política de salário mínimo dos EUA. Conclusão Geral e Implicações: Esta tese defende coletivamente um paradigma de maior rigor, eficiência e compreensão nuances na estimação de HTEs. Ela fornece aos pesquisadores insights criticamente avaliados e novas ferramentas — defesa de estudos de ablação, um algoritmo de design de simulação estatisticamente fundamentado e um estimador DiD não-paramétrico avançado — para gerar evidências causais mais robustas, confiáveis e acionáveis, fortalecendo assim a base para a tomada de decisões baseada em evidências em várias disciplinas.Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)2024/06274-088887.949149/2024-00engUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarAttribution-ShareAlike 3.0 Brazilhttp://creativecommons.org/licenses/by-sa/3.0/br/info:eu-repo/semantics/openAccessCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICAEfeitos de tratamento heterogêneosInferência causalMétodos não paramétricosEstudos de simulaçãoÁrvores BayesianasAvançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticasAdvancing robust and reliable estimation of heterogeneous treatment effects: methodological innovations and critical evaluationsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALorganized (1).pdforganized (1).pdfapplication/pdf4671424https://repositorio.ufscar.br/bitstreams/3a3fe90c-1a2f-4943-b8d0-7de3321e414c/downloadcb8b3f5b185b72a0335a3db0f0a38e14MD51trueAnonymousREADTEXTorganized (1).pdf.txtorganized (1).pdf.txtExtracted texttext/plain101569https://repositorio.ufscar.br/bitstreams/8fbc17e9-5a95-47bf-b959-e0ec3da81eb6/download82ee1d96ca929c1efcb8d2b3f9b2c5bdMD53falseAnonymousREADTHUMBNAILorganized (1).pdf.jpgorganized (1).pdf.jpgGenerated Thumbnailimage/jpeg6606https://repositorio.ufscar.br/bitstreams/d2233bd3-5e74-4aeb-8243-a7fc9c3a3c2d/download16a5ae587dc5030893ae7d967268972fMD54falseAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81161https://repositorio.ufscar.br/bitstreams/6d345036-e792-49eb-bc78-5243bef378f1/download84ecb9106b67bd4faec8d5cf76a31681MD52falseAnonymousREAD20.500.14289/227432025-09-12T03:15:28.492697Zhttp://creativecommons.org/licenses/by-sa/3.0/br/Attribution-ShareAlike 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/22743https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-09-12T03:15:28Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
| dc.title.none.fl_str_mv |
Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas |
| dc.title.alternative.eng.fl_str_mv |
Advancing robust and reliable estimation of heterogeneous treatment effects: methodological innovations and critical evaluations |
| title |
Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas |
| spellingShingle |
Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas Gobato Souto, Hugo CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA Efeitos de tratamento heterogêneos Inferência causal Métodos não paramétricos Estudos de simulação Árvores Bayesianas |
| title_short |
Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas |
| title_full |
Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas |
| title_fullStr |
Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas |
| title_full_unstemmed |
Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas |
| title_sort |
Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas |
| author |
Gobato Souto, Hugo |
| author_facet |
Gobato Souto, Hugo |
| author_role |
author |
| dc.contributor.authorlattes.none.fl_str_mv |
http://lattes.cnpq.br/6289579571895447 |
| dc.contributor.authororcid.none.fl_str_mv |
https://orcid.org/0000-0002-7039-0572 |
| dc.contributor.author.fl_str_mv |
Gobato Souto, Hugo |
| dc.contributor.advisor1.fl_str_mv |
Louzada Neto, Francisco |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/0994050156415890 |
| contributor_str_mv |
Louzada Neto, Francisco |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| topic |
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA Efeitos de tratamento heterogêneos Inferência causal Métodos não paramétricos Estudos de simulação Árvores Bayesianas |
| dc.subject.por.fl_str_mv |
Efeitos de tratamento heterogêneos Inferência causal Métodos não paramétricos Estudos de simulação Árvores Bayesianas |
| description |
Context: The robust and reliable estimation of Heterogeneous Treatment Effects (HTEs) is crucial across many scientific disciplines, yet it faces significant methodological challenges including model complexity, confounding, computational burden, and rigorous evaluation practices. Objectives: This thesis aimed to advance the field of HTE estimation by developing and critically evaluating methodologies that enhance the rigor, efficiency, and practical utility of causal inference techniques. Methodological Contributions: The work presents three primary contributions: (1) An empirical validation of the importance of ablation studies for complex nonparametric causal models, specifically examining the Bayesian Causal Forest (BCF) and the role of its propensity score component; (2) The development of the Test-Informed Simulation Count Algorithm (TISCA), a principled approach for determining the necessary number of replications in simulation studies for model evaluation using statistical principles; and (3) The introduction of the Differencein-Differences Bayesian Causal Forest (DiD-BCF), a novel non-parametric estimator for robust causal inference in DiD settings, particularly effectively addressing treatment effect heterogeneity through a Parallel Trends Assumption (PTA)-based reparameterization. Principal Findings: Ablation studies revealed that the propensity score component in BCF is not essential for performance and its omission can reduce computation time by approximately 21%. TISCA was shown to provide statistically justified simulation counts, promoting efficiency and enhancing the credibility of comparative model evaluations. DiDBCF demonstrated considerably superior performance over established benchmarks and uncovering nuanced conditional treatment effects in an empirical application to U.S. minimum wage policy. Overall Conclusion and Implications: This thesis collectively champions a paradigm of increased rigor, efficiency, and nuanced understanding in HTE estimation. It provides researchers with critically evaluated insights and novel tools— ablation study advocacy, a statistically grounded simulation design algorithm, and an advanced non-parametric DiD estimator—to generate more robust, reliable, and actionable causal evidence, thereby strengthening the foundation for evidence-based decision-making across various disciplines. |
| publishDate |
2025 |
| dc.date.accessioned.fl_str_mv |
2025-09-11T17:34:10Z |
| dc.date.issued.fl_str_mv |
2025-08-05 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
GOBATO SOUTO, Hugo. Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas. 2025. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22743. |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.14289/22743 |
| identifier_str_mv |
GOBATO SOUTO, Hugo. Avançando a estimação robusta e confiável de efeitos de tratamento heterogêneos: inovações metodológicas e avaliações críticas. 2025. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22743. |
| url |
https://hdl.handle.net/20.500.14289/22743 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
Attribution-ShareAlike 3.0 Brazil http://creativecommons.org/licenses/by-sa/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-ShareAlike 3.0 Brazil http://creativecommons.org/licenses/by-sa/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.publisher.program.fl_str_mv |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/3a3fe90c-1a2f-4943-b8d0-7de3321e414c/download https://repositorio.ufscar.br/bitstreams/8fbc17e9-5a95-47bf-b959-e0ec3da81eb6/download https://repositorio.ufscar.br/bitstreams/d2233bd3-5e74-4aeb-8243-a7fc9c3a3c2d/download https://repositorio.ufscar.br/bitstreams/6d345036-e792-49eb-bc78-5243bef378f1/download |
| bitstream.checksum.fl_str_mv |
cb8b3f5b185b72a0335a3db0f0a38e14 82ee1d96ca929c1efcb8d2b3f9b2c5bd 16a5ae587dc5030893ae7d967268972f 84ecb9106b67bd4faec8d5cf76a31681 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1851688849812488192 |