Modelos de regressão binária espacial bayesiana para dados desbalanceados

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Assunção, Alan da Silva
Orientador(a): Ehlers, Ricardo Sandes lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://hdl.handle.net/20.500.14289/22777
Resumo: Binary regression models are excellent modeling approaches for dichotomous data, allowing us to relate the probability of the event of interest to the available covariates. In this type of scenario, it is common to encounter data imbalance, that is, a proportion of zeros (or ones) significantly different from ones (or zeros), which makes symmetric link functions poor alternatives when fitting the model. In this work, we propose a class of binary regression models fitted with asymmetric link functions, namely: the power and reverse power link functions. Additionally, we incorporate spatial random effects into our regression, thereby assuming that the binary data can be spatially referenced. The resulting binary regression becomes a special type of Bayesian hierarchical model whose spatial structure is modeled through a more flexible prior distribution than the standard CAR (Conditional Autoregressive) model: the G-Wishart prior distribution. Through a motivational dataset, we present an extension of the proposed spatial binary regression model. For both models, we provide simulation studies and applications to real data, as well as a Bayesian analysis for the detection of influential points. Parameter estimation is fully Bayesian, with a focus on maximizing computational efficiency during the estimation process. The performance of the models proposed herein will be assessed and compared using Bayesian diagnostic metrics and predictive quality measures. The performance of our algorithm will be evaluated through computational simulations and applications to real-world datasets. Finally, as a preliminary and motivational perspective, we present a simulation study using the DAGAR spatial model.
id SCAR_d799e1edc9ecba2f2cb4fe37c3a0eb1c
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/22777
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Assunção, Alan da SilvaEhlers, Ricardo Sandeshttp://lattes.cnpq.br/4020997206928882http://lattes.cnpq.br/5778341551382016Ehlers , Ricardo SandesPrates, Marcos OliveiraPaez, Marina SilvaPereira, João Batista de MoraisBastos, Leonardo Soareshttp://lattes.cnpq.br/4020997206928882http://lattes.cnpq.br/7893235207392165http://lattes.cnpq.br/2476843545735678http://lattes.cnpq.br/5251604111283337http://lattes.cnpq.br/52417991214372692025-09-17T12:26:54Z2025-08-28ASSUNÇÃO, Alan da Silva. Modelos de regressão binária espacial bayesiana para dados desbalanceados. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22777.https://hdl.handle.net/20.500.14289/22777Binary regression models are excellent modeling approaches for dichotomous data, allowing us to relate the probability of the event of interest to the available covariates. In this type of scenario, it is common to encounter data imbalance, that is, a proportion of zeros (or ones) significantly different from ones (or zeros), which makes symmetric link functions poor alternatives when fitting the model. In this work, we propose a class of binary regression models fitted with asymmetric link functions, namely: the power and reverse power link functions. Additionally, we incorporate spatial random effects into our regression, thereby assuming that the binary data can be spatially referenced. The resulting binary regression becomes a special type of Bayesian hierarchical model whose spatial structure is modeled through a more flexible prior distribution than the standard CAR (Conditional Autoregressive) model: the G-Wishart prior distribution. Through a motivational dataset, we present an extension of the proposed spatial binary regression model. For both models, we provide simulation studies and applications to real data, as well as a Bayesian analysis for the detection of influential points. Parameter estimation is fully Bayesian, with a focus on maximizing computational efficiency during the estimation process. The performance of the models proposed herein will be assessed and compared using Bayesian diagnostic metrics and predictive quality measures. The performance of our algorithm will be evaluated through computational simulations and applications to real-world datasets. Finally, as a preliminary and motivational perspective, we present a simulation study using the DAGAR spatial model.Modelos de regressão binária são excelentes propostas de modelagem para dados dicotômicos, que nos permitem relacionar a probabilidade do evento de interesse com as covariáveis disponíveis. Nesse tipo de cenário, é comum a ocorrência de desbalanceamento dos dados, isto é, uma proporção de zeros (ou uns) significativamente diferente de uns ( ou zeros), fazendo com que funções de ligações simétricas não sejam boas alternativas no momento de ajustar o modelo. Neste trabalho, propomos uma classe de modelos de regressão binária ajustada com funções de ligação assimétricas, a saber: as funções de ligação potência e reversa de potência. Além disso, incrementamos efeitos aleatórios espaciais em nossa regressão, assumindo assim, que os dados binários podem ser referenciados no espaço. A regressão binária resultante torna-se um tipo especial de modelo hierárquico bayesiano cuja estrutura espacial modelamos por meio de uma distribuição a priori mais flexível que o modelo CAR (Conditional autoregressive) padrão: a distribuição a priori G-Wishart. Através de um conjunto de dados motivacionais, apresentamos uma extensão do modelo de regressão binária espacial proposto. Para ambos os modelos, fornecemos estudos de simulação e aplicação em dados reais, além de análise bayesiana de detecção de pontos influentes. A estimação dos parâmetros é feita de forma completamente bayesiana, no qual buscamos a maximização da eficiência computacional no processo de estimação. O desempenho dos modelos aqui propostos será avaliado e comparados através de métricas de diagnóstico bayesiana e qualidade preditiva. O desempenho do nosso algoritmo será avaliado através de simulações computacionais, como também, em conjunto de dados reais. Para concluir esta tese, apresentamos de forma preliminar e motivacional um estudo de simulação com o modelo espacial DAGAR.porUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessRegressão bináriaEspacialLigação assimétricaMCMCMonte Carlo HamiltonianoBinary regressionSpatialAsymmetric linkMCMCHamiltonian Monte CarloCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOSCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAOModelos de regressão binária espacial bayesiana para dados desbalanceadosBayesian spatial binary regression models for imbalanced datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALtese_alan_versao_revisada.pdftese_alan_versao_revisada.pdfapplication/pdf8772204https://repositorio.ufscar.br/bitstreams/d1218805-6885-4247-b188-ac14f712adaa/download2b341c240910e59913eae0b403a4fc46MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8906https://repositorio.ufscar.br/bitstreams/3bad7279-c198-4dc5-a23b-7bc9b17be3df/downloadfba754f0467e45ac3862bc2533fb2736MD52falseAnonymousREADTEXTtese_alan_versao_revisada.pdf.txttese_alan_versao_revisada.pdf.txtExtracted texttext/plain109127https://repositorio.ufscar.br/bitstreams/5dfd7bb5-fec4-41ab-ac4d-eb8aa78889a0/download280d16b1cf7ef0ca11f125680729cf88MD53falseAnonymousREADTHUMBNAILtese_alan_versao_revisada.pdf.jpgtese_alan_versao_revisada.pdf.jpgGenerated Thumbnailimage/jpeg6420https://repositorio.ufscar.br/bitstreams/eaf03cf5-5502-440c-878a-fdeff9a8644f/download0b8743b9db1ff3bc090c873e46bcd6d5MD54falseAnonymousREAD20.500.14289/227772025-09-18T03:12:08.539465Zhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/22777https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-09-18T03:12:08Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Modelos de regressão binária espacial bayesiana para dados desbalanceados
dc.title.alternative.eng.fl_str_mv Bayesian spatial binary regression models for imbalanced data
title Modelos de regressão binária espacial bayesiana para dados desbalanceados
spellingShingle Modelos de regressão binária espacial bayesiana para dados desbalanceados
Assunção, Alan da Silva
Regressão binária
Espacial
Ligação assimétrica
MCMC
Monte Carlo Hamiltoniano
Binary regression
Spatial
Asymmetric link
MCMC
Hamiltonian Monte Carlo
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO
title_short Modelos de regressão binária espacial bayesiana para dados desbalanceados
title_full Modelos de regressão binária espacial bayesiana para dados desbalanceados
title_fullStr Modelos de regressão binária espacial bayesiana para dados desbalanceados
title_full_unstemmed Modelos de regressão binária espacial bayesiana para dados desbalanceados
title_sort Modelos de regressão binária espacial bayesiana para dados desbalanceados
author Assunção, Alan da Silva
author_facet Assunção, Alan da Silva
author_role author
dc.contributor.authorlattes.none.fl_str_mv http://lattes.cnpq.br/5778341551382016
dc.contributor.referee.none.fl_str_mv Ehlers , Ricardo Sandes
Prates, Marcos Oliveira
Paez, Marina Silva
Pereira, João Batista de Morais
Bastos, Leonardo Soares
dc.contributor.refereeLattes.none.fl_str_mv http://lattes.cnpq.br/4020997206928882
http://lattes.cnpq.br/7893235207392165
http://lattes.cnpq.br/2476843545735678
http://lattes.cnpq.br/5251604111283337
http://lattes.cnpq.br/5241799121437269
dc.contributor.author.fl_str_mv Assunção, Alan da Silva
dc.contributor.advisor1.fl_str_mv Ehlers, Ricardo Sandes
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/4020997206928882
contributor_str_mv Ehlers, Ricardo Sandes
dc.subject.por.fl_str_mv Regressão binária
Espacial
Ligação assimétrica
MCMC
Monte Carlo Hamiltoniano
topic Regressão binária
Espacial
Ligação assimétrica
MCMC
Monte Carlo Hamiltoniano
Binary regression
Spatial
Asymmetric link
MCMC
Hamiltonian Monte Carlo
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO
dc.subject.eng.fl_str_mv Binary regression
Spatial
Asymmetric link
MCMC
Hamiltonian Monte Carlo
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO
description Binary regression models are excellent modeling approaches for dichotomous data, allowing us to relate the probability of the event of interest to the available covariates. In this type of scenario, it is common to encounter data imbalance, that is, a proportion of zeros (or ones) significantly different from ones (or zeros), which makes symmetric link functions poor alternatives when fitting the model. In this work, we propose a class of binary regression models fitted with asymmetric link functions, namely: the power and reverse power link functions. Additionally, we incorporate spatial random effects into our regression, thereby assuming that the binary data can be spatially referenced. The resulting binary regression becomes a special type of Bayesian hierarchical model whose spatial structure is modeled through a more flexible prior distribution than the standard CAR (Conditional Autoregressive) model: the G-Wishart prior distribution. Through a motivational dataset, we present an extension of the proposed spatial binary regression model. For both models, we provide simulation studies and applications to real data, as well as a Bayesian analysis for the detection of influential points. Parameter estimation is fully Bayesian, with a focus on maximizing computational efficiency during the estimation process. The performance of the models proposed herein will be assessed and compared using Bayesian diagnostic metrics and predictive quality measures. The performance of our algorithm will be evaluated through computational simulations and applications to real-world datasets. Finally, as a preliminary and motivational perspective, we present a simulation study using the DAGAR spatial model.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-09-17T12:26:54Z
dc.date.issued.fl_str_mv 2025-08-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ASSUNÇÃO, Alan da Silva. Modelos de regressão binária espacial bayesiana para dados desbalanceados. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22777.
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.14289/22777
identifier_str_mv ASSUNÇÃO, Alan da Silva. Modelos de regressão binária espacial bayesiana para dados desbalanceados. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22777.
url https://hdl.handle.net/20.500.14289/22777
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/d1218805-6885-4247-b188-ac14f712adaa/download
https://repositorio.ufscar.br/bitstreams/3bad7279-c198-4dc5-a23b-7bc9b17be3df/download
https://repositorio.ufscar.br/bitstreams/5dfd7bb5-fec4-41ab-ac4d-eb8aa78889a0/download
https://repositorio.ufscar.br/bitstreams/eaf03cf5-5502-440c-878a-fdeff9a8644f/download
bitstream.checksum.fl_str_mv 2b341c240910e59913eae0b403a4fc46
fba754f0467e45ac3862bc2533fb2736
280d16b1cf7ef0ca11f125680729cf88
0b8743b9db1ff3bc090c873e46bcd6d5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688903517405184