Modelos de regressão binária espacial bayesiana para dados desbalanceados
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de São Carlos
Câmpus São Carlos |
| Programa de Pós-Graduação: |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://hdl.handle.net/20.500.14289/22777 |
Resumo: | Binary regression models are excellent modeling approaches for dichotomous data, allowing us to relate the probability of the event of interest to the available covariates. In this type of scenario, it is common to encounter data imbalance, that is, a proportion of zeros (or ones) significantly different from ones (or zeros), which makes symmetric link functions poor alternatives when fitting the model. In this work, we propose a class of binary regression models fitted with asymmetric link functions, namely: the power and reverse power link functions. Additionally, we incorporate spatial random effects into our regression, thereby assuming that the binary data can be spatially referenced. The resulting binary regression becomes a special type of Bayesian hierarchical model whose spatial structure is modeled through a more flexible prior distribution than the standard CAR (Conditional Autoregressive) model: the G-Wishart prior distribution. Through a motivational dataset, we present an extension of the proposed spatial binary regression model. For both models, we provide simulation studies and applications to real data, as well as a Bayesian analysis for the detection of influential points. Parameter estimation is fully Bayesian, with a focus on maximizing computational efficiency during the estimation process. The performance of the models proposed herein will be assessed and compared using Bayesian diagnostic metrics and predictive quality measures. The performance of our algorithm will be evaluated through computational simulations and applications to real-world datasets. Finally, as a preliminary and motivational perspective, we present a simulation study using the DAGAR spatial model. |
| id |
SCAR_d799e1edc9ecba2f2cb4fe37c3a0eb1c |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/22777 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
|
| spelling |
Assunção, Alan da SilvaEhlers, Ricardo Sandeshttp://lattes.cnpq.br/4020997206928882http://lattes.cnpq.br/5778341551382016Ehlers , Ricardo SandesPrates, Marcos OliveiraPaez, Marina SilvaPereira, João Batista de MoraisBastos, Leonardo Soareshttp://lattes.cnpq.br/4020997206928882http://lattes.cnpq.br/7893235207392165http://lattes.cnpq.br/2476843545735678http://lattes.cnpq.br/5251604111283337http://lattes.cnpq.br/52417991214372692025-09-17T12:26:54Z2025-08-28ASSUNÇÃO, Alan da Silva. Modelos de regressão binária espacial bayesiana para dados desbalanceados. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22777.https://hdl.handle.net/20.500.14289/22777Binary regression models are excellent modeling approaches for dichotomous data, allowing us to relate the probability of the event of interest to the available covariates. In this type of scenario, it is common to encounter data imbalance, that is, a proportion of zeros (or ones) significantly different from ones (or zeros), which makes symmetric link functions poor alternatives when fitting the model. In this work, we propose a class of binary regression models fitted with asymmetric link functions, namely: the power and reverse power link functions. Additionally, we incorporate spatial random effects into our regression, thereby assuming that the binary data can be spatially referenced. The resulting binary regression becomes a special type of Bayesian hierarchical model whose spatial structure is modeled through a more flexible prior distribution than the standard CAR (Conditional Autoregressive) model: the G-Wishart prior distribution. Through a motivational dataset, we present an extension of the proposed spatial binary regression model. For both models, we provide simulation studies and applications to real data, as well as a Bayesian analysis for the detection of influential points. Parameter estimation is fully Bayesian, with a focus on maximizing computational efficiency during the estimation process. The performance of the models proposed herein will be assessed and compared using Bayesian diagnostic metrics and predictive quality measures. The performance of our algorithm will be evaluated through computational simulations and applications to real-world datasets. Finally, as a preliminary and motivational perspective, we present a simulation study using the DAGAR spatial model.Modelos de regressão binária são excelentes propostas de modelagem para dados dicotômicos, que nos permitem relacionar a probabilidade do evento de interesse com as covariáveis disponíveis. Nesse tipo de cenário, é comum a ocorrência de desbalanceamento dos dados, isto é, uma proporção de zeros (ou uns) significativamente diferente de uns ( ou zeros), fazendo com que funções de ligações simétricas não sejam boas alternativas no momento de ajustar o modelo. Neste trabalho, propomos uma classe de modelos de regressão binária ajustada com funções de ligação assimétricas, a saber: as funções de ligação potência e reversa de potência. Além disso, incrementamos efeitos aleatórios espaciais em nossa regressão, assumindo assim, que os dados binários podem ser referenciados no espaço. A regressão binária resultante torna-se um tipo especial de modelo hierárquico bayesiano cuja estrutura espacial modelamos por meio de uma distribuição a priori mais flexível que o modelo CAR (Conditional autoregressive) padrão: a distribuição a priori G-Wishart. Através de um conjunto de dados motivacionais, apresentamos uma extensão do modelo de regressão binária espacial proposto. Para ambos os modelos, fornecemos estudos de simulação e aplicação em dados reais, além de análise bayesiana de detecção de pontos influentes. A estimação dos parâmetros é feita de forma completamente bayesiana, no qual buscamos a maximização da eficiência computacional no processo de estimação. O desempenho dos modelos aqui propostos será avaliado e comparados através de métricas de diagnóstico bayesiana e qualidade preditiva. O desempenho do nosso algoritmo será avaliado através de simulações computacionais, como também, em conjunto de dados reais. Para concluir esta tese, apresentamos de forma preliminar e motivacional um estudo de simulação com o modelo espacial DAGAR.porUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessRegressão bináriaEspacialLigação assimétricaMCMCMonte Carlo HamiltonianoBinary regressionSpatialAsymmetric linkMCMCHamiltonian Monte CarloCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOSCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAOModelos de regressão binária espacial bayesiana para dados desbalanceadosBayesian spatial binary regression models for imbalanced datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALtese_alan_versao_revisada.pdftese_alan_versao_revisada.pdfapplication/pdf8772204https://repositorio.ufscar.br/bitstreams/d1218805-6885-4247-b188-ac14f712adaa/download2b341c240910e59913eae0b403a4fc46MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8906https://repositorio.ufscar.br/bitstreams/3bad7279-c198-4dc5-a23b-7bc9b17be3df/downloadfba754f0467e45ac3862bc2533fb2736MD52falseAnonymousREADTEXTtese_alan_versao_revisada.pdf.txttese_alan_versao_revisada.pdf.txtExtracted texttext/plain109127https://repositorio.ufscar.br/bitstreams/5dfd7bb5-fec4-41ab-ac4d-eb8aa78889a0/download280d16b1cf7ef0ca11f125680729cf88MD53falseAnonymousREADTHUMBNAILtese_alan_versao_revisada.pdf.jpgtese_alan_versao_revisada.pdf.jpgGenerated Thumbnailimage/jpeg6420https://repositorio.ufscar.br/bitstreams/eaf03cf5-5502-440c-878a-fdeff9a8644f/download0b8743b9db1ff3bc090c873e46bcd6d5MD54falseAnonymousREAD20.500.14289/227772025-09-18T03:12:08.539465Zhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/22777https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-09-18T03:12:08Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
| dc.title.por.fl_str_mv |
Modelos de regressão binária espacial bayesiana para dados desbalanceados |
| dc.title.alternative.eng.fl_str_mv |
Bayesian spatial binary regression models for imbalanced data |
| title |
Modelos de regressão binária espacial bayesiana para dados desbalanceados |
| spellingShingle |
Modelos de regressão binária espacial bayesiana para dados desbalanceados Assunção, Alan da Silva Regressão binária Espacial Ligação assimétrica MCMC Monte Carlo Hamiltoniano Binary regression Spatial Asymmetric link MCMC Hamiltonian Monte Carlo CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO |
| title_short |
Modelos de regressão binária espacial bayesiana para dados desbalanceados |
| title_full |
Modelos de regressão binária espacial bayesiana para dados desbalanceados |
| title_fullStr |
Modelos de regressão binária espacial bayesiana para dados desbalanceados |
| title_full_unstemmed |
Modelos de regressão binária espacial bayesiana para dados desbalanceados |
| title_sort |
Modelos de regressão binária espacial bayesiana para dados desbalanceados |
| author |
Assunção, Alan da Silva |
| author_facet |
Assunção, Alan da Silva |
| author_role |
author |
| dc.contributor.authorlattes.none.fl_str_mv |
http://lattes.cnpq.br/5778341551382016 |
| dc.contributor.referee.none.fl_str_mv |
Ehlers , Ricardo Sandes Prates, Marcos Oliveira Paez, Marina Silva Pereira, João Batista de Morais Bastos, Leonardo Soares |
| dc.contributor.refereeLattes.none.fl_str_mv |
http://lattes.cnpq.br/4020997206928882 http://lattes.cnpq.br/7893235207392165 http://lattes.cnpq.br/2476843545735678 http://lattes.cnpq.br/5251604111283337 http://lattes.cnpq.br/5241799121437269 |
| dc.contributor.author.fl_str_mv |
Assunção, Alan da Silva |
| dc.contributor.advisor1.fl_str_mv |
Ehlers, Ricardo Sandes |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/4020997206928882 |
| contributor_str_mv |
Ehlers, Ricardo Sandes |
| dc.subject.por.fl_str_mv |
Regressão binária Espacial Ligação assimétrica MCMC Monte Carlo Hamiltoniano |
| topic |
Regressão binária Espacial Ligação assimétrica MCMC Monte Carlo Hamiltoniano Binary regression Spatial Asymmetric link MCMC Hamiltonian Monte Carlo CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO |
| dc.subject.eng.fl_str_mv |
Binary regression Spatial Asymmetric link MCMC Hamiltonian Monte Carlo |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO |
| description |
Binary regression models are excellent modeling approaches for dichotomous data, allowing us to relate the probability of the event of interest to the available covariates. In this type of scenario, it is common to encounter data imbalance, that is, a proportion of zeros (or ones) significantly different from ones (or zeros), which makes symmetric link functions poor alternatives when fitting the model. In this work, we propose a class of binary regression models fitted with asymmetric link functions, namely: the power and reverse power link functions. Additionally, we incorporate spatial random effects into our regression, thereby assuming that the binary data can be spatially referenced. The resulting binary regression becomes a special type of Bayesian hierarchical model whose spatial structure is modeled through a more flexible prior distribution than the standard CAR (Conditional Autoregressive) model: the G-Wishart prior distribution. Through a motivational dataset, we present an extension of the proposed spatial binary regression model. For both models, we provide simulation studies and applications to real data, as well as a Bayesian analysis for the detection of influential points. Parameter estimation is fully Bayesian, with a focus on maximizing computational efficiency during the estimation process. The performance of the models proposed herein will be assessed and compared using Bayesian diagnostic metrics and predictive quality measures. The performance of our algorithm will be evaluated through computational simulations and applications to real-world datasets. Finally, as a preliminary and motivational perspective, we present a simulation study using the DAGAR spatial model. |
| publishDate |
2025 |
| dc.date.accessioned.fl_str_mv |
2025-09-17T12:26:54Z |
| dc.date.issued.fl_str_mv |
2025-08-28 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
ASSUNÇÃO, Alan da Silva. Modelos de regressão binária espacial bayesiana para dados desbalanceados. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22777. |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.14289/22777 |
| identifier_str_mv |
ASSUNÇÃO, Alan da Silva. Modelos de regressão binária espacial bayesiana para dados desbalanceados. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22777. |
| url |
https://hdl.handle.net/20.500.14289/22777 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.publisher.program.fl_str_mv |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/d1218805-6885-4247-b188-ac14f712adaa/download https://repositorio.ufscar.br/bitstreams/3bad7279-c198-4dc5-a23b-7bc9b17be3df/download https://repositorio.ufscar.br/bitstreams/5dfd7bb5-fec4-41ab-ac4d-eb8aa78889a0/download https://repositorio.ufscar.br/bitstreams/eaf03cf5-5502-440c-878a-fdeff9a8644f/download |
| bitstream.checksum.fl_str_mv |
2b341c240910e59913eae0b403a4fc46 fba754f0467e45ac3862bc2533fb2736 280d16b1cf7ef0ca11f125680729cf88 0b8743b9db1ff3bc090c873e46bcd6d5 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1851688903517405184 |