Diagnóstico e seleção de modelos com resposta binária e função de ligação assimétrica

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Coelho, Fabiano Rodrigues
Orientador(a): Novelli, Cibele Maria Russo lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/20.500.14289/19371
Resumo: For binary response variables, probit and logit link functions are widely used. However, when the data is imbalanced, traditional approaches may not be suitable. In this thesis, we consider the skew-probit link function as a potential alternative for models with binary response. The parameters are estimated through a Bayesian approach using Hamiltonian Monte Carlo, and residual analysis is developed. Additionally, an extension for the case of mixed models is presented, with parameter estimation performed through numerical integration. As a practical application, we analyze two datasets. In both applications, it is possible to observe, through model selection criteria, that the skew-probit regression model is more efficient than traditional approaches. Computationally, for the fixed-effects model, we use the Stan language adapted to the R software. In the mixed case, the INLA methodology is considered. Proposals for future research are also discussed.
id SCAR_f77453b89c72635096f0a68bcb45faf8
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/19371
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Coelho, Fabiano RodriguesNovelli, Cibele Maria Russohttp://lattes.cnpq.br/1011098065426388Guzmán, Jorge Luis Bazánhttp://lattes.cnpq.br/8040998023074358http://lattes.cnpq.br/1142248575230930https://orcid.org/0000-0003-1356-02452024-02-19T12:18:38Z2024-02-19T12:18:38Z2023-12-06COELHO, Fabiano Rodrigues. Diagnóstico e seleção de modelos com resposta binária e função de ligação assimétrica. 2023. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/19371.https://repositorio.ufscar.br/handle/20.500.14289/19371For binary response variables, probit and logit link functions are widely used. However, when the data is imbalanced, traditional approaches may not be suitable. In this thesis, we consider the skew-probit link function as a potential alternative for models with binary response. The parameters are estimated through a Bayesian approach using Hamiltonian Monte Carlo, and residual analysis is developed. Additionally, an extension for the case of mixed models is presented, with parameter estimation performed through numerical integration. As a practical application, we analyze two datasets. In both applications, it is possible to observe, through model selection criteria, that the skew-probit regression model is more efficient than traditional approaches. Computationally, for the fixed-effects model, we use the Stan language adapted to the R software. In the mixed case, the INLA methodology is considered. Proposals for future research are also discussed.Para variáveis resposta binárias, as funções de ligação probito e logito são amplamente utilizadas. No entanto, quando os dados são desbalanceados, as abordagens tradicionais podem não ser adequadas. Neste trabalho é considerado a função de ligação skew-probito como uma possível alternativa para modelos com resposta binária. Os parâmetros são estimados por meio de uma abordagem bayesiana utilizando Monte Carlo Hamiltoniano, e a análise de resíduos é desenvolvida. Além disso, uma extensão para o caso de modelos mistos é apresentada, com a estimação dos parâmetros sendo realizada por meio de integração numérica. Como aplicação prática, analisamos dois conjuntos de dados. Em ambas as aplicações, é possível verificar, por meio de critérios de seleção de modelos, que o modelo skew-probito é mais eficiente do que as abordagens tradicionais. Computacionalmente, para o modelo com efeitos fixos, utilizamos a linguagem Stan adaptada ao software R. No caso misto, consideramos a metodologia INLA. Propostas para trabalhos futuros também são discutidas.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)CAPES: Código de financiamento 001porUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessAsymmetric link functionImbalanced dataMixed binary modelsResidual analysisBayesian estimationCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICADiagnóstico e seleção de modelos com resposta binária e função de ligação assimétricaDiagnostic and models selection with binary response and asymmetric link functioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8810https://repositorio.ufscar.br/bitstreams/6e05180f-7a3c-4b9f-9a35-215b0fd81472/downloadf337d95da1fce0a22c77480e5e9a7aecMD52falseAnonymousREADORIGINALTese_Final_UFSCar.pdfTese_Final_UFSCar.pdfTexto Final da Teseapplication/pdf1563579https://repositorio.ufscar.br/bitstreams/876ee060-3244-4f62-b74d-c3c7c4b3470e/downloadd43b051cc5b47c62d1e324435ddd0835MD51trueAnonymousREADTEXTTese_Final_UFSCar.pdf.txtTese_Final_UFSCar.pdf.txtExtracted texttext/plain139294https://repositorio.ufscar.br/bitstreams/e693636f-da0f-4ffc-9c23-dd1c0904e49f/download576db699cf71c138099c236c49774f81MD53falseAnonymousREADTHUMBNAILTese_Final_UFSCar.pdf.jpgTese_Final_UFSCar.pdf.jpgIM Thumbnailimage/jpeg15255https://repositorio.ufscar.br/bitstreams/c405a63b-822d-46a5-a4cf-7a11a7dffa1c/download891b56de76f36178acecf6d875ad06e2MD54falseAnonymousREAD20.500.14289/193712025-02-06 01:33:47.564http://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/19371https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-06T04:33:47Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Diagnóstico e seleção de modelos com resposta binária e função de ligação assimétrica
dc.title.alternative.eng.fl_str_mv Diagnostic and models selection with binary response and asymmetric link function
title Diagnóstico e seleção de modelos com resposta binária e função de ligação assimétrica
spellingShingle Diagnóstico e seleção de modelos com resposta binária e função de ligação assimétrica
Coelho, Fabiano Rodrigues
Asymmetric link function
Imbalanced data
Mixed binary models
Residual analysis
Bayesian estimation
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
title_short Diagnóstico e seleção de modelos com resposta binária e função de ligação assimétrica
title_full Diagnóstico e seleção de modelos com resposta binária e função de ligação assimétrica
title_fullStr Diagnóstico e seleção de modelos com resposta binária e função de ligação assimétrica
title_full_unstemmed Diagnóstico e seleção de modelos com resposta binária e função de ligação assimétrica
title_sort Diagnóstico e seleção de modelos com resposta binária e função de ligação assimétrica
author Coelho, Fabiano Rodrigues
author_facet Coelho, Fabiano Rodrigues
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/1142248575230930
dc.contributor.advisor1orcid.por.fl_str_mv https://orcid.org/0000-0003-1356-0245
dc.contributor.author.fl_str_mv Coelho, Fabiano Rodrigues
dc.contributor.advisor1.fl_str_mv Novelli, Cibele Maria Russo
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/1011098065426388
dc.contributor.advisor-co1.fl_str_mv Guzmán, Jorge Luis Bazán
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/8040998023074358
contributor_str_mv Novelli, Cibele Maria Russo
Guzmán, Jorge Luis Bazán
dc.subject.eng.fl_str_mv Asymmetric link function
Imbalanced data
Mixed binary models
Residual analysis
Bayesian estimation
topic Asymmetric link function
Imbalanced data
Mixed binary models
Residual analysis
Bayesian estimation
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
description For binary response variables, probit and logit link functions are widely used. However, when the data is imbalanced, traditional approaches may not be suitable. In this thesis, we consider the skew-probit link function as a potential alternative for models with binary response. The parameters are estimated through a Bayesian approach using Hamiltonian Monte Carlo, and residual analysis is developed. Additionally, an extension for the case of mixed models is presented, with parameter estimation performed through numerical integration. As a practical application, we analyze two datasets. In both applications, it is possible to observe, through model selection criteria, that the skew-probit regression model is more efficient than traditional approaches. Computationally, for the fixed-effects model, we use the Stan language adapted to the R software. In the mixed case, the INLA methodology is considered. Proposals for future research are also discussed.
publishDate 2023
dc.date.issued.fl_str_mv 2023-12-06
dc.date.accessioned.fl_str_mv 2024-02-19T12:18:38Z
dc.date.available.fl_str_mv 2024-02-19T12:18:38Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv COELHO, Fabiano Rodrigues. Diagnóstico e seleção de modelos com resposta binária e função de ligação assimétrica. 2023. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/19371.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/20.500.14289/19371
identifier_str_mv COELHO, Fabiano Rodrigues. Diagnóstico e seleção de modelos com resposta binária e função de ligação assimétrica. 2023. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2023. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/19371.
url https://repositorio.ufscar.br/handle/20.500.14289/19371
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/6e05180f-7a3c-4b9f-9a35-215b0fd81472/download
https://repositorio.ufscar.br/bitstreams/876ee060-3244-4f62-b74d-c3c7c4b3470e/download
https://repositorio.ufscar.br/bitstreams/e693636f-da0f-4ffc-9c23-dd1c0904e49f/download
https://repositorio.ufscar.br/bitstreams/c405a63b-822d-46a5-a4cf-7a11a7dffa1c/download
bitstream.checksum.fl_str_mv f337d95da1fce0a22c77480e5e9a7aec
d43b051cc5b47c62d1e324435ddd0835
576db699cf71c138099c236c49774f81
891b56de76f36178acecf6d875ad06e2
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688910072053760