Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Molina, Katy Rocio Cruz
Orientador(a): Tomazella, Vera Lucia Damasceno lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://hdl.handle.net/20.500.14289/22756
Resumo: Modeling unobserved heterogeneity in survival analysis traditionally relies on frailty models. However, their conventional architecture, based on continuous distributions, is often restrictive in contexts exhibiting a structural cure fraction. To address this limitation, this thesis proposes an innovative discrete frailty model based on the Hurdle Zero-Modified Generalized Poisson (HZMGP) distribution. The proposed model is distinguished by a multifaceted architecture that provides three key advantages: its discrete nature offers a natural representation of cured individuals (zero frailty); its zero-modification structure flexibly accommodates diverse patterns of zeros (inflated, deflated, or truncated); and its inclusion of a dispersion parameter captures variability arising from latent risk factors. Inference for the model was developed and validated under both frequentist and Bayesian paradigms. Extensive simulation studies in both frameworks confirmed the estimators' asymptotic properties and, crucially, demonstrated the model's flexibility to accurately capture scenarios both with and without a cure fraction. The model's utility and versatility are ultimately demonstrated through its application to two contrasting oncology datasets, validating its relevance for clinical practice. Furthermore, the Bayesian framework yielded two of the thesis's most significant contributions: a probabilistic classification rule for individual prognostic stratification, and a novel conceptual interpretation of the dispersion parameter as a statistical proxy for unobserved biological heterogeneity. These advances represent a significant contribution to the analysis of complex survival data.
id SCAR_b4d35b6854078295a466499f51f7d45d
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/22756
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Molina, Katy Rocio CruzTomazella, Vera Lucia Damascenohttp://lattes.cnpq.br/8870556978317000https://lattes.cnpq.br/8820054149005701https://orcid.org/0000-0002-2614-2336Junior, Oilson Alberto GonzattoSantos, Daiane de SouzaSilva, Danilo Alvares daMarinho, Pedro Rafael Dinizhttp://lattes.cnpq.br/7365405141909374http://lattes.cnpq.br/0929922667210546http://lattes.cnpq.br/6725871336446527http://lattes.cnpq.br/71853685989352722025-09-15T18:25:27Z2025-08-11MOLINA, Katy Rocio Cruz. Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22756.https://hdl.handle.net/20.500.14289/22756Modeling unobserved heterogeneity in survival analysis traditionally relies on frailty models. However, their conventional architecture, based on continuous distributions, is often restrictive in contexts exhibiting a structural cure fraction. To address this limitation, this thesis proposes an innovative discrete frailty model based on the Hurdle Zero-Modified Generalized Poisson (HZMGP) distribution. The proposed model is distinguished by a multifaceted architecture that provides three key advantages: its discrete nature offers a natural representation of cured individuals (zero frailty); its zero-modification structure flexibly accommodates diverse patterns of zeros (inflated, deflated, or truncated); and its inclusion of a dispersion parameter captures variability arising from latent risk factors. Inference for the model was developed and validated under both frequentist and Bayesian paradigms. Extensive simulation studies in both frameworks confirmed the estimators' asymptotic properties and, crucially, demonstrated the model's flexibility to accurately capture scenarios both with and without a cure fraction. The model's utility and versatility are ultimately demonstrated through its application to two contrasting oncology datasets, validating its relevance for clinical practice. Furthermore, the Bayesian framework yielded two of the thesis's most significant contributions: a probabilistic classification rule for individual prognostic stratification, and a novel conceptual interpretation of the dispersion parameter as a statistical proxy for unobserved biological heterogeneity. These advances represent a significant contribution to the analysis of complex survival data. A modelagem da heterogeneidade não observada em análises de sobrevivência é classicamente realizada por meio de modelos de fragilidade. No entanto, sua arquitetura tradicional, baseada em distribuições contínuas, mostra-se restritiva em contextos que exibem uma fração de cura estrutural. Neste cenário, a presente tese propõe um inovador modelo de fragilidade discreta, fundamentado na distribuição Hurdle Poisson Generalizada Zero-Modificada (HZMGP). Este modelo distingue-se por uma estrutura multifacetada: sua natureza discreta permite uma representação natural de indivíduos com fragilidade nula interpretados como individuos curados, sua capacidade de discernir diferentes padrões de zeros (inflação, deflação e truncamento); e a inclusão de um parâmetro de dispersão captura a variabilidade decorrente de fatores de risco latentes. A inferência para o modelo proposto foi estabelecida e validada sob os paradigmas frequentista e Bayesiano. Em ambos os enfoques, realizaram-se extensos estudos de simulação que confirmaram as propriedades assintóticas dos estimadores e, crucialmente, demonstraram a flexibilidade do modelo em acomodar com precisão diferentes. A potência e a versatilidade do modelo foram, por fim, ilustradas através de sua aplicação a dois conjuntos de dados oncológicos, o que valida sua relevância para a prática clínica.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)88887.750700/2022-0088881.981800/2024-0188887.111097/2025-0088887.111097/2025-00porUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessModelo de fragilidade discretaFração de curaVersão hurdleEnfoque bayesianoZero-modificaçãoCâncerDiscrete frailty modelCure rateHurdle versionBayesian approachZero-modifiedCancerCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::INFERENCIA PARAMETRICACIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOSCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAOModelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificadaModeling discrete frailty-induced survival data via the hurdle version of the zero-modified power series distributioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8906https://repositorio.ufscar.br/bitstreams/e4452123-f285-4d51-ab00-6fab3fb202ae/downloadfba754f0467e45ac3862bc2533fb2736MD52falseAnonymousREADTEXTTeseDoutorado_KatyRocioCruzMolina_UFSCar.pdf.txtTeseDoutorado_KatyRocioCruzMolina_UFSCar.pdf.txtExtracted texttext/plain104667https://repositorio.ufscar.br/bitstreams/dd63aca8-ec0f-4e09-ad9a-6d9a5acd462d/download366fbf23e5b6740ab64334e4f002cf6cMD53falseAnonymousREADTHUMBNAILTeseDoutorado_KatyRocioCruzMolina_UFSCar.pdf.jpgTeseDoutorado_KatyRocioCruzMolina_UFSCar.pdf.jpgGenerated Thumbnailimage/jpeg6610https://repositorio.ufscar.br/bitstreams/6160f2ae-95e9-41b1-a8eb-7c7ee89c23e6/download579cd77c47e757bdbbf7bdc3cb6a962bMD54falseAnonymousREADORIGINALTeseDoutorado_KatyRocioCruzMolina_UFSCar.pdfTeseDoutorado_KatyRocioCruzMolina_UFSCar.pdfapplication/pdf1512626https://repositorio.ufscar.br/bitstreams/602ecb71-3203-4788-969c-8a91b5f62eff/download1c5c4211afe308e9fe56a334b05ccc9cMD51trueAnonymousREAD20.500.14289/227562025-09-16T03:03:34.125179Zhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/22756https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-09-16T03:03:34Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada
dc.title.alternative.eng.fl_str_mv Modeling discrete frailty-induced survival data via the hurdle version of the zero-modified power series distribution
title Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada
spellingShingle Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada
Molina, Katy Rocio Cruz
Modelo de fragilidade discreta
Fração de cura
Versão hurdle
Enfoque bayesiano
Zero-modificação
Câncer
Discrete frailty model
Cure rate
Hurdle version
Bayesian approach
Zero-modified
Cancer
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::INFERENCIA PARAMETRICA
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO
title_short Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada
title_full Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada
title_fullStr Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada
title_full_unstemmed Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada
title_sort Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada
author Molina, Katy Rocio Cruz
author_facet Molina, Katy Rocio Cruz
author_role author
dc.contributor.authorlattes.none.fl_str_mv https://lattes.cnpq.br/8820054149005701
dc.contributor.authororcid.none.fl_str_mv https://orcid.org/0000-0002-2614-2336
dc.contributor.referee.none.fl_str_mv Junior, Oilson Alberto Gonzatto
Santos, Daiane de Souza
Silva, Danilo Alvares da
Marinho, Pedro Rafael Diniz
dc.contributor.refereeLattes.none.fl_str_mv http://lattes.cnpq.br/7365405141909374
http://lattes.cnpq.br/0929922667210546
http://lattes.cnpq.br/6725871336446527
http://lattes.cnpq.br/7185368598935272
dc.contributor.author.fl_str_mv Molina, Katy Rocio Cruz
dc.contributor.advisor1.fl_str_mv Tomazella, Vera Lucia Damasceno
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8870556978317000
contributor_str_mv Tomazella, Vera Lucia Damasceno
dc.subject.por.fl_str_mv Modelo de fragilidade discreta
Fração de cura
Versão hurdle
Enfoque bayesiano
Zero-modificação
Câncer
topic Modelo de fragilidade discreta
Fração de cura
Versão hurdle
Enfoque bayesiano
Zero-modificação
Câncer
Discrete frailty model
Cure rate
Hurdle version
Bayesian approach
Zero-modified
Cancer
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::INFERENCIA PARAMETRICA
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO
dc.subject.eng.fl_str_mv Discrete frailty model
Cure rate
Hurdle version
Bayesian approach
Zero-modified
Cancer
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::INFERENCIA PARAMETRICA
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO
description Modeling unobserved heterogeneity in survival analysis traditionally relies on frailty models. However, their conventional architecture, based on continuous distributions, is often restrictive in contexts exhibiting a structural cure fraction. To address this limitation, this thesis proposes an innovative discrete frailty model based on the Hurdle Zero-Modified Generalized Poisson (HZMGP) distribution. The proposed model is distinguished by a multifaceted architecture that provides three key advantages: its discrete nature offers a natural representation of cured individuals (zero frailty); its zero-modification structure flexibly accommodates diverse patterns of zeros (inflated, deflated, or truncated); and its inclusion of a dispersion parameter captures variability arising from latent risk factors. Inference for the model was developed and validated under both frequentist and Bayesian paradigms. Extensive simulation studies in both frameworks confirmed the estimators' asymptotic properties and, crucially, demonstrated the model's flexibility to accurately capture scenarios both with and without a cure fraction. The model's utility and versatility are ultimately demonstrated through its application to two contrasting oncology datasets, validating its relevance for clinical practice. Furthermore, the Bayesian framework yielded two of the thesis's most significant contributions: a probabilistic classification rule for individual prognostic stratification, and a novel conceptual interpretation of the dispersion parameter as a statistical proxy for unobserved biological heterogeneity. These advances represent a significant contribution to the analysis of complex survival data.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-09-15T18:25:27Z
dc.date.issued.fl_str_mv 2025-08-11
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv MOLINA, Katy Rocio Cruz. Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22756.
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.14289/22756
identifier_str_mv MOLINA, Katy Rocio Cruz. Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22756.
url https://hdl.handle.net/20.500.14289/22756
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/e4452123-f285-4d51-ab00-6fab3fb202ae/download
https://repositorio.ufscar.br/bitstreams/dd63aca8-ec0f-4e09-ad9a-6d9a5acd462d/download
https://repositorio.ufscar.br/bitstreams/6160f2ae-95e9-41b1-a8eb-7c7ee89c23e6/download
https://repositorio.ufscar.br/bitstreams/602ecb71-3203-4788-969c-8a91b5f62eff/download
bitstream.checksum.fl_str_mv fba754f0467e45ac3862bc2533fb2736
366fbf23e5b6740ab64334e4f002cf6c
579cd77c47e757bdbbf7bdc3cb6a962b
1c5c4211afe308e9fe56a334b05ccc9c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688795982790656