Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de São Carlos
Câmpus São Carlos |
| Programa de Pós-Graduação: |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://hdl.handle.net/20.500.14289/22756 |
Resumo: | Modeling unobserved heterogeneity in survival analysis traditionally relies on frailty models. However, their conventional architecture, based on continuous distributions, is often restrictive in contexts exhibiting a structural cure fraction. To address this limitation, this thesis proposes an innovative discrete frailty model based on the Hurdle Zero-Modified Generalized Poisson (HZMGP) distribution. The proposed model is distinguished by a multifaceted architecture that provides three key advantages: its discrete nature offers a natural representation of cured individuals (zero frailty); its zero-modification structure flexibly accommodates diverse patterns of zeros (inflated, deflated, or truncated); and its inclusion of a dispersion parameter captures variability arising from latent risk factors. Inference for the model was developed and validated under both frequentist and Bayesian paradigms. Extensive simulation studies in both frameworks confirmed the estimators' asymptotic properties and, crucially, demonstrated the model's flexibility to accurately capture scenarios both with and without a cure fraction. The model's utility and versatility are ultimately demonstrated through its application to two contrasting oncology datasets, validating its relevance for clinical practice. Furthermore, the Bayesian framework yielded two of the thesis's most significant contributions: a probabilistic classification rule for individual prognostic stratification, and a novel conceptual interpretation of the dispersion parameter as a statistical proxy for unobserved biological heterogeneity. These advances represent a significant contribution to the analysis of complex survival data. |
| id |
SCAR_b4d35b6854078295a466499f51f7d45d |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/22756 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
|
| spelling |
Molina, Katy Rocio CruzTomazella, Vera Lucia Damascenohttp://lattes.cnpq.br/8870556978317000https://lattes.cnpq.br/8820054149005701https://orcid.org/0000-0002-2614-2336Junior, Oilson Alberto GonzattoSantos, Daiane de SouzaSilva, Danilo Alvares daMarinho, Pedro Rafael Dinizhttp://lattes.cnpq.br/7365405141909374http://lattes.cnpq.br/0929922667210546http://lattes.cnpq.br/6725871336446527http://lattes.cnpq.br/71853685989352722025-09-15T18:25:27Z2025-08-11MOLINA, Katy Rocio Cruz. Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22756.https://hdl.handle.net/20.500.14289/22756Modeling unobserved heterogeneity in survival analysis traditionally relies on frailty models. However, their conventional architecture, based on continuous distributions, is often restrictive in contexts exhibiting a structural cure fraction. To address this limitation, this thesis proposes an innovative discrete frailty model based on the Hurdle Zero-Modified Generalized Poisson (HZMGP) distribution. The proposed model is distinguished by a multifaceted architecture that provides three key advantages: its discrete nature offers a natural representation of cured individuals (zero frailty); its zero-modification structure flexibly accommodates diverse patterns of zeros (inflated, deflated, or truncated); and its inclusion of a dispersion parameter captures variability arising from latent risk factors. Inference for the model was developed and validated under both frequentist and Bayesian paradigms. Extensive simulation studies in both frameworks confirmed the estimators' asymptotic properties and, crucially, demonstrated the model's flexibility to accurately capture scenarios both with and without a cure fraction. The model's utility and versatility are ultimately demonstrated through its application to two contrasting oncology datasets, validating its relevance for clinical practice. Furthermore, the Bayesian framework yielded two of the thesis's most significant contributions: a probabilistic classification rule for individual prognostic stratification, and a novel conceptual interpretation of the dispersion parameter as a statistical proxy for unobserved biological heterogeneity. These advances represent a significant contribution to the analysis of complex survival data. A modelagem da heterogeneidade não observada em análises de sobrevivência é classicamente realizada por meio de modelos de fragilidade. No entanto, sua arquitetura tradicional, baseada em distribuições contínuas, mostra-se restritiva em contextos que exibem uma fração de cura estrutural. Neste cenário, a presente tese propõe um inovador modelo de fragilidade discreta, fundamentado na distribuição Hurdle Poisson Generalizada Zero-Modificada (HZMGP). Este modelo distingue-se por uma estrutura multifacetada: sua natureza discreta permite uma representação natural de indivíduos com fragilidade nula interpretados como individuos curados, sua capacidade de discernir diferentes padrões de zeros (inflação, deflação e truncamento); e a inclusão de um parâmetro de dispersão captura a variabilidade decorrente de fatores de risco latentes. A inferência para o modelo proposto foi estabelecida e validada sob os paradigmas frequentista e Bayesiano. Em ambos os enfoques, realizaram-se extensos estudos de simulação que confirmaram as propriedades assintóticas dos estimadores e, crucialmente, demonstraram a flexibilidade do modelo em acomodar com precisão diferentes. A potência e a versatilidade do modelo foram, por fim, ilustradas através de sua aplicação a dois conjuntos de dados oncológicos, o que valida sua relevância para a prática clínica.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)88887.750700/2022-0088881.981800/2024-0188887.111097/2025-0088887.111097/2025-00porUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessModelo de fragilidade discretaFração de curaVersão hurdleEnfoque bayesianoZero-modificaçãoCâncerDiscrete frailty modelCure rateHurdle versionBayesian approachZero-modifiedCancerCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::INFERENCIA PARAMETRICACIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOSCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAOModelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificadaModeling discrete frailty-induced survival data via the hurdle version of the zero-modified power series distributioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8906https://repositorio.ufscar.br/bitstreams/e4452123-f285-4d51-ab00-6fab3fb202ae/downloadfba754f0467e45ac3862bc2533fb2736MD52falseAnonymousREADTEXTTeseDoutorado_KatyRocioCruzMolina_UFSCar.pdf.txtTeseDoutorado_KatyRocioCruzMolina_UFSCar.pdf.txtExtracted texttext/plain104667https://repositorio.ufscar.br/bitstreams/dd63aca8-ec0f-4e09-ad9a-6d9a5acd462d/download366fbf23e5b6740ab64334e4f002cf6cMD53falseAnonymousREADTHUMBNAILTeseDoutorado_KatyRocioCruzMolina_UFSCar.pdf.jpgTeseDoutorado_KatyRocioCruzMolina_UFSCar.pdf.jpgGenerated Thumbnailimage/jpeg6610https://repositorio.ufscar.br/bitstreams/6160f2ae-95e9-41b1-a8eb-7c7ee89c23e6/download579cd77c47e757bdbbf7bdc3cb6a962bMD54falseAnonymousREADORIGINALTeseDoutorado_KatyRocioCruzMolina_UFSCar.pdfTeseDoutorado_KatyRocioCruzMolina_UFSCar.pdfapplication/pdf1512626https://repositorio.ufscar.br/bitstreams/602ecb71-3203-4788-969c-8a91b5f62eff/download1c5c4211afe308e9fe56a334b05ccc9cMD51trueAnonymousREAD20.500.14289/227562025-09-16T03:03:34.125179Zhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/22756https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-09-16T03:03:34Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
| dc.title.por.fl_str_mv |
Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada |
| dc.title.alternative.eng.fl_str_mv |
Modeling discrete frailty-induced survival data via the hurdle version of the zero-modified power series distribution |
| title |
Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada |
| spellingShingle |
Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada Molina, Katy Rocio Cruz Modelo de fragilidade discreta Fração de cura Versão hurdle Enfoque bayesiano Zero-modificação Câncer Discrete frailty model Cure rate Hurdle version Bayesian approach Zero-modified Cancer CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::INFERENCIA PARAMETRICA CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO |
| title_short |
Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada |
| title_full |
Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada |
| title_fullStr |
Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada |
| title_full_unstemmed |
Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada |
| title_sort |
Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada |
| author |
Molina, Katy Rocio Cruz |
| author_facet |
Molina, Katy Rocio Cruz |
| author_role |
author |
| dc.contributor.authorlattes.none.fl_str_mv |
https://lattes.cnpq.br/8820054149005701 |
| dc.contributor.authororcid.none.fl_str_mv |
https://orcid.org/0000-0002-2614-2336 |
| dc.contributor.referee.none.fl_str_mv |
Junior, Oilson Alberto Gonzatto Santos, Daiane de Souza Silva, Danilo Alvares da Marinho, Pedro Rafael Diniz |
| dc.contributor.refereeLattes.none.fl_str_mv |
http://lattes.cnpq.br/7365405141909374 http://lattes.cnpq.br/0929922667210546 http://lattes.cnpq.br/6725871336446527 http://lattes.cnpq.br/7185368598935272 |
| dc.contributor.author.fl_str_mv |
Molina, Katy Rocio Cruz |
| dc.contributor.advisor1.fl_str_mv |
Tomazella, Vera Lucia Damasceno |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/8870556978317000 |
| contributor_str_mv |
Tomazella, Vera Lucia Damasceno |
| dc.subject.por.fl_str_mv |
Modelo de fragilidade discreta Fração de cura Versão hurdle Enfoque bayesiano Zero-modificação Câncer |
| topic |
Modelo de fragilidade discreta Fração de cura Versão hurdle Enfoque bayesiano Zero-modificação Câncer Discrete frailty model Cure rate Hurdle version Bayesian approach Zero-modified Cancer CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::INFERENCIA PARAMETRICA CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO |
| dc.subject.eng.fl_str_mv |
Discrete frailty model Cure rate Hurdle version Bayesian approach Zero-modified Cancer |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::INFERENCIA PARAMETRICA CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO |
| description |
Modeling unobserved heterogeneity in survival analysis traditionally relies on frailty models. However, their conventional architecture, based on continuous distributions, is often restrictive in contexts exhibiting a structural cure fraction. To address this limitation, this thesis proposes an innovative discrete frailty model based on the Hurdle Zero-Modified Generalized Poisson (HZMGP) distribution. The proposed model is distinguished by a multifaceted architecture that provides three key advantages: its discrete nature offers a natural representation of cured individuals (zero frailty); its zero-modification structure flexibly accommodates diverse patterns of zeros (inflated, deflated, or truncated); and its inclusion of a dispersion parameter captures variability arising from latent risk factors. Inference for the model was developed and validated under both frequentist and Bayesian paradigms. Extensive simulation studies in both frameworks confirmed the estimators' asymptotic properties and, crucially, demonstrated the model's flexibility to accurately capture scenarios both with and without a cure fraction. The model's utility and versatility are ultimately demonstrated through its application to two contrasting oncology datasets, validating its relevance for clinical practice. Furthermore, the Bayesian framework yielded two of the thesis's most significant contributions: a probabilistic classification rule for individual prognostic stratification, and a novel conceptual interpretation of the dispersion parameter as a statistical proxy for unobserved biological heterogeneity. These advances represent a significant contribution to the analysis of complex survival data. |
| publishDate |
2025 |
| dc.date.accessioned.fl_str_mv |
2025-09-15T18:25:27Z |
| dc.date.issued.fl_str_mv |
2025-08-11 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
MOLINA, Katy Rocio Cruz. Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22756. |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.14289/22756 |
| identifier_str_mv |
MOLINA, Katy Rocio Cruz. Modelagem de dados de sobrevivência induzida por fragilidade discreta via versão hurdle da distribuição série de potência zero-modificada. 2025. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22756. |
| url |
https://hdl.handle.net/20.500.14289/22756 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.publisher.program.fl_str_mv |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/e4452123-f285-4d51-ab00-6fab3fb202ae/download https://repositorio.ufscar.br/bitstreams/dd63aca8-ec0f-4e09-ad9a-6d9a5acd462d/download https://repositorio.ufscar.br/bitstreams/6160f2ae-95e9-41b1-a8eb-7c7ee89c23e6/download https://repositorio.ufscar.br/bitstreams/602ecb71-3203-4788-969c-8a91b5f62eff/download |
| bitstream.checksum.fl_str_mv |
fba754f0467e45ac3862bc2533fb2736 366fbf23e5b6740ab64334e4f002cf6c 579cd77c47e757bdbbf7bdc3cb6a962b 1c5c4211afe308e9fe56a334b05ccc9c |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1851688795982790656 |