Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Silva, Marcus Gabriel da Silva e
Orientador(a): Milan, Luis Aparecido lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://hdl.handle.net/20.500.14289/21410
Resumo: Mixture models are suitable in situations where there is unobservable heterogeneity in the population. Commonly, the number of components present in the mixture is not known, one way to determine it is by using model selection criteria. In a Bayesian context, the estimation of the parameters of each component alongside the number of components is possible, several algorithms have been proposed for this end. The elescoping Sampler (TS) is a new alternative for the simultaneous estimation of the number of components and parameters in a Bayesian context. In regression analysis, the assumption of normality of observation errors is usually made. We extend this assumption by considering errors distributed according to a mixture of Skew-t distributions, thus comprising data with latent subgroups, skewness and the presence of outliers. In what follows, we present the TS and the mixture of Skew-t regressions, we investigate the parameter estimation of the regression mixture model using simulated data and fit the proposed model to a dataset comprising of baseball player salaries and measures of their in-game performance. The TS algorithm was able to recover the number of components and parameters fixed for the simulation and we see that the estimates of the regression coefficients in the regression mixture model are consistent.
id SCAR_1cb10497c9d2178c642aab7dee2856f4
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/21410
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Silva, Marcus Gabriel da Silva eMilan, Luis Aparecidohttp://lattes.cnpq.br/7435391829973844Zuanetti, Daiane Aparecidahttp://lattes.cnpq.br/8352484284929824http://lattes.cnpq.br/2759043778865023https://orcid.org/0000-0001-6466-7865https://orcid.org/0000-0003-1591-959X2025-02-19T19:07:50Z2025-02-17SILVA, Marcus Gabriel da Silva e. Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler. 2025. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21410.https://hdl.handle.net/20.500.14289/21410Mixture models are suitable in situations where there is unobservable heterogeneity in the population. Commonly, the number of components present in the mixture is not known, one way to determine it is by using model selection criteria. In a Bayesian context, the estimation of the parameters of each component alongside the number of components is possible, several algorithms have been proposed for this end. The elescoping Sampler (TS) is a new alternative for the simultaneous estimation of the number of components and parameters in a Bayesian context. In regression analysis, the assumption of normality of observation errors is usually made. We extend this assumption by considering errors distributed according to a mixture of Skew-t distributions, thus comprising data with latent subgroups, skewness and the presence of outliers. In what follows, we present the TS and the mixture of Skew-t regressions, we investigate the parameter estimation of the regression mixture model using simulated data and fit the proposed model to a dataset comprising of baseball player salaries and measures of their in-game performance. The TS algorithm was able to recover the number of components and parameters fixed for the simulation and we see that the estimates of the regression coefficients in the regression mixture model are consistent.Modelos de mistura de distribuições são adequados em situações em que existe heterogeneidade não observável na população. Comumente, o número de componentes presentes na mistura não é conhecido e uma forma de determiná-lo é fazendo o uso de medidas de seleção de modelos. Em um contexto bayesiano, a estimação dos parâmetros de cada componente em conjunto do número de componentes é possível e alguns algoritmos para tal foram propostos, sendo o Telescoping Sampler (TS) uma nova alternativa para a estimação simultânea de número de componentes e parâmetros em um contexto Bayesiano. Na análise de regressão, usualmente é feita a suposição de normalidade dos erros de observação, estendemos essa suposição considerando erros distribuídos segundo uma mistura de t de Student assimétricas, desta forma comportando dados com subgrupos latentes, assimetria e presença de outliers. No que segue, apresentamos o TS e o modelo de misturas de regressões t de Student assimétricas, investigamos a estimação de parâmetros do modelo de misturas de regressões utilizando dados simulados e ajustamos o modelo proposto em um conjunto de dados composto de salários de jogadores de baseball e medidas de sua performance durante o jogo. O algoritmo TS foi capaz de recuperar o número de componentes e parâmetros fixados para a simulação e vemos que as estimativas dos coeficientes de regressão são consistentes.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Processo nº 88887.821299/2023-00, Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)porUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarAttribution-NonCommercial 3.0 Brazilhttp://creativecommons.org/licenses/by-nc/3.0/br/info:eu-repo/semantics/openAccessCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICAAnálise de agrupamentoModelo de regressão robustoMCMCMisturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping SamplerMixture of skew-t regressions with an unknown number of components: an application of the Telescoping Samplerinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissertação revisada.pdfDissertação revisada.pdfapplication/pdf1586505https://repositorio.ufscar.br/bitstreams/de4d4cda-6ace-473c-945c-2cf2b0ddb8cd/download64efe6aaa9ec6ef6f95c873144a5c43fMD51trueAnonymousREADTEXTDissertação revisada.pdf.txtDissertação revisada.pdf.txtExtracted texttext/plain106232https://repositorio.ufscar.br/bitstreams/c8c46035-d5ed-4bec-b0a3-8cd70d7050f8/download5fee6be03a1e9a2ebd1a6684697dc0dcMD53falseAnonymousREADTHUMBNAILDissertação revisada.pdf.jpgDissertação revisada.pdf.jpgGenerated Thumbnailimage/jpeg6576https://repositorio.ufscar.br/bitstreams/3e9752c0-b74c-45a1-ae6e-962141338ce9/downloadcb0b012363f513d52ff55c01e106d471MD54falseAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81031https://repositorio.ufscar.br/bitstreams/cb4aa947-3e47-4d7d-8d88-b235d83074c6/downloadc52f457040770f3bbb040fa07ca7d1dfMD52falseAnonymousREAD20.500.14289/214102025-02-20 00:01:29.983http://creativecommons.org/licenses/by-nc/3.0/br/Attribution-NonCommercial 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/21410https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-20T03:01:29Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.none.fl_str_mv Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler
dc.title.alternative.eng.fl_str_mv Mixture of skew-t regressions with an unknown number of components: an application of the Telescoping Sampler
title Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler
spellingShingle Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler
Silva, Marcus Gabriel da Silva e
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Análise de agrupamento
Modelo de regressão robusto
MCMC
title_short Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler
title_full Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler
title_fullStr Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler
title_full_unstemmed Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler
title_sort Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler
author Silva, Marcus Gabriel da Silva e
author_facet Silva, Marcus Gabriel da Silva e
author_role author
dc.contributor.authorlattes.none.fl_str_mv http://lattes.cnpq.br/2759043778865023
dc.contributor.advisor1orcid.none.fl_str_mv https://orcid.org/0000-0001-6466-7865
dc.contributor.advisor-co1orcid.none.fl_str_mv https://orcid.org/0000-0003-1591-959X
dc.contributor.author.fl_str_mv Silva, Marcus Gabriel da Silva e
dc.contributor.advisor1.fl_str_mv Milan, Luis Aparecido
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/7435391829973844
dc.contributor.advisor-co1.fl_str_mv Zuanetti, Daiane Aparecida
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/8352484284929824
contributor_str_mv Milan, Luis Aparecido
Zuanetti, Daiane Aparecida
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
topic CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Análise de agrupamento
Modelo de regressão robusto
MCMC
dc.subject.por.fl_str_mv Análise de agrupamento
Modelo de regressão robusto
MCMC
description Mixture models are suitable in situations where there is unobservable heterogeneity in the population. Commonly, the number of components present in the mixture is not known, one way to determine it is by using model selection criteria. In a Bayesian context, the estimation of the parameters of each component alongside the number of components is possible, several algorithms have been proposed for this end. The elescoping Sampler (TS) is a new alternative for the simultaneous estimation of the number of components and parameters in a Bayesian context. In regression analysis, the assumption of normality of observation errors is usually made. We extend this assumption by considering errors distributed according to a mixture of Skew-t distributions, thus comprising data with latent subgroups, skewness and the presence of outliers. In what follows, we present the TS and the mixture of Skew-t regressions, we investigate the parameter estimation of the regression mixture model using simulated data and fit the proposed model to a dataset comprising of baseball player salaries and measures of their in-game performance. The TS algorithm was able to recover the number of components and parameters fixed for the simulation and we see that the estimates of the regression coefficients in the regression mixture model are consistent.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-02-19T19:07:50Z
dc.date.issued.fl_str_mv 2025-02-17
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Marcus Gabriel da Silva e. Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler. 2025. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21410.
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.14289/21410
identifier_str_mv SILVA, Marcus Gabriel da Silva e. Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler. 2025. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21410.
url https://hdl.handle.net/20.500.14289/21410
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial 3.0 Brazil
http://creativecommons.org/licenses/by-nc/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial 3.0 Brazil
http://creativecommons.org/licenses/by-nc/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/de4d4cda-6ace-473c-945c-2cf2b0ddb8cd/download
https://repositorio.ufscar.br/bitstreams/c8c46035-d5ed-4bec-b0a3-8cd70d7050f8/download
https://repositorio.ufscar.br/bitstreams/3e9752c0-b74c-45a1-ae6e-962141338ce9/download
https://repositorio.ufscar.br/bitstreams/cb4aa947-3e47-4d7d-8d88-b235d83074c6/download
bitstream.checksum.fl_str_mv 64efe6aaa9ec6ef6f95c873144a5c43f
5fee6be03a1e9a2ebd1a6684697dc0dc
cb0b012363f513d52ff55c01e106d471
c52f457040770f3bbb040fa07ca7d1df
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688741473615872