Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de São Carlos
Câmpus São Carlos |
| Programa de Pós-Graduação: |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://hdl.handle.net/20.500.14289/21410 |
Resumo: | Mixture models are suitable in situations where there is unobservable heterogeneity in the population. Commonly, the number of components present in the mixture is not known, one way to determine it is by using model selection criteria. In a Bayesian context, the estimation of the parameters of each component alongside the number of components is possible, several algorithms have been proposed for this end. The elescoping Sampler (TS) is a new alternative for the simultaneous estimation of the number of components and parameters in a Bayesian context. In regression analysis, the assumption of normality of observation errors is usually made. We extend this assumption by considering errors distributed according to a mixture of Skew-t distributions, thus comprising data with latent subgroups, skewness and the presence of outliers. In what follows, we present the TS and the mixture of Skew-t regressions, we investigate the parameter estimation of the regression mixture model using simulated data and fit the proposed model to a dataset comprising of baseball player salaries and measures of their in-game performance. The TS algorithm was able to recover the number of components and parameters fixed for the simulation and we see that the estimates of the regression coefficients in the regression mixture model are consistent. |
| id |
SCAR_1cb10497c9d2178c642aab7dee2856f4 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/21410 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
|
| spelling |
Silva, Marcus Gabriel da Silva eMilan, Luis Aparecidohttp://lattes.cnpq.br/7435391829973844Zuanetti, Daiane Aparecidahttp://lattes.cnpq.br/8352484284929824http://lattes.cnpq.br/2759043778865023https://orcid.org/0000-0001-6466-7865https://orcid.org/0000-0003-1591-959X2025-02-19T19:07:50Z2025-02-17SILVA, Marcus Gabriel da Silva e. Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler. 2025. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21410.https://hdl.handle.net/20.500.14289/21410Mixture models are suitable in situations where there is unobservable heterogeneity in the population. Commonly, the number of components present in the mixture is not known, one way to determine it is by using model selection criteria. In a Bayesian context, the estimation of the parameters of each component alongside the number of components is possible, several algorithms have been proposed for this end. The elescoping Sampler (TS) is a new alternative for the simultaneous estimation of the number of components and parameters in a Bayesian context. In regression analysis, the assumption of normality of observation errors is usually made. We extend this assumption by considering errors distributed according to a mixture of Skew-t distributions, thus comprising data with latent subgroups, skewness and the presence of outliers. In what follows, we present the TS and the mixture of Skew-t regressions, we investigate the parameter estimation of the regression mixture model using simulated data and fit the proposed model to a dataset comprising of baseball player salaries and measures of their in-game performance. The TS algorithm was able to recover the number of components and parameters fixed for the simulation and we see that the estimates of the regression coefficients in the regression mixture model are consistent.Modelos de mistura de distribuições são adequados em situações em que existe heterogeneidade não observável na população. Comumente, o número de componentes presentes na mistura não é conhecido e uma forma de determiná-lo é fazendo o uso de medidas de seleção de modelos. Em um contexto bayesiano, a estimação dos parâmetros de cada componente em conjunto do número de componentes é possível e alguns algoritmos para tal foram propostos, sendo o Telescoping Sampler (TS) uma nova alternativa para a estimação simultânea de número de componentes e parâmetros em um contexto Bayesiano. Na análise de regressão, usualmente é feita a suposição de normalidade dos erros de observação, estendemos essa suposição considerando erros distribuídos segundo uma mistura de t de Student assimétricas, desta forma comportando dados com subgrupos latentes, assimetria e presença de outliers. No que segue, apresentamos o TS e o modelo de misturas de regressões t de Student assimétricas, investigamos a estimação de parâmetros do modelo de misturas de regressões utilizando dados simulados e ajustamos o modelo proposto em um conjunto de dados composto de salários de jogadores de baseball e medidas de sua performance durante o jogo. O algoritmo TS foi capaz de recuperar o número de componentes e parâmetros fixados para a simulação e vemos que as estimativas dos coeficientes de regressão são consistentes.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Processo nº 88887.821299/2023-00, Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)porUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarAttribution-NonCommercial 3.0 Brazilhttp://creativecommons.org/licenses/by-nc/3.0/br/info:eu-repo/semantics/openAccessCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICAAnálise de agrupamentoModelo de regressão robustoMCMCMisturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping SamplerMixture of skew-t regressions with an unknown number of components: an application of the Telescoping Samplerinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissertação revisada.pdfDissertação revisada.pdfapplication/pdf1586505https://repositorio.ufscar.br/bitstreams/de4d4cda-6ace-473c-945c-2cf2b0ddb8cd/download64efe6aaa9ec6ef6f95c873144a5c43fMD51trueAnonymousREADTEXTDissertação revisada.pdf.txtDissertação revisada.pdf.txtExtracted texttext/plain106232https://repositorio.ufscar.br/bitstreams/c8c46035-d5ed-4bec-b0a3-8cd70d7050f8/download5fee6be03a1e9a2ebd1a6684697dc0dcMD53falseAnonymousREADTHUMBNAILDissertação revisada.pdf.jpgDissertação revisada.pdf.jpgGenerated Thumbnailimage/jpeg6576https://repositorio.ufscar.br/bitstreams/3e9752c0-b74c-45a1-ae6e-962141338ce9/downloadcb0b012363f513d52ff55c01e106d471MD54falseAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81031https://repositorio.ufscar.br/bitstreams/cb4aa947-3e47-4d7d-8d88-b235d83074c6/downloadc52f457040770f3bbb040fa07ca7d1dfMD52falseAnonymousREAD20.500.14289/214102025-02-20 00:01:29.983http://creativecommons.org/licenses/by-nc/3.0/br/Attribution-NonCommercial 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/21410https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-20T03:01:29Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
| dc.title.none.fl_str_mv |
Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler |
| dc.title.alternative.eng.fl_str_mv |
Mixture of skew-t regressions with an unknown number of components: an application of the Telescoping Sampler |
| title |
Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler |
| spellingShingle |
Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler Silva, Marcus Gabriel da Silva e CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA Análise de agrupamento Modelo de regressão robusto MCMC |
| title_short |
Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler |
| title_full |
Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler |
| title_fullStr |
Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler |
| title_full_unstemmed |
Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler |
| title_sort |
Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler |
| author |
Silva, Marcus Gabriel da Silva e |
| author_facet |
Silva, Marcus Gabriel da Silva e |
| author_role |
author |
| dc.contributor.authorlattes.none.fl_str_mv |
http://lattes.cnpq.br/2759043778865023 |
| dc.contributor.advisor1orcid.none.fl_str_mv |
https://orcid.org/0000-0001-6466-7865 |
| dc.contributor.advisor-co1orcid.none.fl_str_mv |
https://orcid.org/0000-0003-1591-959X |
| dc.contributor.author.fl_str_mv |
Silva, Marcus Gabriel da Silva e |
| dc.contributor.advisor1.fl_str_mv |
Milan, Luis Aparecido |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/7435391829973844 |
| dc.contributor.advisor-co1.fl_str_mv |
Zuanetti, Daiane Aparecida |
| dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/8352484284929824 |
| contributor_str_mv |
Milan, Luis Aparecido Zuanetti, Daiane Aparecida |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| topic |
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA Análise de agrupamento Modelo de regressão robusto MCMC |
| dc.subject.por.fl_str_mv |
Análise de agrupamento Modelo de regressão robusto MCMC |
| description |
Mixture models are suitable in situations where there is unobservable heterogeneity in the population. Commonly, the number of components present in the mixture is not known, one way to determine it is by using model selection criteria. In a Bayesian context, the estimation of the parameters of each component alongside the number of components is possible, several algorithms have been proposed for this end. The elescoping Sampler (TS) is a new alternative for the simultaneous estimation of the number of components and parameters in a Bayesian context. In regression analysis, the assumption of normality of observation errors is usually made. We extend this assumption by considering errors distributed according to a mixture of Skew-t distributions, thus comprising data with latent subgroups, skewness and the presence of outliers. In what follows, we present the TS and the mixture of Skew-t regressions, we investigate the parameter estimation of the regression mixture model using simulated data and fit the proposed model to a dataset comprising of baseball player salaries and measures of their in-game performance. The TS algorithm was able to recover the number of components and parameters fixed for the simulation and we see that the estimates of the regression coefficients in the regression mixture model are consistent. |
| publishDate |
2025 |
| dc.date.accessioned.fl_str_mv |
2025-02-19T19:07:50Z |
| dc.date.issued.fl_str_mv |
2025-02-17 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
SILVA, Marcus Gabriel da Silva e. Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler. 2025. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21410. |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.14289/21410 |
| identifier_str_mv |
SILVA, Marcus Gabriel da Silva e. Misturas de regressões t de Student assimétricas com número de componentes desconhecido: uma aplicação do Telescoping Sampler. 2025. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2025. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21410. |
| url |
https://hdl.handle.net/20.500.14289/21410 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial 3.0 Brazil http://creativecommons.org/licenses/by-nc/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial 3.0 Brazil http://creativecommons.org/licenses/by-nc/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.publisher.program.fl_str_mv |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/de4d4cda-6ace-473c-945c-2cf2b0ddb8cd/download https://repositorio.ufscar.br/bitstreams/c8c46035-d5ed-4bec-b0a3-8cd70d7050f8/download https://repositorio.ufscar.br/bitstreams/3e9752c0-b74c-45a1-ae6e-962141338ce9/download https://repositorio.ufscar.br/bitstreams/cb4aa947-3e47-4d7d-8d88-b235d83074c6/download |
| bitstream.checksum.fl_str_mv |
64efe6aaa9ec6ef6f95c873144a5c43f 5fee6be03a1e9a2ebd1a6684697dc0dc cb0b012363f513d52ff55c01e106d471 c52f457040770f3bbb040fa07ca7d1df |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1851688741473615872 |