Modelos Skellam generalizados

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Gandolfi, Marina
Orientador(a): Conceição, Katiane Silva lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/20.500.14289/20415
Resumo: In applied statistics, counting data are often observed in different areas of study. Due to the great diversity of problems that result in these types of data, it is necessary to propose new models. In this work, we propose generalizations of the Skellam distribution, whose support consists of the set formed by integers (positive and negative), aiming to also explore in the context of regression models. For the process of estimating and inferring model parameters, the classical (maximum likelihood method) and Bayesian (Markov Chain Monte Carlo) approaches were considered for comparison purposes. Specifically regarding the Bayesian approach, which was more efficient in the proposals presented here, we used a variant of the Hamiltonian Monte Carlo algorithm, which consists of reformulating Hamilton’s equations by introducing a stochastic component into the gradient equation, deriving the Stochastic Gradient Hamiltonian Monte Carlo algorithm. To illustrate the proposed models, we present the analyzes of data sets referring to two real problems (3 datasets in total): In the first problem, a set of data corresponding to observations of the weekly variation of the Ibovespa score was considered, that is, the price difference, measured in ticks (cents) of the current day in relation to the previous day, in the period between January 2000 and December 2022. The estimated values for the parameter p characterized the data set as inflated with observations -2 (ticks); In the second problem, two sets of data were considered, corresponding to the values of the differences between games won and games lost by teams in the 2022-2023 regular season of the National Basketball Association, in each conference (East and West). The selection criteria indicated the k-MS model with k = −12 as the best adjusted for the Eastern conference, while for the Western conference, the indicated value was k = −38. Given the good results, both the k-MS and the k-IS models proved to be good alternatives to explain the behavior of data with integer values.
id SCAR_ee50d91867ca208b31c4cc70f15cdfd1
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/20415
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Gandolfi, MarinaConceição, Katiane Silvahttp://lattes.cnpq.br/5789619620619667Diniz, Carlos Alberto Ribeirohttp://lattes.cnpq.br/3277371897783194https://lattes.cnpq.br/4024335871041646https://orcid.org/0000-0002-8010-7654https://orcid.org/0000-0002-2784-6845https://orcid.org/0000-0003-3464-11082024-08-22T16:42:30Z2024-08-22T16:42:30Z2024-06-24GANDOLFI, Marina. Modelos Skellam generalizados. 2024. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/20415.https://repositorio.ufscar.br/handle/20.500.14289/20415In applied statistics, counting data are often observed in different areas of study. Due to the great diversity of problems that result in these types of data, it is necessary to propose new models. In this work, we propose generalizations of the Skellam distribution, whose support consists of the set formed by integers (positive and negative), aiming to also explore in the context of regression models. For the process of estimating and inferring model parameters, the classical (maximum likelihood method) and Bayesian (Markov Chain Monte Carlo) approaches were considered for comparison purposes. Specifically regarding the Bayesian approach, which was more efficient in the proposals presented here, we used a variant of the Hamiltonian Monte Carlo algorithm, which consists of reformulating Hamilton’s equations by introducing a stochastic component into the gradient equation, deriving the Stochastic Gradient Hamiltonian Monte Carlo algorithm. To illustrate the proposed models, we present the analyzes of data sets referring to two real problems (3 datasets in total): In the first problem, a set of data corresponding to observations of the weekly variation of the Ibovespa score was considered, that is, the price difference, measured in ticks (cents) of the current day in relation to the previous day, in the period between January 2000 and December 2022. The estimated values for the parameter p characterized the data set as inflated with observations -2 (ticks); In the second problem, two sets of data were considered, corresponding to the values of the differences between games won and games lost by teams in the 2022-2023 regular season of the National Basketball Association, in each conference (East and West). The selection criteria indicated the k-MS model with k = −12 as the best adjusted for the Eastern conference, while for the Western conference, the indicated value was k = −38. Given the good results, both the k-MS and the k-IS models proved to be good alternatives to explain the behavior of data with integer values.Na estatística aplicada, frequentemente dados de contagem são observados em diferentes áreas de estudo. Devido a grande diversidade dos problemas que resultam nestes tipos dados, torna-se necessário a proposta de novos modelos. Neste trabalho, propomos generalizações da distribuição Skellam, cujo suporte consiste do conjunto formado pelos números inteiros (positivos e negativos), visando explorar também no contexto de modelos de regressão. Para o processo de estimação e inferência dos parâmetros dos modelos foram consideradas as abordagens clássica (método de máxima verossimilhança) e bayesiana (Monte Carlo em Cadeia de Markov) para fins de comparação. Especificamente sobre a abordagem bayesiana, que foi mais eficiente nas propostas aqui apresentadas, utilizamos uma variante do algoritmo Hamiltoniano Monte Carlo, que consiste na reformulação das equações de Hamilton ao introduzir uma componente estocástica na equação do gradiente, derivando o algoritmo Gradiente Estocástico Hamiltoniano Monte Carlo. Para ilustrações dos modelos propostos, apresentamos as análises de conjuntos de dados referentes a dois problemas reais (total de 3 conjuntos de dados): no primeiro problema foi considerado um conjunto de dados correspondente às observações da variação semanal da pontuação do Ibovespa, isto é, a diferença de preço, medida em ticks (centavos) do dia atual com relação ao dia anterior, no período entre janeiro de 2000 e dezembro de 2022. Os valores estimados para o parâmetro p, caracterizaram o conjunto de dados como inflacionado de observações -2 (ticks); no segundo problema, foram considerados dois conjuntos de dados, correspondentes aos valores das diferenças entre partidas ganhas e partidas perdidas pelos times na temporada regular de 2022-2023 da National Basketball Association, em cada conferência (Leste e Oeste). Os critérios de seleção indicaram para o modelo k-MS com k = −12 como o mais bem ajustado para a conferência Leste, enquanto para a conferência Oeste, o valor indicado foi k = −38. Diante dos bons resultados, tanto os modelos k-MS quanto os k-IS demonstraram ser boas alternativas para explicar o comportamento de dados com valores inteiros.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Processo nº 88887.634332/2021-00 do Programa REDE-PPGSProcesso nº 88882.427036/2019-01 do Programa DSporUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessDistribuição k-modificadaInflaçãoDeflaçãoAbordagem BayesianaGradiente Estocástico Hamiltoniano Monte Carlok-Modified distributionInflationDeflationBayesian approachStochastic Gradient Hamiltonian Monte CarloCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOSCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::INFERENCIA PARAMETRICACIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAOModelos Skellam generalizadosGeneralized Skellam modelsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARTEXTTese_MarinaGandolfi_UFSCAR.pdf.txtTese_MarinaGandolfi_UFSCAR.pdf.txtExtracted texttext/plain107977https://repositorio.ufscar.br/bitstreams/70e4cca1-069f-457f-9c19-3603791b02b7/download9aac5941a71bbcfe161230df9fa7d786MD53falseAnonymousREADTHUMBNAILTese_MarinaGandolfi_UFSCAR.pdf.jpgTese_MarinaGandolfi_UFSCAR.pdf.jpgGenerated Thumbnailimage/jpeg6261https://repositorio.ufscar.br/bitstreams/ad02bafe-3207-4a51-ad2d-f75279411afb/download985fadecdbe756034fe353f7d6101ab8MD54falseAnonymousREADORIGINALTese_MarinaGandolfi_UFSCAR.pdfTese_MarinaGandolfi_UFSCAR.pdfTese de Doutoradoapplication/pdf927003https://repositorio.ufscar.br/bitstreams/b9acfccd-8239-406f-92d7-810cb654df0f/download87247b316e4d9aab7ecc5866ed0bc7c9MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8810https://repositorio.ufscar.br/bitstreams/3c56750e-dae5-4215-be8b-5ebb5bce0ecd/downloadf337d95da1fce0a22c77480e5e9a7aecMD52falseAnonymousREAD20.500.14289/204152025-02-06 03:03:31.714http://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/20415https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-06T06:03:31Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Modelos Skellam generalizados
dc.title.alternative.eng.fl_str_mv Generalized Skellam models
title Modelos Skellam generalizados
spellingShingle Modelos Skellam generalizados
Gandolfi, Marina
Distribuição k-modificada
Inflação
Deflação
Abordagem Bayesiana
Gradiente Estocástico Hamiltoniano Monte Carlo
k-Modified distribution
Inflation
Deflation
Bayesian approach
Stochastic Gradient Hamiltonian Monte Carlo
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::INFERENCIA PARAMETRICA
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO
title_short Modelos Skellam generalizados
title_full Modelos Skellam generalizados
title_fullStr Modelos Skellam generalizados
title_full_unstemmed Modelos Skellam generalizados
title_sort Modelos Skellam generalizados
author Gandolfi, Marina
author_facet Gandolfi, Marina
author_role author
dc.contributor.authorlattes.por.fl_str_mv https://lattes.cnpq.br/4024335871041646
dc.contributor.authororcid.por.fl_str_mv https://orcid.org/0000-0002-8010-7654
dc.contributor.advisor1orcid.por.fl_str_mv https://orcid.org/0000-0002-2784-6845
dc.contributor.advisor-co1orcid.por.fl_str_mv https://orcid.org/0000-0003-3464-1108
dc.contributor.author.fl_str_mv Gandolfi, Marina
dc.contributor.advisor1.fl_str_mv Conceição, Katiane Silva
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/5789619620619667
dc.contributor.advisor-co1.fl_str_mv Diniz, Carlos Alberto Ribeiro
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/3277371897783194
contributor_str_mv Conceição, Katiane Silva
Diniz, Carlos Alberto Ribeiro
dc.subject.por.fl_str_mv Distribuição k-modificada
Inflação
Deflação
Abordagem Bayesiana
Gradiente Estocástico Hamiltoniano Monte Carlo
topic Distribuição k-modificada
Inflação
Deflação
Abordagem Bayesiana
Gradiente Estocástico Hamiltoniano Monte Carlo
k-Modified distribution
Inflation
Deflation
Bayesian approach
Stochastic Gradient Hamiltonian Monte Carlo
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::INFERENCIA PARAMETRICA
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO
dc.subject.eng.fl_str_mv k-Modified distribution
Inflation
Deflation
Bayesian approach
Stochastic Gradient Hamiltonian Monte Carlo
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOS
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::INFERENCIA PARAMETRICA
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::REGRESSAO E CORRELACAO
description In applied statistics, counting data are often observed in different areas of study. Due to the great diversity of problems that result in these types of data, it is necessary to propose new models. In this work, we propose generalizations of the Skellam distribution, whose support consists of the set formed by integers (positive and negative), aiming to also explore in the context of regression models. For the process of estimating and inferring model parameters, the classical (maximum likelihood method) and Bayesian (Markov Chain Monte Carlo) approaches were considered for comparison purposes. Specifically regarding the Bayesian approach, which was more efficient in the proposals presented here, we used a variant of the Hamiltonian Monte Carlo algorithm, which consists of reformulating Hamilton’s equations by introducing a stochastic component into the gradient equation, deriving the Stochastic Gradient Hamiltonian Monte Carlo algorithm. To illustrate the proposed models, we present the analyzes of data sets referring to two real problems (3 datasets in total): In the first problem, a set of data corresponding to observations of the weekly variation of the Ibovespa score was considered, that is, the price difference, measured in ticks (cents) of the current day in relation to the previous day, in the period between January 2000 and December 2022. The estimated values for the parameter p characterized the data set as inflated with observations -2 (ticks); In the second problem, two sets of data were considered, corresponding to the values of the differences between games won and games lost by teams in the 2022-2023 regular season of the National Basketball Association, in each conference (East and West). The selection criteria indicated the k-MS model with k = −12 as the best adjusted for the Eastern conference, while for the Western conference, the indicated value was k = −38. Given the good results, both the k-MS and the k-IS models proved to be good alternatives to explain the behavior of data with integer values.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-08-22T16:42:30Z
dc.date.available.fl_str_mv 2024-08-22T16:42:30Z
dc.date.issued.fl_str_mv 2024-06-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv GANDOLFI, Marina. Modelos Skellam generalizados. 2024. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/20415.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/20.500.14289/20415
identifier_str_mv GANDOLFI, Marina. Modelos Skellam generalizados. 2024. Tese (Doutorado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/20415.
url https://repositorio.ufscar.br/handle/20.500.14289/20415
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/70e4cca1-069f-457f-9c19-3603791b02b7/download
https://repositorio.ufscar.br/bitstreams/ad02bafe-3207-4a51-ad2d-f75279411afb/download
https://repositorio.ufscar.br/bitstreams/b9acfccd-8239-406f-92d7-810cb654df0f/download
https://repositorio.ufscar.br/bitstreams/3c56750e-dae5-4215-be8b-5ebb5bce0ecd/download
bitstream.checksum.fl_str_mv 9aac5941a71bbcfe161230df9fa7d786
985fadecdbe756034fe353f7d6101ab8
87247b316e4d9aab7ecc5866ed0bc7c9
f337d95da1fce0a22c77480e5e9a7aec
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688914803228672