Exportação concluída — 

Modelos INGARCH log-lineares com inovações Poisson mistas

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Costa, Valdemi Nunes
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal da Paraíba
Brasil
Informática
Programa de Pós-Graduação em Modelagem Matemática e computacional
UFPB
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpb.br/jspui/handle/123456789/32860
Resumo: This work proposes a general structure for inference in modelling discrete data sets using a count time series model with INGARCH models with a log-linear structure and mixed Poisson innovations. To this end, a class of probability distributions will be used, the main objective of which is to model count data over time that present a condition of overdispersion. More specifically, the work presents two particular cases: the Inverse Gaussian Poisson log-linear distribution and the Negative Binomial log-linear distribution, which are obtained by considering cases of unobservable data that follow the Inverse Gaussian and Gamma distributions, respectively. The distributions inserted through the mean have as a common point the fact that they are members of the exponential family of distributions. The iterative maximum likelihood method will be used to estimate the model parameters using the EM algorithm. The performance of the estimators will be evaluated through simulation studies using the Monte Carlo method, considering different sample sizes to evaluate the asymptotic behaviour of these estimators.In the section on applying the proposed model to real data sets, three databases were considered for analysis: the first lists the number of hospitalisations due to alcohol abuse in the state of Paraíba, the second evaluates the same problem, but with the data presented for the state of Piauí and, finally, the database consisting of the number of cases of Campylobacter infections in the province of Quebec in Canada was evaluated, thus closing the section on applications to real data. The simulation data was tested using the two proposed extensions and the comparison model called log-linear Poisson proposed by [9], initially taking into account a graphical analysis of the behaviour of the sample, autocorrelation and partial autocorrelation, the study of simulation by means of convergence taking into account the values obtained and the observation of graphs representing a generalised view of the layout of the simulation data. Subsequently, a reflection was made on its effectiveness through information criteria and the mean square error used in the process of evaluating and choosing the best regression model to adjust the data.
id UFPB-2_3338cd41b4f96d2ad4dcb9939f1cd412
oai_identifier_str oai:repositorio.ufpb.br:123456789/32860
network_acronym_str UFPB-2
network_name_str Repositório Institucional da UFPB
repository_id_str
spelling Modelos INGARCH log-lineares com inovações Poisson mistasModelagem matemáticaSéries temporais de contagemModelos INGARCHAlgoritmo EMCount time seriesINGARCH modelsEM algorithmCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThis work proposes a general structure for inference in modelling discrete data sets using a count time series model with INGARCH models with a log-linear structure and mixed Poisson innovations. To this end, a class of probability distributions will be used, the main objective of which is to model count data over time that present a condition of overdispersion. More specifically, the work presents two particular cases: the Inverse Gaussian Poisson log-linear distribution and the Negative Binomial log-linear distribution, which are obtained by considering cases of unobservable data that follow the Inverse Gaussian and Gamma distributions, respectively. The distributions inserted through the mean have as a common point the fact that they are members of the exponential family of distributions. The iterative maximum likelihood method will be used to estimate the model parameters using the EM algorithm. The performance of the estimators will be evaluated through simulation studies using the Monte Carlo method, considering different sample sizes to evaluate the asymptotic behaviour of these estimators.In the section on applying the proposed model to real data sets, three databases were considered for analysis: the first lists the number of hospitalisations due to alcohol abuse in the state of Paraíba, the second evaluates the same problem, but with the data presented for the state of Piauí and, finally, the database consisting of the number of cases of Campylobacter infections in the province of Quebec in Canada was evaluated, thus closing the section on applications to real data. The simulation data was tested using the two proposed extensions and the comparison model called log-linear Poisson proposed by [9], initially taking into account a graphical analysis of the behaviour of the sample, autocorrelation and partial autocorrelation, the study of simulation by means of convergence taking into account the values obtained and the observation of graphs representing a generalised view of the layout of the simulation data. Subsequently, a reflection was made on its effectiveness through information criteria and the mean square error used in the process of evaluating and choosing the best regression model to adjust the data.NenhumaNeste trabalho, será proposta uma estrutura geral para inferência em modelagem de conjuntos de dados discretos, através de um modelo INGARCH de séries temporais de contagem com estrutura log linear com inovações Poisson mistas. Para tanto, será utilizada classe de distribuições de probabilidade, cujo objetivo principal é de modelar dados de contagem no tempo que apresentem condição de sobredispersão. De forma mais específica, o trabalho apresenta dois casos particulares que são as distribuições log linear Poisson Inversa Gaussiana e a distribuição log linear Binomial Negativa, que são obtidas ao considerar os casos de dados latentes que seguem as distribuições Inversa Gaussiana e Gama, respectivamente. As distribuições, inseridas através da média, têm como ponto comum o fato de serem membros da família exponencial de distribuições. Para estimar os parâmetros do modelo será utilizado o método iterativo de máxima verossimilhança por meio do algoritmo EM. A performance dos estimadores é avaliada através de estudos de simulação pelo método de Monte Carlo, considerando diferentes tamanhos amostrais para avaliar o comportamento assintótico destes estimadores. Na parte de aplicações do modelo proposto a conjuntos de dados reais, foram considerados para análise três bancos de dados: o primeiro deles lista o número de internações por abuso de álcool no estado da Paraíba, o segundo avalia a mesma problemática, porém com os dados apresentados para o estado do Piauí e, por fim, foi avaliado o banco de dados composto pelo número de casos de infecções por Campilobactéria na província de Quebec no Canadá, fechando assim a parte de aplicações a dados reais. Os dados de simulação foram testados nas duas extensões propostas e no modelo de comparação denominado log linear Poisson proposto por [9], levando em conta de início, uma análise gráfica para o comportamento da amostra, a autocorrelação e autocorrelação parcial, o estudo de simulação por meio de convergência levando em conta os valores obtidos e a observação de gráficos que representam uma visão generalizada da disposição dos dados de simulação. Posteriormente foi feita uma reflexão sobre sua eficácia através de critérios de informação e do erro quadrático médio usados no processo de avaliação e escolha do melhor modelo de regressão para o ajuste dos dados.Universidade Federal da ParaíbaBrasilInformáticaPrograma de Pós-Graduação em Modelagem Matemática e computacionalUFPBSilva, Rodrigo Bernardo dahttp://lattes.cnpq.br/0338626517476710Marinho, Pedro Rafael Dinizhttp://lattes.cnpq.br/7185368598935272Costa, Valdemi Nunes2024-12-16T10:59:16Z2024-08-212024-12-16T10:59:16Z2024-07-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttps://repositorio.ufpb.br/jspui/handle/123456789/32860porAttribution-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPB2024-12-17T06:06:14Zoai:repositorio.ufpb.br:123456789/32860Repositório InstitucionalPUBhttps://repositorio.ufpb.br/oai/requestdiretoria@ufpb.br||bdtd@biblioteca.ufpb.bropendoar:25462024-12-17T06:06:14Repositório Institucional da UFPB - Universidade Federal da Paraíba (UFPB)false
dc.title.none.fl_str_mv Modelos INGARCH log-lineares com inovações Poisson mistas
title Modelos INGARCH log-lineares com inovações Poisson mistas
spellingShingle Modelos INGARCH log-lineares com inovações Poisson mistas
Costa, Valdemi Nunes
Modelagem matemática
Séries temporais de contagem
Modelos INGARCH
Algoritmo EM
Count time series
INGARCH models
EM algorithm
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Modelos INGARCH log-lineares com inovações Poisson mistas
title_full Modelos INGARCH log-lineares com inovações Poisson mistas
title_fullStr Modelos INGARCH log-lineares com inovações Poisson mistas
title_full_unstemmed Modelos INGARCH log-lineares com inovações Poisson mistas
title_sort Modelos INGARCH log-lineares com inovações Poisson mistas
author Costa, Valdemi Nunes
author_facet Costa, Valdemi Nunes
author_role author
dc.contributor.none.fl_str_mv Silva, Rodrigo Bernardo da
http://lattes.cnpq.br/0338626517476710
Marinho, Pedro Rafael Diniz
http://lattes.cnpq.br/7185368598935272
dc.contributor.author.fl_str_mv Costa, Valdemi Nunes
dc.subject.por.fl_str_mv Modelagem matemática
Séries temporais de contagem
Modelos INGARCH
Algoritmo EM
Count time series
INGARCH models
EM algorithm
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic Modelagem matemática
Séries temporais de contagem
Modelos INGARCH
Algoritmo EM
Count time series
INGARCH models
EM algorithm
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description This work proposes a general structure for inference in modelling discrete data sets using a count time series model with INGARCH models with a log-linear structure and mixed Poisson innovations. To this end, a class of probability distributions will be used, the main objective of which is to model count data over time that present a condition of overdispersion. More specifically, the work presents two particular cases: the Inverse Gaussian Poisson log-linear distribution and the Negative Binomial log-linear distribution, which are obtained by considering cases of unobservable data that follow the Inverse Gaussian and Gamma distributions, respectively. The distributions inserted through the mean have as a common point the fact that they are members of the exponential family of distributions. The iterative maximum likelihood method will be used to estimate the model parameters using the EM algorithm. The performance of the estimators will be evaluated through simulation studies using the Monte Carlo method, considering different sample sizes to evaluate the asymptotic behaviour of these estimators.In the section on applying the proposed model to real data sets, three databases were considered for analysis: the first lists the number of hospitalisations due to alcohol abuse in the state of Paraíba, the second evaluates the same problem, but with the data presented for the state of Piauí and, finally, the database consisting of the number of cases of Campylobacter infections in the province of Quebec in Canada was evaluated, thus closing the section on applications to real data. The simulation data was tested using the two proposed extensions and the comparison model called log-linear Poisson proposed by [9], initially taking into account a graphical analysis of the behaviour of the sample, autocorrelation and partial autocorrelation, the study of simulation by means of convergence taking into account the values obtained and the observation of graphs representing a generalised view of the layout of the simulation data. Subsequently, a reflection was made on its effectiveness through information criteria and the mean square error used in the process of evaluating and choosing the best regression model to adjust the data.
publishDate 2024
dc.date.none.fl_str_mv 2024-12-16T10:59:16Z
2024-08-21
2024-12-16T10:59:16Z
2024-07-12
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpb.br/jspui/handle/123456789/32860
url https://repositorio.ufpb.br/jspui/handle/123456789/32860
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Informática
Programa de Pós-Graduação em Modelagem Matemática e computacional
UFPB
publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Informática
Programa de Pós-Graduação em Modelagem Matemática e computacional
UFPB
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPB
instname:Universidade Federal da Paraíba (UFPB)
instacron:UFPB
instname_str Universidade Federal da Paraíba (UFPB)
instacron_str UFPB
institution UFPB
reponame_str Repositório Institucional da UFPB
collection Repositório Institucional da UFPB
repository.name.fl_str_mv Repositório Institucional da UFPB - Universidade Federal da Paraíba (UFPB)
repository.mail.fl_str_mv diretoria@ufpb.br||bdtd@biblioteca.ufpb.br
_version_ 1833923278086864896