Modelos INGARCH log-lineares com inovações Poisson mistas
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal da Paraíba
Brasil Informática Programa de Pós-Graduação em Modelagem Matemática e computacional UFPB |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ufpb.br/jspui/handle/123456789/32860 |
Resumo: | This work proposes a general structure for inference in modelling discrete data sets using a count time series model with INGARCH models with a log-linear structure and mixed Poisson innovations. To this end, a class of probability distributions will be used, the main objective of which is to model count data over time that present a condition of overdispersion. More specifically, the work presents two particular cases: the Inverse Gaussian Poisson log-linear distribution and the Negative Binomial log-linear distribution, which are obtained by considering cases of unobservable data that follow the Inverse Gaussian and Gamma distributions, respectively. The distributions inserted through the mean have as a common point the fact that they are members of the exponential family of distributions. The iterative maximum likelihood method will be used to estimate the model parameters using the EM algorithm. The performance of the estimators will be evaluated through simulation studies using the Monte Carlo method, considering different sample sizes to evaluate the asymptotic behaviour of these estimators.In the section on applying the proposed model to real data sets, three databases were considered for analysis: the first lists the number of hospitalisations due to alcohol abuse in the state of Paraíba, the second evaluates the same problem, but with the data presented for the state of Piauí and, finally, the database consisting of the number of cases of Campylobacter infections in the province of Quebec in Canada was evaluated, thus closing the section on applications to real data. The simulation data was tested using the two proposed extensions and the comparison model called log-linear Poisson proposed by [9], initially taking into account a graphical analysis of the behaviour of the sample, autocorrelation and partial autocorrelation, the study of simulation by means of convergence taking into account the values obtained and the observation of graphs representing a generalised view of the layout of the simulation data. Subsequently, a reflection was made on its effectiveness through information criteria and the mean square error used in the process of evaluating and choosing the best regression model to adjust the data. |
| id |
UFPB-2_3338cd41b4f96d2ad4dcb9939f1cd412 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufpb.br:123456789/32860 |
| network_acronym_str |
UFPB-2 |
| network_name_str |
Repositório Institucional da UFPB |
| repository_id_str |
|
| spelling |
Modelos INGARCH log-lineares com inovações Poisson mistasModelagem matemáticaSéries temporais de contagemModelos INGARCHAlgoritmo EMCount time seriesINGARCH modelsEM algorithmCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThis work proposes a general structure for inference in modelling discrete data sets using a count time series model with INGARCH models with a log-linear structure and mixed Poisson innovations. To this end, a class of probability distributions will be used, the main objective of which is to model count data over time that present a condition of overdispersion. More specifically, the work presents two particular cases: the Inverse Gaussian Poisson log-linear distribution and the Negative Binomial log-linear distribution, which are obtained by considering cases of unobservable data that follow the Inverse Gaussian and Gamma distributions, respectively. The distributions inserted through the mean have as a common point the fact that they are members of the exponential family of distributions. The iterative maximum likelihood method will be used to estimate the model parameters using the EM algorithm. The performance of the estimators will be evaluated through simulation studies using the Monte Carlo method, considering different sample sizes to evaluate the asymptotic behaviour of these estimators.In the section on applying the proposed model to real data sets, three databases were considered for analysis: the first lists the number of hospitalisations due to alcohol abuse in the state of Paraíba, the second evaluates the same problem, but with the data presented for the state of Piauí and, finally, the database consisting of the number of cases of Campylobacter infections in the province of Quebec in Canada was evaluated, thus closing the section on applications to real data. The simulation data was tested using the two proposed extensions and the comparison model called log-linear Poisson proposed by [9], initially taking into account a graphical analysis of the behaviour of the sample, autocorrelation and partial autocorrelation, the study of simulation by means of convergence taking into account the values obtained and the observation of graphs representing a generalised view of the layout of the simulation data. Subsequently, a reflection was made on its effectiveness through information criteria and the mean square error used in the process of evaluating and choosing the best regression model to adjust the data.NenhumaNeste trabalho, será proposta uma estrutura geral para inferência em modelagem de conjuntos de dados discretos, através de um modelo INGARCH de séries temporais de contagem com estrutura log linear com inovações Poisson mistas. Para tanto, será utilizada classe de distribuições de probabilidade, cujo objetivo principal é de modelar dados de contagem no tempo que apresentem condição de sobredispersão. De forma mais específica, o trabalho apresenta dois casos particulares que são as distribuições log linear Poisson Inversa Gaussiana e a distribuição log linear Binomial Negativa, que são obtidas ao considerar os casos de dados latentes que seguem as distribuições Inversa Gaussiana e Gama, respectivamente. As distribuições, inseridas através da média, têm como ponto comum o fato de serem membros da família exponencial de distribuições. Para estimar os parâmetros do modelo será utilizado o método iterativo de máxima verossimilhança por meio do algoritmo EM. A performance dos estimadores é avaliada através de estudos de simulação pelo método de Monte Carlo, considerando diferentes tamanhos amostrais para avaliar o comportamento assintótico destes estimadores. Na parte de aplicações do modelo proposto a conjuntos de dados reais, foram considerados para análise três bancos de dados: o primeiro deles lista o número de internações por abuso de álcool no estado da Paraíba, o segundo avalia a mesma problemática, porém com os dados apresentados para o estado do Piauí e, por fim, foi avaliado o banco de dados composto pelo número de casos de infecções por Campilobactéria na província de Quebec no Canadá, fechando assim a parte de aplicações a dados reais. Os dados de simulação foram testados nas duas extensões propostas e no modelo de comparação denominado log linear Poisson proposto por [9], levando em conta de início, uma análise gráfica para o comportamento da amostra, a autocorrelação e autocorrelação parcial, o estudo de simulação por meio de convergência levando em conta os valores obtidos e a observação de gráficos que representam uma visão generalizada da disposição dos dados de simulação. Posteriormente foi feita uma reflexão sobre sua eficácia através de critérios de informação e do erro quadrático médio usados no processo de avaliação e escolha do melhor modelo de regressão para o ajuste dos dados.Universidade Federal da ParaíbaBrasilInformáticaPrograma de Pós-Graduação em Modelagem Matemática e computacionalUFPBSilva, Rodrigo Bernardo dahttp://lattes.cnpq.br/0338626517476710Marinho, Pedro Rafael Dinizhttp://lattes.cnpq.br/7185368598935272Costa, Valdemi Nunes2024-12-16T10:59:16Z2024-08-212024-12-16T10:59:16Z2024-07-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttps://repositorio.ufpb.br/jspui/handle/123456789/32860porAttribution-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPB2024-12-17T06:06:14Zoai:repositorio.ufpb.br:123456789/32860Repositório InstitucionalPUBhttps://repositorio.ufpb.br/oai/requestdiretoria@ufpb.br||bdtd@biblioteca.ufpb.bropendoar:25462024-12-17T06:06:14Repositório Institucional da UFPB - Universidade Federal da Paraíba (UFPB)false |
| dc.title.none.fl_str_mv |
Modelos INGARCH log-lineares com inovações Poisson mistas |
| title |
Modelos INGARCH log-lineares com inovações Poisson mistas |
| spellingShingle |
Modelos INGARCH log-lineares com inovações Poisson mistas Costa, Valdemi Nunes Modelagem matemática Séries temporais de contagem Modelos INGARCH Algoritmo EM Count time series INGARCH models EM algorithm CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| title_short |
Modelos INGARCH log-lineares com inovações Poisson mistas |
| title_full |
Modelos INGARCH log-lineares com inovações Poisson mistas |
| title_fullStr |
Modelos INGARCH log-lineares com inovações Poisson mistas |
| title_full_unstemmed |
Modelos INGARCH log-lineares com inovações Poisson mistas |
| title_sort |
Modelos INGARCH log-lineares com inovações Poisson mistas |
| author |
Costa, Valdemi Nunes |
| author_facet |
Costa, Valdemi Nunes |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Silva, Rodrigo Bernardo da http://lattes.cnpq.br/0338626517476710 Marinho, Pedro Rafael Diniz http://lattes.cnpq.br/7185368598935272 |
| dc.contributor.author.fl_str_mv |
Costa, Valdemi Nunes |
| dc.subject.por.fl_str_mv |
Modelagem matemática Séries temporais de contagem Modelos INGARCH Algoritmo EM Count time series INGARCH models EM algorithm CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| topic |
Modelagem matemática Séries temporais de contagem Modelos INGARCH Algoritmo EM Count time series INGARCH models EM algorithm CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| description |
This work proposes a general structure for inference in modelling discrete data sets using a count time series model with INGARCH models with a log-linear structure and mixed Poisson innovations. To this end, a class of probability distributions will be used, the main objective of which is to model count data over time that present a condition of overdispersion. More specifically, the work presents two particular cases: the Inverse Gaussian Poisson log-linear distribution and the Negative Binomial log-linear distribution, which are obtained by considering cases of unobservable data that follow the Inverse Gaussian and Gamma distributions, respectively. The distributions inserted through the mean have as a common point the fact that they are members of the exponential family of distributions. The iterative maximum likelihood method will be used to estimate the model parameters using the EM algorithm. The performance of the estimators will be evaluated through simulation studies using the Monte Carlo method, considering different sample sizes to evaluate the asymptotic behaviour of these estimators.In the section on applying the proposed model to real data sets, three databases were considered for analysis: the first lists the number of hospitalisations due to alcohol abuse in the state of Paraíba, the second evaluates the same problem, but with the data presented for the state of Piauí and, finally, the database consisting of the number of cases of Campylobacter infections in the province of Quebec in Canada was evaluated, thus closing the section on applications to real data. The simulation data was tested using the two proposed extensions and the comparison model called log-linear Poisson proposed by [9], initially taking into account a graphical analysis of the behaviour of the sample, autocorrelation and partial autocorrelation, the study of simulation by means of convergence taking into account the values obtained and the observation of graphs representing a generalised view of the layout of the simulation data. Subsequently, a reflection was made on its effectiveness through information criteria and the mean square error used in the process of evaluating and choosing the best regression model to adjust the data. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-12-16T10:59:16Z 2024-08-21 2024-12-16T10:59:16Z 2024-07-12 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufpb.br/jspui/handle/123456789/32860 |
| url |
https://repositorio.ufpb.br/jspui/handle/123456789/32860 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nd/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nd/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal da Paraíba Brasil Informática Programa de Pós-Graduação em Modelagem Matemática e computacional UFPB |
| publisher.none.fl_str_mv |
Universidade Federal da Paraíba Brasil Informática Programa de Pós-Graduação em Modelagem Matemática e computacional UFPB |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPB instname:Universidade Federal da Paraíba (UFPB) instacron:UFPB |
| instname_str |
Universidade Federal da Paraíba (UFPB) |
| instacron_str |
UFPB |
| institution |
UFPB |
| reponame_str |
Repositório Institucional da UFPB |
| collection |
Repositório Institucional da UFPB |
| repository.name.fl_str_mv |
Repositório Institucional da UFPB - Universidade Federal da Paraíba (UFPB) |
| repository.mail.fl_str_mv |
diretoria@ufpb.br||bdtd@biblioteca.ufpb.br |
| _version_ |
1833923278086864896 |