Multivariate generalized linear mixed models for count data

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Silva, Guilherme Parreira da, 1992-
Orientador(a): Bonat, Wagner Hugo, 1985-
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/1884/73203
Resumo: Orientador: Prof. Dr. Wagner Hugo Bonat
id UFPR_61615e88afcb3236a86e29bcae6a908f
oai_identifier_str oai:acervodigital.ufpr.br:1884/73203
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str
spelling Silva, Guilherme Parreira da, 1992-Ribeiro Junior, Paulo Justiniano, 1967-Universidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Métodos Numéricos em EngenhariaBonat, Wagner Hugo, 1985-2022-03-30T18:57:52Z2022-03-30T18:57:52Z2021https://hdl.handle.net/1884/73203Orientador: Prof. Dr. Wagner Hugo BonatCoorientador: Prof. Dr. Paulo Justiniano Ribeiro JúniorDissertação (mestrado) - Universidade Federal do Paraná, Setor de Tecnologia, Programa de Pós-Graduação em Métodos Numéricos em Engenharia. Defesa : Curitiba, 29/07/2021Inclui referências: p. 88-92Resumo: Pesquisadores estão frequentemente interessados em entender a relação entre um conjunto de covariáveis e um conjunto de variáveis respostas. Com o objetivo de prover tais respostas, o uso de analise de regressão linear ou um modelo linear generalizado é largamente utilizado. Entretanto, tais modelos permitem que o usuário especifique somente uma variável resposta por vez. Ainda, não é possível calcular diretamente a partir de um modelo de regressão tradicional a correlação entre as variáveis respostas. Nessa dissertação, aplica-se o modelo multivariado linear generalizado misto, que permite especificar um conjunto de variáveis respostas e calcular a correlação entre elas por meio da inclusão de um efeito aleatório que segue uma distribuição¸ao normal multivariada. Foi utilizado o framework de maxima verossimilhança para estimar os parametros do modelo utilizando aproximação de Laplace para integrar os efeitos aleatórios. As derivadas são calculadas através da diferenciação automática. A maximização externa é feita utilizando algoritmos de otimização, como por exemplo, PORT e BFGS. O escopo desse trabalho foi definido para trabalhar somente com variáveis respostas do tipo de contagem com as seguintes distribuições: Poisson, Binomial Negative (NB) e COM-Poisson. Enquanto a primeira distribuição pode modelar somente dado equidisperso, á segunda modela equi e superdisperso, e a terceira modela todos os tipos de dispersão. O modelo foi implementado no software R com o pacote TMB, baseado em C++. Com o objetivo de avaliar as propriedades dos estimadores foi conduzido um estudo de simulação considerando quatro diferentes tamanhos amostrais e três diferentes valores de correlação para cada distribuição. Estimadores consistentes e não viesados foram encontrados para as distribuições de Poisson e NB; para COM-Poisson, estimadores foram consistentes, mas viesados para os parametros de dispersão, variância e correlação, especialmente. Os modelos propostos tambem foram aplicados em três conjuntos de dados. O primeiro foi obtido por meio da pesquisa The National Health and Nutrition Examination Survey, que continha tres variâveis respostas subdispersas com 1281 participantes. O segundo foi coletado em 30 diferentes lugares da Australia e contabiliza á ocorrencia de 41 diferentes espécies de formiga. O terceiro foi obtido por meio da pesquisa Australia Health Survey, com 5 variaveis respostas e 5190 participantes. Os dois ultimos conjunto de dados podem ser considerados como superdispersos a partir do índice de dispersão generalizado. O modelo COM-Poisson superou os outros dois competidores atraves das medidas de qualidade de ajuste AIC, BIC e verossimilhança. Como consequencia, estimou parâmetros com menor erro padrão, e maior número de coeficiente de correlação significativos. Portanto, os modelos propostos foram capazes de lidar com múltiplas contagens e mensurar a correlação entre elas levando em consideração os efeitos das covariáveis.Abstract: Researchers are often interested in understand the relationship between a set of covariates and a set of response variables. In order to achieve this goal, the use of regression analysis, either linear or generalized linear models, is largely applied. However, such models only allow users to model one response variable at a time. Moreover, it is not possible to directly calculate from the regression model a correlation measure between the response variables. In this master thesis, we employed the Multivariate Generalized Linear Mixed Models framework, which allows the specification of a set of response variables and to calculate the correlation between them by means of a random effect structure that follows a multivariate normal distribution. We used the maximum likelihood estimation framework to estimate all parameters using Laplace approximation to integrate out the random effects. The derivatives are provided by automatic differentiation. The outer maximization is made using a general purpose algorithm such as PORT and BFGS. We delimited this problem studying only count response variables with the following distributions: Poisson, negative binomial (NB) and COM-Poisson. While the first distribution can model only equidispersed data, the second models equi and overdispersed, and the third models all types of dispersion. The models were implemented on software R with package TMB, based on C++ templates. In order to assess the estimator properties we conducted a simulation study considering four different sample sizes and three different correlation values for each distribution. Unbiased and consistent estimators were found for Poisson and NB distributions; for COM-Poisson, estimators were consistent, but they were biased for dispersion, variance and correlation parameter estimators specially. These models were applied on three datasets. The first one is from the The National Health and Nutrition Examination Survey, where three underdispersed response variables were measured at 1281 participants. The second is from 30 different sites in Australia where the number of 41 different ant species were registered. The third is from the Australia Health Survey with 5 response variables and 5190 respondents. The last two datasets can be considered as overdispersed by the generalized dispersion index. The COM-Poisson model overcame the other two competitors considering three goodness-of-fit indexes, AIC, BIC and likelihood. As a consequence, it estimated parameters with smaller standard error, and a greater number of significant correlation coefficients. Therefore, the proposed model is capable of dealing with multivariate count response and to measure the correlation between them taken into account the covariates effects.1 recurso online : PDF.application/pdfAnalise de regressãoModelos lineares (Estatistica)Análise NuméricaMultivariate generalized linear mixed models for count datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisengreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - D - GUILHERME PARREIRA DA SILVA.pdfapplication/pdf4650876https://acervodigital.ufpr.br/bitstream/1884/73203/1/R%20-%20D%20-%20GUILHERME%20PARREIRA%20DA%20SILVA.pdffb60f81be7766bed982746837d91eba2MD51open access1884/732032022-03-30 15:57:52.827open accessoai:acervodigital.ufpr.br:1884/73203Repositório InstitucionalPUBhttp://acervodigital.ufpr.br/oai/requestinformacaodigital@ufpr.bropendoar:3082022-03-30T18:57:52Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Multivariate generalized linear mixed models for count data
title Multivariate generalized linear mixed models for count data
spellingShingle Multivariate generalized linear mixed models for count data
Silva, Guilherme Parreira da, 1992-
Analise de regressão
Modelos lineares (Estatistica)
Análise Numérica
title_short Multivariate generalized linear mixed models for count data
title_full Multivariate generalized linear mixed models for count data
title_fullStr Multivariate generalized linear mixed models for count data
title_full_unstemmed Multivariate generalized linear mixed models for count data
title_sort Multivariate generalized linear mixed models for count data
author Silva, Guilherme Parreira da, 1992-
author_facet Silva, Guilherme Parreira da, 1992-
author_role author
dc.contributor.other.pt_BR.fl_str_mv Ribeiro Junior, Paulo Justiniano, 1967-
Universidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Métodos Numéricos em Engenharia
dc.contributor.author.fl_str_mv Silva, Guilherme Parreira da, 1992-
dc.contributor.advisor1.fl_str_mv Bonat, Wagner Hugo, 1985-
contributor_str_mv Bonat, Wagner Hugo, 1985-
dc.subject.por.fl_str_mv Analise de regressão
Modelos lineares (Estatistica)
Análise Numérica
topic Analise de regressão
Modelos lineares (Estatistica)
Análise Numérica
description Orientador: Prof. Dr. Wagner Hugo Bonat
publishDate 2021
dc.date.issued.fl_str_mv 2021
dc.date.accessioned.fl_str_mv 2022-03-30T18:57:52Z
dc.date.available.fl_str_mv 2022-03-30T18:57:52Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/73203
url https://hdl.handle.net/1884/73203
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 1 recurso online : PDF.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/73203/1/R%20-%20D%20-%20GUILHERME%20PARREIRA%20DA%20SILVA.pdf
bitstream.checksum.fl_str_mv fb60f81be7766bed982746837d91eba2
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv informacaodigital@ufpr.br
_version_ 1847526301326376960