Modelo de regressão quase-beta multivariado
Ano de defesa: | 2018 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://hdl.handle.net/1884/58641 |
Resumo: | Orientador: Prof. Dr. Cassius Tadeu Scarpin |
id |
UFPR_c1a4868f5d94568b69650312754d289c |
---|---|
oai_identifier_str |
oai:acervodigital.ufpr.br:1884/58641 |
network_acronym_str |
UFPR |
network_name_str |
Repositório Institucional da UFPR |
repository_id_str |
|
spelling |
Bonat, Wagner Hugo, 1985-Universidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Engenharia de ProduçãoScarpin, Cassius Tadeu, 1980-Petterle, Ricardo Rasmussen2024-04-16T17:40:48Z2024-04-16T17:40:48Z2018https://hdl.handle.net/1884/58641Orientador: Prof. Dr. Cassius Tadeu ScarpinCoorientador: Prof. Dr. Wagner Hugo BonatDissertação (mestrado) - Universidade Federal do Paraná, Setor de Tecnologia, Programa de Pós-Graduação em Engenharia de Produção. Defesa : Curitiba, 12/12/2018Inclui referências: p.84-89Resumo: Em diversas áreas de pesquisa 'e frequente a análise de dados com variareis respostas limitadas ao intervalo unitário. Tais variareis geralmente se apresentam na forma de taxas, proporções, indíces e porcentagens, sendo portanto limitadas ao intervalo (0,1). Para o caso de múltiplas respostas 'e comum analisar cada variável resposta separadamente, o que não permite investigar possíveis correlações entre elas. Nesse sentido, o presente trabalho propõe um novo modelo de regressão para análise de variáveis respostas limitadas multivariada. O modelo é especificado usando apenas suposições de primeiro e segundo momentos. A abordagem usada para estimação dos parâmetros combina as funções de estimação quase-escore e Pearson para estimação dos parâmetros de regressão e dispersão, respectivamente. A principal vantagem da abordagem proposta é não precisar assumir uma distribuição de probabilidade multivariada para o vetor de variáveis respostas. O algoritmo de estimação é de fácil implementação, podendo ser resumido a um simples e eficiente algoritmo do tipo Newton-score. Alám disso, o modelo proposto permite acomodar facilmente dados no intervalo [0,1], incluindo excesso de zeros e uns. No decorrer do trabalho foram delineados três estudos de simulação. O primeiro foi conduzido para investigar o comportamento do algoritmo NORTA (NORmal To Anything) na simulação de variáveis aleatórias beta correlacionadas. O segundo visou explorar a flexibilidade dos estimadores para lidar com dados limitados em estudos longitudinais. E o terceiro foi delineado para checar propriedades dos estimadores como viés, consistência e taxa de cobertura em estudos com múltiplas respostas correlacionadas. O modelo foi motivado por dois conjuntos de dados que não são facilmente manipulados pelos métodos estatísticos convencionais. O primeiro se refere ao índice de qualidade da água de reservatórios de usinas hidrelétricas operadas pela COPEL no Estado do Paraná. E o segundo corresponde ao percentual de gordura corporal, que foi medido em cinco regiões do corpo e representam as variáveis respostas. Além disso, foram adaptadas técnicas de diagnóstico para o modelo proposto, tais como DFFITS, DFBETAS, distância de Cook e o gráfico de probabilidade meio-normal com envelope simulado, para detecção de pontos influentes e outliers. Portanto, as principais contribuições do modelo de regressão proposto nesta dissertação estão na análise de dados limitados em estudos longitudinais, além da análise de dados limitados em estudos com múltiplas respostas correlacionadas.Abstract: In several areas of research it is common to analyze data with response variables limited to the unit interval. These variables usually appear in the form of rates, proportions, index and percentages, being therefore limited to the interval (0,1). When the response variable is multivariate, in general, each response variable is analyzed separately, which does not allow investigating possible correlations between them. Thus, we propose a multivariate regression model to deal with multiple continuous bounded data. The model is specified using only first and second moment assumptions and the method for estimation and inference combines the quasi-score and Pearson estimating functions for the estimation of the regression and dispersion parameters, respectively. The main advantage of the proposed approach is that it does not need to assume a multivariate probability distribution for the response vector. The fitting procedure is easily implemented using a simple and efficient Newton scoring algorithm. Furthermore, the proposed model can easily handle data in the unit interval, including exact zeros and ones. During the work, we conducted three simulation studies. The first one evaluated the behavior of the NORTA algorithm (NORmal To Anything) in the simulation of correlated beta random variables. The second aimed to explore the flexibility of estimators to deal with continuous bounded data in longitudinal studies. And the third was designed to check properties of the estimators, such as bias, consistency, and coverage rate in studies with multiple correlated response variables. The model was motivated by two data sets that are not easily manipulated by existing statistical methods. The first refers to the water quality index measured on power plant reservoirs operated by COPEL in the State of Paran'a, Brazil. The second corresponds to the percentage of body fat, which was measured at five regions of the body and represent the response variables.We adapted diagnostic techniques for the proposed model, such as DFFITS, DFBETAS, Cook's distance and half-normal plot with simulated envelope, to check influential points and outliers. Therefore, the proposed model in this work allows the analysis of continuous bounded data in longitudinal studies, in addition to the analysis of continuous bounded data in studies with multiple correlated response variables.1 recurso online : PDF.application/pdfAnalise de regressãoEngenharia de ProduçãoMétodos de simulaçãoProbabilidadesModelo de regressão quase-beta multivariadoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - D - RICARDO RASMUSSEN PETTERLE.pdfapplication/pdf5035717https://acervodigital.ufpr.br/bitstream/1884/58641/1/R%20-%20D%20-%20RICARDO%20RASMUSSEN%20PETTERLE.pdf6b0305dbb6c001631071125bc542c890MD51open access1884/586412024-04-16 14:40:48.927open accessoai:acervodigital.ufpr.br:1884/58641Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082024-04-16T17:40:48Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false |
dc.title.pt_BR.fl_str_mv |
Modelo de regressão quase-beta multivariado |
title |
Modelo de regressão quase-beta multivariado |
spellingShingle |
Modelo de regressão quase-beta multivariado Petterle, Ricardo Rasmussen Analise de regressão Engenharia de Produção Métodos de simulação Probabilidades |
title_short |
Modelo de regressão quase-beta multivariado |
title_full |
Modelo de regressão quase-beta multivariado |
title_fullStr |
Modelo de regressão quase-beta multivariado |
title_full_unstemmed |
Modelo de regressão quase-beta multivariado |
title_sort |
Modelo de regressão quase-beta multivariado |
author |
Petterle, Ricardo Rasmussen |
author_facet |
Petterle, Ricardo Rasmussen |
author_role |
author |
dc.contributor.other.pt_BR.fl_str_mv |
Bonat, Wagner Hugo, 1985- Universidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Engenharia de Produção |
dc.contributor.advisor1.fl_str_mv |
Scarpin, Cassius Tadeu, 1980- |
dc.contributor.author.fl_str_mv |
Petterle, Ricardo Rasmussen |
contributor_str_mv |
Scarpin, Cassius Tadeu, 1980- |
dc.subject.por.fl_str_mv |
Analise de regressão Engenharia de Produção Métodos de simulação Probabilidades |
topic |
Analise de regressão Engenharia de Produção Métodos de simulação Probabilidades |
description |
Orientador: Prof. Dr. Cassius Tadeu Scarpin |
publishDate |
2018 |
dc.date.issued.fl_str_mv |
2018 |
dc.date.accessioned.fl_str_mv |
2024-04-16T17:40:48Z |
dc.date.available.fl_str_mv |
2024-04-16T17:40:48Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1884/58641 |
url |
https://hdl.handle.net/1884/58641 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
1 recurso online : PDF. application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná (UFPR) instacron:UFPR |
instname_str |
Universidade Federal do Paraná (UFPR) |
instacron_str |
UFPR |
institution |
UFPR |
reponame_str |
Repositório Institucional da UFPR |
collection |
Repositório Institucional da UFPR |
bitstream.url.fl_str_mv |
https://acervodigital.ufpr.br/bitstream/1884/58641/1/R%20-%20D%20-%20RICARDO%20RASMUSSEN%20PETTERLE.pdf |
bitstream.checksum.fl_str_mv |
6b0305dbb6c001631071125bc542c890 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1801861252526374912 |