Family of multivariate distributions for modeling data with positive support : properties and applications

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Andrade, João Victor Monteiros de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.unb.br/handle/10482/51813
Resumo: Este trabalho tem como objetivo o desenvolvimento de uma nova família de distribuições elípticas multivariadas truncadas, ampliando as ferramentas de modelagem estatística para dados multivariados que exibem características como caudas pesadas e assimetria. As distribuições de Cauchy, t-Student e Normal servem de base para a construção dessas novas distribuições, oferecendo diferentes formas de captura de comportamentos e estruturas de dependência entre variáveis. A metodologia de construção envolve o uso de funções monotônicas crescentes, inversíveis e diferenciáveis, definidas no domínio dos números reais positivos, assegurando que as densidades resultantes tenham suporte nos reais positivos. Essa abordagem inovadora permite a preservação de propriedades fundamentais das distribuições elípticas, como a forma das caudas, ao mesmo tempo que incorpora distorções que ajustam a função densidade às características específicas dos dados analisados. A classe de distribuições proposta oferece maior flexibilidade na modelagem de comportamentos complexos de dados multivariados, sendo particularmente relevante em cenários onde as distribuições tradicionais não capturam adequadamente a dinâmica dos dados. Ao mesmo tempo, mantém a estrutura básica das distribuições elípticas, adaptando-se de maneira robusta às particularidades observadas em fenômenos empíricos. A aplicabilidade desta nova classe de distribuições é avaliada por meio de simulações de Monte Carlo e da aplicação a dados reais provenientes do Australian Institute of Sport (AIS) e de dados sobre os 50 estados dos Estados Unidos, como expectativa de vida e taxa de homicídios. Esses estudos fornecem uma avaliação prática da flexibilidade e desempenho das distribuições propostas. Na seção de revisão de literatura e conceitos fundamentais, descrevem-se os conceitos básicos necessários para o desenvolvimento do trabalho. Esses conceitos são essenciais para compreender os tópicos subsequentes, que envolvem modelagem estatística de distribuições multivariadas. A discussão desses fundamentos visa proporcionar ao leitor uma base sólida para o entendimento das propriedades estatísticas e dos métodos empregados na análise e modelagem dos dados. A seção de desenvolvimento do modelo destaca a criação de um novo modelo de distribuição assimétrica multivariada, baseado em distribuições elípticas e assimétricas. Esse modelo representa uma contribuição inédita no campo da estatística, integrando conceitos previamente explorados na literatura, mas com uma nova abordagem para lidar com a assimetria em distribuições multivariadas. A proposta amplia as possibilidades de análise e modelagem em contextos estatísticos diversos, sendo particularmente útil em aplicações onde as distribuições convencionais falham em capturar adequadamente os padrões dos dados. No estudo de simulação, conduzimos uma avaliação detalhada do desempenho dos estimadores de máxima verossimilhança (MLEs) no caso bivariado, aplicando diferentes funções de distorção, como Gi(x) = 1/α p x/β − p β/x , Gi(x) = log(x), Gi(x) = cosh−1 (x + 1), Gi(x) = log(log(x + 1)), e Gi(x) = x − 1/x. Essas funções permitem ajustar a distribuição para diferentes comportamentos dos dados, sendo analisadas com profundidade. Resultados específicos para a função logq (x) estão detalhados no Apêndice. Por fim, a aplicabilidade dos modelos propostos é avaliada em dados reais, utilizandose uma série de métricas para verificar a qualidade dos ajustes das distribuições aos dados. Para isso, são aplicados testes estatísticos bem estabelecidos, como os testes de KolmogorovSmirnov, Anderson-Darling e Cramér-von Mises, com o objetivo de identificar as distribuições que oferecem o melhor ajuste aos dados analisados. Esses resultados demonstram a robustez e a flexibilidade das novas distribuições, contribuindo para o avanço das técnicas de modelagem estatística multivariada. Este trabalho, ao propor uma nova família de distribuições elípticas multivariadas assimétricas, oferece novas perspectivas para a análise estatística de dados complexos, permitindo modelagens mais robustas e adequadas à realidade dos dados. A abordagem inovadora traz avanços significativos na modelagem de dados multivariados, com potencial para aplicações em diversas áreas da ciência e da indústria.
id UNB_db75c1d762b38de08b4d3e1ebdd1df4c
oai_identifier_str oai:repositorio.unb.br:10482/51813
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Family of multivariate distributions for modeling data with positive support : properties and applicationsFamília de distribuições multivariadas para modelagem de dados com suporte positivo : propriedades e aplicaçõesDistribuições elípticas multivariadasModelagem estatísticaCaudas pesadasAssimetriaAnálise de dadosEste trabalho tem como objetivo o desenvolvimento de uma nova família de distribuições elípticas multivariadas truncadas, ampliando as ferramentas de modelagem estatística para dados multivariados que exibem características como caudas pesadas e assimetria. As distribuições de Cauchy, t-Student e Normal servem de base para a construção dessas novas distribuições, oferecendo diferentes formas de captura de comportamentos e estruturas de dependência entre variáveis. A metodologia de construção envolve o uso de funções monotônicas crescentes, inversíveis e diferenciáveis, definidas no domínio dos números reais positivos, assegurando que as densidades resultantes tenham suporte nos reais positivos. Essa abordagem inovadora permite a preservação de propriedades fundamentais das distribuições elípticas, como a forma das caudas, ao mesmo tempo que incorpora distorções que ajustam a função densidade às características específicas dos dados analisados. A classe de distribuições proposta oferece maior flexibilidade na modelagem de comportamentos complexos de dados multivariados, sendo particularmente relevante em cenários onde as distribuições tradicionais não capturam adequadamente a dinâmica dos dados. Ao mesmo tempo, mantém a estrutura básica das distribuições elípticas, adaptando-se de maneira robusta às particularidades observadas em fenômenos empíricos. A aplicabilidade desta nova classe de distribuições é avaliada por meio de simulações de Monte Carlo e da aplicação a dados reais provenientes do Australian Institute of Sport (AIS) e de dados sobre os 50 estados dos Estados Unidos, como expectativa de vida e taxa de homicídios. Esses estudos fornecem uma avaliação prática da flexibilidade e desempenho das distribuições propostas. Na seção de revisão de literatura e conceitos fundamentais, descrevem-se os conceitos básicos necessários para o desenvolvimento do trabalho. Esses conceitos são essenciais para compreender os tópicos subsequentes, que envolvem modelagem estatística de distribuições multivariadas. A discussão desses fundamentos visa proporcionar ao leitor uma base sólida para o entendimento das propriedades estatísticas e dos métodos empregados na análise e modelagem dos dados. A seção de desenvolvimento do modelo destaca a criação de um novo modelo de distribuição assimétrica multivariada, baseado em distribuições elípticas e assimétricas. Esse modelo representa uma contribuição inédita no campo da estatística, integrando conceitos previamente explorados na literatura, mas com uma nova abordagem para lidar com a assimetria em distribuições multivariadas. A proposta amplia as possibilidades de análise e modelagem em contextos estatísticos diversos, sendo particularmente útil em aplicações onde as distribuições convencionais falham em capturar adequadamente os padrões dos dados. No estudo de simulação, conduzimos uma avaliação detalhada do desempenho dos estimadores de máxima verossimilhança (MLEs) no caso bivariado, aplicando diferentes funções de distorção, como Gi(x) = 1/α p x/β − p β/x , Gi(x) = log(x), Gi(x) = cosh−1 (x + 1), Gi(x) = log(log(x + 1)), e Gi(x) = x − 1/x. Essas funções permitem ajustar a distribuição para diferentes comportamentos dos dados, sendo analisadas com profundidade. Resultados específicos para a função logq (x) estão detalhados no Apêndice. Por fim, a aplicabilidade dos modelos propostos é avaliada em dados reais, utilizandose uma série de métricas para verificar a qualidade dos ajustes das distribuições aos dados. Para isso, são aplicados testes estatísticos bem estabelecidos, como os testes de KolmogorovSmirnov, Anderson-Darling e Cramér-von Mises, com o objetivo de identificar as distribuições que oferecem o melhor ajuste aos dados analisados. Esses resultados demonstram a robustez e a flexibilidade das novas distribuições, contribuindo para o avanço das técnicas de modelagem estatística multivariada. Este trabalho, ao propor uma nova família de distribuições elípticas multivariadas assimétricas, oferece novas perspectivas para a análise estatística de dados complexos, permitindo modelagens mais robustas e adequadas à realidade dos dados. A abordagem inovadora traz avanços significativos na modelagem de dados multivariados, com potencial para aplicações em diversas áreas da ciência e da indústria.This work proposes the development of a new family of multivariate truncated elliptical distributions, aiming to expand the possibilities of statistical modeling for multivariate data with specific characteristics, such as heavy tails and asymmetry. The distributions used as a basis for the construction of the new densities are Cauchy, t-Student and Normal, which allow capturing different behaviors and dependence structures between variables. The construction of these new distributions will be performed by applying monotonic increasing, invertible and differentiable functions, defined in the domain of positive real numbers. These characteristics ensure that the resulting density has support in positive real numbers. This new class of distributions offers greater flexibility to model complex behaviors of multivariate data, preserving fundamental characteristics of elliptical distributions, such as the shape of the tails, while incorporating distortions that adjust the density function to the particularities of the studied phenomenon. This development opens new perspectives for statistical analysis, providing more robust models that are appropriate to the reality of the data. A Monte Carlo simulation study will also be carried out and applied to real data from the AIS (Australian Institute of Sport) and information on the 50 states of the United States (life expectancy and homicide rate).Instituto de Ciências Exatas (IE)Departamento de Estatística (IE EST)Programa de Pós-Graduação em EstatísticaGabriel, Roberto VilaSantos, Helton Saulo Bezerra dosAndrade, João Victor Monteiros de2025-03-12T17:42:22Z2025-03-12T17:42:22Z2025-03-122024-10-04info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfANDRADE, João Victor Monteiros de. Family of multivariate distributions for modeling data with positive support: Properties and applications. 2024. 127 f. Dissertação (Mestrado em Estatística) — Universidade de Brasília, Brasília, 2024.http://repositorio.unb.br/handle/10482/51813porA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2025-03-12T17:45:10Zoai:repositorio.unb.br:10482/51813Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2025-03-12T17:45:10Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Family of multivariate distributions for modeling data with positive support : properties and applications
Família de distribuições multivariadas para modelagem de dados com suporte positivo : propriedades e aplicações
title Family of multivariate distributions for modeling data with positive support : properties and applications
spellingShingle Family of multivariate distributions for modeling data with positive support : properties and applications
Andrade, João Victor Monteiros de
Distribuições elípticas multivariadas
Modelagem estatística
Caudas pesadas
Assimetria
Análise de dados
title_short Family of multivariate distributions for modeling data with positive support : properties and applications
title_full Family of multivariate distributions for modeling data with positive support : properties and applications
title_fullStr Family of multivariate distributions for modeling data with positive support : properties and applications
title_full_unstemmed Family of multivariate distributions for modeling data with positive support : properties and applications
title_sort Family of multivariate distributions for modeling data with positive support : properties and applications
author Andrade, João Victor Monteiros de
author_facet Andrade, João Victor Monteiros de
author_role author
dc.contributor.none.fl_str_mv Gabriel, Roberto Vila
Santos, Helton Saulo Bezerra dos
dc.contributor.author.fl_str_mv Andrade, João Victor Monteiros de
dc.subject.por.fl_str_mv Distribuições elípticas multivariadas
Modelagem estatística
Caudas pesadas
Assimetria
Análise de dados
topic Distribuições elípticas multivariadas
Modelagem estatística
Caudas pesadas
Assimetria
Análise de dados
description Este trabalho tem como objetivo o desenvolvimento de uma nova família de distribuições elípticas multivariadas truncadas, ampliando as ferramentas de modelagem estatística para dados multivariados que exibem características como caudas pesadas e assimetria. As distribuições de Cauchy, t-Student e Normal servem de base para a construção dessas novas distribuições, oferecendo diferentes formas de captura de comportamentos e estruturas de dependência entre variáveis. A metodologia de construção envolve o uso de funções monotônicas crescentes, inversíveis e diferenciáveis, definidas no domínio dos números reais positivos, assegurando que as densidades resultantes tenham suporte nos reais positivos. Essa abordagem inovadora permite a preservação de propriedades fundamentais das distribuições elípticas, como a forma das caudas, ao mesmo tempo que incorpora distorções que ajustam a função densidade às características específicas dos dados analisados. A classe de distribuições proposta oferece maior flexibilidade na modelagem de comportamentos complexos de dados multivariados, sendo particularmente relevante em cenários onde as distribuições tradicionais não capturam adequadamente a dinâmica dos dados. Ao mesmo tempo, mantém a estrutura básica das distribuições elípticas, adaptando-se de maneira robusta às particularidades observadas em fenômenos empíricos. A aplicabilidade desta nova classe de distribuições é avaliada por meio de simulações de Monte Carlo e da aplicação a dados reais provenientes do Australian Institute of Sport (AIS) e de dados sobre os 50 estados dos Estados Unidos, como expectativa de vida e taxa de homicídios. Esses estudos fornecem uma avaliação prática da flexibilidade e desempenho das distribuições propostas. Na seção de revisão de literatura e conceitos fundamentais, descrevem-se os conceitos básicos necessários para o desenvolvimento do trabalho. Esses conceitos são essenciais para compreender os tópicos subsequentes, que envolvem modelagem estatística de distribuições multivariadas. A discussão desses fundamentos visa proporcionar ao leitor uma base sólida para o entendimento das propriedades estatísticas e dos métodos empregados na análise e modelagem dos dados. A seção de desenvolvimento do modelo destaca a criação de um novo modelo de distribuição assimétrica multivariada, baseado em distribuições elípticas e assimétricas. Esse modelo representa uma contribuição inédita no campo da estatística, integrando conceitos previamente explorados na literatura, mas com uma nova abordagem para lidar com a assimetria em distribuições multivariadas. A proposta amplia as possibilidades de análise e modelagem em contextos estatísticos diversos, sendo particularmente útil em aplicações onde as distribuições convencionais falham em capturar adequadamente os padrões dos dados. No estudo de simulação, conduzimos uma avaliação detalhada do desempenho dos estimadores de máxima verossimilhança (MLEs) no caso bivariado, aplicando diferentes funções de distorção, como Gi(x) = 1/α p x/β − p β/x , Gi(x) = log(x), Gi(x) = cosh−1 (x + 1), Gi(x) = log(log(x + 1)), e Gi(x) = x − 1/x. Essas funções permitem ajustar a distribuição para diferentes comportamentos dos dados, sendo analisadas com profundidade. Resultados específicos para a função logq (x) estão detalhados no Apêndice. Por fim, a aplicabilidade dos modelos propostos é avaliada em dados reais, utilizandose uma série de métricas para verificar a qualidade dos ajustes das distribuições aos dados. Para isso, são aplicados testes estatísticos bem estabelecidos, como os testes de KolmogorovSmirnov, Anderson-Darling e Cramér-von Mises, com o objetivo de identificar as distribuições que oferecem o melhor ajuste aos dados analisados. Esses resultados demonstram a robustez e a flexibilidade das novas distribuições, contribuindo para o avanço das técnicas de modelagem estatística multivariada. Este trabalho, ao propor uma nova família de distribuições elípticas multivariadas assimétricas, oferece novas perspectivas para a análise estatística de dados complexos, permitindo modelagens mais robustas e adequadas à realidade dos dados. A abordagem inovadora traz avanços significativos na modelagem de dados multivariados, com potencial para aplicações em diversas áreas da ciência e da indústria.
publishDate 2024
dc.date.none.fl_str_mv 2024-10-04
2025-03-12T17:42:22Z
2025-03-12T17:42:22Z
2025-03-12
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv ANDRADE, João Victor Monteiros de. Family of multivariate distributions for modeling data with positive support: Properties and applications. 2024. 127 f. Dissertação (Mestrado em Estatística) — Universidade de Brasília, Brasília, 2024.
http://repositorio.unb.br/handle/10482/51813
identifier_str_mv ANDRADE, João Victor Monteiros de. Family of multivariate distributions for modeling data with positive support: Properties and applications. 2024. 127 f. Dissertação (Mestrado em Estatística) — Universidade de Brasília, Brasília, 2024.
url http://repositorio.unb.br/handle/10482/51813
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1839083919292497920