Spatial models with random covariance structure
| Ano de defesa: | 2021 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Universidade Federal de Minas Gerais
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://hdl.handle.net/1843/38393 |
Resumo: | O modelo autorregressivo condicional (modelo CAR) é a distribuição mais popular para conjuntamente modelar a incerteza a priori sobre dados espacialmente correlacionados. Em geral, é utilizado em modelos espaciais hierárquicos onde modela a incerteza sobre os efeitos aleatórios espaciais. Uma limitação do modelo CAR é sua incapacidade de produzir correlações altas entre áreas vizinhas. Propomos um modelo robusto para dados de área que ameniza esse problema. Representamos o mapa por um grafo não direcionado onde os nós representam as áreas e as arestas conectam nós vizinhos no mapa. Atribuímos às arestas pesos distintos e aleatórios. O modelo é baseado em uma distribuição multivariada t≠ Student, espacialmente estruturada, em que a matriz de precisão é indiretamente construída assumindo-se uma distribuição multivariada para os pesos aleatórios das arestas. Tal distribuição t≠ Student correlaciona espacialmente os pesos das arestas e induz um outro modelo t-Student para o efeitos espaciais das áreas que os correlaciona e é capaz de acomodar outliers e comportamento de cauda pesada para estes efeitos. Mais importante, o modelo proposto pode produzir uma correlação marginal mais alta entre os efeitos espaciais do que o modelo CAR, superando uma das principais limitações deste modelo. Ajustamos o modelo proposto para mapear a incidência de alguns tipos câncer na região sul do Brazil e comparamos seu desempenho com vários modelos alternativos propostos na literatura. Os resultados mostram que o modelo proposto é competitivo e fornece resultados similares e, em alguns casos, melhores que os obtidos ajustando modelos comumente usados para analisar este tipo de dados. Na segunda proposta, abordamos o problema de redução de dimensionalidade em modelos de regressão. Um dos métodos mais utilizados para evitar sobreajuste e selecionar variáveis relevantes em modelos de regressão com muitos preditores é a técnica de regressão penalizada. Sob tais abordagens, a seleção de variáveis é realizada de forma não probabilística utilizando algum critério de otimização. Abordagens Bayesianas para a regressão penalizada têm sido proposta assumindo uma distribuição a priori para os coeficientes de regressão que desempenha um papel semelhante ao termo de penalidade nas estatísticas clássicas: comprimir em direção a zero coeficientes não significativos e colocar uma massa de probabilidade significativa em coeficientes que podem ser agrupados. Geralmente, tais distribuições a priori, chamadas shrinkage priors (ditribuições a priori de encolhimento), assumem independência entre os efeitos das covariáveis, o que pode não ser uma suposição apropriada em muitos casos. Neste trabalho, focamos na redução de dimensionalidade de variáveis categóricas com muitos níveis. Estas vaiáveis são incluídas no modelo através de variáveis dummy induzindo esparsidade na matrix de delineamento, o que pode gerar sobreajuste e dificuldades na interpretação dos resultados. O efeito dos níveis destas variáveis categóricas são naturalmente correlacionados. Para lidarmos com este problema, propomos duas distribuições a priori de encolhimento para os coeficientes associados aos níveis de variáveis categóricas, correlacionando-os. As distribuições propostas são próprias e, além de esparsidade, têm a propriedade de agrupar efeitos similares. Ilustrarmos o uso destas distribuições aplicando-as na redução de dimensionalidade em um regressão linear. Seus desempenhos são analisados e comparados a métodos pré-existentes por meio de estudos de dados simulados e considerando dados de preços de habitação disponíveis no Airbnb. |
| id |
UFMG_4d9d1883fdfa49311b0d122e85bca773 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufmg.br:1843/38393 |
| network_acronym_str |
UFMG |
| network_name_str |
Repositório Institucional da UFMG |
| repository_id_str |
|
| spelling |
Spatial models with random covariance structureEstatística - TesesAnálise espacial (Estatística) – tesesAutoregressão (Estatística) – TesesCâncer – Região Sul – Métodos estatísticos. -TesesSpatial statisticCAR modelGraph of edgesShrinkage priorRobust spatial modelsO modelo autorregressivo condicional (modelo CAR) é a distribuição mais popular para conjuntamente modelar a incerteza a priori sobre dados espacialmente correlacionados. Em geral, é utilizado em modelos espaciais hierárquicos onde modela a incerteza sobre os efeitos aleatórios espaciais. Uma limitação do modelo CAR é sua incapacidade de produzir correlações altas entre áreas vizinhas. Propomos um modelo robusto para dados de área que ameniza esse problema. Representamos o mapa por um grafo não direcionado onde os nós representam as áreas e as arestas conectam nós vizinhos no mapa. Atribuímos às arestas pesos distintos e aleatórios. O modelo é baseado em uma distribuição multivariada t≠ Student, espacialmente estruturada, em que a matriz de precisão é indiretamente construída assumindo-se uma distribuição multivariada para os pesos aleatórios das arestas. Tal distribuição t≠ Student correlaciona espacialmente os pesos das arestas e induz um outro modelo t-Student para o efeitos espaciais das áreas que os correlaciona e é capaz de acomodar outliers e comportamento de cauda pesada para estes efeitos. Mais importante, o modelo proposto pode produzir uma correlação marginal mais alta entre os efeitos espaciais do que o modelo CAR, superando uma das principais limitações deste modelo. Ajustamos o modelo proposto para mapear a incidência de alguns tipos câncer na região sul do Brazil e comparamos seu desempenho com vários modelos alternativos propostos na literatura. Os resultados mostram que o modelo proposto é competitivo e fornece resultados similares e, em alguns casos, melhores que os obtidos ajustando modelos comumente usados para analisar este tipo de dados. Na segunda proposta, abordamos o problema de redução de dimensionalidade em modelos de regressão. Um dos métodos mais utilizados para evitar sobreajuste e selecionar variáveis relevantes em modelos de regressão com muitos preditores é a técnica de regressão penalizada. Sob tais abordagens, a seleção de variáveis é realizada de forma não probabilística utilizando algum critério de otimização. Abordagens Bayesianas para a regressão penalizada têm sido proposta assumindo uma distribuição a priori para os coeficientes de regressão que desempenha um papel semelhante ao termo de penalidade nas estatísticas clássicas: comprimir em direção a zero coeficientes não significativos e colocar uma massa de probabilidade significativa em coeficientes que podem ser agrupados. Geralmente, tais distribuições a priori, chamadas shrinkage priors (ditribuições a priori de encolhimento), assumem independência entre os efeitos das covariáveis, o que pode não ser uma suposição apropriada em muitos casos. Neste trabalho, focamos na redução de dimensionalidade de variáveis categóricas com muitos níveis. Estas vaiáveis são incluídas no modelo através de variáveis dummy induzindo esparsidade na matrix de delineamento, o que pode gerar sobreajuste e dificuldades na interpretação dos resultados. O efeito dos níveis destas variáveis categóricas são naturalmente correlacionados. Para lidarmos com este problema, propomos duas distribuições a priori de encolhimento para os coeficientes associados aos níveis de variáveis categóricas, correlacionando-os. As distribuições propostas são próprias e, além de esparsidade, têm a propriedade de agrupar efeitos similares. Ilustrarmos o uso destas distribuições aplicando-as na redução de dimensionalidade em um regressão linear. Seus desempenhos são analisados e comparados a métodos pré-existentes por meio de estudos de dados simulados e considerando dados de preços de habitação disponíveis no Airbnb.FAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas GeraisCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorUniversidade Federal de Minas Gerais2021-10-18T00:05:40Z2025-09-08T23:57:25Z2021-10-18T00:05:40Z2021-07-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://hdl.handle.net/1843/38393engDanna Lesley Cruz Reyesinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMG2025-09-08T23:57:25Zoai:repositorio.ufmg.br:1843/38393Repositório InstitucionalPUBhttps://repositorio.ufmg.br/oairepositorio@ufmg.bropendoar:2025-09-08T23:57:25Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
| dc.title.none.fl_str_mv |
Spatial models with random covariance structure |
| title |
Spatial models with random covariance structure |
| spellingShingle |
Spatial models with random covariance structure Danna Lesley Cruz Reyes Estatística - Teses Análise espacial (Estatística) – teses Autoregressão (Estatística) – Teses Câncer – Região Sul – Métodos estatísticos. -Teses Spatial statistic CAR model Graph of edges Shrinkage prior Robust spatial models |
| title_short |
Spatial models with random covariance structure |
| title_full |
Spatial models with random covariance structure |
| title_fullStr |
Spatial models with random covariance structure |
| title_full_unstemmed |
Spatial models with random covariance structure |
| title_sort |
Spatial models with random covariance structure |
| author |
Danna Lesley Cruz Reyes |
| author_facet |
Danna Lesley Cruz Reyes |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Danna Lesley Cruz Reyes |
| dc.subject.por.fl_str_mv |
Estatística - Teses Análise espacial (Estatística) – teses Autoregressão (Estatística) – Teses Câncer – Região Sul – Métodos estatísticos. -Teses Spatial statistic CAR model Graph of edges Shrinkage prior Robust spatial models |
| topic |
Estatística - Teses Análise espacial (Estatística) – teses Autoregressão (Estatística) – Teses Câncer – Região Sul – Métodos estatísticos. -Teses Spatial statistic CAR model Graph of edges Shrinkage prior Robust spatial models |
| description |
O modelo autorregressivo condicional (modelo CAR) é a distribuição mais popular para conjuntamente modelar a incerteza a priori sobre dados espacialmente correlacionados. Em geral, é utilizado em modelos espaciais hierárquicos onde modela a incerteza sobre os efeitos aleatórios espaciais. Uma limitação do modelo CAR é sua incapacidade de produzir correlações altas entre áreas vizinhas. Propomos um modelo robusto para dados de área que ameniza esse problema. Representamos o mapa por um grafo não direcionado onde os nós representam as áreas e as arestas conectam nós vizinhos no mapa. Atribuímos às arestas pesos distintos e aleatórios. O modelo é baseado em uma distribuição multivariada t≠ Student, espacialmente estruturada, em que a matriz de precisão é indiretamente construída assumindo-se uma distribuição multivariada para os pesos aleatórios das arestas. Tal distribuição t≠ Student correlaciona espacialmente os pesos das arestas e induz um outro modelo t-Student para o efeitos espaciais das áreas que os correlaciona e é capaz de acomodar outliers e comportamento de cauda pesada para estes efeitos. Mais importante, o modelo proposto pode produzir uma correlação marginal mais alta entre os efeitos espaciais do que o modelo CAR, superando uma das principais limitações deste modelo. Ajustamos o modelo proposto para mapear a incidência de alguns tipos câncer na região sul do Brazil e comparamos seu desempenho com vários modelos alternativos propostos na literatura. Os resultados mostram que o modelo proposto é competitivo e fornece resultados similares e, em alguns casos, melhores que os obtidos ajustando modelos comumente usados para analisar este tipo de dados. Na segunda proposta, abordamos o problema de redução de dimensionalidade em modelos de regressão. Um dos métodos mais utilizados para evitar sobreajuste e selecionar variáveis relevantes em modelos de regressão com muitos preditores é a técnica de regressão penalizada. Sob tais abordagens, a seleção de variáveis é realizada de forma não probabilística utilizando algum critério de otimização. Abordagens Bayesianas para a regressão penalizada têm sido proposta assumindo uma distribuição a priori para os coeficientes de regressão que desempenha um papel semelhante ao termo de penalidade nas estatísticas clássicas: comprimir em direção a zero coeficientes não significativos e colocar uma massa de probabilidade significativa em coeficientes que podem ser agrupados. Geralmente, tais distribuições a priori, chamadas shrinkage priors (ditribuições a priori de encolhimento), assumem independência entre os efeitos das covariáveis, o que pode não ser uma suposição apropriada em muitos casos. Neste trabalho, focamos na redução de dimensionalidade de variáveis categóricas com muitos níveis. Estas vaiáveis são incluídas no modelo através de variáveis dummy induzindo esparsidade na matrix de delineamento, o que pode gerar sobreajuste e dificuldades na interpretação dos resultados. O efeito dos níveis destas variáveis categóricas são naturalmente correlacionados. Para lidarmos com este problema, propomos duas distribuições a priori de encolhimento para os coeficientes associados aos níveis de variáveis categóricas, correlacionando-os. As distribuições propostas são próprias e, além de esparsidade, têm a propriedade de agrupar efeitos similares. Ilustrarmos o uso destas distribuições aplicando-as na redução de dimensionalidade em um regressão linear. Seus desempenhos são analisados e comparados a métodos pré-existentes por meio de estudos de dados simulados e considerando dados de preços de habitação disponíveis no Airbnb. |
| publishDate |
2021 |
| dc.date.none.fl_str_mv |
2021-10-18T00:05:40Z 2021-10-18T00:05:40Z 2021-07-28 2025-09-08T23:57:25Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1843/38393 |
| url |
https://hdl.handle.net/1843/38393 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
| publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
| instname_str |
Universidade Federal de Minas Gerais (UFMG) |
| instacron_str |
UFMG |
| institution |
UFMG |
| reponame_str |
Repositório Institucional da UFMG |
| collection |
Repositório Institucional da UFMG |
| repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
| repository.mail.fl_str_mv |
repositorio@ufmg.br |
| _version_ |
1856413933585301504 |