Análise exploratória e regressão espacial para dados simbólicos intervalares

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: FREITAS, Wanessa Weridiana da Luz
Orientador(a): SOUZA, Renata Maria Cardoso Rodrigues de
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/48976
Resumo: A Análise de Dados Espaciais é uma área que busca identificar padrões existentes em uma determinada região através de diversas metodologias, como índices e testes de autocorrelação espacial. A compreensão da dependência espacial de um fenômeno em uma dada região pode ser mensurada através de abordagens envolvendo a noção de autocorrelação espacial. Essas técnicas são usualmente empregadas no contexto de variáveis clássicas (pontuais). Por outro lado, a Análise de Dados Simbólicos é uma área de pesquisa e aplicação relacionada às áreas de aprendizagem de máquina e estatística, que fornecem ferramentas para descrever unidades (objetos), permitindo lidar com diversos tipos de variáveis, inclusive variáveis do tipo intervalar. Uma questão relevante consiste em tentar obter uma descrição da autocorrelação espacial para variáveis do tipo intervalar. Assim, neste trabalho buscamos conciliar a análise de dados simbólicos (variáveis intervalares) com a análise de dados espaciais. Mais especificamente, o presente estudo tem o intuito de identificar o comportamento de informações georreferenciadas para dados intervalares na Análise de Dados Simbólicos. Os objetivos principais são: i) estender o índice de autocorrelação espacial de Moran da Análise Exploratória Espacial para o caso de dados intervalares e ii) modelar dados utilizando diferentes modelos de regressão. Para analisarmos os índices de autocorrelação espacial intervalar propostos, realizamos experimentos com conjuntos de dados sintéticos do tipo intervalar. Além disso, analisamos duas aplicações para dados reais. A primeira utiliza dados de notificações de casos de COVID-19 para o nordeste brasileiro e a segunda está relacionada ao preço de aluguel de imóveis na cidade de Munique. No contexto de regressão, utilizamos o modelo de regressão linear para dados do tipo intervalar e um modelo de regressão espacial, que leva em consideração a conectividade existente entre as regiões. Para avaliarmos o desempenho dessas abordagens, realizamos simulações de Monte Carlo em que calculamos a média e o desvio padrão da magnitude média relativa do erro da estimativa dos modelos analisados. Além disso, avaliamos o desempenho dos modelos de regressão em conjuntos de dados reais.
id UFPE_e78ce533c1276a75fce1b4ec8035924f
oai_identifier_str oai:repositorio.ufpe.br:123456789/48976
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling FREITAS, Wanessa Weridiana da Luzhttp://lattes.cnpq.br/5897265240100184http://lattes.cnpq.br/9289080285504453http://lattes.cnpq.br/7674916684282039SOUZA, Renata Maria Cardoso Rodrigues deAMARAL, Getúlio José Amorim do2023-02-08T12:27:27Z2023-02-08T12:27:27Z2022-08-15FREITAS, Wanessa Weridiana da Luz. Análise exploratória e regressão espacial para dados simbólicos intervalares. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.https://repositorio.ufpe.br/handle/123456789/48976A Análise de Dados Espaciais é uma área que busca identificar padrões existentes em uma determinada região através de diversas metodologias, como índices e testes de autocorrelação espacial. A compreensão da dependência espacial de um fenômeno em uma dada região pode ser mensurada através de abordagens envolvendo a noção de autocorrelação espacial. Essas técnicas são usualmente empregadas no contexto de variáveis clássicas (pontuais). Por outro lado, a Análise de Dados Simbólicos é uma área de pesquisa e aplicação relacionada às áreas de aprendizagem de máquina e estatística, que fornecem ferramentas para descrever unidades (objetos), permitindo lidar com diversos tipos de variáveis, inclusive variáveis do tipo intervalar. Uma questão relevante consiste em tentar obter uma descrição da autocorrelação espacial para variáveis do tipo intervalar. Assim, neste trabalho buscamos conciliar a análise de dados simbólicos (variáveis intervalares) com a análise de dados espaciais. Mais especificamente, o presente estudo tem o intuito de identificar o comportamento de informações georreferenciadas para dados intervalares na Análise de Dados Simbólicos. Os objetivos principais são: i) estender o índice de autocorrelação espacial de Moran da Análise Exploratória Espacial para o caso de dados intervalares e ii) modelar dados utilizando diferentes modelos de regressão. Para analisarmos os índices de autocorrelação espacial intervalar propostos, realizamos experimentos com conjuntos de dados sintéticos do tipo intervalar. Além disso, analisamos duas aplicações para dados reais. A primeira utiliza dados de notificações de casos de COVID-19 para o nordeste brasileiro e a segunda está relacionada ao preço de aluguel de imóveis na cidade de Munique. No contexto de regressão, utilizamos o modelo de regressão linear para dados do tipo intervalar e um modelo de regressão espacial, que leva em consideração a conectividade existente entre as regiões. Para avaliarmos o desempenho dessas abordagens, realizamos simulações de Monte Carlo em que calculamos a média e o desvio padrão da magnitude média relativa do erro da estimativa dos modelos analisados. Além disso, avaliamos o desempenho dos modelos de regressão em conjuntos de dados reais.FACEPESpatial Data Analysis is a research area that seeks to identify the existence of patterns in a given spatial region by employing appropriate methodologies. The understanding of the spatial dependence of a phenomenon of interest in a given region can be measured through the concept of spatial autocorrelation. Usually, such machinery is employed only in the context of classic variables (punctual variables). On the other hand, Symbolic Data Analysis is a research field related to the framework of machine learning and statistics, which provide us tools to deal with several types of variables, including interval-type variables. A relevant issue regards the description of the spatial autocorrelation in the case of interval type variables. In this work, we seek to unify concepts of symbolic data analysis (for interval variables) and spatial data analysis. More specifically, the present study aims to identify the behavior of georeferenced information for interval data in Symbolic Data Analysis. The main objectives are i) to extend the Moran’s spatial autocorrelation index of Spatial Exploratory Analysis for the case of interval data and ii) to investigate such data through regression models. To analyze the proposed interval spatial autocorrelation indexes, we carried out experiments with interval- type synthetic data sets. Also, we have analyzed two applications for real data. The first one considers data involving the number of COVID-19 notifications in northeastern Brazil, while the second application refers to the rental price of houses in the city of Munich. In the context of regression, we use the linear regression model for interval-type data and a spatial regression model, which takes into account the existing connectivity between regions. To examine the performance of these approaches, we make Monte Carlo simulations and calculate the mean and standard deviation of the performance metric for the models analyzed.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessInteligência computacionalModelos de regressãoDados intervalaresAnálise exploratória e regressão espacial para dados simbólicos intervalaresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisdoutoradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETEXTTESE Wanessa Weridiana da Luz Freitas.pdf.txtTESE Wanessa Weridiana da Luz Freitas.pdf.txtExtracted texttext/plain244933https://repositorio.ufpe.br/bitstream/123456789/48976/4/TESE%20Wanessa%20Weridiana%20da%20Luz%20Freitas.pdf.txt4f4a9a72633c976f58046bcfa8d42e17MD54THUMBNAILTESE Wanessa Weridiana da Luz Freitas.pdf.jpgTESE Wanessa Weridiana da Luz Freitas.pdf.jpgGenerated Thumbnailimage/jpeg1239https://repositorio.ufpe.br/bitstream/123456789/48976/5/TESE%20Wanessa%20Weridiana%20da%20Luz%20Freitas.pdf.jpg18c539fbe1813f861403b881b81b88e0MD55ORIGINALTESE Wanessa Weridiana da Luz Freitas.pdfTESE Wanessa Weridiana da Luz Freitas.pdfapplication/pdf3993100https://repositorio.ufpe.br/bitstream/123456789/48976/1/TESE%20Wanessa%20Weridiana%20da%20Luz%20Freitas.pdf92b62ce669f674f937a584aaf240ba8bMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/48976/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82362https://repositorio.ufpe.br/bitstream/123456789/48976/3/license.txt5e89a1613ddc8510c6576f4b23a78973MD53123456789/489762023-02-09 02:20:41.614oai:repositorio.ufpe.br:123456789/48976VGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2l6YcOnw6NvIGRlIERvY3VtZW50b3Mgbm8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRQoKCkRlY2xhcm8gZXN0YXIgY2llbnRlIGRlIHF1ZSBlc3RlIFRlcm1vIGRlIERlcMOzc2l0byBMZWdhbCBlIEF1dG9yaXphw6fDo28gdGVtIG8gb2JqZXRpdm8gZGUgZGl2dWxnYcOnw6NvIGRvcyBkb2N1bWVudG9zIGRlcG9zaXRhZG9zIG5vIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUgZSBkZWNsYXJvIHF1ZToKCkkgLSBvcyBkYWRvcyBwcmVlbmNoaWRvcyBubyBmb3JtdWzDoXJpbyBkZSBkZXDDs3NpdG8gc8OjbyB2ZXJkYWRlaXJvcyBlIGF1dMOqbnRpY29zOwoKSUkgLSAgbyBjb250ZcO6ZG8gZGlzcG9uaWJpbGl6YWRvIMOpIGRlIHJlc3BvbnNhYmlsaWRhZGUgZGUgc3VhIGF1dG9yaWE7CgpJSUkgLSBvIGNvbnRlw7pkbyDDqSBvcmlnaW5hbCwgZSBzZSBvIHRyYWJhbGhvIGUvb3UgcGFsYXZyYXMgZGUgb3V0cmFzIHBlc3NvYXMgZm9yYW0gdXRpbGl6YWRvcywgZXN0YXMgZm9yYW0gZGV2aWRhbWVudGUgcmVjb25oZWNpZGFzOwoKSVYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIG9icmEgY29sZXRpdmEgKG1haXMgZGUgdW0gYXV0b3IpOiB0b2RvcyBvcyBhdXRvcmVzIGVzdMOjbyBjaWVudGVzIGRvIGRlcMOzc2l0byBlIGRlIGFjb3JkbyBjb20gZXN0ZSB0ZXJtbzsKClYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIFRyYWJhbGhvIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28sIERpc3NlcnRhw6fDo28gb3UgVGVzZTogbyBhcnF1aXZvIGRlcG9zaXRhZG8gY29ycmVzcG9uZGUgw6AgdmVyc8OjbyBmaW5hbCBkbyB0cmFiYWxobzsKClZJIC0gcXVhbmRvIHRyYXRhci1zZSBkZSBUcmFiYWxobyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvLCBEaXNzZXJ0YcOnw6NvIG91IFRlc2U6IGVzdG91IGNpZW50ZSBkZSBxdWUgYSBhbHRlcmHDp8OjbyBkYSBtb2RhbGlkYWRlIGRlIGFjZXNzbyBhbyBkb2N1bWVudG8gYXDDs3MgbyBkZXDDs3NpdG8gZSBhbnRlcyBkZSBmaW5kYXIgbyBwZXLDrW9kbyBkZSBlbWJhcmdvLCBxdWFuZG8gZm9yIGVzY29saGlkbyBhY2Vzc28gcmVzdHJpdG8sIHNlcsOhIHBlcm1pdGlkYSBtZWRpYW50ZSBzb2xpY2l0YcOnw6NvIGRvIChhKSBhdXRvciAoYSkgYW8gU2lzdGVtYSBJbnRlZ3JhZG8gZGUgQmlibGlvdGVjYXMgZGEgVUZQRSAoU0lCL1VGUEUpLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gQWJlcnRvOgoKTmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRlIGF1dG9yIHF1ZSByZWNhZW0gc29icmUgZXN0ZSBkb2N1bWVudG8sIGZ1bmRhbWVudGFkbyBuYSBMZWkgZGUgRGlyZWl0byBBdXRvcmFsIG5vIDkuNjEwLCBkZSAxOSBkZSBmZXZlcmVpcm8gZGUgMTk5OCwgYXJ0LiAyOSwgaW5jaXNvIElJSSwgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIGEgZGlzcG9uaWJpbGl6YXIgZ3JhdHVpdGFtZW50ZSwgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkIChhcXVpc2nDp8OjbykgYXRyYXbDqXMgZG8gc2l0ZSBkbyBSZXBvc2l0w7NyaW8gRGlnaXRhbCBkYSBVRlBFIG5vIGVuZGVyZcOnbyBodHRwOi8vd3d3LnJlcG9zaXRvcmlvLnVmcGUuYnIsIGEgcGFydGlyIGRhIGRhdGEgZGUgZGVww7NzaXRvLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gUmVzdHJpdG86CgpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgYXV0b3IgcXVlIHJlY2FlbSBzb2JyZSBlc3RlIGRvY3VtZW50bywgZnVuZGFtZW50YWRvIG5hIExlaSBkZSBEaXJlaXRvIEF1dG9yYWwgbm8gOS42MTAgZGUgMTkgZGUgZmV2ZXJlaXJvIGRlIDE5OTgsIGFydC4gMjksIGluY2lzbyBJSUksIGF1dG9yaXpvIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgUGVybmFtYnVjbyBhIGRpc3BvbmliaWxpemFyIGdyYXR1aXRhbWVudGUsIHNlbSByZXNzYXJjaW1lbnRvIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gZS9vdSBkb3dubG9hZCAoYXF1aXNpw6fDo28pIGF0cmF2w6lzIGRvIHNpdGUgZG8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRSBubyBlbmRlcmXDp28gaHR0cDovL3d3dy5yZXBvc2l0b3Jpby51ZnBlLmJyLCBxdWFuZG8gZmluZGFyIG8gcGVyw61vZG8gZGUgZW1iYXJnbyBjb25kaXplbnRlIGFvIHRpcG8gZGUgZG9jdW1lbnRvLCBjb25mb3JtZSBpbmRpY2FkbyBubyBjYW1wbyBEYXRhIGRlIEVtYmFyZ28uCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212023-02-09T05:20:41Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Análise exploratória e regressão espacial para dados simbólicos intervalares
title Análise exploratória e regressão espacial para dados simbólicos intervalares
spellingShingle Análise exploratória e regressão espacial para dados simbólicos intervalares
FREITAS, Wanessa Weridiana da Luz
Inteligência computacional
Modelos de regressão
Dados intervalares
title_short Análise exploratória e regressão espacial para dados simbólicos intervalares
title_full Análise exploratória e regressão espacial para dados simbólicos intervalares
title_fullStr Análise exploratória e regressão espacial para dados simbólicos intervalares
title_full_unstemmed Análise exploratória e regressão espacial para dados simbólicos intervalares
title_sort Análise exploratória e regressão espacial para dados simbólicos intervalares
author FREITAS, Wanessa Weridiana da Luz
author_facet FREITAS, Wanessa Weridiana da Luz
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/5897265240100184
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/9289080285504453
dc.contributor.advisor-coLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/7674916684282039
dc.contributor.author.fl_str_mv FREITAS, Wanessa Weridiana da Luz
dc.contributor.advisor1.fl_str_mv SOUZA, Renata Maria Cardoso Rodrigues de
dc.contributor.advisor-co1.fl_str_mv AMARAL, Getúlio José Amorim do
contributor_str_mv SOUZA, Renata Maria Cardoso Rodrigues de
AMARAL, Getúlio José Amorim do
dc.subject.por.fl_str_mv Inteligência computacional
Modelos de regressão
Dados intervalares
topic Inteligência computacional
Modelos de regressão
Dados intervalares
description A Análise de Dados Espaciais é uma área que busca identificar padrões existentes em uma determinada região através de diversas metodologias, como índices e testes de autocorrelação espacial. A compreensão da dependência espacial de um fenômeno em uma dada região pode ser mensurada através de abordagens envolvendo a noção de autocorrelação espacial. Essas técnicas são usualmente empregadas no contexto de variáveis clássicas (pontuais). Por outro lado, a Análise de Dados Simbólicos é uma área de pesquisa e aplicação relacionada às áreas de aprendizagem de máquina e estatística, que fornecem ferramentas para descrever unidades (objetos), permitindo lidar com diversos tipos de variáveis, inclusive variáveis do tipo intervalar. Uma questão relevante consiste em tentar obter uma descrição da autocorrelação espacial para variáveis do tipo intervalar. Assim, neste trabalho buscamos conciliar a análise de dados simbólicos (variáveis intervalares) com a análise de dados espaciais. Mais especificamente, o presente estudo tem o intuito de identificar o comportamento de informações georreferenciadas para dados intervalares na Análise de Dados Simbólicos. Os objetivos principais são: i) estender o índice de autocorrelação espacial de Moran da Análise Exploratória Espacial para o caso de dados intervalares e ii) modelar dados utilizando diferentes modelos de regressão. Para analisarmos os índices de autocorrelação espacial intervalar propostos, realizamos experimentos com conjuntos de dados sintéticos do tipo intervalar. Além disso, analisamos duas aplicações para dados reais. A primeira utiliza dados de notificações de casos de COVID-19 para o nordeste brasileiro e a segunda está relacionada ao preço de aluguel de imóveis na cidade de Munique. No contexto de regressão, utilizamos o modelo de regressão linear para dados do tipo intervalar e um modelo de regressão espacial, que leva em consideração a conectividade existente entre as regiões. Para avaliarmos o desempenho dessas abordagens, realizamos simulações de Monte Carlo em que calculamos a média e o desvio padrão da magnitude média relativa do erro da estimativa dos modelos analisados. Além disso, avaliamos o desempenho dos modelos de regressão em conjuntos de dados reais.
publishDate 2022
dc.date.issued.fl_str_mv 2022-08-15
dc.date.accessioned.fl_str_mv 2023-02-08T12:27:27Z
dc.date.available.fl_str_mv 2023-02-08T12:27:27Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv FREITAS, Wanessa Weridiana da Luz. Análise exploratória e regressão espacial para dados simbólicos intervalares. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/48976
identifier_str_mv FREITAS, Wanessa Weridiana da Luz. Análise exploratória e regressão espacial para dados simbólicos intervalares. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.
url https://repositorio.ufpe.br/handle/123456789/48976
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Computacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/48976/4/TESE%20Wanessa%20Weridiana%20da%20Luz%20Freitas.pdf.txt
https://repositorio.ufpe.br/bitstream/123456789/48976/5/TESE%20Wanessa%20Weridiana%20da%20Luz%20Freitas.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/48976/1/TESE%20Wanessa%20Weridiana%20da%20Luz%20Freitas.pdf
https://repositorio.ufpe.br/bitstream/123456789/48976/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/48976/3/license.txt
bitstream.checksum.fl_str_mv 4f4a9a72633c976f58046bcfa8d42e17
18c539fbe1813f861403b881b81b88e0
92b62ce669f674f937a584aaf240ba8b
e39d27027a6cc9cb039ad269a5db8e34
5e89a1613ddc8510c6576f4b23a78973
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1802311059643564032