Autorização da classificação de dados numéricos para geração de mapas temáticos no contexto do Big Geo data

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Cacciatore, Jose Antonio Dias
Orientador(a): Sluter, Claudia Robbi
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/298994
Resumo: A sociedade contemporânea gera informações em uma escala sem precedentes, impulsionada pela popularização da internet e pela ampla adoção de dispositivos móveis. Esse contexto tem provocado fluxos contínuos de dados gerados em tempo real, originados de transações digitais, redes sociais e sensores conectados à internet. Muitos desses dados possuem referência espacial associada, sendo classificados como Big Geo Data. Portanto, compreender suas particularidades é essencial para sua aplicação em projetos de mapas temáticos. A relevância desta dissertação reside no fato de que, além das conhecidas características do Big Data, como volume e velocidade, o Big Geo Data agrega a dimensão espacial que impõe novos desafios à análise e à representação da informação geográfica. Essa especificidade exige o desenvolvimento de métodos computacionais automatizados, capazes de lidar com a heterogeneidade dos atributos e da geometria para a sua utilização em projetos cartográficos. Diante disso o algoritmo criado nesta pesquisa inicia com a classificação das informações como qualitativas ou quantitativas, utilizando as bibliotecas do ecossistema Python, Pandas e NumPy. Em seguida, os dados quantitativos são categorizados por meio do método de Fisher-Jenks, adaptado ao contexto de fluxos de dados constantes e dinâmicos, característicos do Big Geo Data. Para o controle de qualidade dessa classificação, foi utilizada a métrica Goodness of Absolute Deviation Fit (GADF). Essa métrica permite não apenas avaliar a qualidade de uma categorização, mas também permite monitorar, ao longo do tempo, possíveis degradações nas classes à medida que novos dados são incorporados. Para a automação cartográfica, foram utilizadas as bibliotecas Matplotlib e Folium. Os métodos computacionais desenvolvidos nesta dissertação foram testados com dados reais com atualização constante. Os resultados obtidos, com base na análise da métrica de desempenho GADF, apontam uma melhora nessa métrica conforme a quantidade de dados aumenta, o que demonstra a adequação dos métodos computacionais desenvolvidos ao contexto do Big Geo Data, viabilizando sua utilização na automação da produção de mapas temáticos.
id URGS_7566a3d39892f7e83e33a96d3d014620
oai_identifier_str oai:www.lume.ufrgs.br:10183/298994
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Cacciatore, Jose Antonio DiasSluter, Claudia Robbi2025-11-22T08:06:45Z2025http://hdl.handle.net/10183/298994001296868A sociedade contemporânea gera informações em uma escala sem precedentes, impulsionada pela popularização da internet e pela ampla adoção de dispositivos móveis. Esse contexto tem provocado fluxos contínuos de dados gerados em tempo real, originados de transações digitais, redes sociais e sensores conectados à internet. Muitos desses dados possuem referência espacial associada, sendo classificados como Big Geo Data. Portanto, compreender suas particularidades é essencial para sua aplicação em projetos de mapas temáticos. A relevância desta dissertação reside no fato de que, além das conhecidas características do Big Data, como volume e velocidade, o Big Geo Data agrega a dimensão espacial que impõe novos desafios à análise e à representação da informação geográfica. Essa especificidade exige o desenvolvimento de métodos computacionais automatizados, capazes de lidar com a heterogeneidade dos atributos e da geometria para a sua utilização em projetos cartográficos. Diante disso o algoritmo criado nesta pesquisa inicia com a classificação das informações como qualitativas ou quantitativas, utilizando as bibliotecas do ecossistema Python, Pandas e NumPy. Em seguida, os dados quantitativos são categorizados por meio do método de Fisher-Jenks, adaptado ao contexto de fluxos de dados constantes e dinâmicos, característicos do Big Geo Data. Para o controle de qualidade dessa classificação, foi utilizada a métrica Goodness of Absolute Deviation Fit (GADF). Essa métrica permite não apenas avaliar a qualidade de uma categorização, mas também permite monitorar, ao longo do tempo, possíveis degradações nas classes à medida que novos dados são incorporados. Para a automação cartográfica, foram utilizadas as bibliotecas Matplotlib e Folium. Os métodos computacionais desenvolvidos nesta dissertação foram testados com dados reais com atualização constante. Os resultados obtidos, com base na análise da métrica de desempenho GADF, apontam uma melhora nessa métrica conforme a quantidade de dados aumenta, o que demonstra a adequação dos métodos computacionais desenvolvidos ao contexto do Big Geo Data, viabilizando sua utilização na automação da produção de mapas temáticos.Contemporary society generates information on an unprecedented scale, driven by the popularization of the internet and the widespread adoption of mobile devices. This context has led to continuous flows of data generated in real time, originating from digital transactions, social networks, and internet-connected sensors. Many of these data carry associated spatial references and are thus classified as Big Geo Data. Therefore, understanding their specific characteristics is essential for their application in thematic map projects. The relevance of this dissertation lies in the fact that, beyond the well-known characteristics of Big Data, such as volume and velocity, Big Geo Data adds a spatial dimension that imposes new challenges to the analysis and representation of geographic information. This specificity requires the development of automated computational methods capable of handling the heterogeneity of both attributes and geometries for their use in cartographic projects. In this regard, the algorithm begins by classifying the information as either qualitative or quantitative, using libraries from the Python ecosystem, namely Pandas and NumPy. Then, the quantitative data are categorized using the Fisher-Jenks method, adapted to the context of continuous and dynamic data flows that characterize Big Geo Data. For quality control of this classification, the Goodness of Absolute Deviation Fit (GADF) metric was employed. This metric not only evaluates the quality of a categorization but also allows monitoring, over time, of potential degradations in the classes as new data are incorporated. Subsequently, the quantitative data are classified according to their geometry namely, point, line, or area. For cartographic automation, the Matplotlib and Folium libraries were employed. The computational methods developed in this dissertation were tested using real data with constant updates. The results obtained, based on the analysis of the GADF performance metric, indicate an improvement in this metric as the data volume increases, demonstrating the adequacy of the computational methods developed for the Big Geo Data context and enabling their use in the automation of cartographic products.application/pdfporCartografiaAutomação cartográficaMapa tematicoGeovisualizaçãoBig Geo DataCartographic automationGeovisualizationAutorização da classificação de dados numéricos para geração de mapas temáticos no contexto do Big Geo datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulCentro Estadual de Pesquisas em Sensoriamento Remoto e MeteorologiaPrograma de Pós-Graduação em Sensoriamento RemotoPorto Alegre, BR-RS2025mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001296868.pdf.txt001296868.pdf.txtExtracted Texttext/plain162008http://www.lume.ufrgs.br/bitstream/10183/298994/2/001296868.pdf.txtba8f66cd160f3940c537873664ec4525MD52ORIGINAL001296868.pdfTexto completoapplication/pdf2354551http://www.lume.ufrgs.br/bitstream/10183/298994/1/001296868.pdffc58e2e0759f2524a410892fbef10bd8MD5110183/2989942025-12-15 08:07:25.404268oai:www.lume.ufrgs.br:10183/298994Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br || lume@ufrgs.bropendoar:18532025-12-15T10:07:25Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Autorização da classificação de dados numéricos para geração de mapas temáticos no contexto do Big Geo data
title Autorização da classificação de dados numéricos para geração de mapas temáticos no contexto do Big Geo data
spellingShingle Autorização da classificação de dados numéricos para geração de mapas temáticos no contexto do Big Geo data
Cacciatore, Jose Antonio Dias
Cartografia
Automação cartográfica
Mapa tematico
Geovisualização
Big Geo Data
Cartographic automation
Geovisualization
title_short Autorização da classificação de dados numéricos para geração de mapas temáticos no contexto do Big Geo data
title_full Autorização da classificação de dados numéricos para geração de mapas temáticos no contexto do Big Geo data
title_fullStr Autorização da classificação de dados numéricos para geração de mapas temáticos no contexto do Big Geo data
title_full_unstemmed Autorização da classificação de dados numéricos para geração de mapas temáticos no contexto do Big Geo data
title_sort Autorização da classificação de dados numéricos para geração de mapas temáticos no contexto do Big Geo data
author Cacciatore, Jose Antonio Dias
author_facet Cacciatore, Jose Antonio Dias
author_role author
dc.contributor.author.fl_str_mv Cacciatore, Jose Antonio Dias
dc.contributor.advisor1.fl_str_mv Sluter, Claudia Robbi
contributor_str_mv Sluter, Claudia Robbi
dc.subject.por.fl_str_mv Cartografia
Automação cartográfica
Mapa tematico
Geovisualização
topic Cartografia
Automação cartográfica
Mapa tematico
Geovisualização
Big Geo Data
Cartographic automation
Geovisualization
dc.subject.eng.fl_str_mv Big Geo Data
Cartographic automation
Geovisualization
description A sociedade contemporânea gera informações em uma escala sem precedentes, impulsionada pela popularização da internet e pela ampla adoção de dispositivos móveis. Esse contexto tem provocado fluxos contínuos de dados gerados em tempo real, originados de transações digitais, redes sociais e sensores conectados à internet. Muitos desses dados possuem referência espacial associada, sendo classificados como Big Geo Data. Portanto, compreender suas particularidades é essencial para sua aplicação em projetos de mapas temáticos. A relevância desta dissertação reside no fato de que, além das conhecidas características do Big Data, como volume e velocidade, o Big Geo Data agrega a dimensão espacial que impõe novos desafios à análise e à representação da informação geográfica. Essa especificidade exige o desenvolvimento de métodos computacionais automatizados, capazes de lidar com a heterogeneidade dos atributos e da geometria para a sua utilização em projetos cartográficos. Diante disso o algoritmo criado nesta pesquisa inicia com a classificação das informações como qualitativas ou quantitativas, utilizando as bibliotecas do ecossistema Python, Pandas e NumPy. Em seguida, os dados quantitativos são categorizados por meio do método de Fisher-Jenks, adaptado ao contexto de fluxos de dados constantes e dinâmicos, característicos do Big Geo Data. Para o controle de qualidade dessa classificação, foi utilizada a métrica Goodness of Absolute Deviation Fit (GADF). Essa métrica permite não apenas avaliar a qualidade de uma categorização, mas também permite monitorar, ao longo do tempo, possíveis degradações nas classes à medida que novos dados são incorporados. Para a automação cartográfica, foram utilizadas as bibliotecas Matplotlib e Folium. Os métodos computacionais desenvolvidos nesta dissertação foram testados com dados reais com atualização constante. Os resultados obtidos, com base na análise da métrica de desempenho GADF, apontam uma melhora nessa métrica conforme a quantidade de dados aumenta, o que demonstra a adequação dos métodos computacionais desenvolvidos ao contexto do Big Geo Data, viabilizando sua utilização na automação da produção de mapas temáticos.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-11-22T08:06:45Z
dc.date.issued.fl_str_mv 2025
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/298994
dc.identifier.nrb.pt_BR.fl_str_mv 001296868
url http://hdl.handle.net/10183/298994
identifier_str_mv 001296868
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/298994/2/001296868.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/298994/1/001296868.pdf
bitstream.checksum.fl_str_mv ba8f66cd160f3940c537873664ec4525
fc58e2e0759f2524a410892fbef10bd8
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br || lume@ufrgs.br
_version_ 1854319306966302720