Classificação automática de mensagens de redes sociais em dimensões dos modelos de cidades inteligentes

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Bencke, Luciana Regina
Orientador(a): Cechinel, Cristian
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: https://repositorio.ufsc.br/handle/123456789/215591
Resumo: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Campus Araranguá, Programa de Pós-Graduação em Tecnologias da Informação e Comunicação, Araranguá, 2019
id UFSC_7fb648eb2dec0e2232cc1c2a2110b7bc
oai_identifier_str oai:repositorio.ufsc.br:123456789/215591
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str
spelling Universidade Federal de Santa CatarinaBencke, Luciana ReginaCechinel, Cristian2020-10-21T21:18:16Z2020-10-21T21:18:16Z2019364670https://repositorio.ufsc.br/handle/123456789/215591Dissertação (mestrado) - Universidade Federal de Santa Catarina, Campus Araranguá, Programa de Pós-Graduação em Tecnologias da Informação e Comunicação, Araranguá, 2019Uma cidade inteligente pode ser definida como uma cidade de alta tecnologia com vários recursos para resolver ou mitigar problemas normalmente gerados pela rápida urbanização. Diferentes modelos de indicadores foram desenvolvidos para acompanhar a evolução das cidades na busca por tornarem-se Cidades Inteligentes. Um exemplo é o padrão 37120 da Organização Internacional para Padronização (ISO), que propõe um conjunto de dimensões e indicadores para serviços e qualidade de vida para cidades e comunidades sustentáveis. Tem sido comum encontrar nas redes sociais perfis oficiais de organizações e entidades governamentais relacionadas aos serviços que elas fornecem ou pelos quais são responsáveis (água, resíduos, transporte, eventos culturais, etc.). Os cidadãos interagem com estes perfis diretamente para comunicar problemas sobre os serviços da cidade. O presente trabalho objetiva aplicar algoritmos de aprendizado de máquina sobre os dados urbanos gerados pelas redes sociais, a fim de criar classificadores para categorizar automaticamente as mensagens dos cidadãos de acordo com as diferentes dimensões dos serviços das cidades. Para tanto, dois conjuntos distintos de textos em português foram coletados de duas redes sociais: Twitter (1.950 tweets) e Colab (65.066 postagens). Os textos foram mapeados de acordo com as diferentes categorias ISO 37120, pré-processados e minerados por meio de 11 algoritmos implementados na Scikit-Learn. Os primeiros resultados indicaram a viabilidade da proposta, com os modelos alcançando médias em torno de 59\% para a F1-macro e 75\% para a F1-micro ao usar Linear Support Vector Classification (LSVC) e Complement Naive Bayes (CNB). No entanto, como os conjuntos de dados estavam altamente desbalanceados, os desempenhos dos modelos variam significativamente para cada categoria ISO, com os melhores resultados de F1-score ocorrendo para Transporte (87%), Energia (83%) e Águas Residuais (74%). Os classificadores gerados neste trabalho podem ser integrados à diversos serviços e sistemas da cidade, tais como: sistemas de suporte à decisão governamental, sistemas de reclamações para cidadãos, painéis comunitários, centrais de polícia, empresas de transporte, produtores culturais, agências ambientais e empresas de reciclagem.Abstract: A Smart City can be defined as a high-tech city with several capabilities to strategically solve (or mitigate) problems normally generated by rapid urbanization. Different models of indicators have been developed to follow cities' development to become a Smart City. An example of such model is the standard 37120 from the International Organization for Standardization (ISO) that proposes a set of dimensions and indicators for services and quality of life for sustainable cities and communities. It has been common to find official social network profiles of organizations and governmental entities related to the services they provide or are responsible for (water, waste, transportation, cultural events, etc.) and that are used by citizens as a gateway to directly interact and communicate their complains and problems about those services. The present work proposes to apply machine learning algorithms over the urban data generated by social networks in order to create classifiers to automatically categorize citizens messages according to the different cities? services dimensions. For that, two distinct text datasets in Portuguese were collected from two social networks: Twitter (1,950 tweets) and Colab (65,066 posts). The texts were mapped according to the different ISO 37120 categories, preprocessed and mined through the use of 11 algorithms implemented in Scikit-Learn. Initial results pointed out the feasibility of the proposal with models achieving average F1-measures around 59\% for F1-macro and 75\% for F1-micro when using Linear Support Vector Classification (LSVC) and Complement Naïve Bayes (CNB). However, as the datasets were highly unbalanced, the performances of the models vary significantly for each ISO category, with the best results occurring for Transportation (87%), Energy (83%) and Wastewater (74%). The classifiers generated here can be integrated on a number of different city services and systems such as: governmental support decision systems, citizens complain systems, communities? dashboards, police offices, transportation?s companies, cultural producers, environmental agencies, and recyclers' companies.134 p.| ils., gráfs., tabs.porTecnologias da informação e comunicaçãoCidades inteligentesAprendizado do computadorRedes sociaisClassificação automática de mensagens de redes sociais em dimensões dos modelos de cidades inteligentesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccessORIGINALPTIC0064-D.pdfPTIC0064-D.pdfapplication/pdf4203392https://repositorio.ufsc.br/bitstream/123456789/215591/-1/PTIC0064-D.pdf7167f94fcacf55fb0b174c0b3da2eb99MD5-1123456789/2155912020-10-21 18:18:16.99oai:repositorio.ufsc.br:123456789/215591Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestsandra.sobrera@ufsc.bropendoar:23732020-10-21T21:18:16Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Classificação automática de mensagens de redes sociais em dimensões dos modelos de cidades inteligentes
title Classificação automática de mensagens de redes sociais em dimensões dos modelos de cidades inteligentes
spellingShingle Classificação automática de mensagens de redes sociais em dimensões dos modelos de cidades inteligentes
Bencke, Luciana Regina
Tecnologias da informação e comunicação
Cidades inteligentes
Aprendizado do computador
Redes sociais
title_short Classificação automática de mensagens de redes sociais em dimensões dos modelos de cidades inteligentes
title_full Classificação automática de mensagens de redes sociais em dimensões dos modelos de cidades inteligentes
title_fullStr Classificação automática de mensagens de redes sociais em dimensões dos modelos de cidades inteligentes
title_full_unstemmed Classificação automática de mensagens de redes sociais em dimensões dos modelos de cidades inteligentes
title_sort Classificação automática de mensagens de redes sociais em dimensões dos modelos de cidades inteligentes
author Bencke, Luciana Regina
author_facet Bencke, Luciana Regina
author_role author
dc.contributor.none.fl_str_mv Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Bencke, Luciana Regina
dc.contributor.advisor1.fl_str_mv Cechinel, Cristian
contributor_str_mv Cechinel, Cristian
dc.subject.classification.none.fl_str_mv Tecnologias da informação e comunicação
Cidades inteligentes
Aprendizado do computador
Redes sociais
topic Tecnologias da informação e comunicação
Cidades inteligentes
Aprendizado do computador
Redes sociais
description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Campus Araranguá, Programa de Pós-Graduação em Tecnologias da Informação e Comunicação, Araranguá, 2019
publishDate 2019
dc.date.issued.fl_str_mv 2019
dc.date.accessioned.fl_str_mv 2020-10-21T21:18:16Z
dc.date.available.fl_str_mv 2020-10-21T21:18:16Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/215591
dc.identifier.other.none.fl_str_mv 364670
identifier_str_mv 364670
url https://repositorio.ufsc.br/handle/123456789/215591
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 134 p.| ils., gráfs., tabs.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
bitstream.url.fl_str_mv https://repositorio.ufsc.br/bitstream/123456789/215591/-1/PTIC0064-D.pdf
bitstream.checksum.fl_str_mv 7167f94fcacf55fb0b174c0b3da2eb99
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv sandra.sobrera@ufsc.br
_version_ 1851759318342303744