Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: Paiva, Eduardo Soares de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/unirio/10792
Resumo: Dissertação também disponível em formato impresso, com o número de chamada CCET MI 2017/02
id UNIRIO_11caf9f1a86f1d133e1b082368e4fc0f
oai_identifier_str oai:localhost:unirio/10792
network_acronym_str UNIRIO
network_name_str Repositório Hórus
repository_id_str
spelling Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência públicaCIÊNCIAS EXATAS E DA TERRACIÊNCIA DA COMPUTAÇÃOPublic transparencyText miningData treatmentData intensive processingTransparência públicaMineração de textoTratamento de dadosProcessamento intensivo de dadosDissertação também disponível em formato impresso, com o número de chamada CCET MI 2017/02n/aThe public transparency portals are becoming important communication channels between government and society. However, not always the portals present the information in the most appropriate format. For example, the description of purchases in text format hinders analysis of purchases, as to know the products that are being acquired, it is necessary reading and interpreting of each purchase description, what is humanly impossible due to large data volume presented. Thus, this work goal is automatically identifying the products that are textually specified in the purchase descriptions. So this dissertation research question is: How to automatically identify products by textual specifications, used to characterize them in expenditure, descriptions presented in the public transparency portals? For this, a knowledge discovery process is proposed in textual data capable of generating rules that allow products identification from purchases textual descriptions. This research was performed using the CRISP-DM (Cross Industry Standard Process for Data Mining) methodology and its evaluation was divided into two parts: the first evaluates the rules generated, while the second checks the results quality obtained in identifying process of the purchases. The studies concluded that the proposed process presented satisfactory results, but there are still many other possibilities for improvement that can be explored in future work.n/aOs portais de transparência pública vêm se constituindo em importantes canais de comunicação entre o governo e a sociedade. No entanto, nem sempre o formato das informações apresentadas nesses portais é o mais apropriado. Por exemplo, as descrições de compras em formato de texto dificultam a análise dessas compras, pois para se saber os produtos que estão sendo adquiridos é necessária uma leitura e interpretação de cada descrição de compra, o que é humanamente impossível, devido ao grande volume de dados apresentados. Dessa forma, o objetivo desse trabalho é fazer a identificação automática dos produtos que são especificados de forma textual nas descrições de compras. Logo, a questão de pesquisa dessa dissertação é: como identificar de forma automatizada os produtos a partir das especificações textuais que são usadas para caracterizá-los nas descrições dos gastos que são apresentados nos portais de transparência pública? Para isso, é proposto um processo de descoberta de conhecimento em dados textuais capaz de gerar regras que possibilitam a identificação de produtos a partir das descrições textuais de compras. A pesquisa foi realizada utilizando a metodologia CRISP-DM (Cross Industry Standard Process for Data Mining) e sua avaliação foi dividida em duas partes: a primeira avalia as regras geradas, enquanto que a segunda verifica a qualidade dos resultados obtidos no processo de identificação de compras propriamente dito. Os estudos concluíram que o processo proposto apresentou resultados satisfatórios, porém ainda existem muitas outras possibilidades de melhorias que podem ser exploradas em trabalhos futuros.Revoredo, Kate CerqueiraRevoredo, Kate CerqueiraAló, Claudia CappelliBernardini, Flávia CristinaPaiva, Eduardo Soares de2018-02-02T13:44:21Z2018-02-02T13:44:21Z2017-02-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPAIVA, Eduardo Soares de. Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública. 2017. x, 111f. Dissertação (Mestrado em Informática) - Universidade Federal do estado do Rio de Janeiro, Rio de Janeiro, 2017.http://hdl.handle.net/unirio/10792info:eu-repo/semantics/openAccessporreponame:Repositório Hórusinstname:Universidade Federal do Estado do Rio de Janeiro (UNIRIO)instacron:UNIRIO2018-03-14T22:23:31Zoai:localhost:unirio/10792Repositório InstitucionalPUBhttp://www.repositorio-bc.unirio.br:8080/oai/requestbiblioteca.sid@unirio.bropendoar:2024-12-06T17:56:50.545119Repositório Hórus - Universidade Federal do Estado do Rio de Janeiro (UNIRIO)false
dc.title.none.fl_str_mv Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública
title Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública
spellingShingle Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública
Paiva, Eduardo Soares de
CIÊNCIAS EXATAS E DA TERRA
CIÊNCIA DA COMPUTAÇÃO
Public transparency
Text mining
Data treatment
Data intensive processing
Transparência pública
Mineração de texto
Tratamento de dados
Processamento intensivo de dados
title_short Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública
title_full Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública
title_fullStr Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública
title_full_unstemmed Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública
title_sort Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública
author Paiva, Eduardo Soares de
author_facet Paiva, Eduardo Soares de
author_role author
dc.contributor.none.fl_str_mv Revoredo, Kate Cerqueira
Revoredo, Kate Cerqueira
Aló, Claudia Cappelli
Bernardini, Flávia Cristina
dc.contributor.author.fl_str_mv Paiva, Eduardo Soares de
dc.subject.por.fl_str_mv CIÊNCIAS EXATAS E DA TERRA
CIÊNCIA DA COMPUTAÇÃO
Public transparency
Text mining
Data treatment
Data intensive processing
Transparência pública
Mineração de texto
Tratamento de dados
Processamento intensivo de dados
topic CIÊNCIAS EXATAS E DA TERRA
CIÊNCIA DA COMPUTAÇÃO
Public transparency
Text mining
Data treatment
Data intensive processing
Transparência pública
Mineração de texto
Tratamento de dados
Processamento intensivo de dados
description Dissertação também disponível em formato impresso, com o número de chamada CCET MI 2017/02
publishDate 2017
dc.date.none.fl_str_mv 2017-02-21
2018-02-02T13:44:21Z
2018-02-02T13:44:21Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PAIVA, Eduardo Soares de. Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública. 2017. x, 111f. Dissertação (Mestrado em Informática) - Universidade Federal do estado do Rio de Janeiro, Rio de Janeiro, 2017.
http://hdl.handle.net/unirio/10792
identifier_str_mv PAIVA, Eduardo Soares de. Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública. 2017. x, 111f. Dissertação (Mestrado em Informática) - Universidade Federal do estado do Rio de Janeiro, Rio de Janeiro, 2017.
url http://hdl.handle.net/unirio/10792
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Hórus
instname:Universidade Federal do Estado do Rio de Janeiro (UNIRIO)
instacron:UNIRIO
instname_str Universidade Federal do Estado do Rio de Janeiro (UNIRIO)
instacron_str UNIRIO
institution UNIRIO
reponame_str Repositório Hórus
collection Repositório Hórus
repository.name.fl_str_mv Repositório Hórus - Universidade Federal do Estado do Rio de Janeiro (UNIRIO)
repository.mail.fl_str_mv biblioteca.sid@unirio.br
_version_ 1817726461384065024