Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública
| Ano de defesa: | 2017 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://hdl.handle.net/unirio/10792 |
Resumo: | Dissertação também disponível em formato impresso, com o número de chamada CCET MI 2017/02 |
| id |
UNIRIO_11caf9f1a86f1d133e1b082368e4fc0f |
|---|---|
| oai_identifier_str |
oai:localhost:unirio/10792 |
| network_acronym_str |
UNIRIO |
| network_name_str |
Repositório Hórus |
| repository_id_str |
|
| spelling |
Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência públicaCIÊNCIAS EXATAS E DA TERRACIÊNCIA DA COMPUTAÇÃOPublic transparencyText miningData treatmentData intensive processingTransparência públicaMineração de textoTratamento de dadosProcessamento intensivo de dadosDissertação também disponível em formato impresso, com o número de chamada CCET MI 2017/02n/aThe public transparency portals are becoming important communication channels between government and society. However, not always the portals present the information in the most appropriate format. For example, the description of purchases in text format hinders analysis of purchases, as to know the products that are being acquired, it is necessary reading and interpreting of each purchase description, what is humanly impossible due to large data volume presented. Thus, this work goal is automatically identifying the products that are textually specified in the purchase descriptions. So this dissertation research question is: How to automatically identify products by textual specifications, used to characterize them in expenditure, descriptions presented in the public transparency portals? For this, a knowledge discovery process is proposed in textual data capable of generating rules that allow products identification from purchases textual descriptions. This research was performed using the CRISP-DM (Cross Industry Standard Process for Data Mining) methodology and its evaluation was divided into two parts: the first evaluates the rules generated, while the second checks the results quality obtained in identifying process of the purchases. The studies concluded that the proposed process presented satisfactory results, but there are still many other possibilities for improvement that can be explored in future work.n/aOs portais de transparência pública vêm se constituindo em importantes canais de comunicação entre o governo e a sociedade. No entanto, nem sempre o formato das informações apresentadas nesses portais é o mais apropriado. Por exemplo, as descrições de compras em formato de texto dificultam a análise dessas compras, pois para se saber os produtos que estão sendo adquiridos é necessária uma leitura e interpretação de cada descrição de compra, o que é humanamente impossível, devido ao grande volume de dados apresentados. Dessa forma, o objetivo desse trabalho é fazer a identificação automática dos produtos que são especificados de forma textual nas descrições de compras. Logo, a questão de pesquisa dessa dissertação é: como identificar de forma automatizada os produtos a partir das especificações textuais que são usadas para caracterizá-los nas descrições dos gastos que são apresentados nos portais de transparência pública? Para isso, é proposto um processo de descoberta de conhecimento em dados textuais capaz de gerar regras que possibilitam a identificação de produtos a partir das descrições textuais de compras. A pesquisa foi realizada utilizando a metodologia CRISP-DM (Cross Industry Standard Process for Data Mining) e sua avaliação foi dividida em duas partes: a primeira avalia as regras geradas, enquanto que a segunda verifica a qualidade dos resultados obtidos no processo de identificação de compras propriamente dito. Os estudos concluíram que o processo proposto apresentou resultados satisfatórios, porém ainda existem muitas outras possibilidades de melhorias que podem ser exploradas em trabalhos futuros.Revoredo, Kate CerqueiraRevoredo, Kate CerqueiraAló, Claudia CappelliBernardini, Flávia CristinaPaiva, Eduardo Soares de2018-02-02T13:44:21Z2018-02-02T13:44:21Z2017-02-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPAIVA, Eduardo Soares de. Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública. 2017. x, 111f. Dissertação (Mestrado em Informática) - Universidade Federal do estado do Rio de Janeiro, Rio de Janeiro, 2017.http://hdl.handle.net/unirio/10792info:eu-repo/semantics/openAccessporreponame:Repositório Hórusinstname:Universidade Federal do Estado do Rio de Janeiro (UNIRIO)instacron:UNIRIO2018-03-14T22:23:31Zoai:localhost:unirio/10792Repositório InstitucionalPUBhttp://www.repositorio-bc.unirio.br:8080/oai/requestbiblioteca.sid@unirio.bropendoar:2024-12-06T17:56:50.545119Repositório Hórus - Universidade Federal do Estado do Rio de Janeiro (UNIRIO)false |
| dc.title.none.fl_str_mv |
Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública |
| title |
Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública |
| spellingShingle |
Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública Paiva, Eduardo Soares de CIÊNCIAS EXATAS E DA TERRA CIÊNCIA DA COMPUTAÇÃO Public transparency Text mining Data treatment Data intensive processing Transparência pública Mineração de texto Tratamento de dados Processamento intensivo de dados |
| title_short |
Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública |
| title_full |
Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública |
| title_fullStr |
Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública |
| title_full_unstemmed |
Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública |
| title_sort |
Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública |
| author |
Paiva, Eduardo Soares de |
| author_facet |
Paiva, Eduardo Soares de |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Revoredo, Kate Cerqueira Revoredo, Kate Cerqueira Aló, Claudia Cappelli Bernardini, Flávia Cristina |
| dc.contributor.author.fl_str_mv |
Paiva, Eduardo Soares de |
| dc.subject.por.fl_str_mv |
CIÊNCIAS EXATAS E DA TERRA CIÊNCIA DA COMPUTAÇÃO Public transparency Text mining Data treatment Data intensive processing Transparência pública Mineração de texto Tratamento de dados Processamento intensivo de dados |
| topic |
CIÊNCIAS EXATAS E DA TERRA CIÊNCIA DA COMPUTAÇÃO Public transparency Text mining Data treatment Data intensive processing Transparência pública Mineração de texto Tratamento de dados Processamento intensivo de dados |
| description |
Dissertação também disponível em formato impresso, com o número de chamada CCET MI 2017/02 |
| publishDate |
2017 |
| dc.date.none.fl_str_mv |
2017-02-21 2018-02-02T13:44:21Z 2018-02-02T13:44:21Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
PAIVA, Eduardo Soares de. Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública. 2017. x, 111f. Dissertação (Mestrado em Informática) - Universidade Federal do estado do Rio de Janeiro, Rio de Janeiro, 2017. http://hdl.handle.net/unirio/10792 |
| identifier_str_mv |
PAIVA, Eduardo Soares de. Geração de regras de identificação de produtos em descrições textuais de compras apresentadas em portais de transparência pública. 2017. x, 111f. Dissertação (Mestrado em Informática) - Universidade Federal do estado do Rio de Janeiro, Rio de Janeiro, 2017. |
| url |
http://hdl.handle.net/unirio/10792 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.source.none.fl_str_mv |
reponame:Repositório Hórus instname:Universidade Federal do Estado do Rio de Janeiro (UNIRIO) instacron:UNIRIO |
| instname_str |
Universidade Federal do Estado do Rio de Janeiro (UNIRIO) |
| instacron_str |
UNIRIO |
| institution |
UNIRIO |
| reponame_str |
Repositório Hórus |
| collection |
Repositório Hórus |
| repository.name.fl_str_mv |
Repositório Hórus - Universidade Federal do Estado do Rio de Janeiro (UNIRIO) |
| repository.mail.fl_str_mv |
biblioteca.sid@unirio.br |
| _version_ |
1817726461384065024 |