Construção automática de resumos gráficos utilizando processamento de linguagem natural

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Santos, Vinicius dos
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Programa de Pós-Graduação em Informática
UTFPR
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.utfpr.edu.br/jspui/handle/1/3282
Resumo: Context: Secondary studies, such as Systematic Literature Reviews (SLR) and Systematic Mappings (SM), have been increasingly used in Software Engineering (SE) since they allow the identification of available evidence related to a research topic. One of the main activities of the process of conducting a secondary study is the primary studies selection, which involves, at first, the reading of the abstracts of the candidate studies. However, with the growing number of scientific publications, coupled with the poor quality of their abstracts, it makes this activity increasingly difficult for researchers. Some solutions have been proposed to mitigate the problem, among them, the use of structured abstracts and graphic summaries. Previous studies have proposed guidelines for the construction of graphic summaries. However, these summaries continue to be created manually. Objectives: This work has two objectives: (i) understand the use of Conceptual Maps (CM) in Computer Science and to investigate the main techniques for generation of MCs from Natural Language Processing (NPL); (ii) propose an approach for the automatic construction of graphic abstracts based on CMs using NLP techniques. Method: initially the collection of the main practices for the construction of CMs from NLP was performed. Next, an approach for the construction of graphic summaries based on CMs was defined. Finally, evaluations were conducted in order to verify the quality of the CMs generated. Results: The pilot experiment conducted showed that the CMs constructed by the initiative demonstrated a good performance in terms of concept extraction and comprehensiveness when representing the concepts of the abstract. Conclusions: The preliminary results show that the proposed initiative can generate valid propositions and represent graphic summaries through CMs, becoming an important tool to summarize a complex structure of textual information, contributing to the identification of the most important information of an article.
id UTFPR-12_6bd36309ccbb1b64cfb8359a80f1270d
oai_identifier_str oai:repositorio.utfpr.edu.br:1/3282
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Construção automática de resumos gráficos utilizando processamento de linguagem naturalAutomatic construction of graphic summaries using natural language processingMapeamento conceitualProcessamento de linguagem natural (Computação)ResumosConcept mappingNatural language processing (Computer science)AbstractsCNPQ::CIENCIAS EXATAS E DA TERRACiência da ComputaçãoContext: Secondary studies, such as Systematic Literature Reviews (SLR) and Systematic Mappings (SM), have been increasingly used in Software Engineering (SE) since they allow the identification of available evidence related to a research topic. One of the main activities of the process of conducting a secondary study is the primary studies selection, which involves, at first, the reading of the abstracts of the candidate studies. However, with the growing number of scientific publications, coupled with the poor quality of their abstracts, it makes this activity increasingly difficult for researchers. Some solutions have been proposed to mitigate the problem, among them, the use of structured abstracts and graphic summaries. Previous studies have proposed guidelines for the construction of graphic summaries. However, these summaries continue to be created manually. Objectives: This work has two objectives: (i) understand the use of Conceptual Maps (CM) in Computer Science and to investigate the main techniques for generation of MCs from Natural Language Processing (NPL); (ii) propose an approach for the automatic construction of graphic abstracts based on CMs using NLP techniques. Method: initially the collection of the main practices for the construction of CMs from NLP was performed. Next, an approach for the construction of graphic summaries based on CMs was defined. Finally, evaluations were conducted in order to verify the quality of the CMs generated. Results: The pilot experiment conducted showed that the CMs constructed by the initiative demonstrated a good performance in terms of concept extraction and comprehensiveness when representing the concepts of the abstract. Conclusions: The preliminary results show that the proposed initiative can generate valid propositions and represent graphic summaries through CMs, becoming an important tool to summarize a complex structure of textual information, contributing to the identification of the most important information of an article.Contexto: Estudos secundários, tais como Revisões Sistemáticas da Literatura (RSL) e Mapeamentos Sistemáticos (MS), têm sido cada vez mais utilizados na Engenharia de Software (ES) uma vez que permitem a identificação de evidências disponíveis relacionadas com um tópico de pesquisa. Uma das principais atividades do processo de condução de um estudo secundário é a seleção dos estudos primários, que envolve, em um primeiro momento, a leitura dos resumos dos estudos candidatos. No entanto, com o crescente número de publicações científicas, agregado à baixa qualidade dos seus resumos, torna essa atividade cada vez mais difícil para os pesquisadores. Algumas soluções têm sido propostas para atenuar o problema, entre elas, a utilização dos resumos gráficos baseados em Mapas Conceituais (MC). No entanto, estes resumos são criados de forma manual. Objetivo: este trabalho possui dois objetivos: (i) entender o uso dos MCs na Ciência da Computação, bem como identificar as principais técnicas para geração de MCs a partir do Processamento de Linguagem Natural (PLN); e (ii) propor uma abordagem para a construção automática de resumos gráficos baseados em MCs por meio de técnicas de PLN. Método: inicialmente foram conduzidos dois mapeamentos sistemáticos da literatura para entender o uso dos MCs na ciência da computação e identificar as principais práticas para construção de MCs a partir de PLN. Em seguida, foi definida uma abordagem para construção de resumos gráficos baseados em MCs. Por fim, foram conduzidas avaliações com o objetivo de verificar a qualidade dos MCs gerados. Resultado: O experimento piloto realizado apresentou que os MCs construídos pela iniciativa demonstraram um bom desempenho em termos de extração de conceitos e abrangência ao representar o conteúdo do resumo. Conclusão: Os resultados preliminares apresentados demonstram que a iniciativa proposta pode gerar proposições válidas e representar resumos gráficos por meio de MCs, tornando-se um importante instrumento para sumarizar uma estrutura complexa de informações textuais, contribuindo para a identificação das informações mais importantes de um artigo.Universidade Tecnológica Federal do ParanáCornelio ProcopioBrasilPrograma de Pós-Graduação em InformáticaUTFPRSouza, Érica Ferreira dehttp://lattes.cnpq.br/8904855809524041Scannavino, Katia Romero Felizardohttp://lattes.cnpq.br/3546986594133608Souza, Érica Ferreira deScannavino, Katia Romero FelizardoWatanabe, Willian MassamiVijaykumar, Nandamudi LankalapalliJunior, Arnaldo CandidoSantos, Vinicius dos2018-07-09T12:51:17Z2018-07-09T12:51:17Z2018-04-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSANTOS, Vinicius dos. Construção automática de resumos gráficos utilizando processamento de linguagem natural. 2018. 80 f. Dissertação (Mestrado em Informática) – Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2018.http://repositorio.utfpr.edu.br/jspui/handle/1/3282porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2018-07-09T12:51:17Zoai:repositorio.utfpr.edu.br:1/3282Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2018-07-09T12:51:17Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Construção automática de resumos gráficos utilizando processamento de linguagem natural
Automatic construction of graphic summaries using natural language processing
title Construção automática de resumos gráficos utilizando processamento de linguagem natural
spellingShingle Construção automática de resumos gráficos utilizando processamento de linguagem natural
Santos, Vinicius dos
Mapeamento conceitual
Processamento de linguagem natural (Computação)
Resumos
Concept mapping
Natural language processing (Computer science)
Abstracts
CNPQ::CIENCIAS EXATAS E DA TERRA
Ciência da Computação
title_short Construção automática de resumos gráficos utilizando processamento de linguagem natural
title_full Construção automática de resumos gráficos utilizando processamento de linguagem natural
title_fullStr Construção automática de resumos gráficos utilizando processamento de linguagem natural
title_full_unstemmed Construção automática de resumos gráficos utilizando processamento de linguagem natural
title_sort Construção automática de resumos gráficos utilizando processamento de linguagem natural
author Santos, Vinicius dos
author_facet Santos, Vinicius dos
author_role author
dc.contributor.none.fl_str_mv Souza, Érica Ferreira de
http://lattes.cnpq.br/8904855809524041
Scannavino, Katia Romero Felizardo
http://lattes.cnpq.br/3546986594133608
Souza, Érica Ferreira de
Scannavino, Katia Romero Felizardo
Watanabe, Willian Massami
Vijaykumar, Nandamudi Lankalapalli
Junior, Arnaldo Candido
dc.contributor.author.fl_str_mv Santos, Vinicius dos
dc.subject.por.fl_str_mv Mapeamento conceitual
Processamento de linguagem natural (Computação)
Resumos
Concept mapping
Natural language processing (Computer science)
Abstracts
CNPQ::CIENCIAS EXATAS E DA TERRA
Ciência da Computação
topic Mapeamento conceitual
Processamento de linguagem natural (Computação)
Resumos
Concept mapping
Natural language processing (Computer science)
Abstracts
CNPQ::CIENCIAS EXATAS E DA TERRA
Ciência da Computação
description Context: Secondary studies, such as Systematic Literature Reviews (SLR) and Systematic Mappings (SM), have been increasingly used in Software Engineering (SE) since they allow the identification of available evidence related to a research topic. One of the main activities of the process of conducting a secondary study is the primary studies selection, which involves, at first, the reading of the abstracts of the candidate studies. However, with the growing number of scientific publications, coupled with the poor quality of their abstracts, it makes this activity increasingly difficult for researchers. Some solutions have been proposed to mitigate the problem, among them, the use of structured abstracts and graphic summaries. Previous studies have proposed guidelines for the construction of graphic summaries. However, these summaries continue to be created manually. Objectives: This work has two objectives: (i) understand the use of Conceptual Maps (CM) in Computer Science and to investigate the main techniques for generation of MCs from Natural Language Processing (NPL); (ii) propose an approach for the automatic construction of graphic abstracts based on CMs using NLP techniques. Method: initially the collection of the main practices for the construction of CMs from NLP was performed. Next, an approach for the construction of graphic summaries based on CMs was defined. Finally, evaluations were conducted in order to verify the quality of the CMs generated. Results: The pilot experiment conducted showed that the CMs constructed by the initiative demonstrated a good performance in terms of concept extraction and comprehensiveness when representing the concepts of the abstract. Conclusions: The preliminary results show that the proposed initiative can generate valid propositions and represent graphic summaries through CMs, becoming an important tool to summarize a complex structure of textual information, contributing to the identification of the most important information of an article.
publishDate 2018
dc.date.none.fl_str_mv 2018-07-09T12:51:17Z
2018-07-09T12:51:17Z
2018-04-02
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SANTOS, Vinicius dos. Construção automática de resumos gráficos utilizando processamento de linguagem natural. 2018. 80 f. Dissertação (Mestrado em Informática) – Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2018.
http://repositorio.utfpr.edu.br/jspui/handle/1/3282
identifier_str_mv SANTOS, Vinicius dos. Construção automática de resumos gráficos utilizando processamento de linguagem natural. 2018. 80 f. Dissertação (Mestrado em Informática) – Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2018.
url http://repositorio.utfpr.edu.br/jspui/handle/1/3282
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Programa de Pós-Graduação em Informática
UTFPR
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Programa de Pós-Graduação em Informática
UTFPR
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850498360018993152