Aplicação da arquitetura transformer para sumarização de artigoscientíficos
| Ano de defesa: | 2023 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Centro Universitário FEI, São Bernardo do Campo
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.fei.edu.br/handle/FEI/4845 https://doi.org/10.31414/EE.2023.D.131625 |
Resumo: | O processo de pesquisa científica tem como sua fase inicial a exploração de artigos para o conhecimento do estado da arte do tema a ser investigado. Em virtude do crescimento de dados em artigos científicos e do curso constante da informatização, tornam-se necessários mecanismos que sejam capazes de resumir artigos científicos com a finalidade de melhorar o processo de aquisição de pesquisas e direcionar a pessoa pesquisadora a acessar conteúdos relevantes. Os trabalhos de sumarização de artigos científicos, de modo geral, apresentam métodos de relevância de sentenças e aprendizado de máquina. Nos últimos anos, mecanismos de atenção associados a redes neurais e processamento de linguagem natural vêm sendo propostos para interpretare contextualizar atividades de processamento de linguagens, sendo uma delas a textual. Paralelamente, a arquitetura Transformer sugere uma modelagem de transdução com mecanismos de autoatenção - prescindindo de convoluções e recorrências - é aplicada a diversos campos da Inteligência Articial com resultados considerados promissores. Este trabalho propôs empregar o modelo pré-treinado Longformer para a atividade de sumarização de artigos científicos da base de dados SciSummNet através de etapas de pré-processamento, fine-tuning e geração dos resumos. Os resultados obtidos indicaram melhoria de 20,8% para ROUGE-2 recall e 22,69% para ROUGE-2 F-Measure em relação ao trabalho original da base SciSummNet através do modelo ComAbstract |
| id |
FEI_b10406fc4655e3efb6d59cf6994e4b8e |
|---|---|
| oai_identifier_str |
oai:repositorio.fei.edu.br:FEI/4845 |
| network_acronym_str |
FEI |
| network_name_str |
Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) |
| repository_id_str |
|
| spelling |
Lima, Amanda Maciel deRodrigues, Paulo Sérgio Silva2023-06-08T15:28:14Z2023-06-08T15:28:14Z2023LIMA, Amanda Maciel de. <b> Aplicação da arquitetura transformer para sumarização de artigoscientíficos. </b> 2023. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2023. Disponível em: https://doi.org/10.31414/EE.2023.D.131625.https://repositorio.fei.edu.br/handle/FEI/4845https://doi.org/10.31414/EE.2023.D.131625O processo de pesquisa científica tem como sua fase inicial a exploração de artigos para o conhecimento do estado da arte do tema a ser investigado. Em virtude do crescimento de dados em artigos científicos e do curso constante da informatização, tornam-se necessários mecanismos que sejam capazes de resumir artigos científicos com a finalidade de melhorar o processo de aquisição de pesquisas e direcionar a pessoa pesquisadora a acessar conteúdos relevantes. Os trabalhos de sumarização de artigos científicos, de modo geral, apresentam métodos de relevância de sentenças e aprendizado de máquina. Nos últimos anos, mecanismos de atenção associados a redes neurais e processamento de linguagem natural vêm sendo propostos para interpretare contextualizar atividades de processamento de linguagens, sendo uma delas a textual. Paralelamente, a arquitetura Transformer sugere uma modelagem de transdução com mecanismos de autoatenção - prescindindo de convoluções e recorrências - é aplicada a diversos campos da Inteligência Articial com resultados considerados promissores. Este trabalho propôs empregar o modelo pré-treinado Longformer para a atividade de sumarização de artigos científicos da base de dados SciSummNet através de etapas de pré-processamento, fine-tuning e geração dos resumos. Os resultados obtidos indicaram melhoria de 20,8% para ROUGE-2 recall e 22,69% para ROUGE-2 F-Measure em relação ao trabalho original da base SciSummNet através do modelo ComAbstractThe scientific research process has as its initial phase the exploration of articles for the knowledge of the state of the art of the theme to be investigated. Due to the growth of data in scientific articles and the constant course of computerization, mechanisms that are capable of summarizing scientific articles become necessary in order to improve the research acquisition process and direct the researcher to access relevant content. Scientific articles summarizing works, in general, present sentence relevance and machine learning methods. In recent years, attention mechanisms associated with neural networks and natural language processing have been proposed to interpret and contextualize language processing activities, one of which is textual. In recent years, attention mechanisms associated with neural networks and natural language processing have been proposed to interpret and contextualize language processing activities, one of which is textual. At the same time, the Transformer architecture suggests a transduction modeling with self-attention mechanisms - dispensing with convolutions and recurrences - is applied to several fields of Artificial Intelligence with results considered promising. This work proposes to use the Longformer pre-trained model for summarizing scientific articles from the SciSummNet database through pre-processing, fine-tuning and summary generation steps. The results obtained indicated an improvement of 20.8% for ROUGE-2 recall and 22.69% for ROUGE-2 F-Measure in relation to the original work of the base SciSummNet through the variation model called WithAbstractFundação Educacional Inaciana Padre Saboia de Medeirosporpt_BRCentro Universitário FEI, São Bernardo do CampoProcessamento de linguagem natural (Computação)Sumarização Abstrativa de TextoArtigos científicosArquitetura transformerLongformerAplicação da arquitetura transformer para sumarização de artigoscientíficosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisProcessamento de Sinais e Imagensreponame:Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)instname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEIinfo:eu-repo/semantics/openAccessORIGINALfulltext.pdfapplication/pdf1757062https://repositorio.fei.edu.br/bitstreams/b1594f2a-8189-4008-b755-993ff0b6dbd5/download7711e56063b237e013b08e86884c0213MD51trueAnonymousREADTEXTfulltext.pdf.txtfulltext.pdf.txtExtracted texttext/plain103263https://repositorio.fei.edu.br/bitstreams/2d11b69f-1b7c-45b3-89ab-61a2ddd80518/download198662f11b1752dd6645caa33ab33eabMD52falseAnonymousREADTHUMBNAILfulltext.pdf.jpgfulltext.pdf.jpgGenerated Thumbnailimage/jpeg2489https://repositorio.fei.edu.br/bitstreams/3fa1c426-6922-45f4-962e-fb30e2006e2b/downloadb45ed971c06ffa36b363040dc51004d9MD53falseAnonymousREADFEI/48452025-06-18 22:47:26.773open.accessoai:repositorio.fei.edu.br:FEI/4845https://repositorio.fei.edu.brBiblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttps://repositorio-api.fei.edu.br/server/oai/requestcfernandes@fei.edu.bropendoar:2025-06-18T22:47:26Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) - Centro Universitário da Fundação Educacional Inaciana (FEI)false |
| dc.title.pt_BR.fl_str_mv |
Aplicação da arquitetura transformer para sumarização de artigoscientíficos |
| title |
Aplicação da arquitetura transformer para sumarização de artigoscientíficos |
| spellingShingle |
Aplicação da arquitetura transformer para sumarização de artigoscientíficos Lima, Amanda Maciel de Processamento de linguagem natural (Computação) Sumarização Abstrativa de Texto Artigos científicos Arquitetura transformer Longformer |
| title_short |
Aplicação da arquitetura transformer para sumarização de artigoscientíficos |
| title_full |
Aplicação da arquitetura transformer para sumarização de artigoscientíficos |
| title_fullStr |
Aplicação da arquitetura transformer para sumarização de artigoscientíficos |
| title_full_unstemmed |
Aplicação da arquitetura transformer para sumarização de artigoscientíficos |
| title_sort |
Aplicação da arquitetura transformer para sumarização de artigoscientíficos |
| author |
Lima, Amanda Maciel de |
| author_facet |
Lima, Amanda Maciel de |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Lima, Amanda Maciel de |
| dc.contributor.advisor1.fl_str_mv |
Rodrigues, Paulo Sérgio Silva |
| contributor_str_mv |
Rodrigues, Paulo Sérgio Silva |
| dc.subject.por.fl_str_mv |
Processamento de linguagem natural (Computação) Sumarização Abstrativa de Texto Artigos científicos Arquitetura transformer Longformer |
| topic |
Processamento de linguagem natural (Computação) Sumarização Abstrativa de Texto Artigos científicos Arquitetura transformer Longformer |
| description |
O processo de pesquisa científica tem como sua fase inicial a exploração de artigos para o conhecimento do estado da arte do tema a ser investigado. Em virtude do crescimento de dados em artigos científicos e do curso constante da informatização, tornam-se necessários mecanismos que sejam capazes de resumir artigos científicos com a finalidade de melhorar o processo de aquisição de pesquisas e direcionar a pessoa pesquisadora a acessar conteúdos relevantes. Os trabalhos de sumarização de artigos científicos, de modo geral, apresentam métodos de relevância de sentenças e aprendizado de máquina. Nos últimos anos, mecanismos de atenção associados a redes neurais e processamento de linguagem natural vêm sendo propostos para interpretare contextualizar atividades de processamento de linguagens, sendo uma delas a textual. Paralelamente, a arquitetura Transformer sugere uma modelagem de transdução com mecanismos de autoatenção - prescindindo de convoluções e recorrências - é aplicada a diversos campos da Inteligência Articial com resultados considerados promissores. Este trabalho propôs empregar o modelo pré-treinado Longformer para a atividade de sumarização de artigos científicos da base de dados SciSummNet através de etapas de pré-processamento, fine-tuning e geração dos resumos. Os resultados obtidos indicaram melhoria de 20,8% para ROUGE-2 recall e 22,69% para ROUGE-2 F-Measure em relação ao trabalho original da base SciSummNet através do modelo ComAbstract |
| publishDate |
2023 |
| dc.date.accessioned.fl_str_mv |
2023-06-08T15:28:14Z |
| dc.date.available.fl_str_mv |
2023-06-08T15:28:14Z |
| dc.date.issued.fl_str_mv |
2023 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
LIMA, Amanda Maciel de. <b> Aplicação da arquitetura transformer para sumarização de artigoscientíficos. </b> 2023. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2023. Disponível em: https://doi.org/10.31414/EE.2023.D.131625. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.fei.edu.br/handle/FEI/4845 |
| dc.identifier.doi.none.fl_str_mv |
https://doi.org/10.31414/EE.2023.D.131625 |
| identifier_str_mv |
LIMA, Amanda Maciel de. <b> Aplicação da arquitetura transformer para sumarização de artigoscientíficos. </b> 2023. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2023. Disponível em: https://doi.org/10.31414/EE.2023.D.131625. |
| url |
https://repositorio.fei.edu.br/handle/FEI/4845 https://doi.org/10.31414/EE.2023.D.131625 |
| dc.language.iso.fl_str_mv |
por pt_BR |
| language |
por |
| language_invalid_str_mv |
pt_BR |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.coverage.area.none.fl_str_mv |
Processamento de Sinais e Imagens |
| dc.publisher.none.fl_str_mv |
Centro Universitário FEI, São Bernardo do Campo |
| publisher.none.fl_str_mv |
Centro Universitário FEI, São Bernardo do Campo |
| dc.source.none.fl_str_mv |
reponame:Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) instname:Centro Universitário da Fundação Educacional Inaciana (FEI) instacron:FEI |
| instname_str |
Centro Universitário da Fundação Educacional Inaciana (FEI) |
| instacron_str |
FEI |
| institution |
FEI |
| reponame_str |
Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) |
| collection |
Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) |
| bitstream.url.fl_str_mv |
https://repositorio.fei.edu.br/bitstreams/b1594f2a-8189-4008-b755-993ff0b6dbd5/download https://repositorio.fei.edu.br/bitstreams/2d11b69f-1b7c-45b3-89ab-61a2ddd80518/download https://repositorio.fei.edu.br/bitstreams/3fa1c426-6922-45f4-962e-fb30e2006e2b/download |
| bitstream.checksum.fl_str_mv |
7711e56063b237e013b08e86884c0213 198662f11b1752dd6645caa33ab33eab b45ed971c06ffa36b363040dc51004d9 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) - Centro Universitário da Fundação Educacional Inaciana (FEI) |
| repository.mail.fl_str_mv |
cfernandes@fei.edu.br |
| _version_ |
1865734571197202432 |