Utilização de uma rede multilayer perceptron para buscasemântica de código-fonte a partir de linguagem natural
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Centro Universitário FEI, São Bernardo do Campo
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.fei.edu.br/handle/FEI/5291 https://doi.org/10.31414/EE.2024.D.131707 |
Resumo: | Ferramentas de busca de código-fonte a partir de linguagem natural são cada vez mais importantes no dia a dia de engenheiros e desenvolvedores de software. Atualmente, modelos transformers são o estado da arte em diversas tarefas da área de Natural Language Processing (NLP), como busca de código-fonte a partir de linguagem natural. Porém, tais modelos requerem muito tempo e recursos computacionais para serem treinados em um determinado domínio (fine-tuning). Por outro lado, redes neurais clássicas, como Multilayer perceptron (MLP) por exemplo, necessitam de menos recursos para seu treinamento, porém não obtém os resultados dos modelos transformers. Diante disso, o objetivo do presente trabalho é utilizar uma rede MLP para determinar a similaridade entre dois embeddings, gerados por redes transformers, de dois domínios diferentes: linguagem natural e linguagem de programação. Para tanto, serão utilizados mais de 10000 pares código-fonte/comentário, bem como um conjunto de buscas (queries) e seus resultados esperados; ambos oriundos da base de dados CodeSearchNet. Por fim, a rede obteve bons resultados em determinadas amostras, conseguindo captar informações semânticas do par código-fonte/comentário |
| id |
FEI_cb70bd16db8a476a599321c35c05fe15 |
|---|---|
| oai_identifier_str |
oai:repositorio.fei.edu.br:FEI/5291 |
| network_acronym_str |
FEI |
| network_name_str |
Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) |
| repository_id_str |
|
| spelling |
Pompolo, Adalberto NassuBergamasco, L. C. C.2024-03-07T12:21:26Z2024-03-07T12:21:26Z2024POMPOLO, Adalberto Nassu. <b> Utilização de uma rede multilayer perceptron para buscasemântica de código-fonte a partir de linguagem natural. </b> 2024. 65 p. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2024. Disponível em: https://doi.org/10.31414/EE.2024.D.131707.https://repositorio.fei.edu.br/handle/FEI/5291https://doi.org/10.31414/EE.2024.D.131707Ferramentas de busca de código-fonte a partir de linguagem natural são cada vez mais importantes no dia a dia de engenheiros e desenvolvedores de software. Atualmente, modelos transformers são o estado da arte em diversas tarefas da área de Natural Language Processing (NLP), como busca de código-fonte a partir de linguagem natural. Porém, tais modelos requerem muito tempo e recursos computacionais para serem treinados em um determinado domínio (fine-tuning). Por outro lado, redes neurais clássicas, como Multilayer perceptron (MLP) por exemplo, necessitam de menos recursos para seu treinamento, porém não obtém os resultados dos modelos transformers. Diante disso, o objetivo do presente trabalho é utilizar uma rede MLP para determinar a similaridade entre dois embeddings, gerados por redes transformers, de dois domínios diferentes: linguagem natural e linguagem de programação. Para tanto, serão utilizados mais de 10000 pares código-fonte/comentário, bem como um conjunto de buscas (queries) e seus resultados esperados; ambos oriundos da base de dados CodeSearchNet. Por fim, a rede obteve bons resultados em determinadas amostras, conseguindo captar informações semânticas do par código-fonte/comentárioCode search tools using natural language queries are becoming an essential tool for software engineers. Nowadays, the transformers models are the state-of-art for several natural language processing tasks such as code search using natural language. However, such models requires a lot of computational resources for training in a specific domain (fine-tuning). On the other hand, classical neural networks such as MLP takes less computational resources for training in a specific domain, but it does not achieve the transformers models results. That being said, the goal of this study is to use a MLP network to determine the similarity between two transformers embeddings from two different domains: one trained using NLP and the other using code snippets. Therefore, it will be used more than 10000 code/comment pairs as well as a annotated queries dataset; both datasets came from the CodeSearchNet database. At the end, the network yields good results in a subset of samples, detecting semantic information within the code/comment pairCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESporpt_BRCentro Universitário FEI, São Bernardo do CampoCódigo fonteLinguagem naturalTransformersUtilização de uma rede multilayer perceptron para buscasemântica de código-fonte a partir de linguagem naturalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)instname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEIinfo:eu-repo/semantics/openAccessORIGINALfulltext.pdfapplication/pdf2240213https://repositorio.fei.edu.br/bitstreams/55fb7f4e-de6f-48b4-94cc-a5fdc3b8022e/download753d841f55e151bdfa2ff16d30855686MD51trueAnonymousREADTEXTfulltext.pdf.txtfulltext.pdf.txtExtracted texttext/plain102278https://repositorio.fei.edu.br/bitstreams/04e98206-521f-4e08-b454-18fb73efa21b/download028d0f51cc87779b58e71948878d2378MD52falseAnonymousREADTHUMBNAILfulltext.pdf.jpgfulltext.pdf.jpgGenerated Thumbnailimage/jpeg2540https://repositorio.fei.edu.br/bitstreams/5b59ce06-80dc-495c-af51-651b94014e65/download22b2fca9e96111373b1cca21bd7ec4b2MD53falseAnonymousREADFEI/52912025-03-31 22:02:23.299open.accessoai:repositorio.fei.edu.br:FEI/5291https://repositorio.fei.edu.brBiblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttps://repositorio-api.fei.edu.br/server/oai/requestcfernandes@fei.edu.bropendoar:2025-03-31T22:02:23Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) - Centro Universitário da Fundação Educacional Inaciana (FEI)false |
| dc.title.pt_BR.fl_str_mv |
Utilização de uma rede multilayer perceptron para buscasemântica de código-fonte a partir de linguagem natural |
| title |
Utilização de uma rede multilayer perceptron para buscasemântica de código-fonte a partir de linguagem natural |
| spellingShingle |
Utilização de uma rede multilayer perceptron para buscasemântica de código-fonte a partir de linguagem natural Pompolo, Adalberto Nassu Código fonte Linguagem natural Transformers |
| title_short |
Utilização de uma rede multilayer perceptron para buscasemântica de código-fonte a partir de linguagem natural |
| title_full |
Utilização de uma rede multilayer perceptron para buscasemântica de código-fonte a partir de linguagem natural |
| title_fullStr |
Utilização de uma rede multilayer perceptron para buscasemântica de código-fonte a partir de linguagem natural |
| title_full_unstemmed |
Utilização de uma rede multilayer perceptron para buscasemântica de código-fonte a partir de linguagem natural |
| title_sort |
Utilização de uma rede multilayer perceptron para buscasemântica de código-fonte a partir de linguagem natural |
| author |
Pompolo, Adalberto Nassu |
| author_facet |
Pompolo, Adalberto Nassu |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Pompolo, Adalberto Nassu |
| dc.contributor.advisor1.fl_str_mv |
Bergamasco, L. C. C. |
| contributor_str_mv |
Bergamasco, L. C. C. |
| dc.subject.por.fl_str_mv |
Código fonte Linguagem natural Transformers |
| topic |
Código fonte Linguagem natural Transformers |
| description |
Ferramentas de busca de código-fonte a partir de linguagem natural são cada vez mais importantes no dia a dia de engenheiros e desenvolvedores de software. Atualmente, modelos transformers são o estado da arte em diversas tarefas da área de Natural Language Processing (NLP), como busca de código-fonte a partir de linguagem natural. Porém, tais modelos requerem muito tempo e recursos computacionais para serem treinados em um determinado domínio (fine-tuning). Por outro lado, redes neurais clássicas, como Multilayer perceptron (MLP) por exemplo, necessitam de menos recursos para seu treinamento, porém não obtém os resultados dos modelos transformers. Diante disso, o objetivo do presente trabalho é utilizar uma rede MLP para determinar a similaridade entre dois embeddings, gerados por redes transformers, de dois domínios diferentes: linguagem natural e linguagem de programação. Para tanto, serão utilizados mais de 10000 pares código-fonte/comentário, bem como um conjunto de buscas (queries) e seus resultados esperados; ambos oriundos da base de dados CodeSearchNet. Por fim, a rede obteve bons resultados em determinadas amostras, conseguindo captar informações semânticas do par código-fonte/comentário |
| publishDate |
2024 |
| dc.date.accessioned.fl_str_mv |
2024-03-07T12:21:26Z |
| dc.date.available.fl_str_mv |
2024-03-07T12:21:26Z |
| dc.date.issued.fl_str_mv |
2024 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
POMPOLO, Adalberto Nassu. <b> Utilização de uma rede multilayer perceptron para buscasemântica de código-fonte a partir de linguagem natural. </b> 2024. 65 p. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2024. Disponível em: https://doi.org/10.31414/EE.2024.D.131707. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.fei.edu.br/handle/FEI/5291 |
| dc.identifier.doi.none.fl_str_mv |
https://doi.org/10.31414/EE.2024.D.131707 |
| identifier_str_mv |
POMPOLO, Adalberto Nassu. <b> Utilização de uma rede multilayer perceptron para buscasemântica de código-fonte a partir de linguagem natural. </b> 2024. 65 p. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2024. Disponível em: https://doi.org/10.31414/EE.2024.D.131707. |
| url |
https://repositorio.fei.edu.br/handle/FEI/5291 https://doi.org/10.31414/EE.2024.D.131707 |
| dc.language.iso.fl_str_mv |
por pt_BR |
| language |
por |
| language_invalid_str_mv |
pt_BR |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Centro Universitário FEI, São Bernardo do Campo |
| publisher.none.fl_str_mv |
Centro Universitário FEI, São Bernardo do Campo |
| dc.source.none.fl_str_mv |
reponame:Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) instname:Centro Universitário da Fundação Educacional Inaciana (FEI) instacron:FEI |
| instname_str |
Centro Universitário da Fundação Educacional Inaciana (FEI) |
| instacron_str |
FEI |
| institution |
FEI |
| reponame_str |
Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) |
| collection |
Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) |
| bitstream.url.fl_str_mv |
https://repositorio.fei.edu.br/bitstreams/55fb7f4e-de6f-48b4-94cc-a5fdc3b8022e/download https://repositorio.fei.edu.br/bitstreams/04e98206-521f-4e08-b454-18fb73efa21b/download https://repositorio.fei.edu.br/bitstreams/5b59ce06-80dc-495c-af51-651b94014e65/download |
| bitstream.checksum.fl_str_mv |
753d841f55e151bdfa2ff16d30855686 028d0f51cc87779b58e71948878d2378 22b2fca9e96111373b1cca21bd7ec4b2 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) - Centro Universitário da Fundação Educacional Inaciana (FEI) |
| repository.mail.fl_str_mv |
cfernandes@fei.edu.br |
| _version_ |
1865734575323348992 |