Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Tecnológica Federal do Paraná
Cornelio Procopio Brasil Programa de Pós-Graduação em Informática UTFPR |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://repositorio.utfpr.edu.br/jspui/handle/1/38861 |
Resumo: | Effort estimation in software projects plays a crucial role, directly influencing planning, cost, and development success. With the growing adoption of agile methodologies, new estimation techniques focused on agility and efficiency have emerged. At the same time, the use of machine learning techniques has enabled the development of models that seek to increase the accuracy of these estimates. However, many of these models were trained exclusively on English-language data, limiting their applicability in other languages. Therefore, this dissertation proposes the study and development of an effort estimation model based on textual requirements, supporting both Portuguese and English. The model was built with a deep learning LSTM architecture, using pretrained embeddings from a contextualized language model. For comparison purposes, the XLNet and FastText models (contextualized and context-free, respectively) were selected. To conduct the experiment, we used a database containing 23,313 user stories extracted from 16 open source projects. The experiments were conducted with data in both languages, obtaining, for English, a Mean Absolute Error (MAE) of 3.77, a Mean Squared Error (MSE) of 79.94, and a Median Absolute Error (MOAE) of 1.93, outperforming related works, such as the BERT model, with improvements of 11% in the MAE metric, 7% in the MSE, and 16% in the MOAE. For Portuguese, the results were: MAE of 3.94, MSE of 81.33, and MOAE of 1.94. These results indicate that the proposed model is effective and competitive with the state-of-the-art, in addition to being applicable to different languages. As a practical contribution, the dissertation also presents a web application that allows the use of the model by development teams, promoting faster, more accessible and accurate estimates. |
| id |
UTFPR-12_904b6956fc8984c398ced773389c927e |
|---|---|
| oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/38861 |
| network_acronym_str |
UTFPR-12 |
| network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository_id_str |
|
| spelling |
Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuaisEsapp: a model for estimating software effort from textual requirementsEngenharia de softwareProcessamento de linguagem natural (Computação)Software de aplicação - DesenvolvimentoSoftware engineeringNatural language processing (Computer science)Application software - DevelopmentCNPQ::ENGENHARIASCiência da ComputaçãoEffort estimation in software projects plays a crucial role, directly influencing planning, cost, and development success. With the growing adoption of agile methodologies, new estimation techniques focused on agility and efficiency have emerged. At the same time, the use of machine learning techniques has enabled the development of models that seek to increase the accuracy of these estimates. However, many of these models were trained exclusively on English-language data, limiting their applicability in other languages. Therefore, this dissertation proposes the study and development of an effort estimation model based on textual requirements, supporting both Portuguese and English. The model was built with a deep learning LSTM architecture, using pretrained embeddings from a contextualized language model. For comparison purposes, the XLNet and FastText models (contextualized and context-free, respectively) were selected. To conduct the experiment, we used a database containing 23,313 user stories extracted from 16 open source projects. The experiments were conducted with data in both languages, obtaining, for English, a Mean Absolute Error (MAE) of 3.77, a Mean Squared Error (MSE) of 79.94, and a Median Absolute Error (MOAE) of 1.93, outperforming related works, such as the BERT model, with improvements of 11% in the MAE metric, 7% in the MSE, and 16% in the MOAE. For Portuguese, the results were: MAE of 3.94, MSE of 81.33, and MOAE of 1.94. These results indicate that the proposed model is effective and competitive with the state-of-the-art, in addition to being applicable to different languages. As a practical contribution, the dissertation also presents a web application that allows the use of the model by development teams, promoting faster, more accessible and accurate estimates.A estimativa de esforço em projetos de software desempenha um papel crucial, influenciando diretamente o planejamento, o custo e o sucesso do desenvolvimento. Com a adoção crescente de metodologias ágeis, surgiram novas técnicas de estimativa voltadas a agilidade e eficiência. Paralelamente, o uso de técnicas de machine learning tem possibilitado o desenvolvimento de modelos que buscam aumentar a precisão dessas estimativas. No entanto, muitos desses modelos foram treinados exclusivamente com dados em língua inglesa, limitando sua aplicabilidade em outros idiomas. Diante disso, esta dissertação propõe o estudo e o desenvolvimento de um modelo de estimativa de esforço baseado em requisitos textuais, com suporte aos idiomas português e inglês. O modelo foi construído com uma arquitetura de deep learning LSTM, utilizando embeddings pre-treinados de um modelo de linguagem contextualizado. Para fins de comparação foram selecionados os modelos XLNet e FastText (contextualizado e sem contexto, respectivamente). Para a condução do experimento, foi utilizada uma base de dados contendo 23.313 ˜ historias de usuários, extraídas de 16 projetos open source. Os experimentos foram conduzidos com dados nos dois idiomas, obtendo, para o ingles, um Erro Absoluto Medio (MAE) de 3,77, Erro Quadráico Médio (MSE) de 79,94 e Erro Absoluto Mediano ´ (MdAE) de 1,93, superando trabalhos relacionados, como o modelo BERT, com melhorias de 11% na metrica MAE, 7% em MSE e 16% em MdAE. Para o português, os resultados foram: MAE de 3,94, MSE de 81,33 e MdAE de 1,94. Esses resultados indicam que o modelo proposto e eficaz e competitivo em relação ao estado da arte, alem de ser aplicável a diferentes idiomas. Como contribuição prática, a dissertação apresenta também uma aplicação web que permite o uso do modelo por equipes de desenvolvimento, promovendo estimativas mais rápidas, acessíveis e precisas.Universidade Tecnológica Federal do ParanáCornelio ProcopioBrasilPrograma de Pós-Graduação em InformáticaUTFPRSanches, Silvio Ricardo Rodrigueshttps://orcid.org/0000-0003-3635-7477https://lattes.cnpq.br/9931293076574399Souza, Francisco Carlos Monteirohttps://orcid.org/0000-0002-8953-8653https://lattes.cnpq.br/0057958225738520Oliveira, Claiton dehttps://lattes.cnpq.br/8851289265109891Correa, Cleber Gimenezhttps://lattes.cnpq.br/0521761025000380Souza, Francisco Carlos Monteirohttps://lattes.cnpq.br/0057958225738520Nakamura, RicardoSanches, Silvio Ricardo Rodrigueshttps://lattes.cnpq.br/9931293076574399Silva, Daniel de Oliveira2025-11-05T20:35:38Z2025-11-05T20:35:38Z2025-08-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSILVA, Daniel de Oliveira. Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais. 2025. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2025.http://repositorio.utfpr.edu.br/jspui/handle/1/38861porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2025-11-06T06:15:38Zoai:repositorio.utfpr.edu.br:1/38861Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2025-11-06T06:15:38Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
| dc.title.none.fl_str_mv |
Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais Esapp: a model for estimating software effort from textual requirements |
| title |
Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais |
| spellingShingle |
Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais Silva, Daniel de Oliveira Engenharia de software Processamento de linguagem natural (Computação) Software de aplicação - Desenvolvimento Software engineering Natural language processing (Computer science) Application software - Development CNPQ::ENGENHARIAS Ciência da Computação |
| title_short |
Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais |
| title_full |
Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais |
| title_fullStr |
Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais |
| title_full_unstemmed |
Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais |
| title_sort |
Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais |
| author |
Silva, Daniel de Oliveira |
| author_facet |
Silva, Daniel de Oliveira |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Sanches, Silvio Ricardo Rodrigues https://orcid.org/0000-0003-3635-7477 https://lattes.cnpq.br/9931293076574399 Souza, Francisco Carlos Monteiro https://orcid.org/0000-0002-8953-8653 https://lattes.cnpq.br/0057958225738520 Oliveira, Claiton de https://lattes.cnpq.br/8851289265109891 Correa, Cleber Gimenez https://lattes.cnpq.br/0521761025000380 Souza, Francisco Carlos Monteiro https://lattes.cnpq.br/0057958225738520 Nakamura, Ricardo Sanches, Silvio Ricardo Rodrigues https://lattes.cnpq.br/9931293076574399 |
| dc.contributor.author.fl_str_mv |
Silva, Daniel de Oliveira |
| dc.subject.por.fl_str_mv |
Engenharia de software Processamento de linguagem natural (Computação) Software de aplicação - Desenvolvimento Software engineering Natural language processing (Computer science) Application software - Development CNPQ::ENGENHARIAS Ciência da Computação |
| topic |
Engenharia de software Processamento de linguagem natural (Computação) Software de aplicação - Desenvolvimento Software engineering Natural language processing (Computer science) Application software - Development CNPQ::ENGENHARIAS Ciência da Computação |
| description |
Effort estimation in software projects plays a crucial role, directly influencing planning, cost, and development success. With the growing adoption of agile methodologies, new estimation techniques focused on agility and efficiency have emerged. At the same time, the use of machine learning techniques has enabled the development of models that seek to increase the accuracy of these estimates. However, many of these models were trained exclusively on English-language data, limiting their applicability in other languages. Therefore, this dissertation proposes the study and development of an effort estimation model based on textual requirements, supporting both Portuguese and English. The model was built with a deep learning LSTM architecture, using pretrained embeddings from a contextualized language model. For comparison purposes, the XLNet and FastText models (contextualized and context-free, respectively) were selected. To conduct the experiment, we used a database containing 23,313 user stories extracted from 16 open source projects. The experiments were conducted with data in both languages, obtaining, for English, a Mean Absolute Error (MAE) of 3.77, a Mean Squared Error (MSE) of 79.94, and a Median Absolute Error (MOAE) of 1.93, outperforming related works, such as the BERT model, with improvements of 11% in the MAE metric, 7% in the MSE, and 16% in the MOAE. For Portuguese, the results were: MAE of 3.94, MSE of 81.33, and MOAE of 1.94. These results indicate that the proposed model is effective and competitive with the state-of-the-art, in addition to being applicable to different languages. As a practical contribution, the dissertation also presents a web application that allows the use of the model by development teams, promoting faster, more accessible and accurate estimates. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-11-05T20:35:38Z 2025-11-05T20:35:38Z 2025-08-15 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
SILVA, Daniel de Oliveira. Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais. 2025. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2025. http://repositorio.utfpr.edu.br/jspui/handle/1/38861 |
| identifier_str_mv |
SILVA, Daniel de Oliveira. Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais. 2025. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2025. |
| url |
http://repositorio.utfpr.edu.br/jspui/handle/1/38861 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio Brasil Programa de Pós-Graduação em Informática UTFPR |
| publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio Brasil Programa de Pós-Graduação em Informática UTFPR |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
| instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
| instacron_str |
UTFPR |
| institution |
UTFPR |
| reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
| repository.mail.fl_str_mv |
riut@utfpr.edu.br || sibi@utfpr.edu.br |
| _version_ |
1850498350291353600 |