Exportação concluída — 

Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Silva, Daniel de Oliveira
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Programa de Pós-Graduação em Informática
UTFPR
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.utfpr.edu.br/jspui/handle/1/38861
Resumo: Effort estimation in software projects plays a crucial role, directly influencing planning, cost, and development success. With the growing adoption of agile methodologies, new estimation techniques focused on agility and efficiency have emerged. At the same time, the use of machine learning techniques has enabled the development of models that seek to increase the accuracy of these estimates. However, many of these models were trained exclusively on English-language data, limiting their applicability in other languages. Therefore, this dissertation proposes the study and development of an effort estimation model based on textual requirements, supporting both Portuguese and English. The model was built with a deep learning LSTM architecture, using pretrained embeddings from a contextualized language model. For comparison purposes, the XLNet and FastText models (contextualized and context-free, respectively) were selected. To conduct the experiment, we used a database containing 23,313 user stories extracted from 16 open source projects. The experiments were conducted with data in both languages, obtaining, for English, a Mean Absolute Error (MAE) of 3.77, a Mean Squared Error (MSE) of 79.94, and a Median Absolute Error (MOAE) of 1.93, outperforming related works, such as the BERT model, with improvements of 11% in the MAE metric, 7% in the MSE, and 16% in the MOAE. For Portuguese, the results were: MAE of 3.94, MSE of 81.33, and MOAE of 1.94. These results indicate that the proposed model is effective and competitive with the state-of-the-art, in addition to being applicable to different languages. As a practical contribution, the dissertation also presents a web application that allows the use of the model by development teams, promoting faster, more accessible and accurate estimates.
id UTFPR-12_904b6956fc8984c398ced773389c927e
oai_identifier_str oai:repositorio.utfpr.edu.br:1/38861
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuaisEsapp: a model for estimating software effort from textual requirementsEngenharia de softwareProcessamento de linguagem natural (Computação)Software de aplicação - DesenvolvimentoSoftware engineeringNatural language processing (Computer science)Application software - DevelopmentCNPQ::ENGENHARIASCiência da ComputaçãoEffort estimation in software projects plays a crucial role, directly influencing planning, cost, and development success. With the growing adoption of agile methodologies, new estimation techniques focused on agility and efficiency have emerged. At the same time, the use of machine learning techniques has enabled the development of models that seek to increase the accuracy of these estimates. However, many of these models were trained exclusively on English-language data, limiting their applicability in other languages. Therefore, this dissertation proposes the study and development of an effort estimation model based on textual requirements, supporting both Portuguese and English. The model was built with a deep learning LSTM architecture, using pretrained embeddings from a contextualized language model. For comparison purposes, the XLNet and FastText models (contextualized and context-free, respectively) were selected. To conduct the experiment, we used a database containing 23,313 user stories extracted from 16 open source projects. The experiments were conducted with data in both languages, obtaining, for English, a Mean Absolute Error (MAE) of 3.77, a Mean Squared Error (MSE) of 79.94, and a Median Absolute Error (MOAE) of 1.93, outperforming related works, such as the BERT model, with improvements of 11% in the MAE metric, 7% in the MSE, and 16% in the MOAE. For Portuguese, the results were: MAE of 3.94, MSE of 81.33, and MOAE of 1.94. These results indicate that the proposed model is effective and competitive with the state-of-the-art, in addition to being applicable to different languages. As a practical contribution, the dissertation also presents a web application that allows the use of the model by development teams, promoting faster, more accessible and accurate estimates.A estimativa de esforço em projetos de software desempenha um papel crucial, influenciando diretamente o planejamento, o custo e o sucesso do desenvolvimento. Com a adoção crescente de metodologias ágeis, surgiram novas técnicas de estimativa voltadas a agilidade e eficiência. Paralelamente, o uso de técnicas de machine learning tem possibilitado o desenvolvimento de modelos que buscam aumentar a precisão dessas estimativas. No entanto, muitos desses modelos foram treinados exclusivamente com dados em língua inglesa, limitando sua aplicabilidade em outros idiomas. Diante disso, esta dissertação propõe o estudo e o desenvolvimento de um modelo de estimativa de esforço baseado em requisitos textuais, com suporte aos idiomas português e inglês. O modelo foi construído com uma arquitetura de deep learning LSTM, utilizando embeddings pre-treinados de um modelo de linguagem contextualizado. Para fins de comparação foram selecionados os modelos XLNet e FastText (contextualizado e sem contexto, respectivamente). Para a condução do experimento, foi utilizada uma base de dados contendo 23.313 ˜ historias de usuários, extraídas de 16 projetos open source. Os experimentos foram conduzidos com dados nos dois idiomas, obtendo, para o ingles, um Erro Absoluto Medio (MAE) de 3,77, Erro Quadráico Médio (MSE) de 79,94 e Erro Absoluto Mediano ´ (MdAE) de 1,93, superando trabalhos relacionados, como o modelo BERT, com melhorias de 11% na metrica MAE, 7% em MSE e 16% em MdAE. Para o português, os resultados foram: MAE de 3,94, MSE de 81,33 e MdAE de 1,94. Esses resultados indicam que o modelo proposto e eficaz e competitivo em relação ao estado da arte, alem de ser aplicável a diferentes idiomas. Como contribuição prática, a dissertação apresenta também uma aplicação web que permite o uso do modelo por equipes de desenvolvimento, promovendo estimativas mais rápidas, acessíveis e precisas.Universidade Tecnológica Federal do ParanáCornelio ProcopioBrasilPrograma de Pós-Graduação em InformáticaUTFPRSanches, Silvio Ricardo Rodrigueshttps://orcid.org/0000-0003-3635-7477https://lattes.cnpq.br/9931293076574399Souza, Francisco Carlos Monteirohttps://orcid.org/0000-0002-8953-8653https://lattes.cnpq.br/0057958225738520Oliveira, Claiton dehttps://lattes.cnpq.br/8851289265109891Correa, Cleber Gimenezhttps://lattes.cnpq.br/0521761025000380Souza, Francisco Carlos Monteirohttps://lattes.cnpq.br/0057958225738520Nakamura, RicardoSanches, Silvio Ricardo Rodrigueshttps://lattes.cnpq.br/9931293076574399Silva, Daniel de Oliveira2025-11-05T20:35:38Z2025-11-05T20:35:38Z2025-08-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSILVA, Daniel de Oliveira. Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais. 2025. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2025.http://repositorio.utfpr.edu.br/jspui/handle/1/38861porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2025-11-06T06:15:38Zoai:repositorio.utfpr.edu.br:1/38861Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2025-11-06T06:15:38Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais
Esapp: a model for estimating software effort from textual requirements
title Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais
spellingShingle Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais
Silva, Daniel de Oliveira
Engenharia de software
Processamento de linguagem natural (Computação)
Software de aplicação - Desenvolvimento
Software engineering
Natural language processing (Computer science)
Application software - Development
CNPQ::ENGENHARIAS
Ciência da Computação
title_short Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais
title_full Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais
title_fullStr Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais
title_full_unstemmed Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais
title_sort Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais
author Silva, Daniel de Oliveira
author_facet Silva, Daniel de Oliveira
author_role author
dc.contributor.none.fl_str_mv Sanches, Silvio Ricardo Rodrigues
https://orcid.org/0000-0003-3635-7477
https://lattes.cnpq.br/9931293076574399
Souza, Francisco Carlos Monteiro
https://orcid.org/0000-0002-8953-8653
https://lattes.cnpq.br/0057958225738520
Oliveira, Claiton de
https://lattes.cnpq.br/8851289265109891
Correa, Cleber Gimenez
https://lattes.cnpq.br/0521761025000380
Souza, Francisco Carlos Monteiro
https://lattes.cnpq.br/0057958225738520
Nakamura, Ricardo
Sanches, Silvio Ricardo Rodrigues
https://lattes.cnpq.br/9931293076574399
dc.contributor.author.fl_str_mv Silva, Daniel de Oliveira
dc.subject.por.fl_str_mv Engenharia de software
Processamento de linguagem natural (Computação)
Software de aplicação - Desenvolvimento
Software engineering
Natural language processing (Computer science)
Application software - Development
CNPQ::ENGENHARIAS
Ciência da Computação
topic Engenharia de software
Processamento de linguagem natural (Computação)
Software de aplicação - Desenvolvimento
Software engineering
Natural language processing (Computer science)
Application software - Development
CNPQ::ENGENHARIAS
Ciência da Computação
description Effort estimation in software projects plays a crucial role, directly influencing planning, cost, and development success. With the growing adoption of agile methodologies, new estimation techniques focused on agility and efficiency have emerged. At the same time, the use of machine learning techniques has enabled the development of models that seek to increase the accuracy of these estimates. However, many of these models were trained exclusively on English-language data, limiting their applicability in other languages. Therefore, this dissertation proposes the study and development of an effort estimation model based on textual requirements, supporting both Portuguese and English. The model was built with a deep learning LSTM architecture, using pretrained embeddings from a contextualized language model. For comparison purposes, the XLNet and FastText models (contextualized and context-free, respectively) were selected. To conduct the experiment, we used a database containing 23,313 user stories extracted from 16 open source projects. The experiments were conducted with data in both languages, obtaining, for English, a Mean Absolute Error (MAE) of 3.77, a Mean Squared Error (MSE) of 79.94, and a Median Absolute Error (MOAE) of 1.93, outperforming related works, such as the BERT model, with improvements of 11% in the MAE metric, 7% in the MSE, and 16% in the MOAE. For Portuguese, the results were: MAE of 3.94, MSE of 81.33, and MOAE of 1.94. These results indicate that the proposed model is effective and competitive with the state-of-the-art, in addition to being applicable to different languages. As a practical contribution, the dissertation also presents a web application that allows the use of the model by development teams, promoting faster, more accessible and accurate estimates.
publishDate 2025
dc.date.none.fl_str_mv 2025-11-05T20:35:38Z
2025-11-05T20:35:38Z
2025-08-15
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SILVA, Daniel de Oliveira. Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais. 2025. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2025.
http://repositorio.utfpr.edu.br/jspui/handle/1/38861
identifier_str_mv SILVA, Daniel de Oliveira. Esapp: um modelo para realizar a estimativa de esforço de software a partir de requistos textuais. 2025. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2025.
url http://repositorio.utfpr.edu.br/jspui/handle/1/38861
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Programa de Pós-Graduação em Informática
UTFPR
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Programa de Pós-Graduação em Informática
UTFPR
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850498350291353600