Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Bandeira, Andre Luis Martins
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Programa de Pós-Graduação em Informática
UTFPR
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.utfpr.edu.br/jspui/handle/1/5304
Resumo: Defects are inevitable in software projects, so adopting a policy of analyzing and managing defects during the software development cycle is vital for quality assurance. Storing defect reports is commonplace in the software development cycle, but the information contained in the reports is difficult to understand because they are usually written in natural language. In this sense, classifying defects can help streamline the defect management process. As they are written in natural language, automatic defect classification becomes difficult and may have low effectiveness, with an analyst taking an average of 6 minutes for each bug report. Some studies propose using feature selection approaches to increase the accuracy of automatic defect classification. This study presents an industry case study with automatic defect classification using feature selection approaches proposed in the literature. In addition, a change to the USES feature selection algorithm is proposed to improve its effectiveness, the new algorithm was denominated USES+. As a result, we have that the automatic feature selection approaches result in a greater effectiveness of the automatic classification of defect written in natural language. Finally, USES+ obtained a better effectiveness when compared to USES, even with significant differences. Thus, in general, automatic defect classification using feature selection approaches has shown to be promising with good effectiveness. In this way, automatic classification allows reduction of the cost of prioritization of defects, significantly improving the delivery of the essential corrections.
id UTFPR-12_defaeb9df16ffceadf6baeb26f1580c4
oai_identifier_str oai:repositorio.utfpr.edu.br:1/5304
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústriaAutomatic software defect priority classification using feature selection: a case study in industrySoftware - DesenvolvimentoLocalização de falhas (Engenharia)Processamento de linguagem natural (Computação)Aprendizado do computadorComputer software - DevelopmentFault location (Engineering)Natural language processing (Computer science)Machine learningCNPQ::CIENCIAS EXATAS E DA TERRACiência Da ComputaçãoDefects are inevitable in software projects, so adopting a policy of analyzing and managing defects during the software development cycle is vital for quality assurance. Storing defect reports is commonplace in the software development cycle, but the information contained in the reports is difficult to understand because they are usually written in natural language. In this sense, classifying defects can help streamline the defect management process. As they are written in natural language, automatic defect classification becomes difficult and may have low effectiveness, with an analyst taking an average of 6 minutes for each bug report. Some studies propose using feature selection approaches to increase the accuracy of automatic defect classification. This study presents an industry case study with automatic defect classification using feature selection approaches proposed in the literature. In addition, a change to the USES feature selection algorithm is proposed to improve its effectiveness, the new algorithm was denominated USES+. As a result, we have that the automatic feature selection approaches result in a greater effectiveness of the automatic classification of defect written in natural language. Finally, USES+ obtained a better effectiveness when compared to USES, even with significant differences. Thus, in general, automatic defect classification using feature selection approaches has shown to be promising with good effectiveness. In this way, automatic classification allows reduction of the cost of prioritization of defects, significantly improving the delivery of the essential corrections.Defeitos são inevitáveis em projetos de software, portanto, adotar uma política de análise e gerenciamento de defeitos durante o ciclo de desenvolvimento de software e vital para a garantia de qualidade do mesmo. O armazenamento de relatórios de defeitos é comum no ciclo de desenvolvimento de software, mas as informações contidas nos relatórios são difíceis de entender uma vez que geralmente são escritas em linguagem natural. Nesse sentido, a classificação de defeitos pode ajudar a agilizar o processo de entendimento e gerenciamento desses defeitos. Por serem escritas em linguagem natural, a classificação automática de defeitos se torna difícil e pode ter baixa efetividade, com um analista levando em media de 6 minutos para cada relatório de defeito. Devido a isso, alguns estudos propõem a utilização de abordagens de seleção de atributos para aumentar a precisão da classificação automática de defeitos. Este trabalho apresenta um estudo de caso da indústria com a classificação automática dos defeitos utilizando métodos de seleção de atributos propostos na literatura. Além disso, é proposta uma alteração ao algoritmo de seleção de características USES visando melhorar sua efetividade, o novo algoritmo foi denominado USES+. Como resultado, tem-se que as abordagens automáticas de seleção de atributos resultam em uma maior efetividade da classificação automática de defeito. Por fim, USES+ obteve uma melhor efetividade quando comparado ao USES, inclusive com diferenças significativas. Portanto, de um modo geral, a classificação automática de defeitos utilizando abordagens de seleção de atributos mostrou ser bastante promissora apresentando uma boa efetividade. Dessa forma, a classificação automática permite a redução do custo de priorização dos defeitos, melhorando significativamente o tempo para que as correções essenciais sejam executas.Universidade Tecnológica Federal do ParanáCornelio ProcopioBrasilPrograma de Pós-Graduação em InformáticaUTFPRWatanabe, Willian Massamihttp://lattes.cnpq.br/8946276875418151Oliveira Junior, Edson Alves Dehttp://lattes.cnpq.br/8717980588591239Silva, Marco Aurelio Graciottohttp://lattes.cnpq.br/9383290036853173Re, Reginaldohttp://lattes.cnpq.br/5545891505433768Watanabe, Willian Massamihttp://lattes.cnpq.br/8946276875418151Bandeira, Andre Luis Martins2020-10-27T00:51:44Z2020-10-27T00:51:44Z2019-07-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfBANDEIRA, Andre Luis Martins. Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria. 2019. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2019.http://repositorio.utfpr.edu.br/jspui/handle/1/5304porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2020-10-27T06:00:59Zoai:repositorio.utfpr.edu.br:1/5304Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2020-10-27T06:00:59Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria
Automatic software defect priority classification using feature selection: a case study in industry
title Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria
spellingShingle Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria
Bandeira, Andre Luis Martins
Software - Desenvolvimento
Localização de falhas (Engenharia)
Processamento de linguagem natural (Computação)
Aprendizado do computador
Computer software - Development
Fault location (Engineering)
Natural language processing (Computer science)
Machine learning
CNPQ::CIENCIAS EXATAS E DA TERRA
Ciência Da Computação
title_short Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria
title_full Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria
title_fullStr Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria
title_full_unstemmed Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria
title_sort Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria
author Bandeira, Andre Luis Martins
author_facet Bandeira, Andre Luis Martins
author_role author
dc.contributor.none.fl_str_mv Watanabe, Willian Massami
http://lattes.cnpq.br/8946276875418151
Oliveira Junior, Edson Alves De
http://lattes.cnpq.br/8717980588591239
Silva, Marco Aurelio Graciotto
http://lattes.cnpq.br/9383290036853173
Re, Reginaldo
http://lattes.cnpq.br/5545891505433768
Watanabe, Willian Massami
http://lattes.cnpq.br/8946276875418151
dc.contributor.author.fl_str_mv Bandeira, Andre Luis Martins
dc.subject.por.fl_str_mv Software - Desenvolvimento
Localização de falhas (Engenharia)
Processamento de linguagem natural (Computação)
Aprendizado do computador
Computer software - Development
Fault location (Engineering)
Natural language processing (Computer science)
Machine learning
CNPQ::CIENCIAS EXATAS E DA TERRA
Ciência Da Computação
topic Software - Desenvolvimento
Localização de falhas (Engenharia)
Processamento de linguagem natural (Computação)
Aprendizado do computador
Computer software - Development
Fault location (Engineering)
Natural language processing (Computer science)
Machine learning
CNPQ::CIENCIAS EXATAS E DA TERRA
Ciência Da Computação
description Defects are inevitable in software projects, so adopting a policy of analyzing and managing defects during the software development cycle is vital for quality assurance. Storing defect reports is commonplace in the software development cycle, but the information contained in the reports is difficult to understand because they are usually written in natural language. In this sense, classifying defects can help streamline the defect management process. As they are written in natural language, automatic defect classification becomes difficult and may have low effectiveness, with an analyst taking an average of 6 minutes for each bug report. Some studies propose using feature selection approaches to increase the accuracy of automatic defect classification. This study presents an industry case study with automatic defect classification using feature selection approaches proposed in the literature. In addition, a change to the USES feature selection algorithm is proposed to improve its effectiveness, the new algorithm was denominated USES+. As a result, we have that the automatic feature selection approaches result in a greater effectiveness of the automatic classification of defect written in natural language. Finally, USES+ obtained a better effectiveness when compared to USES, even with significant differences. Thus, in general, automatic defect classification using feature selection approaches has shown to be promising with good effectiveness. In this way, automatic classification allows reduction of the cost of prioritization of defects, significantly improving the delivery of the essential corrections.
publishDate 2019
dc.date.none.fl_str_mv 2019-07-17
2020-10-27T00:51:44Z
2020-10-27T00:51:44Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv BANDEIRA, Andre Luis Martins. Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria. 2019. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2019.
http://repositorio.utfpr.edu.br/jspui/handle/1/5304
identifier_str_mv BANDEIRA, Andre Luis Martins. Classificação automática da prioridade de defeitos utilizando seleção de atributos: um estudo de caso na indústria. 2019. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2019.
url http://repositorio.utfpr.edu.br/jspui/handle/1/5304
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Programa de Pós-Graduação em Informática
UTFPR
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Programa de Pós-Graduação em Informática
UTFPR
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850498324000407552