Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012025-164548/ |
Resumo: | A aprendizagem de máquina é uma área da inteligência artificial que emprega o princípio de indução para obter conclusões genéricas a partir de um conjunto particular de exemplos previamente conhecidos. Amplamente utilizada nas últimas décadas, soluções com aprendizagem de máquina já existem nos domínios de detecção de objetos, condução de veículos autônomos e diagnóstico de câncer. Porém, ainda existem diversas incertezas na sua utilização que impõem barreiras na sua adoção, como problemas nos conjuntos de dados, bias, robustez e segurança. O teste de software é uma atividade dinâmica com o intuito de executar um programa e verificar se seu comportamento está de acordo com o esperado. Características específicas das soluções com aprendizagem de máquina, como o processo de indução de hipótese e o não determinismo, impossibilitam a aplicação das técnicas de teste de software tradicionais. Para enfrentar essas limitações, nesta pesquisa foram desenvolvidos novos critérios de teste de software com Aprendizagem de Máquina baseado no modelo de árvore de decisão. São propostos os critérios de Cobertura de Árvore de Decisão (CAD) e Análise de Valor Limite (AVL) como abordagens para guiar a criação de dados de teste eficazes para software com AM que se baseiam na estrutura interna do modelo de árvore de decisão. Foram conduzidos dois estudos experimentais utilizando conjuntos de dados públicos e bem conhecidos para avaliar os critérios. Os resultados do experimento mostraram que os dois critérios podem ser utilizados para gerar dados de teste eficazes. |
| id |
USP_ec774ebb5d43eda768103aec3aeeb31b |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-06012025-164548 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquinaDefinition of testing criteria based on decision trees for machine learning algorithmsAprendizagem de máquinaÁrvore de decisãoCritério de testeDecision treeMachine learningSoftware testingTest criteriaTeste de softwareA aprendizagem de máquina é uma área da inteligência artificial que emprega o princípio de indução para obter conclusões genéricas a partir de um conjunto particular de exemplos previamente conhecidos. Amplamente utilizada nas últimas décadas, soluções com aprendizagem de máquina já existem nos domínios de detecção de objetos, condução de veículos autônomos e diagnóstico de câncer. Porém, ainda existem diversas incertezas na sua utilização que impõem barreiras na sua adoção, como problemas nos conjuntos de dados, bias, robustez e segurança. O teste de software é uma atividade dinâmica com o intuito de executar um programa e verificar se seu comportamento está de acordo com o esperado. Características específicas das soluções com aprendizagem de máquina, como o processo de indução de hipótese e o não determinismo, impossibilitam a aplicação das técnicas de teste de software tradicionais. Para enfrentar essas limitações, nesta pesquisa foram desenvolvidos novos critérios de teste de software com Aprendizagem de Máquina baseado no modelo de árvore de decisão. São propostos os critérios de Cobertura de Árvore de Decisão (CAD) e Análise de Valor Limite (AVL) como abordagens para guiar a criação de dados de teste eficazes para software com AM que se baseiam na estrutura interna do modelo de árvore de decisão. Foram conduzidos dois estudos experimentais utilizando conjuntos de dados públicos e bem conhecidos para avaliar os critérios. Os resultados do experimento mostraram que os dois critérios podem ser utilizados para gerar dados de teste eficazes.Machine learning is an artificial intelligence area that employs the principle of induction to obtain generic information from a particular set of known examples. Widely used in recent decades, machine learning solutions already exist in the domains of object detection, autonomous vehicle driving, and cancer diagnosis. However, several uncertainties in its use still pose barriers to its adoption, such as data set problems, bias, robustness, and security. Software testing is a dynamic activity that executes a program and verifies whether its behavior is as expected. Specific features of machine learning solutions, such as the hypothesis induction process and non-determinism, make applying traditional Software Testing techniques impossible. This work presents novel testing criteria based on decision tree models to cope with these test challenges. The proposed testing criteria, named Decision Tree Coverage (DTC) and Boundary Value Analysis (BVA), can be used to systematically guide the definition of test data based on a given decision tree model. Two experimental studies were conducted to evaluate our proposed testing criteria. For this, a well-known publicly available dataset was employed. The experiment results showed that these two testing criteria can generate effective test data and improve the quality of machine learning applications.Biblioteca Digitais de Teses e Dissertações da USPDelamaro, Márcio EduardoSantos, Sebastião Henrique Nascimento2024-08-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012025-164548/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-01-06T18:52:02Zoai:teses.usp.br:tde-06012025-164548Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-01-06T18:52:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina Definition of testing criteria based on decision trees for machine learning algorithms |
| title |
Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina |
| spellingShingle |
Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina Santos, Sebastião Henrique Nascimento Aprendizagem de máquina Árvore de decisão Critério de teste Decision tree Machine learning Software testing Test criteria Teste de software |
| title_short |
Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina |
| title_full |
Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina |
| title_fullStr |
Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina |
| title_full_unstemmed |
Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina |
| title_sort |
Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina |
| author |
Santos, Sebastião Henrique Nascimento |
| author_facet |
Santos, Sebastião Henrique Nascimento |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Delamaro, Márcio Eduardo |
| dc.contributor.author.fl_str_mv |
Santos, Sebastião Henrique Nascimento |
| dc.subject.por.fl_str_mv |
Aprendizagem de máquina Árvore de decisão Critério de teste Decision tree Machine learning Software testing Test criteria Teste de software |
| topic |
Aprendizagem de máquina Árvore de decisão Critério de teste Decision tree Machine learning Software testing Test criteria Teste de software |
| description |
A aprendizagem de máquina é uma área da inteligência artificial que emprega o princípio de indução para obter conclusões genéricas a partir de um conjunto particular de exemplos previamente conhecidos. Amplamente utilizada nas últimas décadas, soluções com aprendizagem de máquina já existem nos domínios de detecção de objetos, condução de veículos autônomos e diagnóstico de câncer. Porém, ainda existem diversas incertezas na sua utilização que impõem barreiras na sua adoção, como problemas nos conjuntos de dados, bias, robustez e segurança. O teste de software é uma atividade dinâmica com o intuito de executar um programa e verificar se seu comportamento está de acordo com o esperado. Características específicas das soluções com aprendizagem de máquina, como o processo de indução de hipótese e o não determinismo, impossibilitam a aplicação das técnicas de teste de software tradicionais. Para enfrentar essas limitações, nesta pesquisa foram desenvolvidos novos critérios de teste de software com Aprendizagem de Máquina baseado no modelo de árvore de decisão. São propostos os critérios de Cobertura de Árvore de Decisão (CAD) e Análise de Valor Limite (AVL) como abordagens para guiar a criação de dados de teste eficazes para software com AM que se baseiam na estrutura interna do modelo de árvore de decisão. Foram conduzidos dois estudos experimentais utilizando conjuntos de dados públicos e bem conhecidos para avaliar os critérios. Os resultados do experimento mostraram que os dois critérios podem ser utilizados para gerar dados de teste eficazes. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-08-30 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012025-164548/ |
| url |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012025-164548/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1831214825071443968 |