Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina

Santos, Sebastião Henrique Nascimento

Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina

Detalhes bibliográficos
Ano de defesa:	2024
Autor(a) principal:	Santos, Sebastião Henrique Nascimento
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Aprendizagem de máquina Árvore de decisão Critério de teste Decision tree Machine learning Software testing Test criteria Teste de software
Link de acesso:	https://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012025-164548/
Resumo:	A aprendizagem de máquina é uma área da inteligência artificial que emprega o princípio de indução para obter conclusões genéricas a partir de um conjunto particular de exemplos previamente conhecidos. Amplamente utilizada nas últimas décadas, soluções com aprendizagem de máquina já existem nos domínios de detecção de objetos, condução de veículos autônomos e diagnóstico de câncer. Porém, ainda existem diversas incertezas na sua utilização que impõem barreiras na sua adoção, como problemas nos conjuntos de dados, bias, robustez e segurança. O teste de software é uma atividade dinâmica com o intuito de executar um programa e verificar se seu comportamento está de acordo com o esperado. Características específicas das soluções com aprendizagem de máquina, como o processo de indução de hipótese e o não determinismo, impossibilitam a aplicação das técnicas de teste de software tradicionais. Para enfrentar essas limitações, nesta pesquisa foram desenvolvidos novos critérios de teste de software com Aprendizagem de Máquina baseado no modelo de árvore de decisão. São propostos os critérios de Cobertura de Árvore de Decisão (CAD) e Análise de Valor Limite (AVL) como abordagens para guiar a criação de dados de teste eficazes para software com AM que se baseiam na estrutura interna do modelo de árvore de decisão. Foram conduzidos dois estudos experimentais utilizando conjuntos de dados públicos e bem conhecidos para avaliar os critérios. Os resultados do experimento mostraram que os dois critérios podem ser utilizados para gerar dados de teste eficazes.

Metadados do item

id	USP_ec774ebb5d43eda768103aec3aeeb31b
oai_identifier_str	oai:teses.usp.br:tde-06012025-164548
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling	Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquinaDefinition of testing criteria based on decision trees for machine learning algorithmsAprendizagem de máquinaÁrvore de decisãoCritério de testeDecision treeMachine learningSoftware testingTest criteriaTeste de softwareA aprendizagem de máquina é uma área da inteligência artificial que emprega o princípio de indução para obter conclusões genéricas a partir de um conjunto particular de exemplos previamente conhecidos. Amplamente utilizada nas últimas décadas, soluções com aprendizagem de máquina já existem nos domínios de detecção de objetos, condução de veículos autônomos e diagnóstico de câncer. Porém, ainda existem diversas incertezas na sua utilização que impõem barreiras na sua adoção, como problemas nos conjuntos de dados, bias, robustez e segurança. O teste de software é uma atividade dinâmica com o intuito de executar um programa e verificar se seu comportamento está de acordo com o esperado. Características específicas das soluções com aprendizagem de máquina, como o processo de indução de hipótese e o não determinismo, impossibilitam a aplicação das técnicas de teste de software tradicionais. Para enfrentar essas limitações, nesta pesquisa foram desenvolvidos novos critérios de teste de software com Aprendizagem de Máquina baseado no modelo de árvore de decisão. São propostos os critérios de Cobertura de Árvore de Decisão (CAD) e Análise de Valor Limite (AVL) como abordagens para guiar a criação de dados de teste eficazes para software com AM que se baseiam na estrutura interna do modelo de árvore de decisão. Foram conduzidos dois estudos experimentais utilizando conjuntos de dados públicos e bem conhecidos para avaliar os critérios. Os resultados do experimento mostraram que os dois critérios podem ser utilizados para gerar dados de teste eficazes.Machine learning is an artificial intelligence area that employs the principle of induction to obtain generic information from a particular set of known examples. Widely used in recent decades, machine learning solutions already exist in the domains of object detection, autonomous vehicle driving, and cancer diagnosis. However, several uncertainties in its use still pose barriers to its adoption, such as data set problems, bias, robustness, and security. Software testing is a dynamic activity that executes a program and verifies whether its behavior is as expected. Specific features of machine learning solutions, such as the hypothesis induction process and non-determinism, make applying traditional Software Testing techniques impossible. This work presents novel testing criteria based on decision tree models to cope with these test challenges. The proposed testing criteria, named Decision Tree Coverage (DTC) and Boundary Value Analysis (BVA), can be used to systematically guide the definition of test data based on a given decision tree model. Two experimental studies were conducted to evaluate our proposed testing criteria. For this, a well-known publicly available dataset was employed. The experiment results showed that these two testing criteria can generate effective test data and improve the quality of machine learning applications.Biblioteca Digitais de Teses e Dissertações da USPDelamaro, Márcio EduardoSantos, Sebastião Henrique Nascimento2024-08-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012025-164548/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-01-06T18:52:02Zoai:teses.usp.br:tde-06012025-164548Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212025-01-06T18:52:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina Definition of testing criteria based on decision trees for machine learning algorithms
title	Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina
spellingShingle	Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina Santos, Sebastião Henrique Nascimento Aprendizagem de máquina Árvore de decisão Critério de teste Decision tree Machine learning Software testing Test criteria Teste de software
title_short	Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina
title_full	Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina
title_fullStr	Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina
title_full_unstemmed	Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina
title_sort	Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina
author	Santos, Sebastião Henrique Nascimento
author_facet	Santos, Sebastião Henrique Nascimento
author_role	author
dc.contributor.none.fl_str_mv	Delamaro, Márcio Eduardo
dc.contributor.author.fl_str_mv	Santos, Sebastião Henrique Nascimento
dc.subject.por.fl_str_mv	Aprendizagem de máquina Árvore de decisão Critério de teste Decision tree Machine learning Software testing Test criteria Teste de software
topic	Aprendizagem de máquina Árvore de decisão Critério de teste Decision tree Machine learning Software testing Test criteria Teste de software
description	A aprendizagem de máquina é uma área da inteligência artificial que emprega o princípio de indução para obter conclusões genéricas a partir de um conjunto particular de exemplos previamente conhecidos. Amplamente utilizada nas últimas décadas, soluções com aprendizagem de máquina já existem nos domínios de detecção de objetos, condução de veículos autônomos e diagnóstico de câncer. Porém, ainda existem diversas incertezas na sua utilização que impõem barreiras na sua adoção, como problemas nos conjuntos de dados, bias, robustez e segurança. O teste de software é uma atividade dinâmica com o intuito de executar um programa e verificar se seu comportamento está de acordo com o esperado. Características específicas das soluções com aprendizagem de máquina, como o processo de indução de hipótese e o não determinismo, impossibilitam a aplicação das técnicas de teste de software tradicionais. Para enfrentar essas limitações, nesta pesquisa foram desenvolvidos novos critérios de teste de software com Aprendizagem de Máquina baseado no modelo de árvore de decisão. São propostos os critérios de Cobertura de Árvore de Decisão (CAD) e Análise de Valor Limite (AVL) como abordagens para guiar a criação de dados de teste eficazes para software com AM que se baseiam na estrutura interna do modelo de árvore de decisão. Foram conduzidos dois estudos experimentais utilizando conjuntos de dados públicos e bem conhecidos para avaliar os critérios. Os resultados do experimento mostraram que os dois critérios podem ser utilizados para gerar dados de teste eficazes.
publishDate	2024
dc.date.none.fl_str_mv	2024-08-30
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012025-164548/
url	https://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012025-164548/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1831214825071443968

Definição de critérios de teste baseados em árvores de decisão para algoritmos de aprendizagem de máquina

Registros relacionados