Classificação de uma classe para seleção de conjuntos de dados sintéticos em meta-aprendizado

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: PARENTE, Regina Rosa
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/45450
Resumo: A seleção de algoritmos é uma tarefa crucial e desafiadora no aprendizado de máquina em diferentes domínios do conhecimento. O meta-aprendizado trata a seleção de algoritmos como uma tarefa de aprendizado supervisionado. Exemplos de treinamento (ou seja, meta-exemplos) são gerados a partir de experimentos realizados com um conjunto de algoritmos candidatos em vários conjuntos de dados. Pode haver uma pequena disponibilidade de conjuntos de dados reais em alguns domínios, o que torna difícil gerar bons meta-exemplos. Portanto, confiar em conjuntos de dados sintéticos pode ser uma boa alternativa para gerar meta-exemplos. No entanto, não é garantido que todos os conjuntos de dados sintéticos sejam relevantes e representativos em comparação com os conjuntos de dados reais. Desta forma, o uso indiscriminado de muitos conjuntos de dados sintéticos aumenta o custo computacional da realização de experimentos sem melhorar significativamente a acurácia do meta-aprendizado. Nesta tese, lidamos com a seleção de conjuntos de dados sintéticos para meta-aprendizagem como um problema de classificação de uma classe (OCC). Em OCC, os classificadores são construídos assumindo a disponibilidade de exemplos de treinamento pertencentes a uma classe única de interesse (ou seja, a classe positiva), enquanto os rótulos de classe dos outros exemplos são desconhecidos. Na solução proposta, técnicas de OCC são utilizadas para selecionar os conjuntos de dados sintéticos mais relevantes (a classe desconhecida), considerando os conjuntos de dados reais (a classe positiva) disponíveis. Também conduzimos experimentos em dois estudos de caso, nos quais empregamos dois procedimentos diferentes de manipulação de dados para produzir conjuntos de dados sintéticos e duas técnicas de OCC para seleção de conjuntos de dados. Os resultados demonstraram que é possível usar um número reduzido de conjuntos de dados sintéticos selecionados, mantendo um bom desempenho do Meta-Aprendizado.
id UFPE_81093b898e505c7d95dff413f29a68f0
oai_identifier_str oai:repositorio.ufpe.br:123456789/45450
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling Classificação de uma classe para seleção de conjuntos de dados sintéticos em meta-aprendizadoInteligência ComputacionalMeta-aprendizadoSeleção de algoritmoSeleção de conjuntos de dados sintéticosClassificação de uma classeA seleção de algoritmos é uma tarefa crucial e desafiadora no aprendizado de máquina em diferentes domínios do conhecimento. O meta-aprendizado trata a seleção de algoritmos como uma tarefa de aprendizado supervisionado. Exemplos de treinamento (ou seja, meta-exemplos) são gerados a partir de experimentos realizados com um conjunto de algoritmos candidatos em vários conjuntos de dados. Pode haver uma pequena disponibilidade de conjuntos de dados reais em alguns domínios, o que torna difícil gerar bons meta-exemplos. Portanto, confiar em conjuntos de dados sintéticos pode ser uma boa alternativa para gerar meta-exemplos. No entanto, não é garantido que todos os conjuntos de dados sintéticos sejam relevantes e representativos em comparação com os conjuntos de dados reais. Desta forma, o uso indiscriminado de muitos conjuntos de dados sintéticos aumenta o custo computacional da realização de experimentos sem melhorar significativamente a acurácia do meta-aprendizado. Nesta tese, lidamos com a seleção de conjuntos de dados sintéticos para meta-aprendizagem como um problema de classificação de uma classe (OCC). Em OCC, os classificadores são construídos assumindo a disponibilidade de exemplos de treinamento pertencentes a uma classe única de interesse (ou seja, a classe positiva), enquanto os rótulos de classe dos outros exemplos são desconhecidos. Na solução proposta, técnicas de OCC são utilizadas para selecionar os conjuntos de dados sintéticos mais relevantes (a classe desconhecida), considerando os conjuntos de dados reais (a classe positiva) disponíveis. Também conduzimos experimentos em dois estudos de caso, nos quais empregamos dois procedimentos diferentes de manipulação de dados para produzir conjuntos de dados sintéticos e duas técnicas de OCC para seleção de conjuntos de dados. Os resultados demonstraram que é possível usar um número reduzido de conjuntos de dados sintéticos selecionados, mantendo um bom desempenho do Meta-Aprendizado.Algorithm selection is a crucial and challenging task in machine learning in different domains of knowledge. Meta-learning treats algorithm selection as a supervised learning task. Training examples (i.e. meta-examples) are generated from experiments performed with a set of candidate algorithms in several datasets. There may be a small availability of real datasets in some domains, which makes it challenging to generate good meta-examples. Therefore, relying on synthetic datasets may be a good alternative to generate meta-examples. However, it is not guaranteed that all synthetic datasets are relevant and representative compared to real datasets. In this way, the indiscriminate use of too many synthetic datasets increases the computational cost of performing experiments without significantly improving meta-learning accuracy. In this thesis, we deal with the selection of synthetic datasets for meta-learning as a one-class classification (OCC) problem. In OCC, classifiers are built by assuming the availability of training examples belonging to a unique class of interest (i.e., the positive class), while the class labels of the other examples are unknown. In the proposed solution, OCC techniques are used to select the most relevant synthetic datasets (the unknown class), by considering the real datasets (the positive class) available. We also conducted experiments in two case studies, in which we employed two different data manipulation procedures to produce synthetic datasets and two OCC techniques for dataset selection. The results demonstrated that it is possible to use a reduced number of selected synthetic datasets while maintaining a good meta-learning performance.Universidade Federal de PernambucoUFPEBrasilPrograma de Pos Graduacao em Ciencia da ComputacaoPRUDÊNCIO, Ricardo Bastos Cavalcantehttp://lattes.cnpq.br/9741127748330695http://lattes.cnpq.br/2984888073123287PARENTE, Regina Rosa2022-08-04T13:44:50Z2022-08-04T13:44:50Z2022-02-04info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfPARENTE, Regina Rosa. Classificação de uma classe para seleção de conjuntos de dados sintéticos em meta-aprendizado. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.https://repositorio.ufpe.br/handle/123456789/45450porhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPE2022-08-05T05:16:26Zoai:repositorio.ufpe.br:123456789/45450Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212022-08-05T05:16:26Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.none.fl_str_mv Classificação de uma classe para seleção de conjuntos de dados sintéticos em meta-aprendizado
title Classificação de uma classe para seleção de conjuntos de dados sintéticos em meta-aprendizado
spellingShingle Classificação de uma classe para seleção de conjuntos de dados sintéticos em meta-aprendizado
PARENTE, Regina Rosa
Inteligência Computacional
Meta-aprendizado
Seleção de algoritmo
Seleção de conjuntos de dados sintéticos
Classificação de uma classe
title_short Classificação de uma classe para seleção de conjuntos de dados sintéticos em meta-aprendizado
title_full Classificação de uma classe para seleção de conjuntos de dados sintéticos em meta-aprendizado
title_fullStr Classificação de uma classe para seleção de conjuntos de dados sintéticos em meta-aprendizado
title_full_unstemmed Classificação de uma classe para seleção de conjuntos de dados sintéticos em meta-aprendizado
title_sort Classificação de uma classe para seleção de conjuntos de dados sintéticos em meta-aprendizado
author PARENTE, Regina Rosa
author_facet PARENTE, Regina Rosa
author_role author
dc.contributor.none.fl_str_mv PRUDÊNCIO, Ricardo Bastos Cavalcante
http://lattes.cnpq.br/9741127748330695
http://lattes.cnpq.br/2984888073123287
dc.contributor.author.fl_str_mv PARENTE, Regina Rosa
dc.subject.por.fl_str_mv Inteligência Computacional
Meta-aprendizado
Seleção de algoritmo
Seleção de conjuntos de dados sintéticos
Classificação de uma classe
topic Inteligência Computacional
Meta-aprendizado
Seleção de algoritmo
Seleção de conjuntos de dados sintéticos
Classificação de uma classe
description A seleção de algoritmos é uma tarefa crucial e desafiadora no aprendizado de máquina em diferentes domínios do conhecimento. O meta-aprendizado trata a seleção de algoritmos como uma tarefa de aprendizado supervisionado. Exemplos de treinamento (ou seja, meta-exemplos) são gerados a partir de experimentos realizados com um conjunto de algoritmos candidatos em vários conjuntos de dados. Pode haver uma pequena disponibilidade de conjuntos de dados reais em alguns domínios, o que torna difícil gerar bons meta-exemplos. Portanto, confiar em conjuntos de dados sintéticos pode ser uma boa alternativa para gerar meta-exemplos. No entanto, não é garantido que todos os conjuntos de dados sintéticos sejam relevantes e representativos em comparação com os conjuntos de dados reais. Desta forma, o uso indiscriminado de muitos conjuntos de dados sintéticos aumenta o custo computacional da realização de experimentos sem melhorar significativamente a acurácia do meta-aprendizado. Nesta tese, lidamos com a seleção de conjuntos de dados sintéticos para meta-aprendizagem como um problema de classificação de uma classe (OCC). Em OCC, os classificadores são construídos assumindo a disponibilidade de exemplos de treinamento pertencentes a uma classe única de interesse (ou seja, a classe positiva), enquanto os rótulos de classe dos outros exemplos são desconhecidos. Na solução proposta, técnicas de OCC são utilizadas para selecionar os conjuntos de dados sintéticos mais relevantes (a classe desconhecida), considerando os conjuntos de dados reais (a classe positiva) disponíveis. Também conduzimos experimentos em dois estudos de caso, nos quais empregamos dois procedimentos diferentes de manipulação de dados para produzir conjuntos de dados sintéticos e duas técnicas de OCC para seleção de conjuntos de dados. Os resultados demonstraram que é possível usar um número reduzido de conjuntos de dados sintéticos selecionados, mantendo um bom desempenho do Meta-Aprendizado.
publishDate 2022
dc.date.none.fl_str_mv 2022-08-04T13:44:50Z
2022-08-04T13:44:50Z
2022-02-04
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PARENTE, Regina Rosa. Classificação de uma classe para seleção de conjuntos de dados sintéticos em meta-aprendizado. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.
https://repositorio.ufpe.br/handle/123456789/45450
identifier_str_mv PARENTE, Regina Rosa. Classificação de uma classe para seleção de conjuntos de dados sintéticos em meta-aprendizado. 2022. Tese (Doutorado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2022.
url https://repositorio.ufpe.br/handle/123456789/45450
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1856041893368954880