Uberband : meta-aprendizado e otimização baseada em bandidos multi-armados para seleção eficiente e efetiva de processos completos

Dôres, Silvia Cristina Nunes das

Uberband : meta-aprendizado e otimização baseada em bandidos multi-armados para seleção eficiente e efetiva de processos completos

Detalhes bibliográficos
Ano de defesa:	2019
Autor(a) principal:	Dôres, Silvia Cristina Nunes das
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Tese
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Pontifícia Universidade Católica do Rio Grande do Sul Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Aprendizado de Máquina Automático Meta-Aprendizado Otimização Baseada em Bandidos Multi-Armados Seleção de Processo Completo Automatic Workflow Selection Bandit-Based Optimization Knowledge Discovery in Databases Meta-Learning CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
Link de acesso:	http://tede2.pucrs.br/tede2/handle/tede/8984
Resumo:	Na medida em que tecnologias para gerenciamento e armazenamento de dados se tornam amplamente disponíveis, torna-se um desafio fornecer aos usuários sistemas eficazes de análise e compreensão desses dados. Descoberta de Conhecimento em Bases de Dados (DCBD) é o processo não-trivial de extração de padrões interessantes, válidos e úteis a partir de dados. Este processo inclui desde a seleção de dados, até a interpretação dos padrões identificados. Especialmente para usuários não especialistas, a definição e gestão de um processo de DCBD são atividades complexas, pois é exigido o conhecimento sobre como escolher as operadores adequados dentre a gama disponível para cada etapa, como configurá-los e como interpretar sua saída. Seleção Automática de Processos Completos (SPC) objetiva auxiliar usuários de DCBD na tarefa onerosa de escolher o processo completo de operadores, que inclui métodos de pré processamento, algoritmos de aprendizado de máquina e suas configurações de hiper-parâmetros mais adequados a um determinado problema. Embora diversas soluções já existam para esta tarefa, tais soluções são limitadas do ponto de vista da avaliação do processo completo i) algumas soluções não realizam experimentação do processo e se baseiam apenas em estimativas de desempenho de problemas similares, o que pode levar a recomendações não-precisas e ii) as demais soluções avaliam os processos completos repetidas vezes sobre o conjunto de treinamento inteiro até encontrar a melhor opção. Estas últimas soluções geralmente obtém resultados mais precisos, porém, se tornam computacionalmente custosas em termo de tempo, à medida em que os conjuntos de dados aumentam e novos algoritmos são desenvolvidos. Neste sentido, esta pesquisa propõe e analisa um novo algoritmo para SPC, denominado Uberband, que combina Meta-Aprendizado, para a estimar a probabilidade de amostragem de operadores, e otimização baseada em bandidos multi armados, para realização de alocação adaptativa de instâncias do conjunto de treinamento durante o processo de otimização. Resultados da análise experimental comparativa com soluções estado-da-arte em SPC, indicaram que Uberband proporciona uma SPC com desempenho similar e em um tempo expressivamente menor do que as soluções atuais

Metadados do item

id	P_RS_cddfbc8e9ff81f1674931015ffc4434f
oai_identifier_str	oai:tede2.pucrs.br:tede/8984
network_acronym_str	P_RS
network_name_str	Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling	Uberband : meta-aprendizado e otimização baseada em bandidos multi-armados para seleção eficiente e efetiva de processos completosAprendizado de Máquina AutomáticoMeta-AprendizadoOtimização Baseada em Bandidos Multi-ArmadosSeleção de Processo CompletoAutomatic Workflow SelectionBandit-Based OptimizationKnowledge Discovery in DatabasesMeta-LearningCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAONa medida em que tecnologias para gerenciamento e armazenamento de dados se tornam amplamente disponíveis, torna-se um desafio fornecer aos usuários sistemas eficazes de análise e compreensão desses dados. Descoberta de Conhecimento em Bases de Dados (DCBD) é o processo não-trivial de extração de padrões interessantes, válidos e úteis a partir de dados. Este processo inclui desde a seleção de dados, até a interpretação dos padrões identificados. Especialmente para usuários não especialistas, a definição e gestão de um processo de DCBD são atividades complexas, pois é exigido o conhecimento sobre como escolher as operadores adequados dentre a gama disponível para cada etapa, como configurá-los e como interpretar sua saída. Seleção Automática de Processos Completos (SPC) objetiva auxiliar usuários de DCBD na tarefa onerosa de escolher o processo completo de operadores, que inclui métodos de pré processamento, algoritmos de aprendizado de máquina e suas configurações de hiper-parâmetros mais adequados a um determinado problema. Embora diversas soluções já existam para esta tarefa, tais soluções são limitadas do ponto de vista da avaliação do processo completo i) algumas soluções não realizam experimentação do processo e se baseiam apenas em estimativas de desempenho de problemas similares, o que pode levar a recomendações não-precisas e ii) as demais soluções avaliam os processos completos repetidas vezes sobre o conjunto de treinamento inteiro até encontrar a melhor opção. Estas últimas soluções geralmente obtém resultados mais precisos, porém, se tornam computacionalmente custosas em termo de tempo, à medida em que os conjuntos de dados aumentam e novos algoritmos são desenvolvidos. Neste sentido, esta pesquisa propõe e analisa um novo algoritmo para SPC, denominado Uberband, que combina Meta-Aprendizado, para a estimar a probabilidade de amostragem de operadores, e otimização baseada em bandidos multi armados, para realização de alocação adaptativa de instâncias do conjunto de treinamento durante o processo de otimização. Resultados da análise experimental comparativa com soluções estado-da-arte em SPC, indicaram que Uberband proporciona uma SPC com desempenho similar e em um tempo expressivamente menor do que as soluções atuaisSince data management and storage technologies become widely available, it becomes a challenge to provide users with effective systems for analyzing and understanding these data. Knowledge Discovery on Databases (KDD) is the non trivial process of extracting interesting, valid, and useful patterns from data. This process ranges from data selection to interpretation of the identified patterns. Especially for non-expert users, the definition and management of KDD process are complex activities, since it requires knowledge on how to choose the appropriate operators from the available range, how to configure them and how to interpret their output. Automatic Workflow Selection (AWS) aims to assist users of KDD in the onerous task of choosing the workflow, which includes preprocessing methods, machine learning algorithms and their hyper-parameter configurations, more suitable for a given problem. Although several solutions already exist for this task, such solutions are limited from the point of view of experimental evaluation of candidate workflows: i) some solutions do not perform workflow experimentation and are based on performance predictions in similar problems, which can lead to non-precise recommendations and ii) other solutions evaluate the workflows configurations over the entire training set until the best option is found. These latter solutions usually get more accurate results, however, they become computationally time-consuming as the datasets increase and new algorithms are developed. In this sense, this research proposes and investigates a new algorithm for AWS, named Uberband, that combines metalearning and multi-armed bandit optimization to perform adaptive allocation of the training data set during the optimization process. Results of the comparative experimental analysis with state-of-the-art solutions in AWS indicated that Uberband provides a AWS with good performance and in a significantly speedup over the current solutions.Pontifícia Universidade Católica do Rio Grande do SulEscola PolitécnicaBrasilPUCRSPrograma de Pós-Graduação em Ciência da ComputaçãoRuiz, Duncan Dubugras Alcobahttp://lattes.cnpq.br/8250832800932125Soares, Carlos Manuel Milheiro de Oliveira PintoDôres, Silvia Cristina Nunes das2019-10-28T19:33:20Z2019-04-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://tede2.pucrs.br/tede2/handle/tede/8984porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RS2019-10-29T13:33:41Zoai:tede2.pucrs.br:tede/8984Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br\|\|opendoar:2019-10-29T13:33:41Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.none.fl_str_mv	Uberband : meta-aprendizado e otimização baseada em bandidos multi-armados para seleção eficiente e efetiva de processos completos
title	Uberband : meta-aprendizado e otimização baseada em bandidos multi-armados para seleção eficiente e efetiva de processos completos
spellingShingle	Uberband : meta-aprendizado e otimização baseada em bandidos multi-armados para seleção eficiente e efetiva de processos completos Dôres, Silvia Cristina Nunes das Aprendizado de Máquina Automático Meta-Aprendizado Otimização Baseada em Bandidos Multi-Armados Seleção de Processo Completo Automatic Workflow Selection Bandit-Based Optimization Knowledge Discovery in Databases Meta-Learning CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short	Uberband : meta-aprendizado e otimização baseada em bandidos multi-armados para seleção eficiente e efetiva de processos completos
title_full	Uberband : meta-aprendizado e otimização baseada em bandidos multi-armados para seleção eficiente e efetiva de processos completos
title_fullStr	Uberband : meta-aprendizado e otimização baseada em bandidos multi-armados para seleção eficiente e efetiva de processos completos
title_full_unstemmed	Uberband : meta-aprendizado e otimização baseada em bandidos multi-armados para seleção eficiente e efetiva de processos completos
title_sort	Uberband : meta-aprendizado e otimização baseada em bandidos multi-armados para seleção eficiente e efetiva de processos completos
author	Dôres, Silvia Cristina Nunes das
author_facet	Dôres, Silvia Cristina Nunes das
author_role	author
dc.contributor.none.fl_str_mv	Ruiz, Duncan Dubugras Alcoba http://lattes.cnpq.br/8250832800932125 Soares, Carlos Manuel Milheiro de Oliveira Pinto
dc.contributor.author.fl_str_mv	Dôres, Silvia Cristina Nunes das
dc.subject.por.fl_str_mv	Aprendizado de Máquina Automático Meta-Aprendizado Otimização Baseada em Bandidos Multi-Armados Seleção de Processo Completo Automatic Workflow Selection Bandit-Based Optimization Knowledge Discovery in Databases Meta-Learning CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
topic	Aprendizado de Máquina Automático Meta-Aprendizado Otimização Baseada em Bandidos Multi-Armados Seleção de Processo Completo Automatic Workflow Selection Bandit-Based Optimization Knowledge Discovery in Databases Meta-Learning CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description	Na medida em que tecnologias para gerenciamento e armazenamento de dados se tornam amplamente disponíveis, torna-se um desafio fornecer aos usuários sistemas eficazes de análise e compreensão desses dados. Descoberta de Conhecimento em Bases de Dados (DCBD) é o processo não-trivial de extração de padrões interessantes, válidos e úteis a partir de dados. Este processo inclui desde a seleção de dados, até a interpretação dos padrões identificados. Especialmente para usuários não especialistas, a definição e gestão de um processo de DCBD são atividades complexas, pois é exigido o conhecimento sobre como escolher as operadores adequados dentre a gama disponível para cada etapa, como configurá-los e como interpretar sua saída. Seleção Automática de Processos Completos (SPC) objetiva auxiliar usuários de DCBD na tarefa onerosa de escolher o processo completo de operadores, que inclui métodos de pré processamento, algoritmos de aprendizado de máquina e suas configurações de hiper-parâmetros mais adequados a um determinado problema. Embora diversas soluções já existam para esta tarefa, tais soluções são limitadas do ponto de vista da avaliação do processo completo i) algumas soluções não realizam experimentação do processo e se baseiam apenas em estimativas de desempenho de problemas similares, o que pode levar a recomendações não-precisas e ii) as demais soluções avaliam os processos completos repetidas vezes sobre o conjunto de treinamento inteiro até encontrar a melhor opção. Estas últimas soluções geralmente obtém resultados mais precisos, porém, se tornam computacionalmente custosas em termo de tempo, à medida em que os conjuntos de dados aumentam e novos algoritmos são desenvolvidos. Neste sentido, esta pesquisa propõe e analisa um novo algoritmo para SPC, denominado Uberband, que combina Meta-Aprendizado, para a estimar a probabilidade de amostragem de operadores, e otimização baseada em bandidos multi armados, para realização de alocação adaptativa de instâncias do conjunto de treinamento durante o processo de otimização. Resultados da análise experimental comparativa com soluções estado-da-arte em SPC, indicaram que Uberband proporciona uma SPC com desempenho similar e em um tempo expressivamente menor do que as soluções atuais
publishDate	2019
dc.date.none.fl_str_mv	2019-10-28T19:33:20Z 2019-04-29
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/doctoralThesis
format	doctoralThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://tede2.pucrs.br/tede2/handle/tede/8984
url	http://tede2.pucrs.br/tede2/handle/tede/8984
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Pontifícia Universidade Católica do Rio Grande do Sul Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação
publisher.none.fl_str_mv	Pontifícia Universidade Católica do Rio Grande do Sul Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS
instname_str	Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str	PUC_RS
institution	PUC_RS
reponame_str	Biblioteca Digital de Teses e Dissertações da PUC_RS
collection	Biblioteca Digital de Teses e Dissertações da PUC_RS
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv	biblioteca.central@pucrs.br\|\|
_version_	1850041297762516992

Uberband : meta-aprendizado e otimização baseada em bandidos multi-armados para seleção eficiente e efetiva de processos completos

Registros relacionados