Meta-learning for active learning tuning on stream classification

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Martins, Vinicius Eiji
Orientador(a): Barbon Junior, Sylvio [Orientador]
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.uel.br/handle/123456789/13984
Resumo: Resumo: Aprendizado de Máquina Supervisionado exige o conhecimento de todos os rótulos dos dados a serem utilizados para se treinar um modelo Enquanto isso é factível em situ ações onde os dados são estáticos, em situações de dados contínuos, ou streaming, isso se torna inviável Não só pela quantidade potencialmente infinita de dados, como também a velocidade exigida do modelo para que não se crie um atraso muito grande Aprendizado Ativo (Active Learning) já resolveu uma porção considerável desse problema, diminuindo drasticamente o número de rótulos necessários para treinar um modelo enquanto se man tém uma performance competitiva Essa técnica porém ainda apresenta seus desafios, um deles é o ajuste necessário da técnica com base na tarefa a ser realizada e a possibilidade de que os conceitos e comportamentos dos dados sendo analisados mudem, exigindo uma atualização não só do modelo sendo treinado, como também dos parâmetros de apren dizado ativo ajustados Levando isso em conta, este trabalho busca reduzir esse problema com o uso de Meta-aprendizado Utilizamos Aprendizado Ativo com amostragem baseada em streaming utilizando uma métrica de incerteza para decidir a necessidade de rotulação Esta métrica é comparada com um valor de limiar chamado ?? Com meta-aprendizado podemos decidir o valor de ?? dinamicamente e automaticamente, promovendo a adapt abilidade do modelo quanto a mudança de conceitos e eliminando o passo inicial de decidir qual valor de ?? é mais propício para a tarefa a ser realizada Nossos experimentos demon straram uma redução na quantidade de rótulos necessários para o treinamento (média de 555%) com uma acurácia similar ao uso de Very Fast Decision Tree (VFDT) sob diferentes situações de mudança de conceitos em streams
id UEL_c67a2a76c0680a9318873911f0b6bc2a
oai_identifier_str oai:repositorio.uel.br:123456789/13984
network_acronym_str UEL
network_name_str Repositório Institucional da UEL
repository_id_str
spelling Martins, Vinicius EijiZarpelão, Bruno Bogazc616021b-488a-4c71-9089-c14c349287c9-1Carvalho, Luiz Fernando8dad177f-67c8-4015-8f9d-74829ba736c0-1c9004951-3bdd-4544-98ff-419ae653992794aaf54d-a259-4269-aca8-d1c56214b619Barbon Junior, Sylvio [Orientador]Londrina2024-05-01T14:22:18Z2024-05-01T14:22:18Z2022.0011.03.2022https://repositorio.uel.br/handle/123456789/13984Resumo: Aprendizado de Máquina Supervisionado exige o conhecimento de todos os rótulos dos dados a serem utilizados para se treinar um modelo Enquanto isso é factível em situ ações onde os dados são estáticos, em situações de dados contínuos, ou streaming, isso se torna inviável Não só pela quantidade potencialmente infinita de dados, como também a velocidade exigida do modelo para que não se crie um atraso muito grande Aprendizado Ativo (Active Learning) já resolveu uma porção considerável desse problema, diminuindo drasticamente o número de rótulos necessários para treinar um modelo enquanto se man tém uma performance competitiva Essa técnica porém ainda apresenta seus desafios, um deles é o ajuste necessário da técnica com base na tarefa a ser realizada e a possibilidade de que os conceitos e comportamentos dos dados sendo analisados mudem, exigindo uma atualização não só do modelo sendo treinado, como também dos parâmetros de apren dizado ativo ajustados Levando isso em conta, este trabalho busca reduzir esse problema com o uso de Meta-aprendizado Utilizamos Aprendizado Ativo com amostragem baseada em streaming utilizando uma métrica de incerteza para decidir a necessidade de rotulação Esta métrica é comparada com um valor de limiar chamado ?? Com meta-aprendizado podemos decidir o valor de ?? dinamicamente e automaticamente, promovendo a adapt abilidade do modelo quanto a mudança de conceitos e eliminando o passo inicial de decidir qual valor de ?? é mais propício para a tarefa a ser realizada Nossos experimentos demon straram uma redução na quantidade de rótulos necessários para o treinamento (média de 555%) com uma acurácia similar ao uso de Very Fast Decision Tree (VFDT) sob diferentes situações de mudança de conceitos em streamsDissertação (Mestrado em Ciência da Computação) - Universidade Estadual de Londrina, Centro de Ciências Exatas, Programa de Pós-Graduação em Ciência da ComputaçãoAbstract: Supervised Machine Learning requires knowing the labels from the entire dataset being used for its training While this is manageable in scenarios where the data is static, in situations where data is continuous, or in streaming situations, this becomes infeasible Not only because of the potentially infinite amount of data, but also because of the speed necessary for the model so that a long delay is avoided Active Learning has already solved a good portion of this problem, drastically lowering the number of required labels to train a model, all while maintaining competitive performance However, this technique does present its own set of challenges For example, the required tuning for each task may become outdated should the concepts and behaviours from the data change This would require that not only a change be made to the model being trained, but also to the active learning parameters Taking this into consideration, this work tackles this problem with the use of Meta-learning We used Active Learning with Stream-based Selective Sampling and Uncertainty Sampling, a metric that uses a threshold value named ?? With Meta-learning we can set ??’s value dynamically and automatically, providing adaptability to the model regarding concept drifts and also removing the initial step of choosing an optimal ?? for the task at hand Our experiments showed a reduction in the number of labels necessary for model training (average of 555%) with a similar performance to the use of Very Fast Decision Trees (VFDT) under different scenarios of concept drift in data streamsporComputaçãoMeta-aprendizadoAprendizado ativoClassificação de streamsAjuste dinâmicoComputer scienceMeta-learningActive learningStream classificationDynamic tuningMeta-learning for active learning tuning on stream classificationinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisMestradoCiência da ComputaçãoCentro de Ciências ExatasPrograma de Pós-Graduação em Ciência da Computação-1-1reponame:Repositório Institucional da UELinstname:Universidade Estadual de Londrina (UEL)instacron:UELinfo:eu-repo/semantics/openAccess16204vtls000236423SIMvtls000236423http://www.bibliotecadigital.uel.br/document/?code=vtls00023642364.00SIMhttp://www.bibliotecadigital.uel.br/document/?code=vtls0002364238712.pdf123456789/5002 - Mestrado - Ciência da ComputaçãoORIGINAL8712.pdfapplication/pdf960247https://repositorio.uel.br/bitstreams/0539f546-a448-47bf-a474-266efd34be0f/download4101c9039899ad78711ad7132ecb6df0MD51LICENCElicence.txttext/plain263https://repositorio.uel.br/bitstreams/fd621e64-4e55-40aa-8574-e9be0470c2bf/download753f376dfdbc064b559839be95ac5523MD52TEXT8712.pdf.txt8712.pdf.txtExtracted texttext/plain133428https://repositorio.uel.br/bitstreams/cf6fef5d-0f9a-4d05-80e6-0940bd68535b/download5b2c9b62f9096800a763733cba7d2bf7MD53THUMBNAIL8712.pdf.jpg8712.pdf.jpgGenerated Thumbnailimage/jpeg3471https://repositorio.uel.br/bitstreams/605c65bc-5073-4db7-be9a-bd924fc37e2b/download7c5c505e49bbd1b83341a01cd1f88f5aMD54123456789/139842024-07-12 01:20:15.907open.accessoai:repositorio.uel.br:123456789/13984https://repositorio.uel.brBiblioteca Digital de Teses e Dissertaçõeshttp://www.bibliotecadigital.uel.br/PUBhttp://www.bibliotecadigital.uel.br/OAI/oai2.phpbcuel@uel.br||opendoar:2024-07-12T04:20:15Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL)false
dc.title.pt_BR.fl_str_mv Meta-learning for active learning tuning on stream classification
title Meta-learning for active learning tuning on stream classification
spellingShingle Meta-learning for active learning tuning on stream classification
Martins, Vinicius Eiji
Computação
Meta-aprendizado
Aprendizado ativo
Classificação de streams
Ajuste dinâmico
Computer science
Meta-learning
Active learning
Stream classification
Dynamic tuning
title_short Meta-learning for active learning tuning on stream classification
title_full Meta-learning for active learning tuning on stream classification
title_fullStr Meta-learning for active learning tuning on stream classification
title_full_unstemmed Meta-learning for active learning tuning on stream classification
title_sort Meta-learning for active learning tuning on stream classification
author Martins, Vinicius Eiji
author_facet Martins, Vinicius Eiji
author_role author
dc.contributor.banca.pt_BR.fl_str_mv Zarpelão, Bruno Bogaz
Carvalho, Luiz Fernando
dc.contributor.author.fl_str_mv Martins, Vinicius Eiji
dc.contributor.authorID.fl_str_mv c9004951-3bdd-4544-98ff-419ae6539927
dc.contributor.advisor1ID.fl_str_mv 94aaf54d-a259-4269-aca8-d1c56214b619
dc.contributor.advisor1.fl_str_mv Barbon Junior, Sylvio [Orientador]
contributor_str_mv Barbon Junior, Sylvio [Orientador]
dc.subject.por.fl_str_mv Computação
Meta-aprendizado
Aprendizado ativo
Classificação de streams
Ajuste dinâmico
Computer science
Meta-learning
Active learning
Stream classification
Dynamic tuning
topic Computação
Meta-aprendizado
Aprendizado ativo
Classificação de streams
Ajuste dinâmico
Computer science
Meta-learning
Active learning
Stream classification
Dynamic tuning
description Resumo: Aprendizado de Máquina Supervisionado exige o conhecimento de todos os rótulos dos dados a serem utilizados para se treinar um modelo Enquanto isso é factível em situ ações onde os dados são estáticos, em situações de dados contínuos, ou streaming, isso se torna inviável Não só pela quantidade potencialmente infinita de dados, como também a velocidade exigida do modelo para que não se crie um atraso muito grande Aprendizado Ativo (Active Learning) já resolveu uma porção considerável desse problema, diminuindo drasticamente o número de rótulos necessários para treinar um modelo enquanto se man tém uma performance competitiva Essa técnica porém ainda apresenta seus desafios, um deles é o ajuste necessário da técnica com base na tarefa a ser realizada e a possibilidade de que os conceitos e comportamentos dos dados sendo analisados mudem, exigindo uma atualização não só do modelo sendo treinado, como também dos parâmetros de apren dizado ativo ajustados Levando isso em conta, este trabalho busca reduzir esse problema com o uso de Meta-aprendizado Utilizamos Aprendizado Ativo com amostragem baseada em streaming utilizando uma métrica de incerteza para decidir a necessidade de rotulação Esta métrica é comparada com um valor de limiar chamado ?? Com meta-aprendizado podemos decidir o valor de ?? dinamicamente e automaticamente, promovendo a adapt abilidade do modelo quanto a mudança de conceitos e eliminando o passo inicial de decidir qual valor de ?? é mais propício para a tarefa a ser realizada Nossos experimentos demon straram uma redução na quantidade de rótulos necessários para o treinamento (média de 555%) com uma acurácia similar ao uso de Very Fast Decision Tree (VFDT) sob diferentes situações de mudança de conceitos em streams
publishDate 2024
dc.date.defesa.pt_BR.fl_str_mv 11.03.2022
dc.date.created.fl_str_mv 2022.00
dc.date.accessioned.fl_str_mv 2024-05-01T14:22:18Z
dc.date.available.fl_str_mv 2024-05-01T14:22:18Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.uel.br/handle/123456789/13984
url https://repositorio.uel.br/handle/123456789/13984
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv -1
-1
dc.relation.coursedegree.pt_BR.fl_str_mv Mestrado
dc.relation.coursename.pt_BR.fl_str_mv Ciência da Computação
dc.relation.departament.pt_BR.fl_str_mv Centro de Ciências Exatas
dc.relation.ppgname.pt_BR.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.coverage.spatial.pt_BR.fl_str_mv Londrina
dc.source.none.fl_str_mv reponame:Repositório Institucional da UEL
instname:Universidade Estadual de Londrina (UEL)
instacron:UEL
instname_str Universidade Estadual de Londrina (UEL)
instacron_str UEL
institution UEL
reponame_str Repositório Institucional da UEL
collection Repositório Institucional da UEL
bitstream.url.fl_str_mv https://repositorio.uel.br/bitstreams/0539f546-a448-47bf-a474-266efd34be0f/download
https://repositorio.uel.br/bitstreams/fd621e64-4e55-40aa-8574-e9be0470c2bf/download
https://repositorio.uel.br/bitstreams/cf6fef5d-0f9a-4d05-80e6-0940bd68535b/download
https://repositorio.uel.br/bitstreams/605c65bc-5073-4db7-be9a-bd924fc37e2b/download
bitstream.checksum.fl_str_mv 4101c9039899ad78711ad7132ecb6df0
753f376dfdbc064b559839be95ac5523
5b2c9b62f9096800a763733cba7d2bf7
7c5c505e49bbd1b83341a01cd1f88f5a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL)
repository.mail.fl_str_mv bcuel@uel.br||
_version_ 1856675815300792320