Curriculum learning applied to the combined algorithm selection and hyperparameter optimization problem
| Ano de defesa: | 2021 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Universidade Federal de São Carlos
Câmpus São Carlos |
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Ciência da Computação - PPGCC
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.ufscar.br/handle/20.500.14289/14791 |
Resumo: | AutoML has the goal to find the best Machine Learning (ML) pipeline in a complex and high dimensional search space by evaluating multiple algorithm configurations. Training multiple ML algorithms is time costly, and as AutoML tools usually obey a time constraint, the exploration of the search space may find sub-optimal results. In this work, we explore the application of curriculum learning techniques to overcome this limitation. Curriculum learning and anti-curriculum learning are strategies for ordering examples during model training based on their difficulty. These have shown to improve model performance and accelerate the training process on previous empirical investigations using optimization-based models. We apply and compare curriculum strategies on two optimizers of an AutoML system to accelerate the search space exploration and find good performing machine learning pipelines with efficiency. The results indicate that AutoML can benefit from a curriculum strategy. In most of the evaluated scenarios, the curriculum strategies led the AutoML algorithm to better classification results. |
| id |
SCAR_1051b859b2b990f7856d3c43b198486c |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/14791 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
|
| spelling |
Silva, Lucas Nildaimon dos SantosSilva, Diego Furtadohttp://lattes.cnpq.br/7662777934692986http://lattes.cnpq.br/818455337319895179514cc2-7a3f-4422-af6b-9973e93672852021-08-23T14:23:00Z2021-08-23T14:23:00Z2021-05-25SILVA, Lucas Nildaimon dos Santos. Curriculum learning applied to the combined algorithm selection and hyperparameter optimization problem. 2021. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/14791.https://repositorio.ufscar.br/handle/20.500.14289/14791AutoML has the goal to find the best Machine Learning (ML) pipeline in a complex and high dimensional search space by evaluating multiple algorithm configurations. Training multiple ML algorithms is time costly, and as AutoML tools usually obey a time constraint, the exploration of the search space may find sub-optimal results. In this work, we explore the application of curriculum learning techniques to overcome this limitation. Curriculum learning and anti-curriculum learning are strategies for ordering examples during model training based on their difficulty. These have shown to improve model performance and accelerate the training process on previous empirical investigations using optimization-based models. We apply and compare curriculum strategies on two optimizers of an AutoML system to accelerate the search space exploration and find good performing machine learning pipelines with efficiency. The results indicate that AutoML can benefit from a curriculum strategy. In most of the evaluated scenarios, the curriculum strategies led the AutoML algorithm to better classification results.A automatização do aprendizado de máquina (AutoML) tem como objetivo encontrar o melhor pipeline de aprendizado de máquina (ML) em um espaço de pesquisa complexo e de grande dimensionalidade, avaliando várias configurações de algoritmos. O treinamento de vários algoritmos de ML custa tempo e, como as ferramentas de AutoML geralmente obedecem a uma restrição de tempo, a exploração do espaço de pesquisa pode encontrar resultados abaixo do ideal. Neste trabalho, exploramos a aplicação de técnicas de aprendizado de currículo para superar essa limitação. A aprendizagem curricular e a aprendizagem anticurricular são estratégias para ordenar exemplos durante o treinamento do modelo com base em sua dificuldade. Estes mostraram melhorar o desempenho de modelos e acelerar o processo de treinamento em investigações empíricas anteriores usando modelos baseados em otimização. Aplicamos e comparamos estratégias de currículo em dois otimizadores de um sistema AutoML para melhorar a exploração do espaço de pesquisa e encontrar pipelines de aprendizado de máquina de bom desempenho com eficiência. Os resultados indicam que o AutoML pode se beneficiar de uma estratégia curricular. Na maioria dos cenários avaliados, as estratégias de currículo levaram o algoritmo AutoML a melhores resultados de classificação.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)CAPES: Código de Financiamento 001B2W Digital: 23112.000186/2020-97engUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessAutoMLCurriculum learningMachine learningAprendizagem curricular,Aprendizagem de máquinaCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOCurriculum learning applied to the combined algorithm selection and hyperparameter optimization problemAprendizagem de currículo aplicada ao problema de seleção de algoritmo e otimização de hiperparâmetros combinadosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis6009185a24d-3ee1-48a1-82f2-dad58a6b653ereponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissertação_LucasNildaimon.pdfDissertação_LucasNildaimon.pdfVersão final da dissertação com folha de aprovaçãoapplication/pdf1062770https://repositorio.ufscar.br/bitstreams/13fef18c-4cce-4d6f-b1b7-ef9b131e4eff/download89d032c7c66a44c9d09cd7a904dc0ef8MD51trueAnonymousREADPPGCC_Lucas Nildaimon.pdfPPGCC_Lucas Nildaimon.pdfCarta comprovanteapplication/pdf78960https://repositorio.ufscar.br/bitstreams/37106940-5ee0-42b6-ace8-3d63eed2cde9/download68f9a9c03862c179e4fdcdf31cc01ef3MD52falseAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufscar.br/bitstreams/af2639cd-9c84-4c12-9f5a-1251e413b6ab/downloade39d27027a6cc9cb039ad269a5db8e34MD53falseAnonymousREADTEXTDissertação_LucasNildaimon.pdf.txtDissertação_LucasNildaimon.pdf.txtExtracted texttext/plain118039https://repositorio.ufscar.br/bitstreams/eb30393c-7145-4537-abac-539dd7bdcf50/downloada46350522db8e5210b7f451e56c218d4MD58falseAnonymousREADPPGCC_Lucas Nildaimon.pdf.txtPPGCC_Lucas Nildaimon.pdf.txtExtracted texttext/plain1585https://repositorio.ufscar.br/bitstreams/41289ad6-74d8-4a11-b9dd-b62bce778f90/downloadae69557d1eca7a613b1ebc0fac7fd2b8MD510falseAnonymousREADTHUMBNAILDissertação_LucasNildaimon.pdf.jpgDissertação_LucasNildaimon.pdf.jpgIM Thumbnailimage/jpeg8490https://repositorio.ufscar.br/bitstreams/10856f64-c9b9-4411-8a70-0a41b2c5bb4e/downloadf80eee103830838ad2a8084c25e6c8b9MD59falseAnonymousREADPPGCC_Lucas Nildaimon.pdf.jpgPPGCC_Lucas Nildaimon.pdf.jpgIM Thumbnailimage/jpeg12961https://repositorio.ufscar.br/bitstreams/108415b2-582b-43f0-9c00-43fbf1660fe5/downloadee5eeaf49cbdf2eba3419c4218ccfd74MD511falseAnonymousREAD20.500.14289/147912025-02-05 20:06:41.354http://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/14791https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-05T23:06:41Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
| dc.title.eng.fl_str_mv |
Curriculum learning applied to the combined algorithm selection and hyperparameter optimization problem |
| dc.title.alternative.por.fl_str_mv |
Aprendizagem de currículo aplicada ao problema de seleção de algoritmo e otimização de hiperparâmetros combinados |
| title |
Curriculum learning applied to the combined algorithm selection and hyperparameter optimization problem |
| spellingShingle |
Curriculum learning applied to the combined algorithm selection and hyperparameter optimization problem Silva, Lucas Nildaimon dos Santos AutoML Curriculum learning Machine learning Aprendizagem curricular, Aprendizagem de máquina CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
| title_short |
Curriculum learning applied to the combined algorithm selection and hyperparameter optimization problem |
| title_full |
Curriculum learning applied to the combined algorithm selection and hyperparameter optimization problem |
| title_fullStr |
Curriculum learning applied to the combined algorithm selection and hyperparameter optimization problem |
| title_full_unstemmed |
Curriculum learning applied to the combined algorithm selection and hyperparameter optimization problem |
| title_sort |
Curriculum learning applied to the combined algorithm selection and hyperparameter optimization problem |
| author |
Silva, Lucas Nildaimon dos Santos |
| author_facet |
Silva, Lucas Nildaimon dos Santos |
| author_role |
author |
| dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/8184553373198951 |
| dc.contributor.author.fl_str_mv |
Silva, Lucas Nildaimon dos Santos |
| dc.contributor.advisor1.fl_str_mv |
Silva, Diego Furtado |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/7662777934692986 |
| dc.contributor.authorID.fl_str_mv |
79514cc2-7a3f-4422-af6b-9973e9367285 |
| contributor_str_mv |
Silva, Diego Furtado |
| dc.subject.eng.fl_str_mv |
AutoML Curriculum learning Machine learning |
| topic |
AutoML Curriculum learning Machine learning Aprendizagem curricular, Aprendizagem de máquina CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
| dc.subject.por.fl_str_mv |
Aprendizagem curricular, Aprendizagem de máquina |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO |
| description |
AutoML has the goal to find the best Machine Learning (ML) pipeline in a complex and high dimensional search space by evaluating multiple algorithm configurations. Training multiple ML algorithms is time costly, and as AutoML tools usually obey a time constraint, the exploration of the search space may find sub-optimal results. In this work, we explore the application of curriculum learning techniques to overcome this limitation. Curriculum learning and anti-curriculum learning are strategies for ordering examples during model training based on their difficulty. These have shown to improve model performance and accelerate the training process on previous empirical investigations using optimization-based models. We apply and compare curriculum strategies on two optimizers of an AutoML system to accelerate the search space exploration and find good performing machine learning pipelines with efficiency. The results indicate that AutoML can benefit from a curriculum strategy. In most of the evaluated scenarios, the curriculum strategies led the AutoML algorithm to better classification results. |
| publishDate |
2021 |
| dc.date.accessioned.fl_str_mv |
2021-08-23T14:23:00Z |
| dc.date.available.fl_str_mv |
2021-08-23T14:23:00Z |
| dc.date.issued.fl_str_mv |
2021-05-25 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
SILVA, Lucas Nildaimon dos Santos. Curriculum learning applied to the combined algorithm selection and hyperparameter optimization problem. 2021. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/14791. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/20.500.14289/14791 |
| identifier_str_mv |
SILVA, Lucas Nildaimon dos Santos. Curriculum learning applied to the combined algorithm selection and hyperparameter optimization problem. 2021. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2021. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/14791. |
| url |
https://repositorio.ufscar.br/handle/20.500.14289/14791 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.relation.confidence.fl_str_mv |
600 |
| dc.relation.authority.fl_str_mv |
9185a24d-3ee1-48a1-82f2-dad58a6b653e |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/13fef18c-4cce-4d6f-b1b7-ef9b131e4eff/download https://repositorio.ufscar.br/bitstreams/37106940-5ee0-42b6-ace8-3d63eed2cde9/download https://repositorio.ufscar.br/bitstreams/af2639cd-9c84-4c12-9f5a-1251e413b6ab/download https://repositorio.ufscar.br/bitstreams/eb30393c-7145-4537-abac-539dd7bdcf50/download https://repositorio.ufscar.br/bitstreams/41289ad6-74d8-4a11-b9dd-b62bce778f90/download https://repositorio.ufscar.br/bitstreams/10856f64-c9b9-4411-8a70-0a41b2c5bb4e/download https://repositorio.ufscar.br/bitstreams/108415b2-582b-43f0-9c00-43fbf1660fe5/download |
| bitstream.checksum.fl_str_mv |
89d032c7c66a44c9d09cd7a904dc0ef8 68f9a9c03862c179e4fdcdf31cc01ef3 e39d27027a6cc9cb039ad269a5db8e34 a46350522db8e5210b7f451e56c218d4 ae69557d1eca7a613b1ebc0fac7fd2b8 f80eee103830838ad2a8084c25e6c8b9 ee5eeaf49cbdf2eba3419c4218ccfd74 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1851688858176978944 |