Look-ahead reinforcement learning : an application for load balancing network trafficc

Possebon, Isadora Pedrini

Look-ahead reinforcement learning : an application for load balancing network trafficc

Detalhes bibliográficos
Ano de defesa:	2021
Autor(a) principal:	Possebon, Isadora Pedrini
Orientador(a):	Schaeffer Filho, Alberto Egon
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	eng
Instituição de defesa:	Não Informado pela instituição
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Trafego : Redes : Computadores Aprendizado por reforço Aprendizado de máquina
Palavras-chave em Inglês:	Network traffic Reinforcement learning Network traffic prediction Load balancing Network flow Machine learning
Link de acesso:	http://hdl.handle.net/10183/226270
Resumo:	Considerando o crescimento de complexidade e escala das redes de computadores e que a principal causa de falhas é o erro humano, há um interesse crescente em minimizar o papel dos humanos nas tarefas de gerenciamento de rede. Nesse contexto, propomos uma abordagem de aprendizado de máquina em duas etapas para balancear automaticamente os fluxos de rede que podem comprometer o desempenho da rede. Em primeiro lugar, contamos com a identificação de fluxos de elefantes, que impactam mais fortemente os recursos da rede. Em segundo lugar, utilizamos um mecanismo de aprendizagem por reforço para determinar a melhor ação a ser realizada na rede, dado o seu estado atual. A intuição para esta abordagem em duas etapas é amortizar os custos computacionais do aprendizado por reforço e aplicá-los apenas aos fluxos que podem causar um alto impacto no desempenho da rede. Para avaliar nosso trabalho, primeiramente fazemos uma avaliação funcional para discutir diferentes funções de recompensa usadas no balanceamento de carga com aprendizagem por reforço. Em segundo lugar, avaliamos a identificação de fluxos elefante, discutindo o impacto de observar esse tipo de fluxo nas estratégias de aprendizagem por reforço. Para o primeiro conjunto de experimentos, os resultados indicam que a abordagem RL é melhor do que a solução de base (controlador sem RL). A função de recompensa com melhores resultados utilizou uma heurística de média harmônica e foi capaz de reduzir o FCT, sendo escalável em relação ao número de switches na topologia. Para o segundo conjunto de experimentos, mostramos a importância de usar uma inteligência de fluxos elefantes: a função de recompensa com esse fator foi capaz de reduzir o FCT em 91 %, considerando uma carga de trabalho de 50/50 (50 % de fluxos ratos e 50 % de fluxos elefantes, com intervalo de 15 segundos entre as conexões). Nossas principais contribuições são (i) modelagem de problemas em função de estados e ações em um sistema que visa balancear o tráfego da rede e (ii) uma arquitetura que usa de forma mais criteriosa a aprendizagem por reforço nos fluxos de interesse para o balanceamento de carga.

Metadados do item

id	URGS_04037e2c619456d7fb246086252e565e
oai_identifier_str	oai:www.lume.ufrgs.br:10183/226270
network_acronym_str	URGS
network_name_str	Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling	Possebon, Isadora PedriniSchaeffer Filho, Alberto Egon2021-08-28T04:33:17Z2021http://hdl.handle.net/10183/226270001130752Considerando o crescimento de complexidade e escala das redes de computadores e que a principal causa de falhas é o erro humano, há um interesse crescente em minimizar o papel dos humanos nas tarefas de gerenciamento de rede. Nesse contexto, propomos uma abordagem de aprendizado de máquina em duas etapas para balancear automaticamente os fluxos de rede que podem comprometer o desempenho da rede. Em primeiro lugar, contamos com a identificação de fluxos de elefantes, que impactam mais fortemente os recursos da rede. Em segundo lugar, utilizamos um mecanismo de aprendizagem por reforço para determinar a melhor ação a ser realizada na rede, dado o seu estado atual. A intuição para esta abordagem em duas etapas é amortizar os custos computacionais do aprendizado por reforço e aplicá-los apenas aos fluxos que podem causar um alto impacto no desempenho da rede. Para avaliar nosso trabalho, primeiramente fazemos uma avaliação funcional para discutir diferentes funções de recompensa usadas no balanceamento de carga com aprendizagem por reforço. Em segundo lugar, avaliamos a identificação de fluxos elefante, discutindo o impacto de observar esse tipo de fluxo nas estratégias de aprendizagem por reforço. Para o primeiro conjunto de experimentos, os resultados indicam que a abordagem RL é melhor do que a solução de base (controlador sem RL). A função de recompensa com melhores resultados utilizou uma heurística de média harmônica e foi capaz de reduzir o FCT, sendo escalável em relação ao número de switches na topologia. Para o segundo conjunto de experimentos, mostramos a importância de usar uma inteligência de fluxos elefantes: a função de recompensa com esse fator foi capaz de reduzir o FCT em 91 %, considerando uma carga de trabalho de 50/50 (50 % de fluxos ratos e 50 % de fluxos elefantes, com intervalo de 15 segundos entre as conexões). Nossas principais contribuições são (i) modelagem de problemas em função de estados e ações em um sistema que visa balancear o tráfego da rede e (ii) uma arquitetura que usa de forma mais criteriosa a aprendizagem por reforço nos fluxos de interesse para o balanceamento de carga.Considering the growth in complexity and scale of computer networks and that the lead ing cause of failures is human error, there is an increasing interest in minimizing the role of humans in network management tasks. In this context, we propose a two-step, machine learning approach for automatically balancing network flows that can compro mise network performance. In particular, firstly, we rely on identifying elephant flows, which more heavily impact network resources. Secondly, we use a reinforcement learning mechanism to determine the best action to be performed in the network, given its current status. The intuition for this two-step approach is to amortize the computational costs of reinforcement learning and apply it only to flows which can cause a high impact on network performance. To evaluate our work, we firstly perform a functional evaluation to discuss different re ward functions for load balancing using reinforcement learning. Secondly, we evaluate the elephant flow identification, discussing the impact of looking to elephant flows on reinforcement learning strategies. For the first set of experiments, results indicate that the RL approach is better than the baseline (controller with no RL intervention). The reward function with better results used a harmonic mean heuristic. This reward function was able to reduce FCT and be scalable concerning the number of switches. For the second set of experiments, we showed the importance of using an elephant flow intelligence: reward function with this factor was able to reduce FCT by 91%, considering a 50/50 workload (50% mice flows, and a 50% elephant flows proportion, with a 15 seconds interval between connections). Our main contributions are (i) problem modeling as a function of states and actions in a system that aims to balance network traffic and (ii) an architecture that more judiciously uses reinforcement learning on flows of interest for load balancing.application/pdfengTrafego : Redes : ComputadoresAprendizado por reforçoAprendizado de máquinaNetwork trafficReinforcement learningNetwork traffic predictionLoad balancingNetwork flowMachine learningLook-ahead reinforcement learning : an application for load balancing network trafficcLook-ahead reinforcement learning: uma aplicação para balanceamento de fluxos de rede usando aprendizado por reforço info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2021mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001130752.pdf.txt001130752.pdf.txtExtracted Texttext/plain202091http://www.lume.ufrgs.br/bitstream/10183/226270/2/001130752.pdf.txt1c3da3a738e8b343387d9df769adf9f1MD52ORIGINAL001130752.pdfTexto completo (inglês)application/pdf1415215http://www.lume.ufrgs.br/bitstream/10183/226270/1/001130752.pdf91e3f770f17182547a9e0578b47bbed4MD5110183/2262702021-09-19 04:29:35.082118oai:www.lume.ufrgs.br:10183/226270Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br\|\|lume@ufrgs.bropendoar:18532021-09-19T07:29:35Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv	Look-ahead reinforcement learning : an application for load balancing network trafficc
dc.title.alternative.pt.fl_str_mv	Look-ahead reinforcement learning: uma aplicação para balanceamento de fluxos de rede usando aprendizado por reforço
title	Look-ahead reinforcement learning : an application for load balancing network trafficc
spellingShingle	Look-ahead reinforcement learning : an application for load balancing network trafficc Possebon, Isadora Pedrini Trafego : Redes : Computadores Aprendizado por reforço Aprendizado de máquina Network traffic Reinforcement learning Network traffic prediction Load balancing Network flow Machine learning
title_short	Look-ahead reinforcement learning : an application for load balancing network trafficc
title_full	Look-ahead reinforcement learning : an application for load balancing network trafficc
title_fullStr	Look-ahead reinforcement learning : an application for load balancing network trafficc
title_full_unstemmed	Look-ahead reinforcement learning : an application for load balancing network trafficc
title_sort	Look-ahead reinforcement learning : an application for load balancing network trafficc
author	Possebon, Isadora Pedrini
author_facet	Possebon, Isadora Pedrini
author_role	author
dc.contributor.author.fl_str_mv	Possebon, Isadora Pedrini
dc.contributor.advisor1.fl_str_mv	Schaeffer Filho, Alberto Egon
contributor_str_mv	Schaeffer Filho, Alberto Egon
dc.subject.por.fl_str_mv	Trafego : Redes : Computadores Aprendizado por reforço Aprendizado de máquina
topic	Trafego : Redes : Computadores Aprendizado por reforço Aprendizado de máquina Network traffic Reinforcement learning Network traffic prediction Load balancing Network flow Machine learning
dc.subject.eng.fl_str_mv	Network traffic Reinforcement learning Network traffic prediction Load balancing Network flow Machine learning
description	Considerando o crescimento de complexidade e escala das redes de computadores e que a principal causa de falhas é o erro humano, há um interesse crescente em minimizar o papel dos humanos nas tarefas de gerenciamento de rede. Nesse contexto, propomos uma abordagem de aprendizado de máquina em duas etapas para balancear automaticamente os fluxos de rede que podem comprometer o desempenho da rede. Em primeiro lugar, contamos com a identificação de fluxos de elefantes, que impactam mais fortemente os recursos da rede. Em segundo lugar, utilizamos um mecanismo de aprendizagem por reforço para determinar a melhor ação a ser realizada na rede, dado o seu estado atual. A intuição para esta abordagem em duas etapas é amortizar os custos computacionais do aprendizado por reforço e aplicá-los apenas aos fluxos que podem causar um alto impacto no desempenho da rede. Para avaliar nosso trabalho, primeiramente fazemos uma avaliação funcional para discutir diferentes funções de recompensa usadas no balanceamento de carga com aprendizagem por reforço. Em segundo lugar, avaliamos a identificação de fluxos elefante, discutindo o impacto de observar esse tipo de fluxo nas estratégias de aprendizagem por reforço. Para o primeiro conjunto de experimentos, os resultados indicam que a abordagem RL é melhor do que a solução de base (controlador sem RL). A função de recompensa com melhores resultados utilizou uma heurística de média harmônica e foi capaz de reduzir o FCT, sendo escalável em relação ao número de switches na topologia. Para o segundo conjunto de experimentos, mostramos a importância de usar uma inteligência de fluxos elefantes: a função de recompensa com esse fator foi capaz de reduzir o FCT em 91 %, considerando uma carga de trabalho de 50/50 (50 % de fluxos ratos e 50 % de fluxos elefantes, com intervalo de 15 segundos entre as conexões). Nossas principais contribuições são (i) modelagem de problemas em função de estados e ações em um sistema que visa balancear o tráfego da rede e (ii) uma arquitetura que usa de forma mais criteriosa a aprendizagem por reforço nos fluxos de interesse para o balanceamento de carga.
publishDate	2021
dc.date.accessioned.fl_str_mv	2021-08-28T04:33:17Z
dc.date.issued.fl_str_mv	2021
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10183/226270
dc.identifier.nrb.pt_BR.fl_str_mv	001130752
url	http://hdl.handle.net/10183/226270
identifier_str_mv	001130752
dc.language.iso.fl_str_mv	eng
language	eng
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS
instname_str	Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str	UFRGS
institution	UFRGS
reponame_str	Biblioteca Digital de Teses e Dissertações da UFRGS
collection	Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv	http://www.lume.ufrgs.br/bitstream/10183/226270/2/001130752.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/226270/1/001130752.pdf
bitstream.checksum.fl_str_mv	1c3da3a738e8b343387d9df769adf9f1 91e3f770f17182547a9e0578b47bbed4
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv	lume@ufrgs.br\|\|lume@ufrgs.br
_version_	1831316118161063936

Look-ahead reinforcement learning : an application for load balancing network trafficc

Registros relacionados