Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda

Luna, Reginaldo

Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda

Detalhes bibliográficos
Ano de defesa:	2024
Autor(a) principal:	Luna, Reginaldo
Orientador(a):	Senger, Hermes
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Universidade Federal de São Carlos Câmpus São Carlos
Programa de Pós-Graduação:	Programa de Pós-Graduação em Ciência da Computação - PPGCC
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Eficiência energética Comitê de classificadores Fluxo de dados Computação de borda
Palavras-chave em Inglês:	Energy efficiency Ensembles Edge computing
Área do conhecimento CNPq:	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Link de acesso:	https://repositorio.ufscar.br/handle/20.500.14289/21098
Resumo:	Edge computing (EC) has emerged as an architecture that can help reduce the energy demand and greenhouse gas emissions of digital technologies. Edge computing offers low latency, mobility, and location awareness for delay-sensitive devices, connecting cloud computing services to end-users. Machine learning (ML) methods have increasingly been used on edge devices for data classification and information processing. Classifier ensembles have demonstrated good predictive performance in data stream classification problems. The strategy called mini-batching was previously proposed in the literature to improve cache data reuse when executing classifier ensembles on multi-core architectures for online data stream classification. The strategy involves temporarily grouping data from a data stream and processing them together. As a result, mini-batching can speed up applications and reduce energy consumption. However, the originally proposed mini-batching offers opportunities for further improvements. In this work, we investigate the fusion of the training and classification stages of the data, bringing more gains in cache reuse and predictive performance improvements. We also evaluate the mini-batching strategy compared to two strategies supported by the hardware of common multi-core processors used in edge devices: clock frequency reduction and processor core shutdown. We evaluate the strategies by comparing their performance and energy efficiency for data stream classification using six state-of-the-art classifier ensemble algorithms and four benchmark datasets. The results show that mini-batching strategies can significantly reduce energy consumption in 95% of the experiments, improving energy efficiency by an average of 96% and by 169% in the best case over hardware strategies. Similarly, the newly proposed mini-batching strategy improved energy efficiency by an average of 136% and 456% in the best case. Finally, we proposed an adaptive and multi-objective optimization strategy to dynamically choose the mini-batching size based on CPU occupancy and data arrival rates. The batch size choice uses the Pareto principle to optimize both response time and energy consumption. Results show an improvement in energy consumption in 17 of the 24 cases evaluated. However, for the latency metric, there was no significant reduction compared to batch sizes of 50 (pointed out in the literature as a good choice). In summary, the dynamic strategy offers reduced energy consumption without losses in execution time.

Metadados do item

id	SCAR_2d021f39cd5324ed3882768e002cc055
oai_identifier_str	oai:repositorio.ufscar.br:20.500.14289/21098
network_acronym_str	SCAR
network_name_str	Repositório Institucional da UFSCAR
repository_id_str
spelling	Luna, ReginaldoSenger, Hermeshttp://lattes.cnpq.br/3691742159298316http://lattes.cnpq.br/2982663262422530https://orcid.org/0000-0002-7266-6843https://orcid.org/0000-0003-1273-98092024-12-04T11:59:55Z2024-12-04T11:59:55Z2024-06-28LUNA, Reginaldo. Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda. 2024. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21098.https://repositorio.ufscar.br/handle/20.500.14289/21098Edge computing (EC) has emerged as an architecture that can help reduce the energy demand and greenhouse gas emissions of digital technologies. Edge computing offers low latency, mobility, and location awareness for delay-sensitive devices, connecting cloud computing services to end-users. Machine learning (ML) methods have increasingly been used on edge devices for data classification and information processing. Classifier ensembles have demonstrated good predictive performance in data stream classification problems. The strategy called mini-batching was previously proposed in the literature to improve cache data reuse when executing classifier ensembles on multi-core architectures for online data stream classification. The strategy involves temporarily grouping data from a data stream and processing them together. As a result, mini-batching can speed up applications and reduce energy consumption. However, the originally proposed mini-batching offers opportunities for further improvements. In this work, we investigate the fusion of the training and classification stages of the data, bringing more gains in cache reuse and predictive performance improvements. We also evaluate the mini-batching strategy compared to two strategies supported by the hardware of common multi-core processors used in edge devices: clock frequency reduction and processor core shutdown. We evaluate the strategies by comparing their performance and energy efficiency for data stream classification using six state-of-the-art classifier ensemble algorithms and four benchmark datasets. The results show that mini-batching strategies can significantly reduce energy consumption in 95% of the experiments, improving energy efficiency by an average of 96% and by 169% in the best case over hardware strategies. Similarly, the newly proposed mini-batching strategy improved energy efficiency by an average of 136% and 456% in the best case. Finally, we proposed an adaptive and multi-objective optimization strategy to dynamically choose the mini-batching size based on CPU occupancy and data arrival rates. The batch size choice uses the Pareto principle to optimize both response time and energy consumption. Results show an improvement in energy consumption in 17 of the 24 cases evaluated. However, for the latency metric, there was no significant reduction compared to batch sizes of 50 (pointed out in the literature as a good choice). In summary, the dynamic strategy offers reduced energy consumption without losses in execution time.Computação de borda (CB) surgiu como uma arquitetura que pode ajudar a reduzir a demanda de energia e as emissões de gases de efeito estufa das tecnologias digitais. A computação de borda oferece baixa latência, mobilidade e ciência da localização para dispositivos sensíveis a atrasos, conectando os serviços de computação em nuvem aos usuários finais. Métodos de aprendizado de máquina (AM) têm sido cada vez mais utilizados em dispositivos na borda para classificação de dados e processamento de informações. Os comitês de classificadores tem demonstrado bom desempenho preditivo em problemas de classificação de fluxo de dados. A estratégia mini-batching melhora o reuso de dados dos caches na execução de comitês de classificadores em arquiteturas multi-core para a classificação de fluxos de dados online. A estratégia consiste em agrupar temporariamente dados de um fluxo e processá-los em conjunto. Como efeito, o mini-batching pode acelerar as aplicações e reduzir o consumo de energia. Neste trabalho, investigamos a fusão das etapas de treinamento e de classificação dos dados, trazendo ainda mais ganhos de reuso dos caches e melhorias no desempenho preditivo. Também comparamos mini-batching a duas estratégias que são suportadas pelo hardware de processadores multi-core utilizados em dispositivos de borda, que são a redução da frequência do clock e o desligamento de núcleos de processamento. Avaliamos as estratégias comparando seu desempenho e eficiência energética para a classificação de fluxos de dados usando seis algoritmos de comitês de classificação de última geração e quatro datasets de referência. Os resultados mostram que estratégias de mini-batching podem reduzir significativamente o consumo de energia em 95% dos experimentos, melhorando a eficiência energética em 96% em média e em 169% no melhor caso sobre as estratégias de hardware. Da mesma forma, a nova estratégia de mini-batching proposta melhorou a eficiência energética em 136% em média e 456% no melhor caso. Por fim, propusemos uma estratégia de otimização adaptativa e multi-objetivo para escolher dinamicamente o tamanho do mini-batching em função da ocupação da CPU das taxas de chagada de dados. A escolha do tamanho do batch usa o princípio de Pareto para otimizar tanto o tempo de resposta quanto o consumo de energia. Resultados mostram melhoria do consumo energético em 17 dos 24 casos avaliados. Já para a métrica de atraso, não houve uma redução significativa quando comparado a batches de tamanho 50 (apontado na literatura como uma boa escolha). Em resumo, a estratégia dinâmica oferece redução do consumo energético, sem perdas no tempo de execução.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessEficiência energéticaComitê de classificadoresFluxo de dadosComputação de bordaEnergy efficiencyEnsemblesEdge computingCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOMelhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de bordaImproving the energy efficiency of data stream classifier arrays for edge computinginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARTEXTDissertacao_Reginaldo.pdf.txtDissertacao_Reginaldo.pdf.txtExtracted texttext/plain103606https://repositorio.ufscar.br/bitstreams/6a9f6adb-8037-4916-bff3-2b039ef2b305/download3bf5f131b142c95c493d3cfe2d5e7fd6MD53falseAnonymousREADTHUMBNAILDissertacao_Reginaldo.pdf.jpgDissertacao_Reginaldo.pdf.jpgGenerated Thumbnailimage/jpeg4215https://repositorio.ufscar.br/bitstreams/c7b57746-7d0e-4846-b487-b681d8108d2c/download3acbd212b9c786f644b3e73d1da71fb2MD54falseAnonymousREADORIGINALDissertacao_Reginaldo.pdfDissertacao_Reginaldo.pdfapplication/pdf2197115https://repositorio.ufscar.br/bitstreams/b9cd096c-9819-4383-b04c-dcaa14c20b3c/download24c4bba1f41928817f26cd1248e35a52MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8913https://repositorio.ufscar.br/bitstreams/08836cf4-0f00-4663-9ae6-8037ac68df30/download3185b4de2190c2d366d1d324db01f8b8MD52falseAnonymousREAD20.500.14289/210982025-02-06 04:20:26.547http://creativecommons.org/licenses/by/3.0/br/Attribution 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/21098https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-06T07:20:26Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv	Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda
dc.title.alternative.eng.fl_str_mv	Improving the energy efficiency of data stream classifier arrays for edge computing
title	Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda
spellingShingle	Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda Luna, Reginaldo Eficiência energética Comitê de classificadores Fluxo de dados Computação de borda Energy efficiency Ensembles Edge computing CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short	Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda
title_full	Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda
title_fullStr	Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda
title_full_unstemmed	Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda
title_sort	Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda
author	Luna, Reginaldo
author_facet	Luna, Reginaldo
author_role	author
dc.contributor.authorlattes.por.fl_str_mv	http://lattes.cnpq.br/2982663262422530
dc.contributor.authororcid.por.fl_str_mv	https://orcid.org/0000-0002-7266-6843
dc.contributor.advisor1orcid.por.fl_str_mv	https://orcid.org/0000-0003-1273-9809
dc.contributor.author.fl_str_mv	Luna, Reginaldo
dc.contributor.advisor1.fl_str_mv	Senger, Hermes
dc.contributor.advisor1Lattes.fl_str_mv	http://lattes.cnpq.br/3691742159298316
contributor_str_mv	Senger, Hermes
dc.subject.por.fl_str_mv	Eficiência energética Comitê de classificadores Fluxo de dados Computação de borda
topic	Eficiência energética Comitê de classificadores Fluxo de dados Computação de borda Energy efficiency Ensembles Edge computing CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv	Energy efficiency Ensembles Edge computing
dc.subject.cnpq.fl_str_mv	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description	Edge computing (EC) has emerged as an architecture that can help reduce the energy demand and greenhouse gas emissions of digital technologies. Edge computing offers low latency, mobility, and location awareness for delay-sensitive devices, connecting cloud computing services to end-users. Machine learning (ML) methods have increasingly been used on edge devices for data classification and information processing. Classifier ensembles have demonstrated good predictive performance in data stream classification problems. The strategy called mini-batching was previously proposed in the literature to improve cache data reuse when executing classifier ensembles on multi-core architectures for online data stream classification. The strategy involves temporarily grouping data from a data stream and processing them together. As a result, mini-batching can speed up applications and reduce energy consumption. However, the originally proposed mini-batching offers opportunities for further improvements. In this work, we investigate the fusion of the training and classification stages of the data, bringing more gains in cache reuse and predictive performance improvements. We also evaluate the mini-batching strategy compared to two strategies supported by the hardware of common multi-core processors used in edge devices: clock frequency reduction and processor core shutdown. We evaluate the strategies by comparing their performance and energy efficiency for data stream classification using six state-of-the-art classifier ensemble algorithms and four benchmark datasets. The results show that mini-batching strategies can significantly reduce energy consumption in 95% of the experiments, improving energy efficiency by an average of 96% and by 169% in the best case over hardware strategies. Similarly, the newly proposed mini-batching strategy improved energy efficiency by an average of 136% and 456% in the best case. Finally, we proposed an adaptive and multi-objective optimization strategy to dynamically choose the mini-batching size based on CPU occupancy and data arrival rates. The batch size choice uses the Pareto principle to optimize both response time and energy consumption. Results show an improvement in energy consumption in 17 of the 24 cases evaluated. However, for the latency metric, there was no significant reduction compared to batch sizes of 50 (pointed out in the literature as a good choice). In summary, the dynamic strategy offers reduced energy consumption without losses in execution time.
publishDate	2024
dc.date.accessioned.fl_str_mv	2024-12-04T11:59:55Z
dc.date.available.fl_str_mv	2024-12-04T11:59:55Z
dc.date.issued.fl_str_mv	2024-06-28
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.citation.fl_str_mv	LUNA, Reginaldo. Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda. 2024. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21098.
dc.identifier.uri.fl_str_mv	https://repositorio.ufscar.br/handle/20.500.14289/21098
identifier_str_mv	LUNA, Reginaldo. Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda. 2024. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21098.
url	https://repositorio.ufscar.br/handle/20.500.14289/21098
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal de São Carlos Câmpus São Carlos
dc.publisher.program.fl_str_mv	Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv	UFSCar
publisher.none.fl_str_mv	Universidade Federal de São Carlos Câmpus São Carlos
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR
instname_str	Universidade Federal de São Carlos (UFSCAR)
instacron_str	UFSCAR
institution	UFSCAR
reponame_str	Repositório Institucional da UFSCAR
collection	Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv	https://repositorio.ufscar.br/bitstreams/6a9f6adb-8037-4916-bff3-2b039ef2b305/download https://repositorio.ufscar.br/bitstreams/c7b57746-7d0e-4846-b487-b681d8108d2c/download https://repositorio.ufscar.br/bitstreams/b9cd096c-9819-4383-b04c-dcaa14c20b3c/download https://repositorio.ufscar.br/bitstreams/08836cf4-0f00-4663-9ae6-8037ac68df30/download
bitstream.checksum.fl_str_mv	3bf5f131b142c95c493d3cfe2d5e7fd6 3acbd212b9c786f644b3e73d1da71fb2 24c4bba1f41928817f26cd1248e35a52 3185b4de2190c2d366d1d324db01f8b8
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv	repositorio.sibi@ufscar.br
_version_	1851688749075791872

Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda

Registros relacionados