Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de São Carlos
Câmpus São Carlos |
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Ciência da Computação - PPGCC
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.ufscar.br/handle/20.500.14289/21098 |
Resumo: | Edge computing (EC) has emerged as an architecture that can help reduce the energy demand and greenhouse gas emissions of digital technologies. Edge computing offers low latency, mobility, and location awareness for delay-sensitive devices, connecting cloud computing services to end-users. Machine learning (ML) methods have increasingly been used on edge devices for data classification and information processing. Classifier ensembles have demonstrated good predictive performance in data stream classification problems. The strategy called mini-batching was previously proposed in the literature to improve cache data reuse when executing classifier ensembles on multi-core architectures for online data stream classification. The strategy involves temporarily grouping data from a data stream and processing them together. As a result, mini-batching can speed up applications and reduce energy consumption. However, the originally proposed mini-batching offers opportunities for further improvements. In this work, we investigate the fusion of the training and classification stages of the data, bringing more gains in cache reuse and predictive performance improvements. We also evaluate the mini-batching strategy compared to two strategies supported by the hardware of common multi-core processors used in edge devices: clock frequency reduction and processor core shutdown. We evaluate the strategies by comparing their performance and energy efficiency for data stream classification using six state-of-the-art classifier ensemble algorithms and four benchmark datasets. The results show that mini-batching strategies can significantly reduce energy consumption in 95% of the experiments, improving energy efficiency by an average of 96% and by 169% in the best case over hardware strategies. Similarly, the newly proposed mini-batching strategy improved energy efficiency by an average of 136% and 456% in the best case. Finally, we proposed an adaptive and multi-objective optimization strategy to dynamically choose the mini-batching size based on CPU occupancy and data arrival rates. The batch size choice uses the Pareto principle to optimize both response time and energy consumption. Results show an improvement in energy consumption in 17 of the 24 cases evaluated. However, for the latency metric, there was no significant reduction compared to batch sizes of 50 (pointed out in the literature as a good choice). In summary, the dynamic strategy offers reduced energy consumption without losses in execution time. |
| id |
SCAR_2d021f39cd5324ed3882768e002cc055 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/21098 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
|
| spelling |
Luna, ReginaldoSenger, Hermeshttp://lattes.cnpq.br/3691742159298316http://lattes.cnpq.br/2982663262422530https://orcid.org/0000-0002-7266-6843https://orcid.org/0000-0003-1273-98092024-12-04T11:59:55Z2024-12-04T11:59:55Z2024-06-28LUNA, Reginaldo. Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda. 2024. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21098.https://repositorio.ufscar.br/handle/20.500.14289/21098Edge computing (EC) has emerged as an architecture that can help reduce the energy demand and greenhouse gas emissions of digital technologies. Edge computing offers low latency, mobility, and location awareness for delay-sensitive devices, connecting cloud computing services to end-users. Machine learning (ML) methods have increasingly been used on edge devices for data classification and information processing. Classifier ensembles have demonstrated good predictive performance in data stream classification problems. The strategy called mini-batching was previously proposed in the literature to improve cache data reuse when executing classifier ensembles on multi-core architectures for online data stream classification. The strategy involves temporarily grouping data from a data stream and processing them together. As a result, mini-batching can speed up applications and reduce energy consumption. However, the originally proposed mini-batching offers opportunities for further improvements. In this work, we investigate the fusion of the training and classification stages of the data, bringing more gains in cache reuse and predictive performance improvements. We also evaluate the mini-batching strategy compared to two strategies supported by the hardware of common multi-core processors used in edge devices: clock frequency reduction and processor core shutdown. We evaluate the strategies by comparing their performance and energy efficiency for data stream classification using six state-of-the-art classifier ensemble algorithms and four benchmark datasets. The results show that mini-batching strategies can significantly reduce energy consumption in 95% of the experiments, improving energy efficiency by an average of 96% and by 169% in the best case over hardware strategies. Similarly, the newly proposed mini-batching strategy improved energy efficiency by an average of 136% and 456% in the best case. Finally, we proposed an adaptive and multi-objective optimization strategy to dynamically choose the mini-batching size based on CPU occupancy and data arrival rates. The batch size choice uses the Pareto principle to optimize both response time and energy consumption. Results show an improvement in energy consumption in 17 of the 24 cases evaluated. However, for the latency metric, there was no significant reduction compared to batch sizes of 50 (pointed out in the literature as a good choice). In summary, the dynamic strategy offers reduced energy consumption without losses in execution time.Computação de borda (CB) surgiu como uma arquitetura que pode ajudar a reduzir a demanda de energia e as emissões de gases de efeito estufa das tecnologias digitais. A computação de borda oferece baixa latência, mobilidade e ciência da localização para dispositivos sensíveis a atrasos, conectando os serviços de computação em nuvem aos usuários finais. Métodos de aprendizado de máquina (AM) têm sido cada vez mais utilizados em dispositivos na borda para classificação de dados e processamento de informações. Os comitês de classificadores tem demonstrado bom desempenho preditivo em problemas de classificação de fluxo de dados. A estratégia mini-batching melhora o reuso de dados dos caches na execução de comitês de classificadores em arquiteturas multi-core para a classificação de fluxos de dados online. A estratégia consiste em agrupar temporariamente dados de um fluxo e processá-los em conjunto. Como efeito, o mini-batching pode acelerar as aplicações e reduzir o consumo de energia. Neste trabalho, investigamos a fusão das etapas de treinamento e de classificação dos dados, trazendo ainda mais ganhos de reuso dos caches e melhorias no desempenho preditivo. Também comparamos mini-batching a duas estratégias que são suportadas pelo hardware de processadores multi-core utilizados em dispositivos de borda, que são a redução da frequência do clock e o desligamento de núcleos de processamento. Avaliamos as estratégias comparando seu desempenho e eficiência energética para a classificação de fluxos de dados usando seis algoritmos de comitês de classificação de última geração e quatro datasets de referência. Os resultados mostram que estratégias de mini-batching podem reduzir significativamente o consumo de energia em 95% dos experimentos, melhorando a eficiência energética em 96% em média e em 169% no melhor caso sobre as estratégias de hardware. Da mesma forma, a nova estratégia de mini-batching proposta melhorou a eficiência energética em 136% em média e 456% no melhor caso. Por fim, propusemos uma estratégia de otimização adaptativa e multi-objetivo para escolher dinamicamente o tamanho do mini-batching em função da ocupação da CPU das taxas de chagada de dados. A escolha do tamanho do batch usa o princípio de Pareto para otimizar tanto o tempo de resposta quanto o consumo de energia. Resultados mostram melhoria do consumo energético em 17 dos 24 casos avaliados. Já para a métrica de atraso, não houve uma redução significativa quando comparado a batches de tamanho 50 (apontado na literatura como uma boa escolha). Em resumo, a estratégia dinâmica oferece redução do consumo energético, sem perdas no tempo de execução.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessEficiência energéticaComitê de classificadoresFluxo de dadosComputação de bordaEnergy efficiencyEnsemblesEdge computingCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOMelhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de bordaImproving the energy efficiency of data stream classifier arrays for edge computinginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARTEXTDissertacao_Reginaldo.pdf.txtDissertacao_Reginaldo.pdf.txtExtracted texttext/plain103606https://repositorio.ufscar.br/bitstreams/6a9f6adb-8037-4916-bff3-2b039ef2b305/download3bf5f131b142c95c493d3cfe2d5e7fd6MD53falseAnonymousREADTHUMBNAILDissertacao_Reginaldo.pdf.jpgDissertacao_Reginaldo.pdf.jpgGenerated Thumbnailimage/jpeg4215https://repositorio.ufscar.br/bitstreams/c7b57746-7d0e-4846-b487-b681d8108d2c/download3acbd212b9c786f644b3e73d1da71fb2MD54falseAnonymousREADORIGINALDissertacao_Reginaldo.pdfDissertacao_Reginaldo.pdfapplication/pdf2197115https://repositorio.ufscar.br/bitstreams/b9cd096c-9819-4383-b04c-dcaa14c20b3c/download24c4bba1f41928817f26cd1248e35a52MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8913https://repositorio.ufscar.br/bitstreams/08836cf4-0f00-4663-9ae6-8037ac68df30/download3185b4de2190c2d366d1d324db01f8b8MD52falseAnonymousREAD20.500.14289/210982025-02-06 04:20:26.547http://creativecommons.org/licenses/by/3.0/br/Attribution 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/21098https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-06T07:20:26Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
| dc.title.por.fl_str_mv |
Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda |
| dc.title.alternative.eng.fl_str_mv |
Improving the energy efficiency of data stream classifier arrays for edge computing |
| title |
Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda |
| spellingShingle |
Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda Luna, Reginaldo Eficiência energética Comitê de classificadores Fluxo de dados Computação de borda Energy efficiency Ensembles Edge computing CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| title_short |
Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda |
| title_full |
Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda |
| title_fullStr |
Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda |
| title_full_unstemmed |
Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda |
| title_sort |
Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda |
| author |
Luna, Reginaldo |
| author_facet |
Luna, Reginaldo |
| author_role |
author |
| dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/2982663262422530 |
| dc.contributor.authororcid.por.fl_str_mv |
https://orcid.org/0000-0002-7266-6843 |
| dc.contributor.advisor1orcid.por.fl_str_mv |
https://orcid.org/0000-0003-1273-9809 |
| dc.contributor.author.fl_str_mv |
Luna, Reginaldo |
| dc.contributor.advisor1.fl_str_mv |
Senger, Hermes |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/3691742159298316 |
| contributor_str_mv |
Senger, Hermes |
| dc.subject.por.fl_str_mv |
Eficiência energética Comitê de classificadores Fluxo de dados Computação de borda |
| topic |
Eficiência energética Comitê de classificadores Fluxo de dados Computação de borda Energy efficiency Ensembles Edge computing CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| dc.subject.eng.fl_str_mv |
Energy efficiency Ensembles Edge computing |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| description |
Edge computing (EC) has emerged as an architecture that can help reduce the energy demand and greenhouse gas emissions of digital technologies. Edge computing offers low latency, mobility, and location awareness for delay-sensitive devices, connecting cloud computing services to end-users. Machine learning (ML) methods have increasingly been used on edge devices for data classification and information processing. Classifier ensembles have demonstrated good predictive performance in data stream classification problems. The strategy called mini-batching was previously proposed in the literature to improve cache data reuse when executing classifier ensembles on multi-core architectures for online data stream classification. The strategy involves temporarily grouping data from a data stream and processing them together. As a result, mini-batching can speed up applications and reduce energy consumption. However, the originally proposed mini-batching offers opportunities for further improvements. In this work, we investigate the fusion of the training and classification stages of the data, bringing more gains in cache reuse and predictive performance improvements. We also evaluate the mini-batching strategy compared to two strategies supported by the hardware of common multi-core processors used in edge devices: clock frequency reduction and processor core shutdown. We evaluate the strategies by comparing their performance and energy efficiency for data stream classification using six state-of-the-art classifier ensemble algorithms and four benchmark datasets. The results show that mini-batching strategies can significantly reduce energy consumption in 95% of the experiments, improving energy efficiency by an average of 96% and by 169% in the best case over hardware strategies. Similarly, the newly proposed mini-batching strategy improved energy efficiency by an average of 136% and 456% in the best case. Finally, we proposed an adaptive and multi-objective optimization strategy to dynamically choose the mini-batching size based on CPU occupancy and data arrival rates. The batch size choice uses the Pareto principle to optimize both response time and energy consumption. Results show an improvement in energy consumption in 17 of the 24 cases evaluated. However, for the latency metric, there was no significant reduction compared to batch sizes of 50 (pointed out in the literature as a good choice). In summary, the dynamic strategy offers reduced energy consumption without losses in execution time. |
| publishDate |
2024 |
| dc.date.accessioned.fl_str_mv |
2024-12-04T11:59:55Z |
| dc.date.available.fl_str_mv |
2024-12-04T11:59:55Z |
| dc.date.issued.fl_str_mv |
2024-06-28 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
LUNA, Reginaldo. Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda. 2024. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21098. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/20.500.14289/21098 |
| identifier_str_mv |
LUNA, Reginaldo. Melhoria da eficiência energética de comitês de classificadores de fluxo de dados para computação de borda. 2024. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/21098. |
| url |
https://repositorio.ufscar.br/handle/20.500.14289/21098 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/6a9f6adb-8037-4916-bff3-2b039ef2b305/download https://repositorio.ufscar.br/bitstreams/c7b57746-7d0e-4846-b487-b681d8108d2c/download https://repositorio.ufscar.br/bitstreams/b9cd096c-9819-4383-b04c-dcaa14c20b3c/download https://repositorio.ufscar.br/bitstreams/08836cf4-0f00-4663-9ae6-8037ac68df30/download |
| bitstream.checksum.fl_str_mv |
3bf5f131b142c95c493d3cfe2d5e7fd6 3acbd212b9c786f644b3e73d1da71fb2 24c4bba1f41928817f26cd1248e35a52 3185b4de2190c2d366d1d324db01f8b8 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1851688749075791872 |