Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Monteiro, Marcio
Orientador(a): Meinhardt, Cristina
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: https://repositorio.ufsc.br/handle/123456789/268894
Resumo: Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2025.
id UFSC_2d7184a58eb302584c1a2c577401b6d8
oai_identifier_str oai:repositorio.ufsc.br:123456789/268894
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str
spelling Universidade Federal de Santa CatarinaMonteiro, MarcioMeinhardt, CristinaSoares, Leonardo Bandeira2025-09-16T23:32:42Z2025-09-16T23:32:42Z2025393719https://repositorio.ufsc.br/handle/123456789/268894Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2025.O número de aplicações para o processamento multimídia embarcadas em dispositivos móveis vem crescendo na última década. Em geral, o processamento multimídia requer um elevado número de operações aritméticas, combinado com limitações energéticas dos dispositivos móveis, demanda a redução da potência dos aceleradores. A computação aproximada é um conjunto de técnicas que explora o balanço entre a redução de potência e o aumento dos erros. Isto torna a computação aproximada adequada para aplicações tolerantes a erros, categoria que inclui as aplicações multimídia. Os filtros gaussianos são muito usados em aplicações de processamento de imagens para a redução de artefatos indesejados, por exemplo, ruído. O projeto de hardware dedicado de filtros gaussianos permite explorar diferentes tamanhos de kernel impactando a relação entre potência e qualidade dos resultados. Nesta tese são exploradas combinações de estratégias de computação aproximada em diferentes granularidades para a redução de potência de arquiteturas baseadas no conceito de Multiplierless Constant Multiplication (MCM). MCM permite substituir multiplicações por somas e deslocamentos. Essas técnicas são avaliadas em arquiteturas de filtro gaussiano, derivando uma proposta de arquitetura com tamanho de kernel configurado em tempo de execução, combinada com a configuração em tempo de projeto de somadores aproximados e a reorganização das sequências de operações de deslocamento. As técnicas exploradas envolvem a refatoração lógica das equações dos filtros gaussianos, usando as abordagens MCM e Common Sub-expression Exploration (CSE), a reorganização das arquiteturas através da antecipação dos deslocamentos para direita para reduzir o número de somadores de 1-bit, e a definição de uma metodologia de avaliação para a configuração estratégica de somadores aproximados em tempo de projeto para reduzir a potência, observando uma divisão das árvores de somadores dos filtros em níveis para avaliar os impactos na qualidade. Um conjunto de arquiteturas em diferentes pontos de otimização da curva entre a qualidade e o número de bits aproximados foi sintetizado e simulado para obter a potência. Estas arquiteturas também são avaliadas em duas aplicações reais, demonstrando a usabilidade e aplicação das técnicas desenvolvidas nesta tese. A arquitetura com kernel configurável utiliza os tamanhos 3x3 e 5x5. Alguns resultados obtidos com o kernel 7x7 são usados para ampliar a discussão da escolha do tamanho de kernel. Os resultados da arquitetura configurável mostram que seu uso é apropriado para aplicações que necessitam de flexibilidade. A aplicação da antecipação dos deslocamentos remove 77 bits da árvore de somadores, resultando em uma redução de 30% na potência com qualidade similar à da arquitetura sem a antecipação. Ao comparar os casos aproximados da arquitetura configurável com antecipação dos deslocamentos com o caso exato sem antecipação, a potência reduziu em até 76% e 60% para os kernels 5x5 e 3x3, respectivamente. Os resultados na aplicação de detecção de bordas corroboram que o kernel 3x3 é mais adequado para aplicações com restrições de potência severas, já o kernel 5x5 é melhor para aplicações que demandam compromisso entre potência e qualidade. Para a aplicação de localização automática de placas, o caso aproximado com melhor compromisso entre potência e qualidade para o kernel 5x5 obteve a mesma precisão do caso exato, 59%, com redução de 60% na potência. Já para o kernel 3x3, o caso com melhor compromisso entre potência e qualidade obteve 57% de precisão, similar à precisão da arquitetura exata, e reduziu 34% da potência. Os resultados mostram o potencial das propostas apresentadas nesta tese para reduzir a potência com baixo impacto na qualidade dos filtros para imagens baseadas em MCM.Abstract: The number of multimedia applications embedded into mobile devices has increased in the last decade. Multimedia processing demands a large number of arithmetic operations that, combined with the device?s power restrictions, require the design of power-efficient accelerators. Approximate Computing (AxC) is an approach used to develop power-efficient accelerators based on the balance between the precision of the results and the power reduction. It makes AxC suitable for error-tolerant applications, which include multimedia processing applications. The Gaussian filter is one of the most used preprocessing functions to enhance images by reducing undesirable artifacts like noise. The Gaussian filter design enables the exploration of different kernel sizes to investigate various power-quality trade-offs. In this thesis, different AxC techniques are explored at different granularities to reduce the power of architectures based on the Multiplierless Constant Multiplication (MCM) approach. MCM substitutes multipliers with sums and shifts. The techniques are assessed using Gaussian filter architectures, contributing to the development of a run-time kernel size configurable Gaussian filter architecture that combines design-time approximate adders and the anticipation of right shifts to further reduce the number of operations. The techniques used in this thesis combine MCM and Common Subexpression Exploration (CSE) to logic optimize the kernel equations, use the anticipation of right shifts to reduce the adder?s bit-width, and define a methodology to evaluate the impact on the quality of design-time approximate adders to reduce the power based on an adder tree level-oriented division. A set of architectures from the power-quality Pareto front was synthesized and simulated to obtain the area and power using a 45 nm standard cell library. Those architectures are also evaluated in two practical applications, showing that the techniques proposed in this thesis are suitable for real-world applications. The configurable architecture proposed uses the 3x3 and 5x5 kernel sizes. Preliminary results are extended to 7x7 kernel to expand the discussions regarding the kernel size configuration. The results show that a configurable architecture is more useful for applications that demand flexibility and a good trade-off between power and quality. As a consequence of anticipating shifts, 77 1-bit adders of the configurable architecture were removed. This means a 30% reduction in total power while maintaining a similar quality of results to the architecture without anticipation. Comparing the approximate cases from the configurable architecture with anticipation and the precise case of the configurable architecture without anticipation, the total power was reduced up to 76% for 5x5 kernel and 60% for 3x3 kernel. The border detection application results contribute to the conclusion that the 3x3 kernel is more suitable for severe power-constrained applications, while the 5x5 kernel is more indicated for applications demanding a better power and quality trade-off. For the car plate localization application, the approximate case with the best power-quality trade-off for 5x5 kernel reduced 60% power while achieving 59% precision, which is the same precision as the precise case. For the 3x3 kernel, the case with the best power-quality trade-off reduced 34% power while achieving 57% precision, which is similar to the precise case. The results presented in this thesis show the potential of the proposed approaches to reduce power while maintaining the quality of results in filters for images based on MCM.166 p.| il., gráfs.engComputaçãoProcessos gaussianosSistemas multimídiaComputação aproximadaApproximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplicationinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccessORIGINALPGCC1316-T.pdfPGCC1316-T.pdfapplication/pdf7894745https://repositorio.ufsc.br/bitstream/123456789/268894/-1/PGCC1316-T.pdfbf6055e8afdbba06855b59ea7f42625eMD5-1123456789/2688942025-09-16 20:32:43.824oai:repositorio.ufsc.br:123456789/268894Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestsandra.sobrera@ufsc.bropendoar:23732025-09-16T23:32:43Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication
title Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication
spellingShingle Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication
Monteiro, Marcio
Computação
Processos gaussianos
Sistemas multimídia
Computação aproximada
title_short Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication
title_full Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication
title_fullStr Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication
title_full_unstemmed Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication
title_sort Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication
author Monteiro, Marcio
author_facet Monteiro, Marcio
author_role author
dc.contributor.none.fl_str_mv Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Monteiro, Marcio
dc.contributor.advisor1.fl_str_mv Meinhardt, Cristina
dc.contributor.advisor-co1.fl_str_mv Soares, Leonardo Bandeira
contributor_str_mv Meinhardt, Cristina
Soares, Leonardo Bandeira
dc.subject.classification.none.fl_str_mv Computação
Processos gaussianos
Sistemas multimídia
Computação aproximada
topic Computação
Processos gaussianos
Sistemas multimídia
Computação aproximada
description Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2025.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-09-16T23:32:42Z
dc.date.available.fl_str_mv 2025-09-16T23:32:42Z
dc.date.issued.fl_str_mv 2025
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/268894
dc.identifier.other.none.fl_str_mv 393719
identifier_str_mv 393719
url https://repositorio.ufsc.br/handle/123456789/268894
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 166 p.| il., gráfs.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
bitstream.url.fl_str_mv https://repositorio.ufsc.br/bitstream/123456789/268894/-1/PGCC1316-T.pdf
bitstream.checksum.fl_str_mv bf6055e8afdbba06855b59ea7f42625e
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv sandra.sobrera@ufsc.br
_version_ 1851758945630158848