Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Link de acesso: | https://repositorio.ufsc.br/handle/123456789/268894 |
Resumo: | Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2025. |
| id |
UFSC_2d7184a58eb302584c1a2c577401b6d8 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufsc.br:123456789/268894 |
| network_acronym_str |
UFSC |
| network_name_str |
Repositório Institucional da UFSC |
| repository_id_str |
|
| spelling |
Universidade Federal de Santa CatarinaMonteiro, MarcioMeinhardt, CristinaSoares, Leonardo Bandeira2025-09-16T23:32:42Z2025-09-16T23:32:42Z2025393719https://repositorio.ufsc.br/handle/123456789/268894Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2025.O número de aplicações para o processamento multimídia embarcadas em dispositivos móveis vem crescendo na última década. Em geral, o processamento multimídia requer um elevado número de operações aritméticas, combinado com limitações energéticas dos dispositivos móveis, demanda a redução da potência dos aceleradores. A computação aproximada é um conjunto de técnicas que explora o balanço entre a redução de potência e o aumento dos erros. Isto torna a computação aproximada adequada para aplicações tolerantes a erros, categoria que inclui as aplicações multimídia. Os filtros gaussianos são muito usados em aplicações de processamento de imagens para a redução de artefatos indesejados, por exemplo, ruído. O projeto de hardware dedicado de filtros gaussianos permite explorar diferentes tamanhos de kernel impactando a relação entre potência e qualidade dos resultados. Nesta tese são exploradas combinações de estratégias de computação aproximada em diferentes granularidades para a redução de potência de arquiteturas baseadas no conceito de Multiplierless Constant Multiplication (MCM). MCM permite substituir multiplicações por somas e deslocamentos. Essas técnicas são avaliadas em arquiteturas de filtro gaussiano, derivando uma proposta de arquitetura com tamanho de kernel configurado em tempo de execução, combinada com a configuração em tempo de projeto de somadores aproximados e a reorganização das sequências de operações de deslocamento. As técnicas exploradas envolvem a refatoração lógica das equações dos filtros gaussianos, usando as abordagens MCM e Common Sub-expression Exploration (CSE), a reorganização das arquiteturas através da antecipação dos deslocamentos para direita para reduzir o número de somadores de 1-bit, e a definição de uma metodologia de avaliação para a configuração estratégica de somadores aproximados em tempo de projeto para reduzir a potência, observando uma divisão das árvores de somadores dos filtros em níveis para avaliar os impactos na qualidade. Um conjunto de arquiteturas em diferentes pontos de otimização da curva entre a qualidade e o número de bits aproximados foi sintetizado e simulado para obter a potência. Estas arquiteturas também são avaliadas em duas aplicações reais, demonstrando a usabilidade e aplicação das técnicas desenvolvidas nesta tese. A arquitetura com kernel configurável utiliza os tamanhos 3x3 e 5x5. Alguns resultados obtidos com o kernel 7x7 são usados para ampliar a discussão da escolha do tamanho de kernel. Os resultados da arquitetura configurável mostram que seu uso é apropriado para aplicações que necessitam de flexibilidade. A aplicação da antecipação dos deslocamentos remove 77 bits da árvore de somadores, resultando em uma redução de 30% na potência com qualidade similar à da arquitetura sem a antecipação. Ao comparar os casos aproximados da arquitetura configurável com antecipação dos deslocamentos com o caso exato sem antecipação, a potência reduziu em até 76% e 60% para os kernels 5x5 e 3x3, respectivamente. Os resultados na aplicação de detecção de bordas corroboram que o kernel 3x3 é mais adequado para aplicações com restrições de potência severas, já o kernel 5x5 é melhor para aplicações que demandam compromisso entre potência e qualidade. Para a aplicação de localização automática de placas, o caso aproximado com melhor compromisso entre potência e qualidade para o kernel 5x5 obteve a mesma precisão do caso exato, 59%, com redução de 60% na potência. Já para o kernel 3x3, o caso com melhor compromisso entre potência e qualidade obteve 57% de precisão, similar à precisão da arquitetura exata, e reduziu 34% da potência. Os resultados mostram o potencial das propostas apresentadas nesta tese para reduzir a potência com baixo impacto na qualidade dos filtros para imagens baseadas em MCM.Abstract: The number of multimedia applications embedded into mobile devices has increased in the last decade. Multimedia processing demands a large number of arithmetic operations that, combined with the device?s power restrictions, require the design of power-efficient accelerators. Approximate Computing (AxC) is an approach used to develop power-efficient accelerators based on the balance between the precision of the results and the power reduction. It makes AxC suitable for error-tolerant applications, which include multimedia processing applications. The Gaussian filter is one of the most used preprocessing functions to enhance images by reducing undesirable artifacts like noise. The Gaussian filter design enables the exploration of different kernel sizes to investigate various power-quality trade-offs. In this thesis, different AxC techniques are explored at different granularities to reduce the power of architectures based on the Multiplierless Constant Multiplication (MCM) approach. MCM substitutes multipliers with sums and shifts. The techniques are assessed using Gaussian filter architectures, contributing to the development of a run-time kernel size configurable Gaussian filter architecture that combines design-time approximate adders and the anticipation of right shifts to further reduce the number of operations. The techniques used in this thesis combine MCM and Common Subexpression Exploration (CSE) to logic optimize the kernel equations, use the anticipation of right shifts to reduce the adder?s bit-width, and define a methodology to evaluate the impact on the quality of design-time approximate adders to reduce the power based on an adder tree level-oriented division. A set of architectures from the power-quality Pareto front was synthesized and simulated to obtain the area and power using a 45 nm standard cell library. Those architectures are also evaluated in two practical applications, showing that the techniques proposed in this thesis are suitable for real-world applications. The configurable architecture proposed uses the 3x3 and 5x5 kernel sizes. Preliminary results are extended to 7x7 kernel to expand the discussions regarding the kernel size configuration. The results show that a configurable architecture is more useful for applications that demand flexibility and a good trade-off between power and quality. As a consequence of anticipating shifts, 77 1-bit adders of the configurable architecture were removed. This means a 30% reduction in total power while maintaining a similar quality of results to the architecture without anticipation. Comparing the approximate cases from the configurable architecture with anticipation and the precise case of the configurable architecture without anticipation, the total power was reduced up to 76% for 5x5 kernel and 60% for 3x3 kernel. The border detection application results contribute to the conclusion that the 3x3 kernel is more suitable for severe power-constrained applications, while the 5x5 kernel is more indicated for applications demanding a better power and quality trade-off. For the car plate localization application, the approximate case with the best power-quality trade-off for 5x5 kernel reduced 60% power while achieving 59% precision, which is the same precision as the precise case. For the 3x3 kernel, the case with the best power-quality trade-off reduced 34% power while achieving 57% precision, which is similar to the precise case. The results presented in this thesis show the potential of the proposed approaches to reduce power while maintaining the quality of results in filters for images based on MCM.166 p.| il., gráfs.engComputaçãoProcessos gaussianosSistemas multimídiaComputação aproximadaApproximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplicationinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccessORIGINALPGCC1316-T.pdfPGCC1316-T.pdfapplication/pdf7894745https://repositorio.ufsc.br/bitstream/123456789/268894/-1/PGCC1316-T.pdfbf6055e8afdbba06855b59ea7f42625eMD5-1123456789/2688942025-09-16 20:32:43.824oai:repositorio.ufsc.br:123456789/268894Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestsandra.sobrera@ufsc.bropendoar:23732025-09-16T23:32:43Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
| dc.title.none.fl_str_mv |
Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication |
| title |
Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication |
| spellingShingle |
Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication Monteiro, Marcio Computação Processos gaussianos Sistemas multimídia Computação aproximada |
| title_short |
Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication |
| title_full |
Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication |
| title_fullStr |
Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication |
| title_full_unstemmed |
Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication |
| title_sort |
Approximate computing strategies for optimizing power efficient design of gaussian filter architectures based on multiplierless constant multiplication |
| author |
Monteiro, Marcio |
| author_facet |
Monteiro, Marcio |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Universidade Federal de Santa Catarina |
| dc.contributor.author.fl_str_mv |
Monteiro, Marcio |
| dc.contributor.advisor1.fl_str_mv |
Meinhardt, Cristina |
| dc.contributor.advisor-co1.fl_str_mv |
Soares, Leonardo Bandeira |
| contributor_str_mv |
Meinhardt, Cristina Soares, Leonardo Bandeira |
| dc.subject.classification.none.fl_str_mv |
Computação Processos gaussianos Sistemas multimídia Computação aproximada |
| topic |
Computação Processos gaussianos Sistemas multimídia Computação aproximada |
| description |
Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2025. |
| publishDate |
2025 |
| dc.date.accessioned.fl_str_mv |
2025-09-16T23:32:42Z |
| dc.date.available.fl_str_mv |
2025-09-16T23:32:42Z |
| dc.date.issued.fl_str_mv |
2025 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufsc.br/handle/123456789/268894 |
| dc.identifier.other.none.fl_str_mv |
393719 |
| identifier_str_mv |
393719 |
| url |
https://repositorio.ufsc.br/handle/123456789/268894 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
166 p.| il., gráfs. |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
| instname_str |
Universidade Federal de Santa Catarina (UFSC) |
| instacron_str |
UFSC |
| institution |
UFSC |
| reponame_str |
Repositório Institucional da UFSC |
| collection |
Repositório Institucional da UFSC |
| bitstream.url.fl_str_mv |
https://repositorio.ufsc.br/bitstream/123456789/268894/-1/PGCC1316-T.pdf |
| bitstream.checksum.fl_str_mv |
bf6055e8afdbba06855b59ea7f42625e |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
| repository.mail.fl_str_mv |
sandra.sobrera@ufsc.br |
| _version_ |
1851758945630158848 |