Software-only computation reuse techniques for energy efficient CNNs

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Moura, Rafael Fão de
Orientador(a): Carro, Luigi
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/198517
Resumo: Nos últimos anos, pesquisas em melhorias nas áreas de algoritmos e arquiteturas computacionais foram postas lado-a-lado de modo a permitir o uso em larga-escala de CNNs. Desde então, a maior parte destas melhorias têm sido baseadas na aceleração de convoluções através da execução paralela de operações MAC, utilizando a replicação de unidades de ponto-flutuante. No entanto, essas soluções ficam muito aquém do que é permitido em termos de consumo energético quando se trata de sistemas embarcados executando NNs. Considerando características específicas de imagens, tais como repetições de padrões de entrada, neste trabalho, nós apresentamos uma mudança algorítmica no modo como CNNs realizam inferências, empregando uma técnica de reuso de computação no lugar da implementação original. Com base em análises estatísticas, nós abordamos o reuso de computação em três granularidades: ao nível de convolução e ao nível de conjunto de convoluções, realizando consultas em tabelas ao invés das convoluções originais, e ao nível de frame através da substituição da computação original de um frame inteiro por um algoritmo de predição de movimento. Nossos resultados mostram que é possível obter níveis de economia de energia em até 27,5 , e reduzir o tempo de inferência por um fator de 116 em relação à versão original, com uma perda de precisão de 13%.
id UFRGS-2_009d996e6a1d695076e1d82f1e75fd3c
oai_identifier_str oai:www.lume.ufrgs.br:10183/198517
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Moura, Rafael Fão deCarro, Luigi2019-08-29T02:34:41Z2019http://hdl.handle.net/10183/198517001100053Nos últimos anos, pesquisas em melhorias nas áreas de algoritmos e arquiteturas computacionais foram postas lado-a-lado de modo a permitir o uso em larga-escala de CNNs. Desde então, a maior parte destas melhorias têm sido baseadas na aceleração de convoluções através da execução paralela de operações MAC, utilizando a replicação de unidades de ponto-flutuante. No entanto, essas soluções ficam muito aquém do que é permitido em termos de consumo energético quando se trata de sistemas embarcados executando NNs. Considerando características específicas de imagens, tais como repetições de padrões de entrada, neste trabalho, nós apresentamos uma mudança algorítmica no modo como CNNs realizam inferências, empregando uma técnica de reuso de computação no lugar da implementação original. Com base em análises estatísticas, nós abordamos o reuso de computação em três granularidades: ao nível de convolução e ao nível de conjunto de convoluções, realizando consultas em tabelas ao invés das convoluções originais, e ao nível de frame através da substituição da computação original de um frame inteiro por um algoritmo de predição de movimento. Nossos resultados mostram que é possível obter níveis de economia de energia em até 27,5 , e reduzir o tempo de inferência por um fator de 116 em relação à versão original, com uma perda de precisão de 13%.In the past years, several efforts in algorithm and architectural research were put together to enable large-scale use of CNNs as we know today. Thus far, most of these achievements have been based on improving convolutions by chasing the parallel execution of MAC operations through the replication of floating-point units. However, these solutions fall far short of what is allowed from the energy budget when it comes to embedded systems running these NN models. Given specific image characteristics, such as recurrent input patterns, we propose an algorithmic changing for performing CNN inferences by employing a computation reuse technique instead of the original implementation. Based on statistical analysis, we address computation reuse at three granularity levels: convolution kernel-level and grid-level through employing lookup tables in place of the original convolutions, and frame-level by replacing entire frame computations with a movement prediction algorithm. Experimental results show that it is possible to achieve energy savings up to 27.5 , while reducing the inference time to 116 of the baseline, with an accuracy loss of 13%.application/pdfengRedes neuraisEngenharia : SoftwareConvolutional neural networkscomputation reuseSoftware-only computation reuse techniques for energy efficient CNNsTécnicas de reuso de computação em software para CNNs energeticamente eficientes info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2019mestradoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001100053.pdf.txt001100053.pdf.txtExtracted Texttext/plain133746http://www.lume.ufrgs.br/bitstream/10183/198517/2/001100053.pdf.txt3348903eb619305e0c3ecf1e1cea80efMD52ORIGINAL001100053.pdfTexto completo (inglês)application/pdf1353290http://www.lume.ufrgs.br/bitstream/10183/198517/1/001100053.pdf90e9669dc7e70299bfe74b0c9fbd0d20MD5110183/1985172019-08-30 02:34:44.334246oai:www.lume.ufrgs.br:10183/198517Repositório InstitucionalPUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.bropendoar:2019-08-30T05:34:44Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Software-only computation reuse techniques for energy efficient CNNs
dc.title.alternative.en.fl_str_mv Técnicas de reuso de computação em software para CNNs energeticamente eficientes
title Software-only computation reuse techniques for energy efficient CNNs
spellingShingle Software-only computation reuse techniques for energy efficient CNNs
Moura, Rafael Fão de
Redes neurais
Engenharia : Software
Convolutional neural networks
computation reuse
title_short Software-only computation reuse techniques for energy efficient CNNs
title_full Software-only computation reuse techniques for energy efficient CNNs
title_fullStr Software-only computation reuse techniques for energy efficient CNNs
title_full_unstemmed Software-only computation reuse techniques for energy efficient CNNs
title_sort Software-only computation reuse techniques for energy efficient CNNs
author Moura, Rafael Fão de
author_facet Moura, Rafael Fão de
author_role author
dc.contributor.author.fl_str_mv Moura, Rafael Fão de
dc.contributor.advisor1.fl_str_mv Carro, Luigi
contributor_str_mv Carro, Luigi
dc.subject.por.fl_str_mv Redes neurais
Engenharia : Software
topic Redes neurais
Engenharia : Software
Convolutional neural networks
computation reuse
dc.subject.eng.fl_str_mv Convolutional neural networks
computation reuse
description Nos últimos anos, pesquisas em melhorias nas áreas de algoritmos e arquiteturas computacionais foram postas lado-a-lado de modo a permitir o uso em larga-escala de CNNs. Desde então, a maior parte destas melhorias têm sido baseadas na aceleração de convoluções através da execução paralela de operações MAC, utilizando a replicação de unidades de ponto-flutuante. No entanto, essas soluções ficam muito aquém do que é permitido em termos de consumo energético quando se trata de sistemas embarcados executando NNs. Considerando características específicas de imagens, tais como repetições de padrões de entrada, neste trabalho, nós apresentamos uma mudança algorítmica no modo como CNNs realizam inferências, empregando uma técnica de reuso de computação no lugar da implementação original. Com base em análises estatísticas, nós abordamos o reuso de computação em três granularidades: ao nível de convolução e ao nível de conjunto de convoluções, realizando consultas em tabelas ao invés das convoluções originais, e ao nível de frame através da substituição da computação original de um frame inteiro por um algoritmo de predição de movimento. Nossos resultados mostram que é possível obter níveis de economia de energia em até 27,5 , e reduzir o tempo de inferência por um fator de 116 em relação à versão original, com uma perda de precisão de 13%.
publishDate 2019
dc.date.accessioned.fl_str_mv 2019-08-29T02:34:41Z
dc.date.issued.fl_str_mv 2019
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/198517
dc.identifier.nrb.pt_BR.fl_str_mv 001100053
url http://hdl.handle.net/10183/198517
identifier_str_mv 001100053
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/198517/2/001100053.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/198517/1/001100053.pdf
bitstream.checksum.fl_str_mv 3348903eb619305e0c3ecf1e1cea80ef
90e9669dc7e70299bfe74b0c9fbd0d20
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br
_version_ 1864542646054158336