Software-only computation reuse techniques for energy efficient CNNs
| Ano de defesa: | 2019 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Link de acesso: | http://hdl.handle.net/10183/198517 |
Resumo: | Nos últimos anos, pesquisas em melhorias nas áreas de algoritmos e arquiteturas computacionais foram postas lado-a-lado de modo a permitir o uso em larga-escala de CNNs. Desde então, a maior parte destas melhorias têm sido baseadas na aceleração de convoluções através da execução paralela de operações MAC, utilizando a replicação de unidades de ponto-flutuante. No entanto, essas soluções ficam muito aquém do que é permitido em termos de consumo energético quando se trata de sistemas embarcados executando NNs. Considerando características específicas de imagens, tais como repetições de padrões de entrada, neste trabalho, nós apresentamos uma mudança algorítmica no modo como CNNs realizam inferências, empregando uma técnica de reuso de computação no lugar da implementação original. Com base em análises estatísticas, nós abordamos o reuso de computação em três granularidades: ao nível de convolução e ao nível de conjunto de convoluções, realizando consultas em tabelas ao invés das convoluções originais, e ao nível de frame através da substituição da computação original de um frame inteiro por um algoritmo de predição de movimento. Nossos resultados mostram que é possível obter níveis de economia de energia em até 27,5 , e reduzir o tempo de inferência por um fator de 116 em relação à versão original, com uma perda de precisão de 13%. |
| id |
UFRGS-2_009d996e6a1d695076e1d82f1e75fd3c |
|---|---|
| oai_identifier_str |
oai:www.lume.ufrgs.br:10183/198517 |
| network_acronym_str |
UFRGS-2 |
| network_name_str |
Repositório Institucional da UFRGS |
| repository_id_str |
|
| spelling |
Moura, Rafael Fão deCarro, Luigi2019-08-29T02:34:41Z2019http://hdl.handle.net/10183/198517001100053Nos últimos anos, pesquisas em melhorias nas áreas de algoritmos e arquiteturas computacionais foram postas lado-a-lado de modo a permitir o uso em larga-escala de CNNs. Desde então, a maior parte destas melhorias têm sido baseadas na aceleração de convoluções através da execução paralela de operações MAC, utilizando a replicação de unidades de ponto-flutuante. No entanto, essas soluções ficam muito aquém do que é permitido em termos de consumo energético quando se trata de sistemas embarcados executando NNs. Considerando características específicas de imagens, tais como repetições de padrões de entrada, neste trabalho, nós apresentamos uma mudança algorítmica no modo como CNNs realizam inferências, empregando uma técnica de reuso de computação no lugar da implementação original. Com base em análises estatísticas, nós abordamos o reuso de computação em três granularidades: ao nível de convolução e ao nível de conjunto de convoluções, realizando consultas em tabelas ao invés das convoluções originais, e ao nível de frame através da substituição da computação original de um frame inteiro por um algoritmo de predição de movimento. Nossos resultados mostram que é possível obter níveis de economia de energia em até 27,5 , e reduzir o tempo de inferência por um fator de 116 em relação à versão original, com uma perda de precisão de 13%.In the past years, several efforts in algorithm and architectural research were put together to enable large-scale use of CNNs as we know today. Thus far, most of these achievements have been based on improving convolutions by chasing the parallel execution of MAC operations through the replication of floating-point units. However, these solutions fall far short of what is allowed from the energy budget when it comes to embedded systems running these NN models. Given specific image characteristics, such as recurrent input patterns, we propose an algorithmic changing for performing CNN inferences by employing a computation reuse technique instead of the original implementation. Based on statistical analysis, we address computation reuse at three granularity levels: convolution kernel-level and grid-level through employing lookup tables in place of the original convolutions, and frame-level by replacing entire frame computations with a movement prediction algorithm. Experimental results show that it is possible to achieve energy savings up to 27.5 , while reducing the inference time to 116 of the baseline, with an accuracy loss of 13%.application/pdfengRedes neuraisEngenharia : SoftwareConvolutional neural networkscomputation reuseSoftware-only computation reuse techniques for energy efficient CNNsTécnicas de reuso de computação em software para CNNs energeticamente eficientes info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2019mestradoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001100053.pdf.txt001100053.pdf.txtExtracted Texttext/plain133746http://www.lume.ufrgs.br/bitstream/10183/198517/2/001100053.pdf.txt3348903eb619305e0c3ecf1e1cea80efMD52ORIGINAL001100053.pdfTexto completo (inglês)application/pdf1353290http://www.lume.ufrgs.br/bitstream/10183/198517/1/001100053.pdf90e9669dc7e70299bfe74b0c9fbd0d20MD5110183/1985172019-08-30 02:34:44.334246oai:www.lume.ufrgs.br:10183/198517Repositório InstitucionalPUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.bropendoar:2019-08-30T05:34:44Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
| dc.title.pt_BR.fl_str_mv |
Software-only computation reuse techniques for energy efficient CNNs |
| dc.title.alternative.en.fl_str_mv |
Técnicas de reuso de computação em software para CNNs energeticamente eficientes |
| title |
Software-only computation reuse techniques for energy efficient CNNs |
| spellingShingle |
Software-only computation reuse techniques for energy efficient CNNs Moura, Rafael Fão de Redes neurais Engenharia : Software Convolutional neural networks computation reuse |
| title_short |
Software-only computation reuse techniques for energy efficient CNNs |
| title_full |
Software-only computation reuse techniques for energy efficient CNNs |
| title_fullStr |
Software-only computation reuse techniques for energy efficient CNNs |
| title_full_unstemmed |
Software-only computation reuse techniques for energy efficient CNNs |
| title_sort |
Software-only computation reuse techniques for energy efficient CNNs |
| author |
Moura, Rafael Fão de |
| author_facet |
Moura, Rafael Fão de |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Moura, Rafael Fão de |
| dc.contributor.advisor1.fl_str_mv |
Carro, Luigi |
| contributor_str_mv |
Carro, Luigi |
| dc.subject.por.fl_str_mv |
Redes neurais Engenharia : Software |
| topic |
Redes neurais Engenharia : Software Convolutional neural networks computation reuse |
| dc.subject.eng.fl_str_mv |
Convolutional neural networks computation reuse |
| description |
Nos últimos anos, pesquisas em melhorias nas áreas de algoritmos e arquiteturas computacionais foram postas lado-a-lado de modo a permitir o uso em larga-escala de CNNs. Desde então, a maior parte destas melhorias têm sido baseadas na aceleração de convoluções através da execução paralela de operações MAC, utilizando a replicação de unidades de ponto-flutuante. No entanto, essas soluções ficam muito aquém do que é permitido em termos de consumo energético quando se trata de sistemas embarcados executando NNs. Considerando características específicas de imagens, tais como repetições de padrões de entrada, neste trabalho, nós apresentamos uma mudança algorítmica no modo como CNNs realizam inferências, empregando uma técnica de reuso de computação no lugar da implementação original. Com base em análises estatísticas, nós abordamos o reuso de computação em três granularidades: ao nível de convolução e ao nível de conjunto de convoluções, realizando consultas em tabelas ao invés das convoluções originais, e ao nível de frame através da substituição da computação original de um frame inteiro por um algoritmo de predição de movimento. Nossos resultados mostram que é possível obter níveis de economia de energia em até 27,5 , e reduzir o tempo de inferência por um fator de 116 em relação à versão original, com uma perda de precisão de 13%. |
| publishDate |
2019 |
| dc.date.accessioned.fl_str_mv |
2019-08-29T02:34:41Z |
| dc.date.issued.fl_str_mv |
2019 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/198517 |
| dc.identifier.nrb.pt_BR.fl_str_mv |
001100053 |
| url |
http://hdl.handle.net/10183/198517 |
| identifier_str_mv |
001100053 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
| instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
| instacron_str |
UFRGS |
| institution |
UFRGS |
| reponame_str |
Repositório Institucional da UFRGS |
| collection |
Repositório Institucional da UFRGS |
| bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/198517/2/001100053.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/198517/1/001100053.pdf |
| bitstream.checksum.fl_str_mv |
3348903eb619305e0c3ecf1e1cea80ef 90e9669dc7e70299bfe74b0c9fbd0d20 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
| repository.mail.fl_str_mv |
lume@ufrgs.br |
| _version_ |
1864542646054158336 |