Técnicas de agrupamento de dados para computação aproximativa

Malfatti, Guilherme Meneguzzi

Técnicas de agrupamento de dados para computação aproximativa

Detalhes bibliográficos
Ano de defesa:	2017
Autor(a) principal:	Malfatti, Guilherme Meneguzzi
Orientador(a):	Beck Filho, Antonio Carlos Schneider
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Não Informado pela instituição
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Redes neurais Cluster
Palavras-chave em Inglês:	Approximate Computing High Performance Neural networks Data Clustering
Link de acesso:	http://hdl.handle.net/10183/169096
Resumo:	Dois dos principais fatores do aumento da performance em aplicações single-thread – frequência de operação e exploração do paralelismo no nível das instruções – tiveram pouco avanço nos últimos anos devido a restrições de potência. Neste contexto, considerando a natureza tolerante a imprecisões (i.e.: suas saídas podem conter um nível aceitável de ruído sem comprometer o resultado final) de muitas aplicações atuais, como processamento de imagens e aprendizado de máquina, a computação aproximativa torna-se uma abordagem atrativa. Esta técnica baseia-se em computar valores aproximados ao invés de precisos que, por sua vez, pode aumentar o desempenho e reduzir o consumo energético ao custo de qualidade. No atual estado da arte, a forma mais comum de exploração da técnica é através de redes neurais (mais especificamente, o modelo Multilayer Perceptron), devido à capacidade destas estruturas de aprender funções arbitrárias e aproximá-las. Tais redes são geralmente implementadas em um hardware dedicado, chamado acelerador neural. Contudo, essa execução exige uma grande quantidade de área em chip e geralmente não oferece melhorias suficientes que justifiquem este espaço adicional. Este trabalho tem por objetivo propor um novo mecanismo para fazer computação aproximativa, baseado em reúso aproximativo de funções e trechos de código. Esta técnica agrupa automaticamente entradas e saídas de dados por similaridade, armazena-os em uma tabela em memória controlada via software. A partir disto, os valores quantizados podem ser reutilizados através de uma busca a essa tabela, onde será selecionada a saída mais apropriada e desta forma a execução do trecho de código será substituído. A aplicação desta técnica é bastante eficaz, sendo capaz de alcançar uma redução, em média, de 97.1% em Energy-Delay-Product (EDP) quando comparado a aceleradores neurais.

Metadados do item

id	URGS_c10a732b02a86e5efd36aee14062f4a5
oai_identifier_str	oai:www.lume.ufrgs.br:10183/169096
network_acronym_str	URGS
network_name_str	Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling	Malfatti, Guilherme MeneguzziBeck Filho, Antonio Carlos SchneiderCarro, Luigi2017-10-03T02:27:22Z2017http://hdl.handle.net/10183/169096001047914Dois dos principais fatores do aumento da performance em aplicações single-thread – frequência de operação e exploração do paralelismo no nível das instruções – tiveram pouco avanço nos últimos anos devido a restrições de potência. Neste contexto, considerando a natureza tolerante a imprecisões (i.e.: suas saídas podem conter um nível aceitável de ruído sem comprometer o resultado final) de muitas aplicações atuais, como processamento de imagens e aprendizado de máquina, a computação aproximativa torna-se uma abordagem atrativa. Esta técnica baseia-se em computar valores aproximados ao invés de precisos que, por sua vez, pode aumentar o desempenho e reduzir o consumo energético ao custo de qualidade. No atual estado da arte, a forma mais comum de exploração da técnica é através de redes neurais (mais especificamente, o modelo Multilayer Perceptron), devido à capacidade destas estruturas de aprender funções arbitrárias e aproximá-las. Tais redes são geralmente implementadas em um hardware dedicado, chamado acelerador neural. Contudo, essa execução exige uma grande quantidade de área em chip e geralmente não oferece melhorias suficientes que justifiquem este espaço adicional. Este trabalho tem por objetivo propor um novo mecanismo para fazer computação aproximativa, baseado em reúso aproximativo de funções e trechos de código. Esta técnica agrupa automaticamente entradas e saídas de dados por similaridade, armazena-os em uma tabela em memória controlada via software. A partir disto, os valores quantizados podem ser reutilizados através de uma busca a essa tabela, onde será selecionada a saída mais apropriada e desta forma a execução do trecho de código será substituído. A aplicação desta técnica é bastante eficaz, sendo capaz de alcançar uma redução, em média, de 97.1% em Energy-Delay-Product (EDP) quando comparado a aceleradores neurais.Two of the major drivers of increased performance in single-thread applications - increase in operation frequency and exploitation of instruction-level parallelism - have had little advances in the last years due to power constraints. In this context, considering the intrinsic imprecision-tolerance (i.e., outputs may present an acceptable level of noise without compromising the result) of many modern applications, such as image processing and machine learning, approximate computation becomes a promising approach. This technique is based on computing approximate instead of accurate results, which can increase performance and reduce energy consumption at the cost of quality. In the current state of the art, the most common way of exploiting the technique is through neural networks (more specifically, the Multilayer Perceptron model), due to the ability of these structures to learn arbitrary functions and to approximate them. Such networks are usually implemented in a dedicated neural accelerator. However, this implementation requires a large amount of chip area and usually does not offer enough improvements to justify this additional cost. The goal of this work is to propose a new mechanism to address approximate computation, based on approximate reuse of functions and code fragments. This technique automatically groups input and output data by similarity and stores this information in a sofware-controlled memory. Based on these data, the quantized values can be reused through a search to this table, in which the most appropriate output will be selected and, therefore, execution of the original code will be replaced. Applying this technique is effective, achieving an average 97.1% reduction in Energy-Delay-Product (EDP) when compared to neural accelerators.application/pdfporRedes neuraisClusterApproximate ComputingHigh PerformanceNeural networksData ClusteringTécnicas de agrupamento de dados para computação aproximativainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2017mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL001047914.pdf001047914.pdfTexto completoapplication/pdf3236881http://www.lume.ufrgs.br/bitstream/10183/169096/1/001047914.pdffbe96541db3c5abd92af3339a616a0a3MD51TEXT001047914.pdf.txt001047914.pdf.txtExtracted Texttext/plain144960http://www.lume.ufrgs.br/bitstream/10183/169096/2/001047914.pdf.txt29151a1ff1143f6ec05fffad8a49b599MD52THUMBNAIL001047914.pdf.jpg001047914.pdf.jpgGenerated Thumbnailimage/jpeg1134http://www.lume.ufrgs.br/bitstream/10183/169096/3/001047914.pdf.jpg66b15f0d7a5234e19b75f80609b8c198MD5310183/1690962018-10-29 08:21:40.729oai:www.lume.ufrgs.br:10183/169096Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br\|\|lume@ufrgs.bropendoar:18532018-10-29T11:21:40Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv	Técnicas de agrupamento de dados para computação aproximativa
title	Técnicas de agrupamento de dados para computação aproximativa
spellingShingle	Técnicas de agrupamento de dados para computação aproximativa Malfatti, Guilherme Meneguzzi Redes neurais Cluster Approximate Computing High Performance Neural networks Data Clustering
title_short	Técnicas de agrupamento de dados para computação aproximativa
title_full	Técnicas de agrupamento de dados para computação aproximativa
title_fullStr	Técnicas de agrupamento de dados para computação aproximativa
title_full_unstemmed	Técnicas de agrupamento de dados para computação aproximativa
title_sort	Técnicas de agrupamento de dados para computação aproximativa
author	Malfatti, Guilherme Meneguzzi
author_facet	Malfatti, Guilherme Meneguzzi
author_role	author
dc.contributor.author.fl_str_mv	Malfatti, Guilherme Meneguzzi
dc.contributor.advisor1.fl_str_mv	Beck Filho, Antonio Carlos Schneider
dc.contributor.advisor-co1.fl_str_mv	Carro, Luigi
contributor_str_mv	Beck Filho, Antonio Carlos Schneider Carro, Luigi
dc.subject.por.fl_str_mv	Redes neurais Cluster
topic	Redes neurais Cluster Approximate Computing High Performance Neural networks Data Clustering
dc.subject.eng.fl_str_mv	Approximate Computing High Performance Neural networks Data Clustering
description	Dois dos principais fatores do aumento da performance em aplicações single-thread – frequência de operação e exploração do paralelismo no nível das instruções – tiveram pouco avanço nos últimos anos devido a restrições de potência. Neste contexto, considerando a natureza tolerante a imprecisões (i.e.: suas saídas podem conter um nível aceitável de ruído sem comprometer o resultado final) de muitas aplicações atuais, como processamento de imagens e aprendizado de máquina, a computação aproximativa torna-se uma abordagem atrativa. Esta técnica baseia-se em computar valores aproximados ao invés de precisos que, por sua vez, pode aumentar o desempenho e reduzir o consumo energético ao custo de qualidade. No atual estado da arte, a forma mais comum de exploração da técnica é através de redes neurais (mais especificamente, o modelo Multilayer Perceptron), devido à capacidade destas estruturas de aprender funções arbitrárias e aproximá-las. Tais redes são geralmente implementadas em um hardware dedicado, chamado acelerador neural. Contudo, essa execução exige uma grande quantidade de área em chip e geralmente não oferece melhorias suficientes que justifiquem este espaço adicional. Este trabalho tem por objetivo propor um novo mecanismo para fazer computação aproximativa, baseado em reúso aproximativo de funções e trechos de código. Esta técnica agrupa automaticamente entradas e saídas de dados por similaridade, armazena-os em uma tabela em memória controlada via software. A partir disto, os valores quantizados podem ser reutilizados através de uma busca a essa tabela, onde será selecionada a saída mais apropriada e desta forma a execução do trecho de código será substituído. A aplicação desta técnica é bastante eficaz, sendo capaz de alcançar uma redução, em média, de 97.1% em Energy-Delay-Product (EDP) quando comparado a aceleradores neurais.
publishDate	2017
dc.date.accessioned.fl_str_mv	2017-10-03T02:27:22Z
dc.date.issued.fl_str_mv	2017
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10183/169096
dc.identifier.nrb.pt_BR.fl_str_mv	001047914
url	http://hdl.handle.net/10183/169096
identifier_str_mv	001047914
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS
instname_str	Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str	UFRGS
institution	UFRGS
reponame_str	Biblioteca Digital de Teses e Dissertações da UFRGS
collection	Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv	http://www.lume.ufrgs.br/bitstream/10183/169096/1/001047914.pdf http://www.lume.ufrgs.br/bitstream/10183/169096/2/001047914.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/169096/3/001047914.pdf.jpg
bitstream.checksum.fl_str_mv	fbe96541db3c5abd92af3339a616a0a3 29151a1ff1143f6ec05fffad8a49b599 66b15f0d7a5234e19b75f80609b8c198
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv	lume@ufrgs.br\|\|lume@ufrgs.br
_version_	1831316027667906560

Técnicas de agrupamento de dados para computação aproximativa

Registros relacionados