Particionamento de redes neurais profundas com saídas antecipadas
| Ano de defesa: | 2020 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal do Rio de Janeiro
Brasil Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Pós-Graduação em Engenharia Elétrica UFRJ |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://hdl.handle.net/11422/23205 |
Resumo: | Deep Neural Networks (DNNs) requires high computation power. This power may not be available on end devices, requiring the use of a cloud computing infrastructure. However, sending raw data to the cloud can increase the inference time, due to the communication time. To reduce this time, the first layers of DNN can be executed in a edge device and the remaining layers in the cloud. Depending on which layers are processed at the edge, this can reduce the amount of data sent, but can also increase processing time. As the inference time is composed of the communication and processing time, it is necessary to deal with this trade-off. Partitioning problems try to solve this trade-off, choosing a set of layers to be executed in the edge device to minimize the inference time. This dissertation addresses DNN partitioning with early exits. In this kind of DNN, the inference can be finished in the middle layers, depending on the level of uncertainty of the classification of an input sample. Therefore, besides of network conditions and cloud and edge hardware, input data characteristics can also influence the partitioning decision. To consider these characteristics, this disseration models the partitioning problem as a shortest path problem in a graph and, thus, can be solved in polynomial time. This model is used as the basis for proposing the POPEX (Partitioning OPtimization for deep neural networks with Early eXits) system. Moreover, this dissertation evaluates as the DNN model and input data can affect the DNN partitioning with early exits. Regarding the first, this considers the process of DNN calibration, while the second refers to image distortion in the partitioning. |
| id |
UFRJ_a6a31428384af4efca84b92ef873ff07 |
|---|---|
| oai_identifier_str |
oai:pantheon.ufrj.br:11422/23205 |
| network_acronym_str |
UFRJ |
| network_name_str |
Repositório Institucional da UFRJ |
| repository_id_str |
|
| spelling |
Particionamento de redes neurais profundas com saídas antecipadasRedes neurais profundasComputação em bordaParticionamento de redes neurais profundasEngenharia ElétricaDeep Neural Networks (DNNs) requires high computation power. This power may not be available on end devices, requiring the use of a cloud computing infrastructure. However, sending raw data to the cloud can increase the inference time, due to the communication time. To reduce this time, the first layers of DNN can be executed in a edge device and the remaining layers in the cloud. Depending on which layers are processed at the edge, this can reduce the amount of data sent, but can also increase processing time. As the inference time is composed of the communication and processing time, it is necessary to deal with this trade-off. Partitioning problems try to solve this trade-off, choosing a set of layers to be executed in the edge device to minimize the inference time. This dissertation addresses DNN partitioning with early exits. In this kind of DNN, the inference can be finished in the middle layers, depending on the level of uncertainty of the classification of an input sample. Therefore, besides of network conditions and cloud and edge hardware, input data characteristics can also influence the partitioning decision. To consider these characteristics, this disseration models the partitioning problem as a shortest path problem in a graph and, thus, can be solved in polynomial time. This model is used as the basis for proposing the POPEX (Partitioning OPtimization for deep neural networks with Early eXits) system. Moreover, this dissertation evaluates as the DNN model and input data can affect the DNN partitioning with early exits. Regarding the first, this considers the process of DNN calibration, while the second refers to image distortion in the partitioning.O processo de inferência em redes neurais profundas (Deep Neural Networks - DNNs) demanda uma alta capacidade computacional. Essa capacidade pode não estar disponível nos dispositivos finais, sendo necessário o uso de uma infraestrutura de computação em nuvem. No entanto, enviar dados brutos à nuvem pode aumentar o tempo de inferência, devido ao tempo de comunicação. Para reduzir esse tempo, as primeiras camadas neurais da DNN podem ser executadas em uma infraestrutura de computação na borda e o restante na nuvem. Dependendo de quais camadas são processadas na borda, isso pode reduzir a quantidade de dados enviada, mas pode também aumentar o tempo de processamento. Como o tempo de inferência é composto pelo tempo de comunicação e de processamento, é necessário lidar com esse compromisso. Problemas de particionamento de DNNs buscam resolver esse compromisso, escolhendo o conjunto de camadas a ser executado na borda para minimizar o tempo de inferência. Esta dissertação aborda o particionamento de DNNs com saídas antecipadas. Nesse tipo de DNN, o processo de inferência pode ser concluído nas camadas intermediárias, dependendo do nível de incerteza da classificação de uma amostra de entrada. Assim, além das condições da rede e do hardware da nuvem e da borda, características dos dados de entrada também podem influenciar a decisão de particionamento. Para considerar tais características, esta dissertação modela o problema de particionamento como um problema de caminho mais curto em um grafo e, portanto, resolvido em tempo polinomial. O modelo é usado como base para propor o sistema POPEX (Partitioning OPtimization for deep neural networks with Early eXits). Além disso, esta dissertação avalia como o modelo da rede neural e os dados de entrada alteram o particionamento ótimo em DNNs com saídas antecipadas. Em relação ao primeiro, considera-se o processo de calibração de DNNs, enquanto o segundo refere-se ao impacto da distorção da imagem no particionamento.Universidade Federal do Rio de JaneiroBrasilInstituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de EngenhariaPrograma de Pós-Graduação em Engenharia ElétricaUFRJCouto, Rodrigo de Souzahttp://lattes.cnpq.br/1492779284348545Costa, Luís Henrique Maciel KosmalskiBoth, Cristiano BonatoPacheco, Roberto Gonçalves2024-07-17T19:51:56Z2024-07-19T03:00:21Z2020-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/11422/23205porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJ2024-07-19T03:00:21Zoai:pantheon.ufrj.br:11422/23205Repositório InstitucionalPUBhttp://www.pantheon.ufrj.br/oai/requestpantheon@sibi.ufrj.bropendoar:2024-07-19T03:00:21Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false |
| dc.title.none.fl_str_mv |
Particionamento de redes neurais profundas com saídas antecipadas |
| title |
Particionamento de redes neurais profundas com saídas antecipadas |
| spellingShingle |
Particionamento de redes neurais profundas com saídas antecipadas Pacheco, Roberto Gonçalves Redes neurais profundas Computação em borda Particionamento de redes neurais profundas Engenharia Elétrica |
| title_short |
Particionamento de redes neurais profundas com saídas antecipadas |
| title_full |
Particionamento de redes neurais profundas com saídas antecipadas |
| title_fullStr |
Particionamento de redes neurais profundas com saídas antecipadas |
| title_full_unstemmed |
Particionamento de redes neurais profundas com saídas antecipadas |
| title_sort |
Particionamento de redes neurais profundas com saídas antecipadas |
| author |
Pacheco, Roberto Gonçalves |
| author_facet |
Pacheco, Roberto Gonçalves |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Couto, Rodrigo de Souza http://lattes.cnpq.br/1492779284348545 Costa, Luís Henrique Maciel Kosmalski Both, Cristiano Bonato |
| dc.contributor.author.fl_str_mv |
Pacheco, Roberto Gonçalves |
| dc.subject.por.fl_str_mv |
Redes neurais profundas Computação em borda Particionamento de redes neurais profundas Engenharia Elétrica |
| topic |
Redes neurais profundas Computação em borda Particionamento de redes neurais profundas Engenharia Elétrica |
| description |
Deep Neural Networks (DNNs) requires high computation power. This power may not be available on end devices, requiring the use of a cloud computing infrastructure. However, sending raw data to the cloud can increase the inference time, due to the communication time. To reduce this time, the first layers of DNN can be executed in a edge device and the remaining layers in the cloud. Depending on which layers are processed at the edge, this can reduce the amount of data sent, but can also increase processing time. As the inference time is composed of the communication and processing time, it is necessary to deal with this trade-off. Partitioning problems try to solve this trade-off, choosing a set of layers to be executed in the edge device to minimize the inference time. This dissertation addresses DNN partitioning with early exits. In this kind of DNN, the inference can be finished in the middle layers, depending on the level of uncertainty of the classification of an input sample. Therefore, besides of network conditions and cloud and edge hardware, input data characteristics can also influence the partitioning decision. To consider these characteristics, this disseration models the partitioning problem as a shortest path problem in a graph and, thus, can be solved in polynomial time. This model is used as the basis for proposing the POPEX (Partitioning OPtimization for deep neural networks with Early eXits) system. Moreover, this dissertation evaluates as the DNN model and input data can affect the DNN partitioning with early exits. Regarding the first, this considers the process of DNN calibration, while the second refers to image distortion in the partitioning. |
| publishDate |
2020 |
| dc.date.none.fl_str_mv |
2020-09 2024-07-17T19:51:56Z 2024-07-19T03:00:21Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11422/23205 |
| url |
http://hdl.handle.net/11422/23205 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Brasil Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Pós-Graduação em Engenharia Elétrica UFRJ |
| publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Brasil Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Pós-Graduação em Engenharia Elétrica UFRJ |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRJ instname:Universidade Federal do Rio de Janeiro (UFRJ) instacron:UFRJ |
| instname_str |
Universidade Federal do Rio de Janeiro (UFRJ) |
| instacron_str |
UFRJ |
| institution |
UFRJ |
| reponame_str |
Repositório Institucional da UFRJ |
| collection |
Repositório Institucional da UFRJ |
| repository.name.fl_str_mv |
Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ) |
| repository.mail.fl_str_mv |
pantheon@sibi.ufrj.br |
| _version_ |
1861279121282170880 |