An exploratory assessment of multistream deep neural network fusion : design and applications

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Almeida, Ana Paula Gonçalves Soares de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.unb.br/handle/10482/45041
Resumo: Tese (doutorado) — Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Mecânica, 2022.
id UNB_968ec25dcfb511de49ee225d39eb4c27
oai_identifier_str oai:repositorio.unb.br:10482/45041
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling An exploratory assessment of multistream deep neural network fusion : design and applicationsAprendizagem de máquinaRedes neurais convolucionaisArquitetura de computadorTese (doutorado) — Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Mecânica, 2022.Os métodos de aprendizado de máquina dependem muito de quão bom o extrator de características selecionado pode representar os dados brutos de entrada. Atualmente, temos mais dados e capacidade computacional para lidar com isso. Com as Redes Neurais Convolucionais temos uma rede que é mais fácil de treinar e generaliza muito melhor do que o habitual. Há, no entanto, uma boa quantidade de características que são essenciais, mas são descartadas nesse processo, mesmo quando se utiliza uma CNN poderosa. As Redes Neurais Convolucionais Multistream podem processar mais de uma entrada usando fluxos separados e são projetadas usando qualquer arquitetura CNN clássica como base. O uso de M-CNNs gera mais informação de características e, assim, melhora o resultado geral. Este trabalho explorou arquiteturas M-CNNs e como os sinais de fluxo se comportam durante o processamento, chegando a uma nova estratégia de fusão cruzada de M-CNNs. O novo módulo é validado, inicialmente, com um conjunto de dados padrão, CIFAR-10, e comparado com as redes correspondentes (single-stream CNN e late fusion M-CNN). Os primeiros resultados neste cenário mostraram que nosso modelo adaptado superou todos os modelos mencionados acima em pelo menos 28% em comparação com todos os modelos testados. Expandindo o teste, usamos a base de antigas redes estado-da-arte na classificação de imagens e conjuntos de dados adicionais para investigar se a técnica pode colocar essas estruturas de volta ao jogo. No conjunto de dados NORB, mostramos que podemos aumentar a precisão em até 63, 21% quando comparado às estruturas básicas de M-CNNs. Variando nossas aplicações, o mAP@75 do conjunto de dados de detecção e reconhecimento de objetos BDD100K melhorou em 50, 16% em comparação com sua versão não adaptada, mesmo quando treinado do zero. A fusão proposta demonstrou robustez e estabilidade, mesmo quando distratores foram usados como entradas. Embora nosso objetivo seja reutilizar arquiteturas estado-da-arte anteriores com poucas modificações, também expomos as desvantagens de nossa estratégia explorada.Machine-learning methods depend heavily on how well the selected feature extractor can represent the raw input data. Nowadays, we have more data and computational capacity to deal with it. With Convolutional Neural Networks, we have a network that is easier to train and generalizes much better than usual. However, a good amount of essential features are discarded in this process, even when using a powerful CNN. Multistream Convolutional Neural Networks can process more than one input using separate streams and are designed using any classical CNN architecture as a base. The use of M-CNNs generates more features and thus, improves the overall outcome. This work explored M-CNNs architectures and how the stream signals behave during the processing, coming up with a novel M-CNN cross-fusion strategy. The new module is first validated with a standard dataset, CIFAR-10, and compared with the corresponding networks (single-stream CNN and late fusion M-CNN). Early results on this scenario showed that our adapted model outperformed all the abovementioned models by at least 28% compared to all tested models. Expanding the test, we used the backbones of former state-of-the-art networks on image classification and additional datasets to investigate if the technique can put these designs back in the game. On the NORB dataset, we showed that we could increase accuracy up to 63.21% compared to basic M-CNNs structures. Varying our applications, the mAP@75 of the BDD100K multi-object detection and recognition dataset improved by 50.16% compared to its unadapted version, even when trained from scratch. The proposed fusion demonstrated robustness and stability, even when distractors were used as inputs. While our goal is to reuse previous state-of-the-art architectures with few modifications, we also expose the disadvantages of our explored strategy.Faculdade de Tecnologia (FT)Departamento de Engenharia Mecânica (FT ENM)Programa de Pós-Graduação em Ciências MecânicasVidal, Flávio de Barrosanapaula.gsa@gmail.comAlmeida, Ana Paula Gonçalves Soares de2022-10-13T21:00:02Z2022-10-13T21:00:02Z2022-10-132022-07-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfALMEIDA, Ana Paula Gonçalves Soares de. An exploratory assessment of multistream deep neural network fusion: design and applications. 2022. xi, 106 f., il. Tese (Doutorado em Ciências Mecânicas) — Universidade de Brasília, Brasília, 2022.https://repositorio.unb.br/handle/10482/45041engA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2025-03-19T16:19:15Zoai:repositorio.unb.br:10482/45041Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2025-03-19T16:19:15Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv An exploratory assessment of multistream deep neural network fusion : design and applications
title An exploratory assessment of multistream deep neural network fusion : design and applications
spellingShingle An exploratory assessment of multistream deep neural network fusion : design and applications
Almeida, Ana Paula Gonçalves Soares de
Aprendizagem de máquina
Redes neurais convolucionais
Arquitetura de computador
title_short An exploratory assessment of multistream deep neural network fusion : design and applications
title_full An exploratory assessment of multistream deep neural network fusion : design and applications
title_fullStr An exploratory assessment of multistream deep neural network fusion : design and applications
title_full_unstemmed An exploratory assessment of multistream deep neural network fusion : design and applications
title_sort An exploratory assessment of multistream deep neural network fusion : design and applications
author Almeida, Ana Paula Gonçalves Soares de
author_facet Almeida, Ana Paula Gonçalves Soares de
author_role author
dc.contributor.none.fl_str_mv Vidal, Flávio de Barros
anapaula.gsa@gmail.com
dc.contributor.author.fl_str_mv Almeida, Ana Paula Gonçalves Soares de
dc.subject.por.fl_str_mv Aprendizagem de máquina
Redes neurais convolucionais
Arquitetura de computador
topic Aprendizagem de máquina
Redes neurais convolucionais
Arquitetura de computador
description Tese (doutorado) — Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Mecânica, 2022.
publishDate 2022
dc.date.none.fl_str_mv 2022-10-13T21:00:02Z
2022-10-13T21:00:02Z
2022-10-13
2022-07-01
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv ALMEIDA, Ana Paula Gonçalves Soares de. An exploratory assessment of multistream deep neural network fusion: design and applications. 2022. xi, 106 f., il. Tese (Doutorado em Ciências Mecânicas) — Universidade de Brasília, Brasília, 2022.
https://repositorio.unb.br/handle/10482/45041
identifier_str_mv ALMEIDA, Ana Paula Gonçalves Soares de. An exploratory assessment of multistream deep neural network fusion: design and applications. 2022. xi, 106 f., il. Tese (Doutorado em Ciências Mecânicas) — Universidade de Brasília, Brasília, 2022.
url https://repositorio.unb.br/handle/10482/45041
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1839083752606662656