Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Costa, Felipe Franco
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Programa de Pós-Graduação em Informática
UTFPR
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.utfpr.edu.br/jspui/handle/1/30169
Resumo: Video classification methods have been evolving through proposals based on end-to-end architectures for deep learning. Many academic works have validated that such end-to-end models are effective for the learning of characteristics intrinsic to videos, especially when compared to traditional, handcrafted, descriptors. In general, convolutional neural networks are used for deep learning in videos. When applied to such contexts, the networks can display variations based on temporal information, based memory cells (e.g. long-short term memory), or even optical flow techniques used in conjunction with the convolution process. However, despite its effectiveness, those methods neglect global analysis, processing only a small quantity of frames in each batch during the learning and inference process. Moreover, they also completely ignore the semantic relationship between different videos that belong to the same context. Thus, the present work aims to fill the existing gaps by using concepts of information grouping and contextual detection through graph-based convolutional neural networks (GCN). With these architectures we hope to propose new approaches to create and explore the relationship between different videos of a given context, improving the state-of-the-art in the process.
id UTFPR-12_e72b16128492c3d63ea950b1c074d4ea
oai_identifier_str oai:repositorio.utfpr.edu.br:1/30169
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafosVideo actions classification through graph-based convolutional neural networksAprendizado do computadorTeoria dos grafosVisão por computadorMachine learningGraph theoryComputer visionCNPQ::CIENCIAS EXATAS E DA TERRACiência da ComputaçãoVideo classification methods have been evolving through proposals based on end-to-end architectures for deep learning. Many academic works have validated that such end-to-end models are effective for the learning of characteristics intrinsic to videos, especially when compared to traditional, handcrafted, descriptors. In general, convolutional neural networks are used for deep learning in videos. When applied to such contexts, the networks can display variations based on temporal information, based memory cells (e.g. long-short term memory), or even optical flow techniques used in conjunction with the convolution process. However, despite its effectiveness, those methods neglect global analysis, processing only a small quantity of frames in each batch during the learning and inference process. Moreover, they also completely ignore the semantic relationship between different videos that belong to the same context. Thus, the present work aims to fill the existing gaps by using concepts of information grouping and contextual detection through graph-based convolutional neural networks (GCN). With these architectures we hope to propose new approaches to create and explore the relationship between different videos of a given context, improving the state-of-the-art in the process.Métodos para classificação de vídeos têm evoluido por meio de propostas baseadas em arquiteturas end-to-end para aprendizagem profunda. Diversos trabalhos da literatura têm corroborado que tais modelos end-to-end são eficazes para o aprendizado de características intrínsecas às imagens (ou frames de um vídeo), quando comparados a descritores tradicionais (handcrafted). Assim, de maneira geral, utiliza-se redes neurais convolucionais para realizar o aprendizado profundo em vídeos. Quando aplicadas a tais contextos as mesmas podem apresentar variações baseadas em informações temporais, em células de memória (e.g. long-short term memory - LSTM) ou até mesmo métodos de entrada de fluxo óptico para auxílio de convolução. Porém, apesar de serem, de certa forma, eficazes para a classificação de vídeos, as mesmas negligenciam a análise global de vídeos, aceitando apenas alguns poucos frames por lote de processamento para treino e inferência. Além disso, não consideram o relacionamento semântico entre diferentes vídeos pertencentes a um mesmo contexto para auxiliar o processo de classificação. Dessa forma, o presentre trabalho visa preencher essas lacunas existentes. Para tanto, serão utilizados conceitos de agrupamento de informação e detecção contextual por meio de redes convolucionais baseadas em grafos (graph convolutional networks). Por meio de tal arquitetura espera-se propor um método capaz de criar e explorar o relacionamento entre diferentes vídeos de um dado contexto, visando melhor eficácia quando comparadao aos métodos do estado da arte.Universidade Tecnológica Federal do ParanáCornelio ProcopioBrasilPrograma de Pós-Graduação em InformáticaUTFPRBugatti, Pedro Henriquehttps://orcid.org/0000-0001-9421-9254http://lattes.cnpq.br/2177467029991118Oliveira, Claiton dehttps://orcid.org/0000-0003-2953-6223http://lattes.cnpq.br/8851289265109891Silva, Marcelo Ponciano dahttp://lattes.cnpq.br/5460455448058206Bugatti, Pedro Henriquehttps://orcid.org/0000-0001-9421-9254http://lattes.cnpq.br/2177467029991118Costa, Felipe Franco2022-11-24T13:49:24Z2022-11-24T13:49:24Z2020-08-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfCOSTA, Felipe Franco. Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos. 2020. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020.http://repositorio.utfpr.edu.br/jspui/handle/1/30169porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2022-11-25T06:05:23Zoai:repositorio.utfpr.edu.br:1/30169Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2022-11-25T06:05:23Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos
Video actions classification through graph-based convolutional neural networks
title Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos
spellingShingle Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos
Costa, Felipe Franco
Aprendizado do computador
Teoria dos grafos
Visão por computador
Machine learning
Graph theory
Computer vision
CNPQ::CIENCIAS EXATAS E DA TERRA
Ciência da Computação
title_short Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos
title_full Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos
title_fullStr Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos
title_full_unstemmed Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos
title_sort Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos
author Costa, Felipe Franco
author_facet Costa, Felipe Franco
author_role author
dc.contributor.none.fl_str_mv Bugatti, Pedro Henrique
https://orcid.org/0000-0001-9421-9254
http://lattes.cnpq.br/2177467029991118
Oliveira, Claiton de
https://orcid.org/0000-0003-2953-6223
http://lattes.cnpq.br/8851289265109891
Silva, Marcelo Ponciano da
http://lattes.cnpq.br/5460455448058206
Bugatti, Pedro Henrique
https://orcid.org/0000-0001-9421-9254
http://lattes.cnpq.br/2177467029991118
dc.contributor.author.fl_str_mv Costa, Felipe Franco
dc.subject.por.fl_str_mv Aprendizado do computador
Teoria dos grafos
Visão por computador
Machine learning
Graph theory
Computer vision
CNPQ::CIENCIAS EXATAS E DA TERRA
Ciência da Computação
topic Aprendizado do computador
Teoria dos grafos
Visão por computador
Machine learning
Graph theory
Computer vision
CNPQ::CIENCIAS EXATAS E DA TERRA
Ciência da Computação
description Video classification methods have been evolving through proposals based on end-to-end architectures for deep learning. Many academic works have validated that such end-to-end models are effective for the learning of characteristics intrinsic to videos, especially when compared to traditional, handcrafted, descriptors. In general, convolutional neural networks are used for deep learning in videos. When applied to such contexts, the networks can display variations based on temporal information, based memory cells (e.g. long-short term memory), or even optical flow techniques used in conjunction with the convolution process. However, despite its effectiveness, those methods neglect global analysis, processing only a small quantity of frames in each batch during the learning and inference process. Moreover, they also completely ignore the semantic relationship between different videos that belong to the same context. Thus, the present work aims to fill the existing gaps by using concepts of information grouping and contextual detection through graph-based convolutional neural networks (GCN). With these architectures we hope to propose new approaches to create and explore the relationship between different videos of a given context, improving the state-of-the-art in the process.
publishDate 2020
dc.date.none.fl_str_mv 2020-08-14
2022-11-24T13:49:24Z
2022-11-24T13:49:24Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv COSTA, Felipe Franco. Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos. 2020. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020.
http://repositorio.utfpr.edu.br/jspui/handle/1/30169
identifier_str_mv COSTA, Felipe Franco. Classificação de ações em vídeos por meio de redes neurais convolucionais baseadas em grafos. 2020. Dissertação (Mestrado em Informática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020.
url http://repositorio.utfpr.edu.br/jspui/handle/1/30169
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Programa de Pós-Graduação em Informática
UTFPR
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Programa de Pós-Graduação em Informática
UTFPR
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850498331855290368