Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos

Silva, Leandro Pereira da

Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos

Detalhes bibliográficos
Ano de defesa:	2018
Autor(a) principal:	Silva, Leandro Pereira da
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Pontifícia Universidade Católica do Rio Grande do Sul Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Detecção de Objetos Rede Neural Convolucional Rede Neural Aprendizagem Profunda Objetos em Contexto Object Detection Convolutional Neural Network Neural Network Deep Learning Object in Context CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
Link de acesso:	http://tede2.pucrs.br/tede2/handle/tede/8168
Resumo:	A visão computacional é a ciência que permite fornecer aos computadores a ca- pacidade de verem o mundo em sua volta. Entre as tarefas, o reconhecimento de objetos pretende classificar objetos e identificar a posição onde cada objeto está em uma imagem. Como objetos costumam ocorrer em ambientes particulares, a utilização de seus contex- tos pode ser vantajosa para melhorar a tarefa de reconhecimento de objetos. Para utilizar o contexto na tarefa de reconhecimento de objetos, a abordagem proposta realiza a iden- tificação do contexto da cena separadamente da identificação do objeto, fundindo ambas informações para a melhora da detecção do objeto. Para tanto, propomos uma nova arquite- tura composta de duas redes neurais convolucionais em paralelo: uma para a identificação do objeto e outra para a identificação do contexto no qual o objeto está inserido. Por fim, a informação de ambas as redes é concatenada para realizar a classificação do objeto. Ava- liamos a arquitetura proposta com os datasets públicos PASCAL VOC 2007 e o MS COCO, comparando o desempenho da abordagem proposta com abordagens que não utilizam o contexto. Os resultados mostram que nossa abordagem é capaz de aumentar a probabili- dade de classificação para objetos que estão em contexto e reduzir para objetos que estão fora de contexto.

Metadados do item

id	P_RS_6746665875d7148960754b0b54e9e14e
oai_identifier_str	oai:tede2.pucrs.br:tede/8168
network_acronym_str	P_RS
network_name_str	Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling	Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetosDetecção de ObjetosRede Neural ConvolucionalRede NeuralAprendizagem ProfundaObjetos em ContextoObject DetectionConvolutional Neural NetworkNeural NetworkDeep LearningObject in ContextCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOA visão computacional é a ciência que permite fornecer aos computadores a ca- pacidade de verem o mundo em sua volta. Entre as tarefas, o reconhecimento de objetos pretende classificar objetos e identificar a posição onde cada objeto está em uma imagem. Como objetos costumam ocorrer em ambientes particulares, a utilização de seus contex- tos pode ser vantajosa para melhorar a tarefa de reconhecimento de objetos. Para utilizar o contexto na tarefa de reconhecimento de objetos, a abordagem proposta realiza a iden- tificação do contexto da cena separadamente da identificação do objeto, fundindo ambas informações para a melhora da detecção do objeto. Para tanto, propomos uma nova arquite- tura composta de duas redes neurais convolucionais em paralelo: uma para a identificação do objeto e outra para a identificação do contexto no qual o objeto está inserido. Por fim, a informação de ambas as redes é concatenada para realizar a classificação do objeto. Ava- liamos a arquitetura proposta com os datasets públicos PASCAL VOC 2007 e o MS COCO, comparando o desempenho da abordagem proposta com abordagens que não utilizam o contexto. Os resultados mostram que nossa abordagem é capaz de aumentar a probabili- dade de classificação para objetos que estão em contexto e reduzir para objetos que estão fora de contexto.Computer vision is the science that aims to give computers the capability of see- ing the world around them. Among its tasks, object recognition intends to classify objects and to identify where each object is in a given image. As objects tend to occur in particular environments, their contextual association can be useful to improve the object recognition task. To address the contextual awareness on object recognition task, the proposed ap- proach performs the identification of the scene context separately from the identification of the object, fusing both information in order to improve the object detection. In order to do so, we propose a novel architecture composed of two convolutional neural networks running in parallel: one for object identification and the other to the identification of the context where the object is located. Finally, the information of the two-streams architecture is concatenated to perform the object classification. The evaluation is performed using PASCAL VOC 2007 and MS COCO public datasets, by comparing the performance of our proposed approach with architectures that do not use the scene context to perform the classification of the ob- jects. Results show that our approach is able to raise in-context object scores, and reduces out-of-context objects scores.Pontifícia Universidade Católica do Rio Grande do SulEscola PolitécnicaBrasilPUCRSPrograma de Pós-Graduação em Ciência da ComputaçãoRuiz, Duncan Dubugras Alcobahttp://lattes.cnpq.br/8250832800932125Silva, Leandro Pereira da2018-06-26T13:34:22Z2018-03-27info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://tede2.pucrs.br/tede2/handle/tede/8168porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RS2018-06-26T23:00:58Zoai:tede2.pucrs.br:tede/8168Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br\|\|opendoar:2018-06-26T23:00:58Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.none.fl_str_mv	Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos
title	Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos
spellingShingle	Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos Silva, Leandro Pereira da Detecção de Objetos Rede Neural Convolucional Rede Neural Aprendizagem Profunda Objetos em Contexto Object Detection Convolutional Neural Network Neural Network Deep Learning Object in Context CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short	Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos
title_full	Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos
title_fullStr	Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos
title_full_unstemmed	Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos
title_sort	Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos
author	Silva, Leandro Pereira da
author_facet	Silva, Leandro Pereira da
author_role	author
dc.contributor.none.fl_str_mv	Ruiz, Duncan Dubugras Alcoba http://lattes.cnpq.br/8250832800932125
dc.contributor.author.fl_str_mv	Silva, Leandro Pereira da
dc.subject.por.fl_str_mv	Detecção de Objetos Rede Neural Convolucional Rede Neural Aprendizagem Profunda Objetos em Contexto Object Detection Convolutional Neural Network Neural Network Deep Learning Object in Context CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
topic	Detecção de Objetos Rede Neural Convolucional Rede Neural Aprendizagem Profunda Objetos em Contexto Object Detection Convolutional Neural Network Neural Network Deep Learning Object in Context CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description	A visão computacional é a ciência que permite fornecer aos computadores a ca- pacidade de verem o mundo em sua volta. Entre as tarefas, o reconhecimento de objetos pretende classificar objetos e identificar a posição onde cada objeto está em uma imagem. Como objetos costumam ocorrer em ambientes particulares, a utilização de seus contex- tos pode ser vantajosa para melhorar a tarefa de reconhecimento de objetos. Para utilizar o contexto na tarefa de reconhecimento de objetos, a abordagem proposta realiza a iden- tificação do contexto da cena separadamente da identificação do objeto, fundindo ambas informações para a melhora da detecção do objeto. Para tanto, propomos uma nova arquite- tura composta de duas redes neurais convolucionais em paralelo: uma para a identificação do objeto e outra para a identificação do contexto no qual o objeto está inserido. Por fim, a informação de ambas as redes é concatenada para realizar a classificação do objeto. Ava- liamos a arquitetura proposta com os datasets públicos PASCAL VOC 2007 e o MS COCO, comparando o desempenho da abordagem proposta com abordagens que não utilizam o contexto. Os resultados mostram que nossa abordagem é capaz de aumentar a probabili- dade de classificação para objetos que estão em contexto e reduzir para objetos que estão fora de contexto.
publishDate	2018
dc.date.none.fl_str_mv	2018-06-26T13:34:22Z 2018-03-27
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://tede2.pucrs.br/tede2/handle/tede/8168
url	http://tede2.pucrs.br/tede2/handle/tede/8168
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Pontifícia Universidade Católica do Rio Grande do Sul Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação
publisher.none.fl_str_mv	Pontifícia Universidade Católica do Rio Grande do Sul Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS
instname_str	Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str	PUC_RS
institution	PUC_RS
reponame_str	Biblioteca Digital de Teses e Dissertações da PUC_RS
collection	Biblioteca Digital de Teses e Dissertações da PUC_RS
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv	biblioteca.central@pucrs.br\|\|
_version_	1850041290954113024

Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos

Registros relacionados