Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos
Ano de defesa: | 2018 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Pontif?cia Universidade Cat?lica do Rio Grande do Sul
|
Programa de Pós-Graduação: |
Programa de P?s-Gradua??o em Ci?ncia da Computa??o
|
Departamento: |
Escola Polit?cnica
|
País: |
Brasil
|
Palavras-chave em Português: | |
Palavras-chave em Inglês: | |
Área do conhecimento CNPq: | |
Link de acesso: | http://tede2.pucrs.br/tede2/handle/tede/8168 |
Resumo: | Computer vision is the science that aims to give computers the capability of see- ing the world around them. Among its tasks, object recognition intends to classify objects and to identify where each object is in a given image. As objects tend to occur in particular environments, their contextual association can be useful to improve the object recognition task. To address the contextual awareness on object recognition task, the proposed ap- proach performs the identification of the scene context separately from the identification of the object, fusing both information in order to improve the object detection. In order to do so, we propose a novel architecture composed of two convolutional neural networks running in parallel: one for object identification and the other to the identification of the context where the object is located. Finally, the information of the two-streams architecture is concatenated to perform the object classification. The evaluation is performed using PASCAL VOC 2007 and MS COCO public datasets, by comparing the performance of our proposed approach with architectures that do not use the scene context to perform the classification of the ob- jects. Results show that our approach is able to raise in-context object scores, and reduces out-of-context objects scores. |
id |
P_RS_6746665875d7148960754b0b54e9e14e |
---|---|
oai_identifier_str |
oai:tede2.pucrs.br:tede/8168 |
network_acronym_str |
P_RS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
repository_id_str |
|
spelling |
Ruiz, Duncan Dubugras Alcobahttp://lattes.cnpq.br/8250832800932125http://lattes.cnpq.br/0541028414171477Silva, Leandro Pereira da2018-06-26T13:34:22Z2018-03-27http://tede2.pucrs.br/tede2/handle/tede/8168Computer vision is the science that aims to give computers the capability of see- ing the world around them. Among its tasks, object recognition intends to classify objects and to identify where each object is in a given image. As objects tend to occur in particular environments, their contextual association can be useful to improve the object recognition task. To address the contextual awareness on object recognition task, the proposed ap- proach performs the identification of the scene context separately from the identification of the object, fusing both information in order to improve the object detection. In order to do so, we propose a novel architecture composed of two convolutional neural networks running in parallel: one for object identification and the other to the identification of the context where the object is located. Finally, the information of the two-streams architecture is concatenated to perform the object classification. The evaluation is performed using PASCAL VOC 2007 and MS COCO public datasets, by comparing the performance of our proposed approach with architectures that do not use the scene context to perform the classification of the ob- jects. Results show that our approach is able to raise in-context object scores, and reduces out-of-context objects scores.A vis?o computacional ? a ci?ncia que permite fornecer aos computadores a ca- pacidade de verem o mundo em sua volta. Entre as tarefas, o reconhecimento de objetos pretende classificar objetos e identificar a posi??o onde cada objeto est? em uma imagem. Como objetos costumam ocorrer em ambientes particulares, a utiliza??o de seus contex- tos pode ser vantajosa para melhorar a tarefa de reconhecimento de objetos. Para utilizar o contexto na tarefa de reconhecimento de objetos, a abordagem proposta realiza a iden- tifica??o do contexto da cena separadamente da identifica??o do objeto, fundindo ambas informa??es para a melhora da detec??o do objeto. Para tanto, propomos uma nova arquite- tura composta de duas redes neurais convolucionais em paralelo: uma para a identifica??o do objeto e outra para a identifica??o do contexto no qual o objeto est? inserido. Por fim, a informa??o de ambas as redes ? concatenada para realizar a classifica??o do objeto. Ava- liamos a arquitetura proposta com os datasets p?blicos PASCAL VOC 2007 e o MS COCO, comparando o desempenho da abordagem proposta com abordagens que n?o utilizam o contexto. Os resultados mostram que nossa abordagem ? capaz de aumentar a probabili- dade de classifica??o para objetos que est?o em contexto e reduzir para objetos que est?o fora de contexto.Submitted by PPG Ci?ncia da Computa??o (ppgcc@pucrs.br) on 2018-06-15T16:40:47Z No. of bitstreams: 1 LEANDRO PEREIRA DA SILVA_DIS.pdf: 16008947 bytes, checksum: 327a925ea56fcca0a86530a0eb3b1637 (MD5)Approved for entry into archive by Sheila Dias (sheila.dias@pucrs.br) on 2018-06-26T13:25:28Z (GMT) No. of bitstreams: 1 LEANDRO PEREIRA DA SILVA_DIS.pdf: 16008947 bytes, checksum: 327a925ea56fcca0a86530a0eb3b1637 (MD5)Made available in DSpace on 2018-06-26T13:34:22Z (GMT). No. of bitstreams: 1 LEANDRO PEREIRA DA SILVA_DIS.pdf: 16008947 bytes, checksum: 327a925ea56fcca0a86530a0eb3b1637 (MD5) Previous issue date: 2018-03-27application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/172628/DIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.jpgporPontif?cia Universidade Cat?lica do Rio Grande do SulPrograma de P?s-Gradua??o em Ci?ncia da Computa??oPUCRSBrasilEscola Polit?cnicaDetec??o de ObjetosRede Neural ConvolucionalRede NeuralAprendizagem ProfundaObjetos em ContextoObject DetectionConvolutional Neural NetworkNeural NetworkDeep LearningObject in ContextCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOLeannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisTrabalho n?o apresenta restri??o para publica??o1974996533081274470500500-862078257083325301info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAILDIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.jpgDIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.jpgimage/jpeg5598http://tede2.pucrs.br/tede2/bitstream/tede/8168/4/DIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.jpg4ee3cf0d65ad490630c84438b61b58ccMD54TEXTDIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.txtDIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.txttext/plain125491http://tede2.pucrs.br/tede2/bitstream/tede/8168/3/DIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.txta2d1414c8a799297b055d89ea3b20fe3MD53ORIGINALDIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdfDIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdfapplication/pdf1745852http://tede2.pucrs.br/tede2/bitstream/tede/8168/2/DIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf33ba4f9e01bfe933b903189daa72bfc1MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8610http://tede2.pucrs.br/tede2/bitstream/tede/8168/1/license.txt5a9d6006225b368ef605ba16b4f6d1beMD51tede/81682018-06-26 20:00:58.215oai:tede2.pucrs.br:tede/8168QXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBFbGV0csO0bmljYTogQ29tIGJhc2Ugbm8gZGlzcG9zdG8gbmEgTGVpIEZlZGVyYWwgbsK6OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYcOnw6NvIGVsZXRyw7RuaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWbDrWNpYSBVbml2ZXJzaWRhZGUgQ2F0w7NsaWNhIGRvIFJpbyBHcmFuZGUgZG8gU3VsLCBzZWRpYWRhIGEgQXYuIElwaXJhbmdhIDY2ODEsIFBvcnRvIEFsZWdyZSwgUmlvIEdyYW5kZSBkbyBTdWwsIGNvbSByZWdpc3RybyBkZSBDTlBKIDg4NjMwNDEzMDAwMi04MSBiZW0gY29tbyBlbSBvdXRyYXMgYmlibGlvdGVjYXMgZGlnaXRhaXMsIG5hY2lvbmFpcyBlIGludGVybmFjaW9uYWlzLCBjb25zw7NyY2lvcyBlIHJlZGVzIMOgcyBxdWFpcyBhIGJpYmxpb3RlY2EgZGEgUFVDUlMgcG9zc2EgYSB2aXIgcGFydGljaXBhciwgc2VtIMO0bnVzIGFsdXNpdm8gYW9zIGRpcmVpdG9zIGF1dG9yYWlzLCBhIHTDrXR1bG8gZGUgZGl2dWxnYcOnw6NvIGRhIHByb2R1w6fDo28gY2llbnTDrWZpY2EuCg==Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2018-06-26T23:00:58Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
dc.title.por.fl_str_mv |
Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos |
title |
Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos |
spellingShingle |
Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos Silva, Leandro Pereira da Detec??o de Objetos Rede Neural Convolucional Rede Neural Aprendizagem Profunda Objetos em Contexto Object Detection Convolutional Neural Network Neural Network Deep Learning Object in Context CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
title_short |
Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos |
title_full |
Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos |
title_fullStr |
Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos |
title_full_unstemmed |
Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos |
title_sort |
Leannet : uma arquitetura que utiliza o contexto da cena para melhorar o reconhecimento de objetos |
author |
Silva, Leandro Pereira da |
author_facet |
Silva, Leandro Pereira da |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Ruiz, Duncan Dubugras Alcoba |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/8250832800932125 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/0541028414171477 |
dc.contributor.author.fl_str_mv |
Silva, Leandro Pereira da |
contributor_str_mv |
Ruiz, Duncan Dubugras Alcoba |
dc.subject.por.fl_str_mv |
Detec??o de Objetos Rede Neural Convolucional Rede Neural Aprendizagem Profunda Objetos em Contexto |
topic |
Detec??o de Objetos Rede Neural Convolucional Rede Neural Aprendizagem Profunda Objetos em Contexto Object Detection Convolutional Neural Network Neural Network Deep Learning Object in Context CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Object Detection Convolutional Neural Network Neural Network Deep Learning Object in Context |
dc.subject.cnpq.fl_str_mv |
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
description |
Computer vision is the science that aims to give computers the capability of see- ing the world around them. Among its tasks, object recognition intends to classify objects and to identify where each object is in a given image. As objects tend to occur in particular environments, their contextual association can be useful to improve the object recognition task. To address the contextual awareness on object recognition task, the proposed ap- proach performs the identification of the scene context separately from the identification of the object, fusing both information in order to improve the object detection. In order to do so, we propose a novel architecture composed of two convolutional neural networks running in parallel: one for object identification and the other to the identification of the context where the object is located. Finally, the information of the two-streams architecture is concatenated to perform the object classification. The evaluation is performed using PASCAL VOC 2007 and MS COCO public datasets, by comparing the performance of our proposed approach with architectures that do not use the scene context to perform the classification of the ob- jects. Results show that our approach is able to raise in-context object scores, and reduces out-of-context objects scores. |
publishDate |
2018 |
dc.date.accessioned.fl_str_mv |
2018-06-26T13:34:22Z |
dc.date.issued.fl_str_mv |
2018-03-27 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://tede2.pucrs.br/tede2/handle/tede/8168 |
url |
http://tede2.pucrs.br/tede2/handle/tede/8168 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.program.fl_str_mv |
1974996533081274470 |
dc.relation.confidence.fl_str_mv |
500 500 |
dc.relation.cnpq.fl_str_mv |
-862078257083325301 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontif?cia Universidade Cat?lica do Rio Grande do Sul |
dc.publisher.program.fl_str_mv |
Programa de P?s-Gradua??o em Ci?ncia da Computa??o |
dc.publisher.initials.fl_str_mv |
PUCRS |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Escola Polit?cnica |
publisher.none.fl_str_mv |
Pontif?cia Universidade Cat?lica do Rio Grande do Sul |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
instacron_str |
PUC_RS |
institution |
PUC_RS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
collection |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
bitstream.url.fl_str_mv |
http://tede2.pucrs.br/tede2/bitstream/tede/8168/4/DIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.jpg http://tede2.pucrs.br/tede2/bitstream/tede/8168/3/DIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf.txt http://tede2.pucrs.br/tede2/bitstream/tede/8168/2/DIS_LEANDRO_PEREIRA_DA_SILVA_COMPLETO.pdf http://tede2.pucrs.br/tede2/bitstream/tede/8168/1/license.txt |
bitstream.checksum.fl_str_mv |
4ee3cf0d65ad490630c84438b61b58cc a2d1414c8a799297b055d89ea3b20fe3 33ba4f9e01bfe933b903189daa72bfc1 5a9d6006225b368ef605ba16b4f6d1be |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
repository.mail.fl_str_mv |
biblioteca.central@pucrs.br|| |
_version_ |
1796793234535481344 |