Segmentação de imagens de pessoas em tempo real para videoconferências

Parolin, Alessandro

Segmentação de imagens de pessoas em tempo real para videoconferências

Detalhes bibliográficos
Ano de defesa:	2011
Autor(a) principal:	Parolin, Alessandro
Orientador(a):	Oliveira, Luiz Paulo Luna de
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Universidade do Vale do Rio dos Sinos
Programa de Pós-Graduação:	Programa de Pós-Graduação em Computação Aplicada
Departamento:	Escola Politécnica
País:	Brasil
Palavras-chave em Português:	Videoconferências Processamento de imagens Detecção de faces Segmentação de objetos Visão computacional Interação homem-máquina
Palavras-chave em Inglês:	Human segmentation Image processing Computer vision Face detection
Área do conhecimento CNPq:	ACCNPQ::Ciências Exatas e da Terra::Ciência da Computação
Link de acesso:	http://www.repositorio.jesuita.org.br/handle/UNISINOS/3005
Resumo:	Segmentação de objetos em imagens e vídeos é uma área relativamente antiga na área de processamento de imagens e visão computacional. De fato, recentemente, devido à grande evolução dos sistemas computacionais em termos de hardware e à popularização da internet, uma aplicação de segmentação de imagens de pessoas que vem ganhando grande destaque na área acadêmica e comercial são as videoconferências. Esse tipo de aplicação traz benefícios a diferentes áreas, como telemedicina, educação à distância, e principalmente empresarial. Diversas empresas utilizam esse tipo de recurso para realizar reuniões/conferências a nível global economizando quantias consideráveis de recursos. No entanto, videoconferências ainda não proporcionam a mesma experiência que as pessoas têm quando estão num mesmo ambiente. Portanto, esse trabalho propõe o desenvolvimento de um sistema de segmentação da imagem do locutor, específico para videoconferências, a fim de permitir futuros processamentos que aumentem a sensação de imersão dos participantes, como por exemplo, a substituição do fundo da imagem por um fundo padrão em todos ambientes. O sistema proposto utiliza basicamente um algoritmo de programação dinâmica guiado por energias extraídas da imagem, envolvendo informações de borda, movimento e probabilidade. Através de diversos testes realizados, observou-se que o sistema apresenta resultados equiparáveis aos do estado da arte do tema, sendo capaz de ser executado em tempo real a uma taxa de 8 FPS, mesmo com um código não otimizado. O grande diferencial do sistema proposto é que nenhum tipo de treinamento prévio é necessário para efetuar a segmentação

Metadados do item

id	USIN_390a89d81b969a4b686ba5b3994f6e8c
oai_identifier_str	oai:www.repositorio.jesuita.org.br:UNISINOS/3005
network_acronym_str	USIN
network_name_str	Repositório Institucional da UNISINOS (RBDU Repositório Digital da Biblioteca da Unisinos)
repository_id_str
spelling	2015-03-16T14:26:47Z2015-03-16T14:26:47Z2011-03-22Submitted by Mariana Dornelles Vargas (marianadv) on 2015-03-16T14:26:47Z No. of bitstreams: 1 segmentacao_imagens.pdf: 6472132 bytes, checksum: b5a25706eff2375403bc63c7d6a89f0d (MD5)Made available in DSpace on 2015-03-16T14:26:47Z (GMT). No. of bitstreams: 1 segmentacao_imagens.pdf: 6472132 bytes, checksum: b5a25706eff2375403bc63c7d6a89f0d (MD5) Previous issue date: 2011Segmentação de objetos em imagens e vídeos é uma área relativamente antiga na área de processamento de imagens e visão computacional. De fato, recentemente, devido à grande evolução dos sistemas computacionais em termos de hardware e à popularização da internet, uma aplicação de segmentação de imagens de pessoas que vem ganhando grande destaque na área acadêmica e comercial são as videoconferências. Esse tipo de aplicação traz benefícios a diferentes áreas, como telemedicina, educação à distância, e principalmente empresarial. Diversas empresas utilizam esse tipo de recurso para realizar reuniões/conferências a nível global economizando quantias consideráveis de recursos. No entanto, videoconferências ainda não proporcionam a mesma experiência que as pessoas têm quando estão num mesmo ambiente. Portanto, esse trabalho propõe o desenvolvimento de um sistema de segmentação da imagem do locutor, específico para videoconferências, a fim de permitir futuros processamentos que aumentem a sensação de imersão dos participantes, como por exemplo, a substituição do fundo da imagem por um fundo padrão em todos ambientes. O sistema proposto utiliza basicamente um algoritmo de programação dinâmica guiado por energias extraídas da imagem, envolvendo informações de borda, movimento e probabilidade. Através de diversos testes realizados, observou-se que o sistema apresenta resultados equiparáveis aos do estado da arte do tema, sendo capaz de ser executado em tempo real a uma taxa de 8 FPS, mesmo com um código não otimizado. O grande diferencial do sistema proposto é que nenhum tipo de treinamento prévio é necessário para efetuar a segmentaçãoObject segmentation has been discussed on Computer Vision and Image processing fields for quite some time. Recently, given the hardware evolution and popularization of the World Wide Web, videoconferences have been the main discussion in this area. This technique brings advantages to many fields, such as telemedicine, education (distance learning), and mainly to the business world. Many companies use videoconferences for worldwide meetings, in order to save a substantial amount o f resources. However, videoconferences still do not provide the same experience a s people have when they are in the same room. Therefore, in this paper we propose the development of a system to segment the image of a person who is attending the videoconference, in order to allow future processing that may increase the experience of being in the same room. For instance, the background of the scene could be replaced by a standard one for all participants. The proposed system uses a dynamic programming algorithm guided by energies, such as image edges, motion and probabilistic information. After extensive tests, we could conclude that the results obtained are comparable to other state of the art works and the system is able to execute in real time at 8 FPS. The advantage of the proposed system when compared to others is that no previous training is required in order to perform the segmentationHP - Hewlett-Packard Brasil LtdaMilton ValenteParolin, Alessandrohttp://lattes.cnpq.br/6931013337647100http://lattes.cnpq.br/0625922822611048Oliveira, Luiz Paulo Luna deUniversidade do Vale do Rio dos SinosPrograma de Pós-Graduação em Computação AplicadaUnisinosBrasilEscola PolitécnicaSegmentação de imagens de pessoas em tempo real para videoconferênciasACCNPQ::Ciências Exatas e da Terra::Ciência da ComputaçãoVideoconferênciasProcessamento de imagensDetecção de facesSegmentação de objetosVisão computacionalInteração homem-máquinaHuman segmentationImage processingComputer visionFace detectioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://www.repositorio.jesuita.org.br/handle/UNISINOS/3005info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UNISINOS (RBDU Repositório Digital da Biblioteca da Unisinos)instname:Universidade do Vale do Rio dos Sinos (UNISINOS)instacron:UNISINOSORIGINALsegmentacao_imagens.pdfsegmentacao_imagens.pdfapplication/pdf6472132http://repositorio.jesuita.org.br/bitstream/UNISINOS/3005/1/segmentacao_imagens.pdfb5a25706eff2375403bc63c7d6a89f0dMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82097http://repositorio.jesuita.org.br/bitstream/UNISINOS/3005/2/license.txt30aee977a52392c99464e4663dd115a2MD52UNISINOS/30052015-03-31 08:34:59.934oai:www.repositorio.jesuita.org.br:UNISINOS/3005Tk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSP1BSSUEgTElDRU4/QQpFc3RhIGxpY2VuP2EgZGUgZXhlbXBsbyA/IGZvcm5lY2lkYSBhcGVuYXMgcGFyYSBmaW5zIGluZm9ybWF0aXZvcy4KCkxJQ0VOP0EgREUgRElTVFJJQlVJPz9PIE4/Ty1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YT8/byBkZXN0YSBsaWNlbj9hLCB2b2M/IChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSA/IApVbml2ZXJzaWRhZGUgZG8gVmFsZSBkbyBSaW8gZG9zIFNpbm9zIChVTklTSU5PUykgbyBkaXJlaXRvIG4/by1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGE/P28gKGluY2x1aW5kbyBvIHJlc3VtbykgcG9yIHRvZG8gbyBtdW5kbyBubyBmb3JtYXRvIGltcHJlc3NvIGUgZWxldHI/bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3MgP3VkaW8gb3Ugdj9kZW8uCgpWb2M/IGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlP2RvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhPz9vIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmE/P28uCgpWb2M/IHRhbWI/bSBjb25jb3JkYSBxdWUgYSBTaWdsYSBkZSBVbml2ZXJzaWRhZGUgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgYz9waWEgYSBzdWEgdGVzZSBvdSAKZGlzc2VydGE/P28gcGFyYSBmaW5zIGRlIHNlZ3VyYW4/YSwgYmFjay11cCBlIHByZXNlcnZhPz9vLgoKVm9jPyBkZWNsYXJhIHF1ZSBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhPz9vID8gb3JpZ2luYWwgZSBxdWUgdm9jPyB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW4/YS4gVm9jPyB0YW1iP20gZGVjbGFyYSBxdWUgbyBkZXA/c2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YT8/byBuP28sIHF1ZSBzZWphIGRlIHNldSAKY29uaGVjaW1lbnRvLCBpbmZyaW5nZSBkaXJlaXRvcyBhdXRvcmFpcyBkZSBuaW5ndT9tLgoKQ2FzbyBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhPz9vIGNvbnRlbmhhIG1hdGVyaWFsIHF1ZSB2b2M/IG4/byBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2M/IApkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzP28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciA/IFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2VuP2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdD8gY2xhcmFtZW50ZSAKaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGU/ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YT8/byBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBPz9PIE9SQSBERVBPU0lUQURBIFRFTkhBIFNJRE8gUkVTVUxUQURPIERFIFVNIFBBVFJPQz9OSU8gT1UgCkFQT0lPIERFIFVNQSBBRz9OQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOP08gU0VKQSBBIFNJR0xBIERFIApVTklWRVJTSURBREUsIFZPQz8gREVDTEFSQSBRVUUgUkVTUEVJVE9VIFRPRE9TIEUgUVVBSVNRVUVSIERJUkVJVE9TIERFIFJFVklTP08gQ09NTyAKVEFNQj9NIEFTIERFTUFJUyBPQlJJR0E/P0VTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YT8/bywgZSBuP28gZmFyPyBxdWFscXVlciBhbHRlcmE/P28sIGFsP20gZGFxdWVsYXMgCmNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW4/YS4KBiblioteca Digital de Teses e Dissertaçõeshttp://www.repositorio.jesuita.org.br/oai/requestopendoar:2015-03-31T11:34:59Repositório Institucional da UNISINOS (RBDU Repositório Digital da Biblioteca da Unisinos) - Universidade do Vale do Rio dos Sinos (UNISINOS)false
dc.title.pt_BR.fl_str_mv	Segmentação de imagens de pessoas em tempo real para videoconferências
title	Segmentação de imagens de pessoas em tempo real para videoconferências
spellingShingle	Segmentação de imagens de pessoas em tempo real para videoconferências Parolin, Alessandro ACCNPQ::Ciências Exatas e da Terra::Ciência da Computação Videoconferências Processamento de imagens Detecção de faces Segmentação de objetos Visão computacional Interação homem-máquina Human segmentation Image processing Computer vision Face detection
title_short	Segmentação de imagens de pessoas em tempo real para videoconferências
title_full	Segmentação de imagens de pessoas em tempo real para videoconferências
title_fullStr	Segmentação de imagens de pessoas em tempo real para videoconferências
title_full_unstemmed	Segmentação de imagens de pessoas em tempo real para videoconferências
title_sort	Segmentação de imagens de pessoas em tempo real para videoconferências
author	Parolin, Alessandro
author_facet	Parolin, Alessandro
author_role	author
dc.contributor.authorLattes.pt_BR.fl_str_mv	http://lattes.cnpq.br/6931013337647100
dc.contributor.advisorLattes.pt_BR.fl_str_mv	http://lattes.cnpq.br/0625922822611048
dc.contributor.author.fl_str_mv	Parolin, Alessandro
dc.contributor.advisor1.fl_str_mv	Oliveira, Luiz Paulo Luna de
contributor_str_mv	Oliveira, Luiz Paulo Luna de
dc.subject.cnpq.fl_str_mv	ACCNPQ::Ciências Exatas e da Terra::Ciência da Computação
topic	ACCNPQ::Ciências Exatas e da Terra::Ciência da Computação Videoconferências Processamento de imagens Detecção de faces Segmentação de objetos Visão computacional Interação homem-máquina Human segmentation Image processing Computer vision Face detection
dc.subject.por.fl_str_mv	Videoconferências Processamento de imagens Detecção de faces Segmentação de objetos Visão computacional Interação homem-máquina
dc.subject.eng.fl_str_mv	Human segmentation Image processing Computer vision Face detection
description	Segmentação de objetos em imagens e vídeos é uma área relativamente antiga na área de processamento de imagens e visão computacional. De fato, recentemente, devido à grande evolução dos sistemas computacionais em termos de hardware e à popularização da internet, uma aplicação de segmentação de imagens de pessoas que vem ganhando grande destaque na área acadêmica e comercial são as videoconferências. Esse tipo de aplicação traz benefícios a diferentes áreas, como telemedicina, educação à distância, e principalmente empresarial. Diversas empresas utilizam esse tipo de recurso para realizar reuniões/conferências a nível global economizando quantias consideráveis de recursos. No entanto, videoconferências ainda não proporcionam a mesma experiência que as pessoas têm quando estão num mesmo ambiente. Portanto, esse trabalho propõe o desenvolvimento de um sistema de segmentação da imagem do locutor, específico para videoconferências, a fim de permitir futuros processamentos que aumentem a sensação de imersão dos participantes, como por exemplo, a substituição do fundo da imagem por um fundo padrão em todos ambientes. O sistema proposto utiliza basicamente um algoritmo de programação dinâmica guiado por energias extraídas da imagem, envolvendo informações de borda, movimento e probabilidade. Através de diversos testes realizados, observou-se que o sistema apresenta resultados equiparáveis aos do estado da arte do tema, sendo capaz de ser executado em tempo real a uma taxa de 8 FPS, mesmo com um código não otimizado. O grande diferencial do sistema proposto é que nenhum tipo de treinamento prévio é necessário para efetuar a segmentação
publishDate	2011
dc.date.issued.fl_str_mv	2011-03-22
dc.date.accessioned.fl_str_mv	2015-03-16T14:26:47Z
dc.date.available.fl_str_mv	2015-03-16T14:26:47Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://www.repositorio.jesuita.org.br/handle/UNISINOS/3005
url	http://www.repositorio.jesuita.org.br/handle/UNISINOS/3005
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade do Vale do Rio dos Sinos
dc.publisher.program.fl_str_mv	Programa de Pós-Graduação em Computação Aplicada
dc.publisher.initials.fl_str_mv	Unisinos
dc.publisher.country.fl_str_mv	Brasil
dc.publisher.department.fl_str_mv	Escola Politécnica
publisher.none.fl_str_mv	Universidade do Vale do Rio dos Sinos
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UNISINOS (RBDU Repositório Digital da Biblioteca da Unisinos) instname:Universidade do Vale do Rio dos Sinos (UNISINOS) instacron:UNISINOS
instname_str	Universidade do Vale do Rio dos Sinos (UNISINOS)
instacron_str	UNISINOS
institution	UNISINOS
reponame_str	Repositório Institucional da UNISINOS (RBDU Repositório Digital da Biblioteca da Unisinos)
collection	Repositório Institucional da UNISINOS (RBDU Repositório Digital da Biblioteca da Unisinos)
bitstream.url.fl_str_mv	http://repositorio.jesuita.org.br/bitstream/UNISINOS/3005/1/segmentacao_imagens.pdf http://repositorio.jesuita.org.br/bitstream/UNISINOS/3005/2/license.txt
bitstream.checksum.fl_str_mv	b5a25706eff2375403bc63c7d6a89f0d 30aee977a52392c99464e4663dd115a2
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UNISINOS (RBDU Repositório Digital da Biblioteca da Unisinos) - Universidade do Vale do Rio dos Sinos (UNISINOS)
repository.mail.fl_str_mv
_version_	1797220855934091264

Segmentação de imagens de pessoas em tempo real para videoconferências

Registros relacionados