An efficient strategy for estimation of visually salient regions in images

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Lie, Maiko Min Ian
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Tecnológica Federal do Paraná
Curitiba
Brasil
Mestrado em Engenharia Elétrica e Informática Industrial
UTFPR
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.utfpr.edu.br/jspui/handle/1/3302
Resumo: The information incident on the human visual system is bound by a selection mechanism, known as visual attention. This mechanism is responsible for restricting incomingvisual information to a smaller and potentially important subset for further processing,enabling the visual system to respond rapidly, despite the enormous amount of information to which it is subject. Computer vision systems often employ reproductionsof this mechanism in order to reduce visual search space, since this strategy can leadto substantial improvement in efficiency. This thesis addresses the problem of efficient computation of visual attention, particularly the case of salient region detection. A strategy based on joint upsampling of coarse-scale saliency estimates is presented for that purpose. This approach allows leveraging both the advantages of coarsescale estimation (reduction of computational cost, abstraction of unnecessary details) and fine-scale edge information (high accuracy). Based on the highly redundant data and spatially-varying importance of content in images of real-world scenes, two visual saliency formulations are presented for coarse-scale estimation in the proposed strategy. The first approach operates on a pixel level, based on random color distances. The second approach operates on a patch level, based on the reconstruction error computed from the Principal Component Analysis of the image boundaries. The efficacy and efficiency of the proposed strategy are demonstrated through assessment on the ASD, MSRA10K, ECSSD, and DUT-OMRON datasets. Comparison with other seven state-of-the-art methods in terms of precision, recall, F-measure, and execution time demonstrate that the proposed strategy is highly competitive, achieving one of the best trade-offs between accuracy and execution time.
id UTFPR-12_8866b26483d36441d62791a8798d7dec
oai_identifier_str oai:repositorio.utfpr.edu.br:1/3302
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling An efficient strategy for estimation of visually salient regions in imagesUma estratégia eficiente para estimação de regiões visualmente salientes em imagensPercepção visualAtenção - Simulação por computadorVisão por computadorProcessamento de imagens - Técnicas digitaisAlgorítmos computacionaisSistemas de reconhecimento de padrõesMétodos de simulaçãoEngenharia de computadorEngenharia elétricaVisual perceptionAttention - Computer simulationComputer visionImage processing - Digital techniquesComputer algorithmsPattern recognition systemsSimulation methodsComputer engineeringElectric engineeringCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::PROCESSAMENTO GRAFICO (GRAPHICS)Engenharia ElétricaThe information incident on the human visual system is bound by a selection mechanism, known as visual attention. This mechanism is responsible for restricting incomingvisual information to a smaller and potentially important subset for further processing,enabling the visual system to respond rapidly, despite the enormous amount of information to which it is subject. Computer vision systems often employ reproductionsof this mechanism in order to reduce visual search space, since this strategy can leadto substantial improvement in efficiency. This thesis addresses the problem of efficient computation of visual attention, particularly the case of salient region detection. A strategy based on joint upsampling of coarse-scale saliency estimates is presented for that purpose. This approach allows leveraging both the advantages of coarsescale estimation (reduction of computational cost, abstraction of unnecessary details) and fine-scale edge information (high accuracy). Based on the highly redundant data and spatially-varying importance of content in images of real-world scenes, two visual saliency formulations are presented for coarse-scale estimation in the proposed strategy. The first approach operates on a pixel level, based on random color distances. The second approach operates on a patch level, based on the reconstruction error computed from the Principal Component Analysis of the image boundaries. The efficacy and efficiency of the proposed strategy are demonstrated through assessment on the ASD, MSRA10K, ECSSD, and DUT-OMRON datasets. Comparison with other seven state-of-the-art methods in terms of precision, recall, F-measure, and execution time demonstrate that the proposed strategy is highly competitive, achieving one of the best trade-offs between accuracy and execution time.A informação incidente no sistema visual humano é limitada por um mecanismo de seleção, conhecido como atenção visual. Este mecanismo é responsável por restringir a informação visual incidente a um subconjunto menor e potencialmente importante para processamento adicional, permitindo que o sistema visual responda rapidamente apesar da enorme quantidade de informação ao qual normalmente está sujeito. Sistemas de visão computacional empregam reproduções deste mecanismo para redução de espaço visual, visto que essa estratégia pode levar a substanciais ganhos em eficiência. Esta dissertação trata do problema de computação eficiente de atenção visual, em particular o caso de detecção de regiões salientes. Uma estratégia com base em sobreamostragem conjunta (joint upsampling), de estimativas de saliência em baixa resolução é apresentada com esse propósito. Isso permite explorar tanto as vantagens de estimativa em baixa-resolução (redução de custo computacional, abstração de detalhes desnecessários) quanto as de bordas em alta-resolução (alta acurácia). Com base na alta redundância de dados e importância espacialmente-variável no conteúdo de imagens de cenas reais, duas formulações de saliência visual são apresentadas para estimativa em baixa resolução na estratégia proposta. A primeira opera em nível de pixel, baseada em distâncias de cor aleatórias. A segunda opera em nível de patch, baseada em erro de reconstrução por bases obtidas através de Análise de Componentes Principais nas margens da imagem. A eficácia e eficiência da estratégia proposta são demonstradas através de avaliação nos bancos de imagens ASD, MSRA10K, ECSSD, e DUTOMRON. Uma comparação com outros sete métodos do estado-da-arte em termos de precisão, abrangência, F-measure e tempo de execução demonstra que a estratégia proposta é altamente competitiva, alcançando uma das maiores relações custo-benefício entre acurácia e tempo de execução.Universidade Tecnológica Federal do ParanáCuritibaBrasilMestrado em Engenharia Elétrica e Informática IndustrialUTFPRVieira Neto, Hugohttp://lattes.cnpq.br/8827447995496589Borba, Gustavo Benvenuttihttp://lattes.cnpq.br/2591233508037006Vieira Neto, HugoFarias, Mylène Christine Queiroz deSchwartz, William RobsonNassu, Bogdan TomoyukiLie, Maiko Min Ian2018-08-02T16:10:53Z2018-08-02T16:10:53Z2018-03-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfLIE, Maiko Min Ian. An efficient strategy for estimation of visually salient regions in images. 2018. 69 f. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2018.http://repositorio.utfpr.edu.br/jspui/handle/1/3302enginfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2018-08-20T21:38:27Zoai:repositorio.utfpr.edu.br:1/3302Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2018-08-20T21:38:27Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv An efficient strategy for estimation of visually salient regions in images
Uma estratégia eficiente para estimação de regiões visualmente salientes em imagens
title An efficient strategy for estimation of visually salient regions in images
spellingShingle An efficient strategy for estimation of visually salient regions in images
Lie, Maiko Min Ian
Percepção visual
Atenção - Simulação por computador
Visão por computador
Processamento de imagens - Técnicas digitais
Algorítmos computacionais
Sistemas de reconhecimento de padrões
Métodos de simulação
Engenharia de computador
Engenharia elétrica
Visual perception
Attention - Computer simulation
Computer vision
Image processing - Digital techniques
Computer algorithms
Pattern recognition systems
Simulation methods
Computer engineering
Electric engineering
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::PROCESSAMENTO GRAFICO (GRAPHICS)
Engenharia Elétrica
title_short An efficient strategy for estimation of visually salient regions in images
title_full An efficient strategy for estimation of visually salient regions in images
title_fullStr An efficient strategy for estimation of visually salient regions in images
title_full_unstemmed An efficient strategy for estimation of visually salient regions in images
title_sort An efficient strategy for estimation of visually salient regions in images
author Lie, Maiko Min Ian
author_facet Lie, Maiko Min Ian
author_role author
dc.contributor.none.fl_str_mv Vieira Neto, Hugo
http://lattes.cnpq.br/8827447995496589
Borba, Gustavo Benvenutti
http://lattes.cnpq.br/2591233508037006
Vieira Neto, Hugo
Farias, Mylène Christine Queiroz de
Schwartz, William Robson
Nassu, Bogdan Tomoyuki
dc.contributor.author.fl_str_mv Lie, Maiko Min Ian
dc.subject.por.fl_str_mv Percepção visual
Atenção - Simulação por computador
Visão por computador
Processamento de imagens - Técnicas digitais
Algorítmos computacionais
Sistemas de reconhecimento de padrões
Métodos de simulação
Engenharia de computador
Engenharia elétrica
Visual perception
Attention - Computer simulation
Computer vision
Image processing - Digital techniques
Computer algorithms
Pattern recognition systems
Simulation methods
Computer engineering
Electric engineering
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::PROCESSAMENTO GRAFICO (GRAPHICS)
Engenharia Elétrica
topic Percepção visual
Atenção - Simulação por computador
Visão por computador
Processamento de imagens - Técnicas digitais
Algorítmos computacionais
Sistemas de reconhecimento de padrões
Métodos de simulação
Engenharia de computador
Engenharia elétrica
Visual perception
Attention - Computer simulation
Computer vision
Image processing - Digital techniques
Computer algorithms
Pattern recognition systems
Simulation methods
Computer engineering
Electric engineering
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::PROCESSAMENTO GRAFICO (GRAPHICS)
Engenharia Elétrica
description The information incident on the human visual system is bound by a selection mechanism, known as visual attention. This mechanism is responsible for restricting incomingvisual information to a smaller and potentially important subset for further processing,enabling the visual system to respond rapidly, despite the enormous amount of information to which it is subject. Computer vision systems often employ reproductionsof this mechanism in order to reduce visual search space, since this strategy can leadto substantial improvement in efficiency. This thesis addresses the problem of efficient computation of visual attention, particularly the case of salient region detection. A strategy based on joint upsampling of coarse-scale saliency estimates is presented for that purpose. This approach allows leveraging both the advantages of coarsescale estimation (reduction of computational cost, abstraction of unnecessary details) and fine-scale edge information (high accuracy). Based on the highly redundant data and spatially-varying importance of content in images of real-world scenes, two visual saliency formulations are presented for coarse-scale estimation in the proposed strategy. The first approach operates on a pixel level, based on random color distances. The second approach operates on a patch level, based on the reconstruction error computed from the Principal Component Analysis of the image boundaries. The efficacy and efficiency of the proposed strategy are demonstrated through assessment on the ASD, MSRA10K, ECSSD, and DUT-OMRON datasets. Comparison with other seven state-of-the-art methods in terms of precision, recall, F-measure, and execution time demonstrate that the proposed strategy is highly competitive, achieving one of the best trade-offs between accuracy and execution time.
publishDate 2018
dc.date.none.fl_str_mv 2018-08-02T16:10:53Z
2018-08-02T16:10:53Z
2018-03-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv LIE, Maiko Min Ian. An efficient strategy for estimation of visually salient regions in images. 2018. 69 f. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2018.
http://repositorio.utfpr.edu.br/jspui/handle/1/3302
identifier_str_mv LIE, Maiko Min Ian. An efficient strategy for estimation of visually salient regions in images. 2018. 69 f. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2018.
url http://repositorio.utfpr.edu.br/jspui/handle/1/3302
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Curitiba
Brasil
Mestrado em Engenharia Elétrica e Informática Industrial
UTFPR
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Curitiba
Brasil
Mestrado em Engenharia Elétrica e Informática Industrial
UTFPR
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850498301837705216