An efficient strategy for estimation of visually salient regions in images
| Ano de defesa: | 2018 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Universidade Tecnológica Federal do Paraná
Curitiba Brasil Mestrado em Engenharia Elétrica e Informática Industrial UTFPR |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://repositorio.utfpr.edu.br/jspui/handle/1/3302 |
Resumo: | The information incident on the human visual system is bound by a selection mechanism, known as visual attention. This mechanism is responsible for restricting incomingvisual information to a smaller and potentially important subset for further processing,enabling the visual system to respond rapidly, despite the enormous amount of information to which it is subject. Computer vision systems often employ reproductionsof this mechanism in order to reduce visual search space, since this strategy can leadto substantial improvement in efficiency. This thesis addresses the problem of efficient computation of visual attention, particularly the case of salient region detection. A strategy based on joint upsampling of coarse-scale saliency estimates is presented for that purpose. This approach allows leveraging both the advantages of coarsescale estimation (reduction of computational cost, abstraction of unnecessary details) and fine-scale edge information (high accuracy). Based on the highly redundant data and spatially-varying importance of content in images of real-world scenes, two visual saliency formulations are presented for coarse-scale estimation in the proposed strategy. The first approach operates on a pixel level, based on random color distances. The second approach operates on a patch level, based on the reconstruction error computed from the Principal Component Analysis of the image boundaries. The efficacy and efficiency of the proposed strategy are demonstrated through assessment on the ASD, MSRA10K, ECSSD, and DUT-OMRON datasets. Comparison with other seven state-of-the-art methods in terms of precision, recall, F-measure, and execution time demonstrate that the proposed strategy is highly competitive, achieving one of the best trade-offs between accuracy and execution time. |
| id |
UTFPR-12_8866b26483d36441d62791a8798d7dec |
|---|---|
| oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/3302 |
| network_acronym_str |
UTFPR-12 |
| network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository_id_str |
|
| spelling |
An efficient strategy for estimation of visually salient regions in imagesUma estratégia eficiente para estimação de regiões visualmente salientes em imagensPercepção visualAtenção - Simulação por computadorVisão por computadorProcessamento de imagens - Técnicas digitaisAlgorítmos computacionaisSistemas de reconhecimento de padrõesMétodos de simulaçãoEngenharia de computadorEngenharia elétricaVisual perceptionAttention - Computer simulationComputer visionImage processing - Digital techniquesComputer algorithmsPattern recognition systemsSimulation methodsComputer engineeringElectric engineeringCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::PROCESSAMENTO GRAFICO (GRAPHICS)Engenharia ElétricaThe information incident on the human visual system is bound by a selection mechanism, known as visual attention. This mechanism is responsible for restricting incomingvisual information to a smaller and potentially important subset for further processing,enabling the visual system to respond rapidly, despite the enormous amount of information to which it is subject. Computer vision systems often employ reproductionsof this mechanism in order to reduce visual search space, since this strategy can leadto substantial improvement in efficiency. This thesis addresses the problem of efficient computation of visual attention, particularly the case of salient region detection. A strategy based on joint upsampling of coarse-scale saliency estimates is presented for that purpose. This approach allows leveraging both the advantages of coarsescale estimation (reduction of computational cost, abstraction of unnecessary details) and fine-scale edge information (high accuracy). Based on the highly redundant data and spatially-varying importance of content in images of real-world scenes, two visual saliency formulations are presented for coarse-scale estimation in the proposed strategy. The first approach operates on a pixel level, based on random color distances. The second approach operates on a patch level, based on the reconstruction error computed from the Principal Component Analysis of the image boundaries. The efficacy and efficiency of the proposed strategy are demonstrated through assessment on the ASD, MSRA10K, ECSSD, and DUT-OMRON datasets. Comparison with other seven state-of-the-art methods in terms of precision, recall, F-measure, and execution time demonstrate that the proposed strategy is highly competitive, achieving one of the best trade-offs between accuracy and execution time.A informação incidente no sistema visual humano é limitada por um mecanismo de seleção, conhecido como atenção visual. Este mecanismo é responsável por restringir a informação visual incidente a um subconjunto menor e potencialmente importante para processamento adicional, permitindo que o sistema visual responda rapidamente apesar da enorme quantidade de informação ao qual normalmente está sujeito. Sistemas de visão computacional empregam reproduções deste mecanismo para redução de espaço visual, visto que essa estratégia pode levar a substanciais ganhos em eficiência. Esta dissertação trata do problema de computação eficiente de atenção visual, em particular o caso de detecção de regiões salientes. Uma estratégia com base em sobreamostragem conjunta (joint upsampling), de estimativas de saliência em baixa resolução é apresentada com esse propósito. Isso permite explorar tanto as vantagens de estimativa em baixa-resolução (redução de custo computacional, abstração de detalhes desnecessários) quanto as de bordas em alta-resolução (alta acurácia). Com base na alta redundância de dados e importância espacialmente-variável no conteúdo de imagens de cenas reais, duas formulações de saliência visual são apresentadas para estimativa em baixa resolução na estratégia proposta. A primeira opera em nível de pixel, baseada em distâncias de cor aleatórias. A segunda opera em nível de patch, baseada em erro de reconstrução por bases obtidas através de Análise de Componentes Principais nas margens da imagem. A eficácia e eficiência da estratégia proposta são demonstradas através de avaliação nos bancos de imagens ASD, MSRA10K, ECSSD, e DUTOMRON. Uma comparação com outros sete métodos do estado-da-arte em termos de precisão, abrangência, F-measure e tempo de execução demonstra que a estratégia proposta é altamente competitiva, alcançando uma das maiores relações custo-benefício entre acurácia e tempo de execução.Universidade Tecnológica Federal do ParanáCuritibaBrasilMestrado em Engenharia Elétrica e Informática IndustrialUTFPRVieira Neto, Hugohttp://lattes.cnpq.br/8827447995496589Borba, Gustavo Benvenuttihttp://lattes.cnpq.br/2591233508037006Vieira Neto, HugoFarias, Mylène Christine Queiroz deSchwartz, William RobsonNassu, Bogdan TomoyukiLie, Maiko Min Ian2018-08-02T16:10:53Z2018-08-02T16:10:53Z2018-03-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfLIE, Maiko Min Ian. An efficient strategy for estimation of visually salient regions in images. 2018. 69 f. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2018.http://repositorio.utfpr.edu.br/jspui/handle/1/3302enginfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2018-08-20T21:38:27Zoai:repositorio.utfpr.edu.br:1/3302Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2018-08-20T21:38:27Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
| dc.title.none.fl_str_mv |
An efficient strategy for estimation of visually salient regions in images Uma estratégia eficiente para estimação de regiões visualmente salientes em imagens |
| title |
An efficient strategy for estimation of visually salient regions in images |
| spellingShingle |
An efficient strategy for estimation of visually salient regions in images Lie, Maiko Min Ian Percepção visual Atenção - Simulação por computador Visão por computador Processamento de imagens - Técnicas digitais Algorítmos computacionais Sistemas de reconhecimento de padrões Métodos de simulação Engenharia de computador Engenharia elétrica Visual perception Attention - Computer simulation Computer vision Image processing - Digital techniques Computer algorithms Pattern recognition systems Simulation methods Computer engineering Electric engineering CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::PROCESSAMENTO GRAFICO (GRAPHICS) Engenharia Elétrica |
| title_short |
An efficient strategy for estimation of visually salient regions in images |
| title_full |
An efficient strategy for estimation of visually salient regions in images |
| title_fullStr |
An efficient strategy for estimation of visually salient regions in images |
| title_full_unstemmed |
An efficient strategy for estimation of visually salient regions in images |
| title_sort |
An efficient strategy for estimation of visually salient regions in images |
| author |
Lie, Maiko Min Ian |
| author_facet |
Lie, Maiko Min Ian |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Vieira Neto, Hugo http://lattes.cnpq.br/8827447995496589 Borba, Gustavo Benvenutti http://lattes.cnpq.br/2591233508037006 Vieira Neto, Hugo Farias, Mylène Christine Queiroz de Schwartz, William Robson Nassu, Bogdan Tomoyuki |
| dc.contributor.author.fl_str_mv |
Lie, Maiko Min Ian |
| dc.subject.por.fl_str_mv |
Percepção visual Atenção - Simulação por computador Visão por computador Processamento de imagens - Técnicas digitais Algorítmos computacionais Sistemas de reconhecimento de padrões Métodos de simulação Engenharia de computador Engenharia elétrica Visual perception Attention - Computer simulation Computer vision Image processing - Digital techniques Computer algorithms Pattern recognition systems Simulation methods Computer engineering Electric engineering CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::PROCESSAMENTO GRAFICO (GRAPHICS) Engenharia Elétrica |
| topic |
Percepção visual Atenção - Simulação por computador Visão por computador Processamento de imagens - Técnicas digitais Algorítmos computacionais Sistemas de reconhecimento de padrões Métodos de simulação Engenharia de computador Engenharia elétrica Visual perception Attention - Computer simulation Computer vision Image processing - Digital techniques Computer algorithms Pattern recognition systems Simulation methods Computer engineering Electric engineering CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::PROCESSAMENTO GRAFICO (GRAPHICS) Engenharia Elétrica |
| description |
The information incident on the human visual system is bound by a selection mechanism, known as visual attention. This mechanism is responsible for restricting incomingvisual information to a smaller and potentially important subset for further processing,enabling the visual system to respond rapidly, despite the enormous amount of information to which it is subject. Computer vision systems often employ reproductionsof this mechanism in order to reduce visual search space, since this strategy can leadto substantial improvement in efficiency. This thesis addresses the problem of efficient computation of visual attention, particularly the case of salient region detection. A strategy based on joint upsampling of coarse-scale saliency estimates is presented for that purpose. This approach allows leveraging both the advantages of coarsescale estimation (reduction of computational cost, abstraction of unnecessary details) and fine-scale edge information (high accuracy). Based on the highly redundant data and spatially-varying importance of content in images of real-world scenes, two visual saliency formulations are presented for coarse-scale estimation in the proposed strategy. The first approach operates on a pixel level, based on random color distances. The second approach operates on a patch level, based on the reconstruction error computed from the Principal Component Analysis of the image boundaries. The efficacy and efficiency of the proposed strategy are demonstrated through assessment on the ASD, MSRA10K, ECSSD, and DUT-OMRON datasets. Comparison with other seven state-of-the-art methods in terms of precision, recall, F-measure, and execution time demonstrate that the proposed strategy is highly competitive, achieving one of the best trade-offs between accuracy and execution time. |
| publishDate |
2018 |
| dc.date.none.fl_str_mv |
2018-08-02T16:10:53Z 2018-08-02T16:10:53Z 2018-03-28 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
LIE, Maiko Min Ian. An efficient strategy for estimation of visually salient regions in images. 2018. 69 f. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2018. http://repositorio.utfpr.edu.br/jspui/handle/1/3302 |
| identifier_str_mv |
LIE, Maiko Min Ian. An efficient strategy for estimation of visually salient regions in images. 2018. 69 f. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2018. |
| url |
http://repositorio.utfpr.edu.br/jspui/handle/1/3302 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Curitiba Brasil Mestrado em Engenharia Elétrica e Informática Industrial UTFPR |
| publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Curitiba Brasil Mestrado em Engenharia Elétrica e Informática Industrial UTFPR |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
| instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
| instacron_str |
UTFPR |
| institution |
UTFPR |
| reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
| repository.mail.fl_str_mv |
riut@utfpr.edu.br || sibi@utfpr.edu.br |
| _version_ |
1850498301837705216 |