Superpixel-driven 360º image compression

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Binkowski, Bruno
Orientador(a): Walter, Marcelo
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/295558
Resumo: Imagens omnidirecionais, 360◦ ou esféricas são sinais definidos sobre a superfície da esfera que capturam todo o campo de visão em todas as direções. Essas imagens são es senciais para aplicações imersivas, como a realidade virtual, e frequentemente possuem altas resoluções, exigindo estratégias de compressão eficientes e especializadas. Tipica mente, imagens esféricas são projetadas em um plano bidimensional por meio da projeção equiretangular, a qual introduz distorções dependentes da latitude que afetam tanto a re presentação quanto o desempenho da compressão. Métodos convencionais de compressão baseados em blocos, quando aplicados a imagens 360◦, frequentemente resultam em ar tefatos visuais de blocagem e enfrentam limitações quanto à adaptabilidade geométrica, levando a uma qualidade visual subótima e desafios práticos de implementação. Neste trabalho, propomos uma nova estrutura de compressão guiada por conteúdo, especifica mente projetada para imagens esféricas, que utiliza superpixels esféricos como unidades de codificação. Cada superpixel é processado por meio de uma transformada de Fou rier no domínio de grafos com pesos esféricos (GFT) e uma estratégia de quantização adaptativa à latitude, permitindo melhor alinhamento com a geometria e a distribuição de conteúdo do sinal esférico. Nosso método atinge desempenho de compressão com va lores de estado da arte, com ganhos de qualidade de imagem de até 3,66 dB e reduções de taxa de bits de até 55% em comparação com outras abordagens recentes baseadas em unidades de codificação. Em comparação com os métodos baseados em aprendizado de máquina, que exigem treinamento específico para cada taxa de bits e enfrentam dificulda des de generalização, nossa abordagem dispensa treinamento e alcança qualidade visual competitiva.
id URGS_25fc42fed5dbba0ca324a35487807512
oai_identifier_str oai:www.lume.ufrgs.br:10183/295558
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Binkowski, BrunoWalter, MarceloSilveira, Thiago Lopes Trugillo da2025-08-21T08:03:39Z2025http://hdl.handle.net/10183/295558001291701Imagens omnidirecionais, 360◦ ou esféricas são sinais definidos sobre a superfície da esfera que capturam todo o campo de visão em todas as direções. Essas imagens são es senciais para aplicações imersivas, como a realidade virtual, e frequentemente possuem altas resoluções, exigindo estratégias de compressão eficientes e especializadas. Tipica mente, imagens esféricas são projetadas em um plano bidimensional por meio da projeção equiretangular, a qual introduz distorções dependentes da latitude que afetam tanto a re presentação quanto o desempenho da compressão. Métodos convencionais de compressão baseados em blocos, quando aplicados a imagens 360◦, frequentemente resultam em ar tefatos visuais de blocagem e enfrentam limitações quanto à adaptabilidade geométrica, levando a uma qualidade visual subótima e desafios práticos de implementação. Neste trabalho, propomos uma nova estrutura de compressão guiada por conteúdo, especifica mente projetada para imagens esféricas, que utiliza superpixels esféricos como unidades de codificação. Cada superpixel é processado por meio de uma transformada de Fou rier no domínio de grafos com pesos esféricos (GFT) e uma estratégia de quantização adaptativa à latitude, permitindo melhor alinhamento com a geometria e a distribuição de conteúdo do sinal esférico. Nosso método atinge desempenho de compressão com va lores de estado da arte, com ganhos de qualidade de imagem de até 3,66 dB e reduções de taxa de bits de até 55% em comparação com outras abordagens recentes baseadas em unidades de codificação. Em comparação com os métodos baseados em aprendizado de máquina, que exigem treinamento específico para cada taxa de bits e enfrentam dificulda des de generalização, nossa abordagem dispensa treinamento e alcança qualidade visual competitiva.Omnidirectional, 360◦, or spherical images are signals defined on the surface of the sphere that capture information in all directions. These images are essential for immersive ap plications such as virtual reality and often come in high resolutions, requiring efficient and specialized compression strategies. Typically, spherical images are projected onto a two-dimensional plane using the equirectangular projection, which introduces latitude dependent distortions that affect both image representation and compression performance. Conventional block-based compression methods applied to 360◦ images often lead to vis ible blocking artifacts and face limitations in terms of geometric adaptability, resulting in suboptimal visual quality and practical implementation challenges. In this work, we pro pose a novel content-guided compression framework specifically designed for spherical images, which uses spherical superpixels as coding units. Each superpixel is processed using a spherically-weighted graph Fourier transform and a latitude-adaptive quantization strategy, allowing for better alignment with the geometry and content distribution of the spherical signal. Our method achieves state-of-the-art compression performance, yielding image quality gains of up to 3.66 dB and bit rate reductions of up to 55% compared to other recent coding unit-based approaches. Compared to learning-based methods, which require bitrate-specific training and struggle with generalization, our approach is training free and achieves competitive visual quality.application/pdfengImagens omnidirecionaisImagens 360°Realidade virtualCompressão de imagensGraph fourier transformLatitude-adaptive quantizationSuperpixelsSuperpixel-driven 360º image compressionCompressão de imagens em 360º orientada por superpixels info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2025mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001291701.pdf.txt001291701.pdf.txtExtracted Texttext/plain107753http://www.lume.ufrgs.br/bitstream/10183/295558/2/001291701.pdf.txtc0c2d86b8c447d04f542f5b5efea684fMD52ORIGINAL001291701.pdfTexto completo (inglês)application/pdf6494511http://www.lume.ufrgs.br/bitstream/10183/295558/1/001291701.pdfed4f2b29b157a44af31047a2c067136fMD5110183/2955582025-10-05 08:02:52.850761oai:www.lume.ufrgs.br:10183/295558Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br || lume@ufrgs.bropendoar:18532025-10-05T11:02:52Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Superpixel-driven 360º image compression
dc.title.alternative.pt.fl_str_mv Compressão de imagens em 360º orientada por superpixels
title Superpixel-driven 360º image compression
spellingShingle Superpixel-driven 360º image compression
Binkowski, Bruno
Imagens omnidirecionais
Imagens 360°
Realidade virtual
Compressão de imagens
Graph fourier transform
Latitude-adaptive quantization
Superpixels
title_short Superpixel-driven 360º image compression
title_full Superpixel-driven 360º image compression
title_fullStr Superpixel-driven 360º image compression
title_full_unstemmed Superpixel-driven 360º image compression
title_sort Superpixel-driven 360º image compression
author Binkowski, Bruno
author_facet Binkowski, Bruno
author_role author
dc.contributor.author.fl_str_mv Binkowski, Bruno
dc.contributor.advisor1.fl_str_mv Walter, Marcelo
dc.contributor.advisor-co1.fl_str_mv Silveira, Thiago Lopes Trugillo da
contributor_str_mv Walter, Marcelo
Silveira, Thiago Lopes Trugillo da
dc.subject.por.fl_str_mv Imagens omnidirecionais
Imagens 360°
Realidade virtual
Compressão de imagens
topic Imagens omnidirecionais
Imagens 360°
Realidade virtual
Compressão de imagens
Graph fourier transform
Latitude-adaptive quantization
Superpixels
dc.subject.eng.fl_str_mv Graph fourier transform
Latitude-adaptive quantization
Superpixels
description Imagens omnidirecionais, 360◦ ou esféricas são sinais definidos sobre a superfície da esfera que capturam todo o campo de visão em todas as direções. Essas imagens são es senciais para aplicações imersivas, como a realidade virtual, e frequentemente possuem altas resoluções, exigindo estratégias de compressão eficientes e especializadas. Tipica mente, imagens esféricas são projetadas em um plano bidimensional por meio da projeção equiretangular, a qual introduz distorções dependentes da latitude que afetam tanto a re presentação quanto o desempenho da compressão. Métodos convencionais de compressão baseados em blocos, quando aplicados a imagens 360◦, frequentemente resultam em ar tefatos visuais de blocagem e enfrentam limitações quanto à adaptabilidade geométrica, levando a uma qualidade visual subótima e desafios práticos de implementação. Neste trabalho, propomos uma nova estrutura de compressão guiada por conteúdo, especifica mente projetada para imagens esféricas, que utiliza superpixels esféricos como unidades de codificação. Cada superpixel é processado por meio de uma transformada de Fou rier no domínio de grafos com pesos esféricos (GFT) e uma estratégia de quantização adaptativa à latitude, permitindo melhor alinhamento com a geometria e a distribuição de conteúdo do sinal esférico. Nosso método atinge desempenho de compressão com va lores de estado da arte, com ganhos de qualidade de imagem de até 3,66 dB e reduções de taxa de bits de até 55% em comparação com outras abordagens recentes baseadas em unidades de codificação. Em comparação com os métodos baseados em aprendizado de máquina, que exigem treinamento específico para cada taxa de bits e enfrentam dificulda des de generalização, nossa abordagem dispensa treinamento e alcança qualidade visual competitiva.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-08-21T08:03:39Z
dc.date.issued.fl_str_mv 2025
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/295558
dc.identifier.nrb.pt_BR.fl_str_mv 001291701
url http://hdl.handle.net/10183/295558
identifier_str_mv 001291701
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/295558/2/001291701.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/295558/1/001291701.pdf
bitstream.checksum.fl_str_mv c0c2d86b8c447d04f542f5b5efea684f
ed4f2b29b157a44af31047a2c067136f
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br || lume@ufrgs.br
_version_ 1854319309552091136