Superpixel-driven 360º image compression
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Link de acesso: | http://hdl.handle.net/10183/295558 |
Resumo: | Imagens omnidirecionais, 360◦ ou esféricas são sinais definidos sobre a superfície da esfera que capturam todo o campo de visão em todas as direções. Essas imagens são es senciais para aplicações imersivas, como a realidade virtual, e frequentemente possuem altas resoluções, exigindo estratégias de compressão eficientes e especializadas. Tipica mente, imagens esféricas são projetadas em um plano bidimensional por meio da projeção equiretangular, a qual introduz distorções dependentes da latitude que afetam tanto a re presentação quanto o desempenho da compressão. Métodos convencionais de compressão baseados em blocos, quando aplicados a imagens 360◦, frequentemente resultam em ar tefatos visuais de blocagem e enfrentam limitações quanto à adaptabilidade geométrica, levando a uma qualidade visual subótima e desafios práticos de implementação. Neste trabalho, propomos uma nova estrutura de compressão guiada por conteúdo, especifica mente projetada para imagens esféricas, que utiliza superpixels esféricos como unidades de codificação. Cada superpixel é processado por meio de uma transformada de Fou rier no domínio de grafos com pesos esféricos (GFT) e uma estratégia de quantização adaptativa à latitude, permitindo melhor alinhamento com a geometria e a distribuição de conteúdo do sinal esférico. Nosso método atinge desempenho de compressão com va lores de estado da arte, com ganhos de qualidade de imagem de até 3,66 dB e reduções de taxa de bits de até 55% em comparação com outras abordagens recentes baseadas em unidades de codificação. Em comparação com os métodos baseados em aprendizado de máquina, que exigem treinamento específico para cada taxa de bits e enfrentam dificulda des de generalização, nossa abordagem dispensa treinamento e alcança qualidade visual competitiva. |
| id |
URGS_25fc42fed5dbba0ca324a35487807512 |
|---|---|
| oai_identifier_str |
oai:www.lume.ufrgs.br:10183/295558 |
| network_acronym_str |
URGS |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| repository_id_str |
|
| spelling |
Binkowski, BrunoWalter, MarceloSilveira, Thiago Lopes Trugillo da2025-08-21T08:03:39Z2025http://hdl.handle.net/10183/295558001291701Imagens omnidirecionais, 360◦ ou esféricas são sinais definidos sobre a superfície da esfera que capturam todo o campo de visão em todas as direções. Essas imagens são es senciais para aplicações imersivas, como a realidade virtual, e frequentemente possuem altas resoluções, exigindo estratégias de compressão eficientes e especializadas. Tipica mente, imagens esféricas são projetadas em um plano bidimensional por meio da projeção equiretangular, a qual introduz distorções dependentes da latitude que afetam tanto a re presentação quanto o desempenho da compressão. Métodos convencionais de compressão baseados em blocos, quando aplicados a imagens 360◦, frequentemente resultam em ar tefatos visuais de blocagem e enfrentam limitações quanto à adaptabilidade geométrica, levando a uma qualidade visual subótima e desafios práticos de implementação. Neste trabalho, propomos uma nova estrutura de compressão guiada por conteúdo, especifica mente projetada para imagens esféricas, que utiliza superpixels esféricos como unidades de codificação. Cada superpixel é processado por meio de uma transformada de Fou rier no domínio de grafos com pesos esféricos (GFT) e uma estratégia de quantização adaptativa à latitude, permitindo melhor alinhamento com a geometria e a distribuição de conteúdo do sinal esférico. Nosso método atinge desempenho de compressão com va lores de estado da arte, com ganhos de qualidade de imagem de até 3,66 dB e reduções de taxa de bits de até 55% em comparação com outras abordagens recentes baseadas em unidades de codificação. Em comparação com os métodos baseados em aprendizado de máquina, que exigem treinamento específico para cada taxa de bits e enfrentam dificulda des de generalização, nossa abordagem dispensa treinamento e alcança qualidade visual competitiva.Omnidirectional, 360◦, or spherical images are signals defined on the surface of the sphere that capture information in all directions. These images are essential for immersive ap plications such as virtual reality and often come in high resolutions, requiring efficient and specialized compression strategies. Typically, spherical images are projected onto a two-dimensional plane using the equirectangular projection, which introduces latitude dependent distortions that affect both image representation and compression performance. Conventional block-based compression methods applied to 360◦ images often lead to vis ible blocking artifacts and face limitations in terms of geometric adaptability, resulting in suboptimal visual quality and practical implementation challenges. In this work, we pro pose a novel content-guided compression framework specifically designed for spherical images, which uses spherical superpixels as coding units. Each superpixel is processed using a spherically-weighted graph Fourier transform and a latitude-adaptive quantization strategy, allowing for better alignment with the geometry and content distribution of the spherical signal. Our method achieves state-of-the-art compression performance, yielding image quality gains of up to 3.66 dB and bit rate reductions of up to 55% compared to other recent coding unit-based approaches. Compared to learning-based methods, which require bitrate-specific training and struggle with generalization, our approach is training free and achieves competitive visual quality.application/pdfengImagens omnidirecionaisImagens 360°Realidade virtualCompressão de imagensGraph fourier transformLatitude-adaptive quantizationSuperpixelsSuperpixel-driven 360º image compressionCompressão de imagens em 360º orientada por superpixels info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2025mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001291701.pdf.txt001291701.pdf.txtExtracted Texttext/plain107753http://www.lume.ufrgs.br/bitstream/10183/295558/2/001291701.pdf.txtc0c2d86b8c447d04f542f5b5efea684fMD52ORIGINAL001291701.pdfTexto completo (inglês)application/pdf6494511http://www.lume.ufrgs.br/bitstream/10183/295558/1/001291701.pdfed4f2b29b157a44af31047a2c067136fMD5110183/2955582025-10-05 08:02:52.850761oai:www.lume.ufrgs.br:10183/295558Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br || lume@ufrgs.bropendoar:18532025-10-05T11:02:52Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
| dc.title.pt_BR.fl_str_mv |
Superpixel-driven 360º image compression |
| dc.title.alternative.pt.fl_str_mv |
Compressão de imagens em 360º orientada por superpixels |
| title |
Superpixel-driven 360º image compression |
| spellingShingle |
Superpixel-driven 360º image compression Binkowski, Bruno Imagens omnidirecionais Imagens 360° Realidade virtual Compressão de imagens Graph fourier transform Latitude-adaptive quantization Superpixels |
| title_short |
Superpixel-driven 360º image compression |
| title_full |
Superpixel-driven 360º image compression |
| title_fullStr |
Superpixel-driven 360º image compression |
| title_full_unstemmed |
Superpixel-driven 360º image compression |
| title_sort |
Superpixel-driven 360º image compression |
| author |
Binkowski, Bruno |
| author_facet |
Binkowski, Bruno |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Binkowski, Bruno |
| dc.contributor.advisor1.fl_str_mv |
Walter, Marcelo |
| dc.contributor.advisor-co1.fl_str_mv |
Silveira, Thiago Lopes Trugillo da |
| contributor_str_mv |
Walter, Marcelo Silveira, Thiago Lopes Trugillo da |
| dc.subject.por.fl_str_mv |
Imagens omnidirecionais Imagens 360° Realidade virtual Compressão de imagens |
| topic |
Imagens omnidirecionais Imagens 360° Realidade virtual Compressão de imagens Graph fourier transform Latitude-adaptive quantization Superpixels |
| dc.subject.eng.fl_str_mv |
Graph fourier transform Latitude-adaptive quantization Superpixels |
| description |
Imagens omnidirecionais, 360◦ ou esféricas são sinais definidos sobre a superfície da esfera que capturam todo o campo de visão em todas as direções. Essas imagens são es senciais para aplicações imersivas, como a realidade virtual, e frequentemente possuem altas resoluções, exigindo estratégias de compressão eficientes e especializadas. Tipica mente, imagens esféricas são projetadas em um plano bidimensional por meio da projeção equiretangular, a qual introduz distorções dependentes da latitude que afetam tanto a re presentação quanto o desempenho da compressão. Métodos convencionais de compressão baseados em blocos, quando aplicados a imagens 360◦, frequentemente resultam em ar tefatos visuais de blocagem e enfrentam limitações quanto à adaptabilidade geométrica, levando a uma qualidade visual subótima e desafios práticos de implementação. Neste trabalho, propomos uma nova estrutura de compressão guiada por conteúdo, especifica mente projetada para imagens esféricas, que utiliza superpixels esféricos como unidades de codificação. Cada superpixel é processado por meio de uma transformada de Fou rier no domínio de grafos com pesos esféricos (GFT) e uma estratégia de quantização adaptativa à latitude, permitindo melhor alinhamento com a geometria e a distribuição de conteúdo do sinal esférico. Nosso método atinge desempenho de compressão com va lores de estado da arte, com ganhos de qualidade de imagem de até 3,66 dB e reduções de taxa de bits de até 55% em comparação com outras abordagens recentes baseadas em unidades de codificação. Em comparação com os métodos baseados em aprendizado de máquina, que exigem treinamento específico para cada taxa de bits e enfrentam dificulda des de generalização, nossa abordagem dispensa treinamento e alcança qualidade visual competitiva. |
| publishDate |
2025 |
| dc.date.accessioned.fl_str_mv |
2025-08-21T08:03:39Z |
| dc.date.issued.fl_str_mv |
2025 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/295558 |
| dc.identifier.nrb.pt_BR.fl_str_mv |
001291701 |
| url |
http://hdl.handle.net/10183/295558 |
| identifier_str_mv |
001291701 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
| instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
| instacron_str |
UFRGS |
| institution |
UFRGS |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/295558/2/001291701.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/295558/1/001291701.pdf |
| bitstream.checksum.fl_str_mv |
c0c2d86b8c447d04f542f5b5efea684f ed4f2b29b157a44af31047a2c067136f |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
| repository.mail.fl_str_mv |
lume@ufrgs.br || lume@ufrgs.br |
| _version_ |
1854319309552091136 |