Predição de Light Fields Utilizando Redes Neurais Convolucionais

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Jahnke, Matheus da Silva
Orientador(a): Zatt, Bruno
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pelotas
Programa de Pós-Graduação: Programa de Pós-Graduação em Computação
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/16642
Resumo: Imagens digitais são extremamente comuns e usadas em inúmeras aplicações atuais. No entanto, sua estrutura bidimensional é insuficiente para algumas aplicações como, por exemplo, representação de ambientes imersivos, mudança de foco e iluminação pós-captura, entre outras. Buscando tratar essa limitação, estuda-se outras representações como nuvens de pontos, imagens tridimensionais, imagens omnidirecionais e light fields (LFs)– este sendo o foco deste trabalho. Light Fields são, essencialmente, imagens quadrimensionais. Dado um conjunto de pontos em um plano– referido como plano do sensor– LFs descrevem, para cada direção de incidência, uma intensidade diferente. Isso pode ser interpretado de vá rias formas, uma delas é como uma matriz bidimensional onde cada elemento é uma imagem bidimensional ou, nesse contexto, uma sub-aperture image (SAI). Dentro das SAIs, variamos as dimensões espaciais de um LF, enquanto que, ao variar as dimensões angulares, escolhemos uma SAI ou outra. Como eles são estruturas quadrimensionais, o volume de dados necessário para armazená-los e transmiti-los exige uma compressão eficiente. Várias propostas foram feitas, em geral podendo ser classificadas em dois grandes grupos: aquelas que organizam as SAIs em uma sequência pseudo temporal– que então é comprimida utilizando algum codificador de vídeo, tal como o High Efficiency Video Coding (HEVC)– tratando uma matriz de SAIs como uma sequência de SAIs; e aquelas que exploram diretamente a natureza quadridimensional de um LF, tal como o JPEG-Pleno. Umas das técnicas utilizadas para melhorar o desempenho da compressão é a predição. Ou seja, a partir de dados que foram (de)codificados anteriormente, tenta-se prever os próximos dados. Quanto melhor for a predição, menores serão os resíduos– a diferença entre o que foi predito com o que realmente é– deverão ser codificados e maior será a eficiência de codificação. O JPEG-Pleno não utiliza predição intraquadro, mostrando que existe uma área a ser investigada. Redes neurais já foram utilizadas com sucesso para uma miríade de problemas, inclusive no processamento de sinais visuais: identificação de números escritos, detecção e identificação de objetos, reconhecimento facial, entre outros. Em particular, foram desenvolvidas com elas abordagens de predição intra-quadro para compressão de imagens e vídeos. Com isso em mente, este trabalho propôs a criação de modelos de predição intra-LF utilizando redes neurais convolucionais.
id UFPL_df77fc00ede4a61d0dbc91b925739025
oai_identifier_str oai:guaiaca.ufpel.edu.br:prefix/16642
network_acronym_str UFPL
network_name_str Repositório Institucional da UFPel - Guaiaca
repository_id_str
spelling 2025-07-21T11:43:02Z2025-07-212025-07-21T11:43:02Z2025-05-16JAHNKE, Matheus da Silva. Predição de Light Fields Utilizando Redes Neurais Convolucionais. Orientador: Bruno Zatt. 2025. 48 f. Dissertação (Mestrado em Ciência da Computação) - Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025.http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/16642Imagens digitais são extremamente comuns e usadas em inúmeras aplicações atuais. No entanto, sua estrutura bidimensional é insuficiente para algumas aplicações como, por exemplo, representação de ambientes imersivos, mudança de foco e iluminação pós-captura, entre outras. Buscando tratar essa limitação, estuda-se outras representações como nuvens de pontos, imagens tridimensionais, imagens omnidirecionais e light fields (LFs)– este sendo o foco deste trabalho. Light Fields são, essencialmente, imagens quadrimensionais. Dado um conjunto de pontos em um plano– referido como plano do sensor– LFs descrevem, para cada direção de incidência, uma intensidade diferente. Isso pode ser interpretado de vá rias formas, uma delas é como uma matriz bidimensional onde cada elemento é uma imagem bidimensional ou, nesse contexto, uma sub-aperture image (SAI). Dentro das SAIs, variamos as dimensões espaciais de um LF, enquanto que, ao variar as dimensões angulares, escolhemos uma SAI ou outra. Como eles são estruturas quadrimensionais, o volume de dados necessário para armazená-los e transmiti-los exige uma compressão eficiente. Várias propostas foram feitas, em geral podendo ser classificadas em dois grandes grupos: aquelas que organizam as SAIs em uma sequência pseudo temporal– que então é comprimida utilizando algum codificador de vídeo, tal como o High Efficiency Video Coding (HEVC)– tratando uma matriz de SAIs como uma sequência de SAIs; e aquelas que exploram diretamente a natureza quadridimensional de um LF, tal como o JPEG-Pleno. Umas das técnicas utilizadas para melhorar o desempenho da compressão é a predição. Ou seja, a partir de dados que foram (de)codificados anteriormente, tenta-se prever os próximos dados. Quanto melhor for a predição, menores serão os resíduos– a diferença entre o que foi predito com o que realmente é– deverão ser codificados e maior será a eficiência de codificação. O JPEG-Pleno não utiliza predição intraquadro, mostrando que existe uma área a ser investigada. Redes neurais já foram utilizadas com sucesso para uma miríade de problemas, inclusive no processamento de sinais visuais: identificação de números escritos, detecção e identificação de objetos, reconhecimento facial, entre outros. Em particular, foram desenvolvidas com elas abordagens de predição intra-quadro para compressão de imagens e vídeos. Com isso em mente, este trabalho propôs a criação de modelos de predição intra-LF utilizando redes neurais convolucionais.Digital images are extremely commons and used in myriad applications. How ever, their bidimensional structure is insufficient for some applications as, for instance, representing immersive environments, post-capture refocus and illumination. Trying to solve this limitation, other representations like point clouds, 3d and omnidirectional images and light fields(LFs)– the last being the focus of this work. Light fields are, essentially, quadridimensional images. Given a set de points in a plane– referred as the sensor plane– LFs describe, for every incidence direction, a possibly different intensity. This can be interpreted in many ways, one of them being a bidimensional matrix where every entry is a bidimensional image, or, in this context, a sub-aperture image(SAI). Given they are quadridimensional structures, the volume of data involved to store and transmit them require a efficient compression. Various proposals were made, in a broader view, they can be classified in two big groups: those who organize the SAIs in a pseudo temporal sequence– which is then compressed using some video encoder, for instance, the High Efficiency Video Coding(HEVC)– and those which directly explore the quadrimentional nature of LFs. Neural networks were already used with success to a myriad of problems, including the processing of visual signals: dentification of written numbers, detection and identification of objects, facial recognition, amongst others. In particular, intra-frame prediction for compression of images and video approaches were developed using neural networks. With that in mind, this work proposes the creation of intra-LF prediction models using convolutional neural networks.Fundação de Amparo à Pesquisa do Estado do Rio Grande do Sul - FAPERGSporUniversidade Federal de PelotasPrograma de Pós-Graduação em ComputaçãoUFPelBrasilCC BY-NC-SAinfo:eu-repo/semantics/openAccessCIENCIAS EXATAS E DA TERRACIENCIA DA COMPUTACAORedes Neurais ConvolucionaisLight FieldsCompressãoConvolutional Neural NetworksPredição de Light Fields Utilizando Redes Neurais ConvolucionaisLight field prediction using neural networksinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://lattes.cnpq.br/9901662050753096http://lattes.cnpq.br/8251926321102019Zatt, BrunoJahnke, Matheus da Silvareponame:Repositório Institucional da UFPel - Guaiacainstname:Universidade Federal de Pelotas (UFPEL)instacron:UFPELORIGINALDissertação_ Matheus da Silva Jahnke.pdfDissertação_ Matheus da Silva Jahnke.pdfapplication/pdf4768357http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/16642/1/Disserta%c3%a7%c3%a3o_%20Matheus%20da%20Silva%20Jahnke.pdffdb72b441b1fc771cba89db8669f7ef5MD51open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-81960http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/16642/2/license.txta963c7f783e32dba7010280c7b5ea154MD52open accessTEXTDissertação_ Matheus da Silva Jahnke.pdf.txtDissertação_ Matheus da Silva Jahnke.pdf.txtExtracted texttext/plain74234http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/16642/3/Disserta%c3%a7%c3%a3o_%20Matheus%20da%20Silva%20Jahnke.pdf.txt62406266906666b7c638a32eb85bae57MD53open accessTHUMBNAILDissertação_ Matheus da Silva Jahnke.pdf.jpgDissertação_ Matheus da Silva Jahnke.pdf.jpgGenerated Thumbnailimage/jpeg1243http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/16642/4/Disserta%c3%a7%c3%a3o_%20Matheus%20da%20Silva%20Jahnke.pdf.jpgc0bdf30d1cf1057afc058cf9192c2178MD54open accessprefix/166422025-07-22 03:03:34.385open accessoai:guaiaca.ufpel.edu.br:prefix/16642TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkkgLSBDb20gYSBhcHJlc2VudGHDp8OjbyBkZXN0YSBsaWNlbsOnYSwgdm9jw6ogKG8ocykgYXV0b3IoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIChSSSkgZGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgUGVsb3RhcyAoVUZQZWwpIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCB0cmFkdXppciAKKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIHN1YSBwdWJsaWNhw6fDo28gKGluY2x1aW5kbyBvIHJlc3VtbykgcG9yIHRvZG8gbyBtdW5kbyBubyBmb3JtYXRvIGltcHJlc3NvIAplIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW87CgpJSSAtIFZvY8OqIGNvbmNvcmRhIHF1ZSBvIFJJIGRhIFVGUGVsIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gCnBhcmEgZmlucyBkZSBwcmVzZXJ2YcOnw6NvOwoKSUlJIC0gVm9jw6ogdGFtYsOpbSBjb25jb3JkYSBxdWUgbyBSSSBkYSBVRlBlbCBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZGUgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIGZpbnMgZGUgc2VndXJhbsOnYSwgYmFja3VwIAplIHByZXNlcnZhw6fDo287CgpJViAtIFZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHB1YmxpY2HDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gClZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHB1YmxpY2HDp8OjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgbsOjbyBpbmZyaW5nZSBkaXJlaXRvcyBhdXRvcmFpcyAKZGUgbmluZ3XDqW07CgpWIC0gQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBSSSBkYSBVRlBlbCBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhOwoKVkkgLSBDQVNPIEEgUFVCTElDQcOHw4NPIE9SQSBERVBPU0lUQURBIFRFTkhBIFNJRE8gUkVTVUxUQURPIERFIFVNIFBBVFJPQ8ONTklPIE9VIEFQT0lPIERFIFVNQSBBR8OKTkNJQSBERSBGT01FTlRPIE9VCk9VVFJBIE9SR0FOSVpBw4fDg08sIFZPQ8OKIERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJU8ODTyBDT01PIFRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyAKRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETzsKClZJSSAtIE8gUkkgZGEgVUZQZWwgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSBvdSBvKHMpIG5vbWUocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyAKYXV0b3JhaXMgZGEgcHVibGljYcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalPUBhttp://repositorio.ufpel.edu.br/oai/requestrippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.bropendoar:2025-07-22T06:03:34Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)false
dc.title.pt_BR.fl_str_mv Predição de Light Fields Utilizando Redes Neurais Convolucionais
dc.title.alternative.pt_BR.fl_str_mv Light field prediction using neural networks
title Predição de Light Fields Utilizando Redes Neurais Convolucionais
spellingShingle Predição de Light Fields Utilizando Redes Neurais Convolucionais
Jahnke, Matheus da Silva
CIENCIAS EXATAS E DA TERRA
Redes Neurais Convolucionais
Light Fields
Compressão
Convolutional Neural Networks
CIENCIA DA COMPUTACAO
title_short Predição de Light Fields Utilizando Redes Neurais Convolucionais
title_full Predição de Light Fields Utilizando Redes Neurais Convolucionais
title_fullStr Predição de Light Fields Utilizando Redes Neurais Convolucionais
title_full_unstemmed Predição de Light Fields Utilizando Redes Neurais Convolucionais
title_sort Predição de Light Fields Utilizando Redes Neurais Convolucionais
author Jahnke, Matheus da Silva
author_facet Jahnke, Matheus da Silva
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/9901662050753096
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/8251926321102019
dc.contributor.advisor1.fl_str_mv Zatt, Bruno
dc.contributor.author.fl_str_mv Jahnke, Matheus da Silva
contributor_str_mv Zatt, Bruno
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA
topic CIENCIAS EXATAS E DA TERRA
Redes Neurais Convolucionais
Light Fields
Compressão
Convolutional Neural Networks
CIENCIA DA COMPUTACAO
dc.subject.por.fl_str_mv Redes Neurais Convolucionais
Light Fields
Compressão
Convolutional Neural Networks
dc.subject.cnpq1.pt_BR.fl_str_mv CIENCIA DA COMPUTACAO
description Imagens digitais são extremamente comuns e usadas em inúmeras aplicações atuais. No entanto, sua estrutura bidimensional é insuficiente para algumas aplicações como, por exemplo, representação de ambientes imersivos, mudança de foco e iluminação pós-captura, entre outras. Buscando tratar essa limitação, estuda-se outras representações como nuvens de pontos, imagens tridimensionais, imagens omnidirecionais e light fields (LFs)– este sendo o foco deste trabalho. Light Fields são, essencialmente, imagens quadrimensionais. Dado um conjunto de pontos em um plano– referido como plano do sensor– LFs descrevem, para cada direção de incidência, uma intensidade diferente. Isso pode ser interpretado de vá rias formas, uma delas é como uma matriz bidimensional onde cada elemento é uma imagem bidimensional ou, nesse contexto, uma sub-aperture image (SAI). Dentro das SAIs, variamos as dimensões espaciais de um LF, enquanto que, ao variar as dimensões angulares, escolhemos uma SAI ou outra. Como eles são estruturas quadrimensionais, o volume de dados necessário para armazená-los e transmiti-los exige uma compressão eficiente. Várias propostas foram feitas, em geral podendo ser classificadas em dois grandes grupos: aquelas que organizam as SAIs em uma sequência pseudo temporal– que então é comprimida utilizando algum codificador de vídeo, tal como o High Efficiency Video Coding (HEVC)– tratando uma matriz de SAIs como uma sequência de SAIs; e aquelas que exploram diretamente a natureza quadridimensional de um LF, tal como o JPEG-Pleno. Umas das técnicas utilizadas para melhorar o desempenho da compressão é a predição. Ou seja, a partir de dados que foram (de)codificados anteriormente, tenta-se prever os próximos dados. Quanto melhor for a predição, menores serão os resíduos– a diferença entre o que foi predito com o que realmente é– deverão ser codificados e maior será a eficiência de codificação. O JPEG-Pleno não utiliza predição intraquadro, mostrando que existe uma área a ser investigada. Redes neurais já foram utilizadas com sucesso para uma miríade de problemas, inclusive no processamento de sinais visuais: identificação de números escritos, detecção e identificação de objetos, reconhecimento facial, entre outros. Em particular, foram desenvolvidas com elas abordagens de predição intra-quadro para compressão de imagens e vídeos. Com isso em mente, este trabalho propôs a criação de modelos de predição intra-LF utilizando redes neurais convolucionais.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-07-21T11:43:02Z
dc.date.available.fl_str_mv 2025-07-21
2025-07-21T11:43:02Z
dc.date.issued.fl_str_mv 2025-05-16
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv JAHNKE, Matheus da Silva. Predição de Light Fields Utilizando Redes Neurais Convolucionais. Orientador: Bruno Zatt. 2025. 48 f. Dissertação (Mestrado em Ciência da Computação) - Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025.
dc.identifier.uri.fl_str_mv http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/16642
identifier_str_mv JAHNKE, Matheus da Silva. Predição de Light Fields Utilizando Redes Neurais Convolucionais. Orientador: Bruno Zatt. 2025. 48 f. Dissertação (Mestrado em Ciência da Computação) - Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025.
url http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/16642
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC BY-NC-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC BY-NC-SA
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pelotas
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Computação
dc.publisher.initials.fl_str_mv UFPel
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pelotas
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPel - Guaiaca
instname:Universidade Federal de Pelotas (UFPEL)
instacron:UFPEL
instname_str Universidade Federal de Pelotas (UFPEL)
instacron_str UFPEL
institution UFPEL
reponame_str Repositório Institucional da UFPel - Guaiaca
collection Repositório Institucional da UFPel - Guaiaca
bitstream.url.fl_str_mv http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/16642/1/Disserta%c3%a7%c3%a3o_%20Matheus%20da%20Silva%20Jahnke.pdf
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/16642/2/license.txt
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/16642/3/Disserta%c3%a7%c3%a3o_%20Matheus%20da%20Silva%20Jahnke.pdf.txt
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/16642/4/Disserta%c3%a7%c3%a3o_%20Matheus%20da%20Silva%20Jahnke.pdf.jpg
bitstream.checksum.fl_str_mv fdb72b441b1fc771cba89db8669f7ef5
a963c7f783e32dba7010280c7b5ea154
62406266906666b7c638a32eb85bae57
c0bdf30d1cf1057afc058cf9192c2178
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)
repository.mail.fl_str_mv rippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.br
_version_ 1862741527181131776