Exploring curve-based prediction models for intra-frame prediction

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Fernandes, Ramon Costi
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://tede2.pucrs.br/tede2/handle/tede/9589
Resumo: This Thesis presents two novel intra-frame prediction models for video coding: Least-Squares Approximation Surfaces (LSAS) and curve-based prediction models. Both approaches enhance intra-frame prediction capabilities by offering a better approximation of encoded block contents. While the LSAS implementation is currently not practical due to its prohibitive bitrate requirements, the curve-based prediction models show promising results. The evaluations for the novel intra-frame prediction models adopt the High Efficiency Video Coding (HEVC) standard, which culminates years of advancements in video coding technologies. Compared to its predecessor, H.264, HEVC achieves up to 50% coding efficiency improvements. This efficiency gain translates into half the encoded video size while keeping the same visual quality. Among the many improvements of HEVC, its intra-frame predictor comes with more prediction modes, capable of modeling more textures in prediction blocks than its predecessors. Improving intra-frame prediction is an essential aspect of the encoding flow, as a better prediction translates into reduced residual energy, consequently improving coding efficiency. All thirty-three angular modes in HEVC received a curve displacement calculation to each predicted sample so that the resulting prediction block models image regions with curved textures. The proposal includes a small overhead in the bitstream syntax elements to transmit the curve displacement value and increased encoding times. However, the enhanced prediction offsets this overhead with improved coding efficiency. The experimental results demonstrate increased prediction accuracy with lower residual energy when applying the Centerline and Radial curve-based models for the displacement calculations. These models achieve an average reduction of the Bjøntegaard-Delta bitrate (BD-Rate) of 2% and 3% for the HEVC test sequences using the All-Intra-8 configuration, for the Centerline and Radial models, respectively, albeit at an increase in encoding times. Higher encoding efficiency is achievable with the combination of both curve models, reaching an average 4% BD-Rate reduction with the All-Intra-8 configuration.
id P_RS_ce42f235e1d2e6c9ad3e72a9d498fe00
oai_identifier_str oai:tede2.pucrs.br:tede/9589
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Exploring curve-based prediction models for intra-frame predictionIntra-Frame PredictionVideo CodingPredictive CodingPredição Intra-QuadrosCodificação de VídeosCodificação PreditivaCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOThis Thesis presents two novel intra-frame prediction models for video coding: Least-Squares Approximation Surfaces (LSAS) and curve-based prediction models. Both approaches enhance intra-frame prediction capabilities by offering a better approximation of encoded block contents. While the LSAS implementation is currently not practical due to its prohibitive bitrate requirements, the curve-based prediction models show promising results. The evaluations for the novel intra-frame prediction models adopt the High Efficiency Video Coding (HEVC) standard, which culminates years of advancements in video coding technologies. Compared to its predecessor, H.264, HEVC achieves up to 50% coding efficiency improvements. This efficiency gain translates into half the encoded video size while keeping the same visual quality. Among the many improvements of HEVC, its intra-frame predictor comes with more prediction modes, capable of modeling more textures in prediction blocks than its predecessors. Improving intra-frame prediction is an essential aspect of the encoding flow, as a better prediction translates into reduced residual energy, consequently improving coding efficiency. All thirty-three angular modes in HEVC received a curve displacement calculation to each predicted sample so that the resulting prediction block models image regions with curved textures. The proposal includes a small overhead in the bitstream syntax elements to transmit the curve displacement value and increased encoding times. However, the enhanced prediction offsets this overhead with improved coding efficiency. The experimental results demonstrate increased prediction accuracy with lower residual energy when applying the Centerline and Radial curve-based models for the displacement calculations. These models achieve an average reduction of the Bjøntegaard-Delta bitrate (BD-Rate) of 2% and 3% for the HEVC test sequences using the All-Intra-8 configuration, for the Centerline and Radial models, respectively, albeit at an increase in encoding times. Higher encoding efficiency is achievable with the combination of both curve models, reaching an average 4% BD-Rate reduction with the All-Intra-8 configuration.Esta Tese apresenta dois novos modelos de predição intra-quadros: LSAS (superfícies de aproximação baseadas em mínimos quadrados, em inglês Least-Squares Approximation Surfaces) e modelos de predição baseados em curvas. Ambas as abordagens aprimoram a predição intra-quadros, oferecendo uma melhor aproximação do conteúdo de bloco codificado. Embora o LSAS não seja prático devido aos requisitos proibitivos de taxa de bits, os modelos de predição baseados em curvas mostram resultados promissores. As avaliações dos novos modelos de predição intra-quadros adotam o padrão HEVC (codificação de vídeo de alta eficiência, em inglês High Efficiency Video Coding), que culmina anos de avanços em tecnologias de codificação de vídeo. Em comparação com seu antecessor H.264, o HEVC alcança até 50% de melhorias na eficiência de codificação. Isso se traduz em metade do tamanho de um vídeo codificado, mantendo a mesma qualidade visual. Entre as muitas melhorias do HEVC, o seu preditor intra-quadros vem com mais modos de predição, capazes de modelar mais texturas em blocos de predição do que seus antecessores. Melhorar a predição intra-quadros é um aspecto importante do fluxo de codificação, pois uma melhor predição se traduz em redução da energia residual, consequentemente melhorando a eficiência da codificação. Todos os trinta e três modos angulares do HEVC receberam um cálculo de deslocamento de curva para cada amostra predita para que a predição de blocos modele regiões de imagem com texturas curvas. A proposta inclui um pequeno custo adicional nos elementos de sintaxe do vídeo codificado, para incorporar o valor de deslocamento da curva, e um aumento no tempo de codificação. No entanto, a predição aprimorada compensa esse custo com uma maior eficiência de codificação. Utilizando os modelos baseados em curvas Centerline e Radial, para aplicar o cálculo de deslocamento, os resultados experimentais demonstram maior precisão da predição com menor energia residual, alcançando uma redução média na taxa de bits Bjøntegaard-Delta (BD-Rate) de 2% e 3% para as sequências de teste HEVC na configuração All-Intra-8, para os modelos Centerline e Radial, respectivamente, porém com um aumento no tempo de codificação. Uma maior eficiência de codificação é alcançável com a combinação de ambos os modelos de curvas, chegando a uma redução média de 4% BDRate na configuração All-Intra-8.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESPontifícia Universidade Católica do Rio Grande do SulEscola PolitécnicaBrasilPUCRSPrograma de Pós-Graduação em Ciência da ComputaçãoMarcon, César Augusto Missiohttp://lattes.cnpq.br/8611020242763828Agostini, Luciano Volcanhttp://lattes.cnpq.br/9604735363839730Fernandes, Ramon Costi2021-05-06T12:23:04Z2021-03-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://tede2.pucrs.br/tede2/handle/tede/9589enginfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RS2021-05-06T15:00:23Zoai:tede2.pucrs.br:tede/9589Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2021-05-06T15:00:23Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.none.fl_str_mv Exploring curve-based prediction models for intra-frame prediction
title Exploring curve-based prediction models for intra-frame prediction
spellingShingle Exploring curve-based prediction models for intra-frame prediction
Fernandes, Ramon Costi
Intra-Frame Prediction
Video Coding
Predictive Coding
Predição Intra-Quadros
Codificação de Vídeos
Codificação Preditiva
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short Exploring curve-based prediction models for intra-frame prediction
title_full Exploring curve-based prediction models for intra-frame prediction
title_fullStr Exploring curve-based prediction models for intra-frame prediction
title_full_unstemmed Exploring curve-based prediction models for intra-frame prediction
title_sort Exploring curve-based prediction models for intra-frame prediction
author Fernandes, Ramon Costi
author_facet Fernandes, Ramon Costi
author_role author
dc.contributor.none.fl_str_mv Marcon, César Augusto Missio
http://lattes.cnpq.br/8611020242763828
Agostini, Luciano Volcan
http://lattes.cnpq.br/9604735363839730
dc.contributor.author.fl_str_mv Fernandes, Ramon Costi
dc.subject.por.fl_str_mv Intra-Frame Prediction
Video Coding
Predictive Coding
Predição Intra-Quadros
Codificação de Vídeos
Codificação Preditiva
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
topic Intra-Frame Prediction
Video Coding
Predictive Coding
Predição Intra-Quadros
Codificação de Vídeos
Codificação Preditiva
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description This Thesis presents two novel intra-frame prediction models for video coding: Least-Squares Approximation Surfaces (LSAS) and curve-based prediction models. Both approaches enhance intra-frame prediction capabilities by offering a better approximation of encoded block contents. While the LSAS implementation is currently not practical due to its prohibitive bitrate requirements, the curve-based prediction models show promising results. The evaluations for the novel intra-frame prediction models adopt the High Efficiency Video Coding (HEVC) standard, which culminates years of advancements in video coding technologies. Compared to its predecessor, H.264, HEVC achieves up to 50% coding efficiency improvements. This efficiency gain translates into half the encoded video size while keeping the same visual quality. Among the many improvements of HEVC, its intra-frame predictor comes with more prediction modes, capable of modeling more textures in prediction blocks than its predecessors. Improving intra-frame prediction is an essential aspect of the encoding flow, as a better prediction translates into reduced residual energy, consequently improving coding efficiency. All thirty-three angular modes in HEVC received a curve displacement calculation to each predicted sample so that the resulting prediction block models image regions with curved textures. The proposal includes a small overhead in the bitstream syntax elements to transmit the curve displacement value and increased encoding times. However, the enhanced prediction offsets this overhead with improved coding efficiency. The experimental results demonstrate increased prediction accuracy with lower residual energy when applying the Centerline and Radial curve-based models for the displacement calculations. These models achieve an average reduction of the Bjøntegaard-Delta bitrate (BD-Rate) of 2% and 3% for the HEVC test sequences using the All-Intra-8 configuration, for the Centerline and Radial models, respectively, albeit at an increase in encoding times. Higher encoding efficiency is achievable with the combination of both curve models, reaching an average 4% BD-Rate reduction with the All-Intra-8 configuration.
publishDate 2021
dc.date.none.fl_str_mv 2021-05-06T12:23:04Z
2021-03-23
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/9589
url http://tede2.pucrs.br/tede2/handle/tede/9589
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1850041302639443968