LINCE : a terabit-scale hybrid virtualization engine for distributed applications

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Tirone, Mateus Saquetti Pereira de Carvalho
Orientador(a): Azambuja, José Rodrigo Furlanetto de
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
P4
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/300466
Resumo: O aumento de aplicações com uso intensivo de dados e sensíveis à latência exige uma mudança para a computação em rede. No entanto, ainda há uma lacuna significativa: as plataformas acadêmicas existentes baseadas em FPGA não têm desempenho em escala de terabit, enquanto os ASICs comerciais não têm a flexibilidade e a virtualização necessárias para planos de dados programáveis e multilocatários. Esta tese apresenta o Line-rate In-Network Compute Engine (LINCE) para preencher essa lacuna. O LINCE sinergiza o desempenho de alta velocidade de um ASIC para E/S estática e funções de enfileiramento com a reconfigurabilidade dinâmica de um FPGA para hospedar unidades de computação em rede paralelas e isoladas. A plataforma oferece um ecossistema de desenvolvimento versátil, com suporte à linguagem P4 padrão para funções de rede e a um fluxo de trabalho C++/HLS altamente eficiente para aplicações complexas. A arquitetura é caracterizada para atingir uma taxa de transferência virtualizada agregada de 3,2 Tbps, uma ordem de grandeza superior às soluções acadêmicas anteriores. Nosso fluxo de C++/HLS demonstrou reduzir a utilização de recursos em até 99,5% em comparação com as cadeias de ferramentas P4 tradicionais e, ao mesmo tempo, melhorar a latência e a taxa de transferência. A eficácia da plataforma é validada por meio da implantação bem-sucedida de aplicativos distribuídos sofisticados, incluindo inferência de redes neurais artificiais com taxa de linha (atingindo latências abaixo de 1,5 µs) e processamento de fluxo de vídeo em tempo real com reconhecimento de conteúdo (reduzindo a perda crítica de pacotes em 82,5%).
id UFRGS-2_09bda0ae1477eb58cf0509e9f2b6c64d
oai_identifier_str oai:www.lume.ufrgs.br:10183/300466
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Tirone, Mateus Saquetti Pereira de CarvalhoAzambuja, José Rodrigo Furlanetto deCordeiro, Weverton Luis da Costa2026-01-21T07:55:08Z2025http://hdl.handle.net/10183/300466001299992O aumento de aplicações com uso intensivo de dados e sensíveis à latência exige uma mudança para a computação em rede. No entanto, ainda há uma lacuna significativa: as plataformas acadêmicas existentes baseadas em FPGA não têm desempenho em escala de terabit, enquanto os ASICs comerciais não têm a flexibilidade e a virtualização necessárias para planos de dados programáveis e multilocatários. Esta tese apresenta o Line-rate In-Network Compute Engine (LINCE) para preencher essa lacuna. O LINCE sinergiza o desempenho de alta velocidade de um ASIC para E/S estática e funções de enfileiramento com a reconfigurabilidade dinâmica de um FPGA para hospedar unidades de computação em rede paralelas e isoladas. A plataforma oferece um ecossistema de desenvolvimento versátil, com suporte à linguagem P4 padrão para funções de rede e a um fluxo de trabalho C++/HLS altamente eficiente para aplicações complexas. A arquitetura é caracterizada para atingir uma taxa de transferência virtualizada agregada de 3,2 Tbps, uma ordem de grandeza superior às soluções acadêmicas anteriores. Nosso fluxo de C++/HLS demonstrou reduzir a utilização de recursos em até 99,5% em comparação com as cadeias de ferramentas P4 tradicionais e, ao mesmo tempo, melhorar a latência e a taxa de transferência. A eficácia da plataforma é validada por meio da implantação bem-sucedida de aplicativos distribuídos sofisticados, incluindo inferência de redes neurais artificiais com taxa de linha (atingindo latências abaixo de 1,5 µs) e processamento de fluxo de vídeo em tempo real com reconhecimento de conteúdo (reduzindo a perda crítica de pacotes em 82,5%).The rise of data-intensive, latency-sensitive applications necessitates a shift towards InNetwork Computing (INC). However, a significant gap persists: existing academic FPGAbased platforms lack terabit-scale performance, while commercial ASICs lack the flexibility and virtualization required for multi-tenant, programmable data planes. This thesis introduces the Line-rate In-Network Compute Engine (LINCE) to bridge this gap. LINCE synergizes the high-speed performance of an ASIC for static I/O and queuing functions with the dynamic reconfigurability of an FPGA for hosting parallel, isolated In-Network Computing units. The platform offers a versatile development ecosystem, supporting both the standard P4 language for network functions and a highly efficient C++/HLS workflow for complex applications. The architecture is characterized to achieve an aggregate virtualized throughput of 3.2 Tbps, an order of magnitude beyond prior academic solutions. Our C++/HLS flow is demonstrated to reduce resource utilization by up to 99.5% compared to traditional P4 toolchains while improving latency and throughput. The platform’s efficacy is validated through the successful deployment of sophisticated distributed applications, including line-rate Artificial Neural Network inference (achieving latencies under 1.5 µs) and real-time, content-aware video stream processing (reducing critical packet loss by 82.5%). By reconciling terabit-scale performance with deep programmability and dynamic virtualization, LINCE establishes a new benchmark and provides a robust, opensource foundation for the next generation of intelligent networks.application/pdfengComputação em redeVirtualização de funções de redePlanos de dados programáveisFPGAP4Sistemas distribuídosProgrammable forwarding planesLINCE : a terabit-scale hybrid virtualization engine for distributed applicationsLINCE (Line-rate In-Network Compute Engine) : um mecanismo de virtualização híbrido em escala de terabits para aplicativos distribuídosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS3 dez. 2025doutoradoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001299992.pdf.txt001299992.pdf.txtExtracted Texttext/plain426880http://www.lume.ufrgs.br/bitstream/10183/300466/2/001299992.pdf.txted02ebdf01db2bf62f2e3538d0dba87eMD52ORIGINAL001299992.pdfTexto completo (inglês)application/pdf5226059http://www.lume.ufrgs.br/bitstream/10183/300466/1/001299992.pdf1bc84b1b138307f22cbc1627d34dffbcMD5110183/3004662026-05-01 08:03:17.004055oai:www.lume.ufrgs.br:10183/300466Repositório InstitucionalPUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.bropendoar:2026-05-01T11:03:17Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv LINCE : a terabit-scale hybrid virtualization engine for distributed applications
dc.title.alternative.pt.fl_str_mv LINCE (Line-rate In-Network Compute Engine) : um mecanismo de virtualização híbrido em escala de terabits para aplicativos distribuídos
title LINCE : a terabit-scale hybrid virtualization engine for distributed applications
spellingShingle LINCE : a terabit-scale hybrid virtualization engine for distributed applications
Tirone, Mateus Saquetti Pereira de Carvalho
Computação em rede
Virtualização de funções de rede
Planos de dados programáveis
FPGA
P4
Sistemas distribuídos
Programmable forwarding planes
title_short LINCE : a terabit-scale hybrid virtualization engine for distributed applications
title_full LINCE : a terabit-scale hybrid virtualization engine for distributed applications
title_fullStr LINCE : a terabit-scale hybrid virtualization engine for distributed applications
title_full_unstemmed LINCE : a terabit-scale hybrid virtualization engine for distributed applications
title_sort LINCE : a terabit-scale hybrid virtualization engine for distributed applications
author Tirone, Mateus Saquetti Pereira de Carvalho
author_facet Tirone, Mateus Saquetti Pereira de Carvalho
author_role author
dc.contributor.author.fl_str_mv Tirone, Mateus Saquetti Pereira de Carvalho
dc.contributor.advisor1.fl_str_mv Azambuja, José Rodrigo Furlanetto de
dc.contributor.advisor-co1.fl_str_mv Cordeiro, Weverton Luis da Costa
contributor_str_mv Azambuja, José Rodrigo Furlanetto de
Cordeiro, Weverton Luis da Costa
dc.subject.por.fl_str_mv Computação em rede
Virtualização de funções de rede
Planos de dados programáveis
FPGA
P4
Sistemas distribuídos
topic Computação em rede
Virtualização de funções de rede
Planos de dados programáveis
FPGA
P4
Sistemas distribuídos
Programmable forwarding planes
dc.subject.eng.fl_str_mv Programmable forwarding planes
description O aumento de aplicações com uso intensivo de dados e sensíveis à latência exige uma mudança para a computação em rede. No entanto, ainda há uma lacuna significativa: as plataformas acadêmicas existentes baseadas em FPGA não têm desempenho em escala de terabit, enquanto os ASICs comerciais não têm a flexibilidade e a virtualização necessárias para planos de dados programáveis e multilocatários. Esta tese apresenta o Line-rate In-Network Compute Engine (LINCE) para preencher essa lacuna. O LINCE sinergiza o desempenho de alta velocidade de um ASIC para E/S estática e funções de enfileiramento com a reconfigurabilidade dinâmica de um FPGA para hospedar unidades de computação em rede paralelas e isoladas. A plataforma oferece um ecossistema de desenvolvimento versátil, com suporte à linguagem P4 padrão para funções de rede e a um fluxo de trabalho C++/HLS altamente eficiente para aplicações complexas. A arquitetura é caracterizada para atingir uma taxa de transferência virtualizada agregada de 3,2 Tbps, uma ordem de grandeza superior às soluções acadêmicas anteriores. Nosso fluxo de C++/HLS demonstrou reduzir a utilização de recursos em até 99,5% em comparação com as cadeias de ferramentas P4 tradicionais e, ao mesmo tempo, melhorar a latência e a taxa de transferência. A eficácia da plataforma é validada por meio da implantação bem-sucedida de aplicativos distribuídos sofisticados, incluindo inferência de redes neurais artificiais com taxa de linha (atingindo latências abaixo de 1,5 µs) e processamento de fluxo de vídeo em tempo real com reconhecimento de conteúdo (reduzindo a perda crítica de pacotes em 82,5%).
publishDate 2025
dc.date.issued.fl_str_mv 2025
dc.date.accessioned.fl_str_mv 2026-01-21T07:55:08Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/300466
dc.identifier.nrb.pt_BR.fl_str_mv 001299992
url http://hdl.handle.net/10183/300466
identifier_str_mv 001299992
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/300466/2/001299992.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/300466/1/001299992.pdf
bitstream.checksum.fl_str_mv ed02ebdf01db2bf62f2e3538d0dba87e
1bc84b1b138307f22cbc1627d34dffbc
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br
_version_ 1864542947115008000