LINCE : a terabit-scale hybrid virtualization engine for distributed applications
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Link de acesso: | http://hdl.handle.net/10183/300466 |
Resumo: | O aumento de aplicações com uso intensivo de dados e sensíveis à latência exige uma mudança para a computação em rede. No entanto, ainda há uma lacuna significativa: as plataformas acadêmicas existentes baseadas em FPGA não têm desempenho em escala de terabit, enquanto os ASICs comerciais não têm a flexibilidade e a virtualização necessárias para planos de dados programáveis e multilocatários. Esta tese apresenta o Line-rate In-Network Compute Engine (LINCE) para preencher essa lacuna. O LINCE sinergiza o desempenho de alta velocidade de um ASIC para E/S estática e funções de enfileiramento com a reconfigurabilidade dinâmica de um FPGA para hospedar unidades de computação em rede paralelas e isoladas. A plataforma oferece um ecossistema de desenvolvimento versátil, com suporte à linguagem P4 padrão para funções de rede e a um fluxo de trabalho C++/HLS altamente eficiente para aplicações complexas. A arquitetura é caracterizada para atingir uma taxa de transferência virtualizada agregada de 3,2 Tbps, uma ordem de grandeza superior às soluções acadêmicas anteriores. Nosso fluxo de C++/HLS demonstrou reduzir a utilização de recursos em até 99,5% em comparação com as cadeias de ferramentas P4 tradicionais e, ao mesmo tempo, melhorar a latência e a taxa de transferência. A eficácia da plataforma é validada por meio da implantação bem-sucedida de aplicativos distribuídos sofisticados, incluindo inferência de redes neurais artificiais com taxa de linha (atingindo latências abaixo de 1,5 µs) e processamento de fluxo de vídeo em tempo real com reconhecimento de conteúdo (reduzindo a perda crítica de pacotes em 82,5%). |
| id |
UFRGS-2_09bda0ae1477eb58cf0509e9f2b6c64d |
|---|---|
| oai_identifier_str |
oai:www.lume.ufrgs.br:10183/300466 |
| network_acronym_str |
UFRGS-2 |
| network_name_str |
Repositório Institucional da UFRGS |
| repository_id_str |
|
| spelling |
Tirone, Mateus Saquetti Pereira de CarvalhoAzambuja, José Rodrigo Furlanetto deCordeiro, Weverton Luis da Costa2026-01-21T07:55:08Z2025http://hdl.handle.net/10183/300466001299992O aumento de aplicações com uso intensivo de dados e sensíveis à latência exige uma mudança para a computação em rede. No entanto, ainda há uma lacuna significativa: as plataformas acadêmicas existentes baseadas em FPGA não têm desempenho em escala de terabit, enquanto os ASICs comerciais não têm a flexibilidade e a virtualização necessárias para planos de dados programáveis e multilocatários. Esta tese apresenta o Line-rate In-Network Compute Engine (LINCE) para preencher essa lacuna. O LINCE sinergiza o desempenho de alta velocidade de um ASIC para E/S estática e funções de enfileiramento com a reconfigurabilidade dinâmica de um FPGA para hospedar unidades de computação em rede paralelas e isoladas. A plataforma oferece um ecossistema de desenvolvimento versátil, com suporte à linguagem P4 padrão para funções de rede e a um fluxo de trabalho C++/HLS altamente eficiente para aplicações complexas. A arquitetura é caracterizada para atingir uma taxa de transferência virtualizada agregada de 3,2 Tbps, uma ordem de grandeza superior às soluções acadêmicas anteriores. Nosso fluxo de C++/HLS demonstrou reduzir a utilização de recursos em até 99,5% em comparação com as cadeias de ferramentas P4 tradicionais e, ao mesmo tempo, melhorar a latência e a taxa de transferência. A eficácia da plataforma é validada por meio da implantação bem-sucedida de aplicativos distribuídos sofisticados, incluindo inferência de redes neurais artificiais com taxa de linha (atingindo latências abaixo de 1,5 µs) e processamento de fluxo de vídeo em tempo real com reconhecimento de conteúdo (reduzindo a perda crítica de pacotes em 82,5%).The rise of data-intensive, latency-sensitive applications necessitates a shift towards InNetwork Computing (INC). However, a significant gap persists: existing academic FPGAbased platforms lack terabit-scale performance, while commercial ASICs lack the flexibility and virtualization required for multi-tenant, programmable data planes. This thesis introduces the Line-rate In-Network Compute Engine (LINCE) to bridge this gap. LINCE synergizes the high-speed performance of an ASIC for static I/O and queuing functions with the dynamic reconfigurability of an FPGA for hosting parallel, isolated In-Network Computing units. The platform offers a versatile development ecosystem, supporting both the standard P4 language for network functions and a highly efficient C++/HLS workflow for complex applications. The architecture is characterized to achieve an aggregate virtualized throughput of 3.2 Tbps, an order of magnitude beyond prior academic solutions. Our C++/HLS flow is demonstrated to reduce resource utilization by up to 99.5% compared to traditional P4 toolchains while improving latency and throughput. The platform’s efficacy is validated through the successful deployment of sophisticated distributed applications, including line-rate Artificial Neural Network inference (achieving latencies under 1.5 µs) and real-time, content-aware video stream processing (reducing critical packet loss by 82.5%). By reconciling terabit-scale performance with deep programmability and dynamic virtualization, LINCE establishes a new benchmark and provides a robust, opensource foundation for the next generation of intelligent networks.application/pdfengComputação em redeVirtualização de funções de redePlanos de dados programáveisFPGAP4Sistemas distribuídosProgrammable forwarding planesLINCE : a terabit-scale hybrid virtualization engine for distributed applicationsLINCE (Line-rate In-Network Compute Engine) : um mecanismo de virtualização híbrido em escala de terabits para aplicativos distribuídosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS3 dez. 2025doutoradoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001299992.pdf.txt001299992.pdf.txtExtracted Texttext/plain426880http://www.lume.ufrgs.br/bitstream/10183/300466/2/001299992.pdf.txted02ebdf01db2bf62f2e3538d0dba87eMD52ORIGINAL001299992.pdfTexto completo (inglês)application/pdf5226059http://www.lume.ufrgs.br/bitstream/10183/300466/1/001299992.pdf1bc84b1b138307f22cbc1627d34dffbcMD5110183/3004662026-05-01 08:03:17.004055oai:www.lume.ufrgs.br:10183/300466Repositório InstitucionalPUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.bropendoar:2026-05-01T11:03:17Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
| dc.title.pt_BR.fl_str_mv |
LINCE : a terabit-scale hybrid virtualization engine for distributed applications |
| dc.title.alternative.pt.fl_str_mv |
LINCE (Line-rate In-Network Compute Engine) : um mecanismo de virtualização híbrido em escala de terabits para aplicativos distribuídos |
| title |
LINCE : a terabit-scale hybrid virtualization engine for distributed applications |
| spellingShingle |
LINCE : a terabit-scale hybrid virtualization engine for distributed applications Tirone, Mateus Saquetti Pereira de Carvalho Computação em rede Virtualização de funções de rede Planos de dados programáveis FPGA P4 Sistemas distribuídos Programmable forwarding planes |
| title_short |
LINCE : a terabit-scale hybrid virtualization engine for distributed applications |
| title_full |
LINCE : a terabit-scale hybrid virtualization engine for distributed applications |
| title_fullStr |
LINCE : a terabit-scale hybrid virtualization engine for distributed applications |
| title_full_unstemmed |
LINCE : a terabit-scale hybrid virtualization engine for distributed applications |
| title_sort |
LINCE : a terabit-scale hybrid virtualization engine for distributed applications |
| author |
Tirone, Mateus Saquetti Pereira de Carvalho |
| author_facet |
Tirone, Mateus Saquetti Pereira de Carvalho |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Tirone, Mateus Saquetti Pereira de Carvalho |
| dc.contributor.advisor1.fl_str_mv |
Azambuja, José Rodrigo Furlanetto de |
| dc.contributor.advisor-co1.fl_str_mv |
Cordeiro, Weverton Luis da Costa |
| contributor_str_mv |
Azambuja, José Rodrigo Furlanetto de Cordeiro, Weverton Luis da Costa |
| dc.subject.por.fl_str_mv |
Computação em rede Virtualização de funções de rede Planos de dados programáveis FPGA P4 Sistemas distribuídos |
| topic |
Computação em rede Virtualização de funções de rede Planos de dados programáveis FPGA P4 Sistemas distribuídos Programmable forwarding planes |
| dc.subject.eng.fl_str_mv |
Programmable forwarding planes |
| description |
O aumento de aplicações com uso intensivo de dados e sensíveis à latência exige uma mudança para a computação em rede. No entanto, ainda há uma lacuna significativa: as plataformas acadêmicas existentes baseadas em FPGA não têm desempenho em escala de terabit, enquanto os ASICs comerciais não têm a flexibilidade e a virtualização necessárias para planos de dados programáveis e multilocatários. Esta tese apresenta o Line-rate In-Network Compute Engine (LINCE) para preencher essa lacuna. O LINCE sinergiza o desempenho de alta velocidade de um ASIC para E/S estática e funções de enfileiramento com a reconfigurabilidade dinâmica de um FPGA para hospedar unidades de computação em rede paralelas e isoladas. A plataforma oferece um ecossistema de desenvolvimento versátil, com suporte à linguagem P4 padrão para funções de rede e a um fluxo de trabalho C++/HLS altamente eficiente para aplicações complexas. A arquitetura é caracterizada para atingir uma taxa de transferência virtualizada agregada de 3,2 Tbps, uma ordem de grandeza superior às soluções acadêmicas anteriores. Nosso fluxo de C++/HLS demonstrou reduzir a utilização de recursos em até 99,5% em comparação com as cadeias de ferramentas P4 tradicionais e, ao mesmo tempo, melhorar a latência e a taxa de transferência. A eficácia da plataforma é validada por meio da implantação bem-sucedida de aplicativos distribuídos sofisticados, incluindo inferência de redes neurais artificiais com taxa de linha (atingindo latências abaixo de 1,5 µs) e processamento de fluxo de vídeo em tempo real com reconhecimento de conteúdo (reduzindo a perda crítica de pacotes em 82,5%). |
| publishDate |
2025 |
| dc.date.issued.fl_str_mv |
2025 |
| dc.date.accessioned.fl_str_mv |
2026-01-21T07:55:08Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/300466 |
| dc.identifier.nrb.pt_BR.fl_str_mv |
001299992 |
| url |
http://hdl.handle.net/10183/300466 |
| identifier_str_mv |
001299992 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
| instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
| instacron_str |
UFRGS |
| institution |
UFRGS |
| reponame_str |
Repositório Institucional da UFRGS |
| collection |
Repositório Institucional da UFRGS |
| bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/300466/2/001299992.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/300466/1/001299992.pdf |
| bitstream.checksum.fl_str_mv |
ed02ebdf01db2bf62f2e3538d0dba87e 1bc84b1b138307f22cbc1627d34dffbc |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
| repository.mail.fl_str_mv |
lume@ufrgs.br |
| _version_ |
1864542947115008000 |