Estudo da confiabilidade de interfaces de sinal misto em dispositivos programáveis para aplicações críticas

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Aguilera, Carlos Julio González
Orientador(a): Balen, Tiago Roberto
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/297677
Resumo: Estratégias de tolerância a falhas, como a Redundância Modular Tripla (TMR, Triple Modular Redundancy) e a diversidade de projeto — utilização de diferentes abordagens de projeto para mitigar falhas de modo comum — têm sido amplamente estudadas para aumentar a confiabilidade de System-on-Chip (SoCs) multipropósito, visando mitigar os efeitos da radiação ionizante. Este trabalho apresenta o desenvolvimento, implementação e avaliação experimental de uma técnica de TMR com diversidade aplicada a conversores analógico-digitais (ADCs) operando sob radiação ionizante. A técnica de tolerância a falhas foi implementada em um Programmable System-on-Chip (PSoC), identificando pontos críticos de falha após experimentos de radiação, validando algoritmos de votação por software e propondo configurações otimizadas para diversos ambientes de radiação. Foram realizadas quatro campanhas experimentais; duas envolvendo irradiação com íons pesados, para validar a suscetibilidade a efeitos de evento único (SEEs, Single Event Effects) e avaliar estratégias de votação; uma campanha abordou a Interferência Eletromagnética (EMI), para analisar simultaneamente o comportamento dos votadores. Por fim, realizou-se um experimento com raios-X para confirmar os mecanismos de degradação associados a dose total ionizante (TID, Total Ionizing Dose). Nos experimentos com íons pesados, diferentes arquiteturas de conversores apresentaram diferentes níveis de suscetibilidade quando aplicada a diversidade entre módulos irradiados. Foram observadas 98 ocorrências de erros do tipo Silent Data Corruption, das quais cerca de 22% ocorreram no esquema de votação bit a bit implementado. Esses resultados evidenciam vulnerabilidades específicas em determinadas estratégias de votação e ressaltam a importância de considerar o tempo de execução e a complexidade do algoritmo. O votador de palavra mostrou-se mais robusto, sendo aproximadamente 77% mais resistente a falhas induzidas por radiação, destacando diferenças significativas nas seções de choque obtidas quando comparado com um votador do tipo bit-a-bit. Nos experimentos de radiação acumulativa (TID), a utilização da redundância com diversidade de projeto e temporal, demostrouse eficaz na extensão da vida útil do sistema. O sistema atingindo uma dose total de 242 krad(Si) para 60Co (Cobalto-60) e até 30,6 krad(Si) sob exposição a raios-X antes de apresentar falha total do sistema. No experimento com 60Co, apenas um dos três módulos do TMR diversificado apresentou degradação crítica, enquanto, no experimento com raio-X, os módulos falharam em diferentes doses acumuladas, evidenciando variabilidade associada à diversidade implementada. Posteriormente, foram realizados estudos de simulação elétrica para investigar o mecanismo principal de falha nos conversores SAR (Successive Approximation Register) testados sob TID. As simulações indicaram que a principal vulnerabilidade era associada à degradação de uma chave do tipo bootstrap, responsável pela conexão da tensão de referência à matriz capacitiva do SAR. De modo geral, os resultados experimentais confirmam que a aplicação de TMR combinada com diversidade de projeto e temporal proporciona um aumento significativo na robustez do sistema frente aos efeitos da radiação ionizante e da interferência eletromagnética, utilizando de forma eficiente os recursos internos do SoC, sem introduzir overhead significativo de área ou consumo.
id URGS_af529fac954731ee466e22240bc61578
oai_identifier_str oai:www.lume.ufrgs.br:10183/297677
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Aguilera, Carlos Julio GonzálezBalen, Tiago Roberto2025-10-01T07:55:40Z2024http://hdl.handle.net/10183/297677001294405Estratégias de tolerância a falhas, como a Redundância Modular Tripla (TMR, Triple Modular Redundancy) e a diversidade de projeto — utilização de diferentes abordagens de projeto para mitigar falhas de modo comum — têm sido amplamente estudadas para aumentar a confiabilidade de System-on-Chip (SoCs) multipropósito, visando mitigar os efeitos da radiação ionizante. Este trabalho apresenta o desenvolvimento, implementação e avaliação experimental de uma técnica de TMR com diversidade aplicada a conversores analógico-digitais (ADCs) operando sob radiação ionizante. A técnica de tolerância a falhas foi implementada em um Programmable System-on-Chip (PSoC), identificando pontos críticos de falha após experimentos de radiação, validando algoritmos de votação por software e propondo configurações otimizadas para diversos ambientes de radiação. Foram realizadas quatro campanhas experimentais; duas envolvendo irradiação com íons pesados, para validar a suscetibilidade a efeitos de evento único (SEEs, Single Event Effects) e avaliar estratégias de votação; uma campanha abordou a Interferência Eletromagnética (EMI), para analisar simultaneamente o comportamento dos votadores. Por fim, realizou-se um experimento com raios-X para confirmar os mecanismos de degradação associados a dose total ionizante (TID, Total Ionizing Dose). Nos experimentos com íons pesados, diferentes arquiteturas de conversores apresentaram diferentes níveis de suscetibilidade quando aplicada a diversidade entre módulos irradiados. Foram observadas 98 ocorrências de erros do tipo Silent Data Corruption, das quais cerca de 22% ocorreram no esquema de votação bit a bit implementado. Esses resultados evidenciam vulnerabilidades específicas em determinadas estratégias de votação e ressaltam a importância de considerar o tempo de execução e a complexidade do algoritmo. O votador de palavra mostrou-se mais robusto, sendo aproximadamente 77% mais resistente a falhas induzidas por radiação, destacando diferenças significativas nas seções de choque obtidas quando comparado com um votador do tipo bit-a-bit. Nos experimentos de radiação acumulativa (TID), a utilização da redundância com diversidade de projeto e temporal, demostrouse eficaz na extensão da vida útil do sistema. O sistema atingindo uma dose total de 242 krad(Si) para 60Co (Cobalto-60) e até 30,6 krad(Si) sob exposição a raios-X antes de apresentar falha total do sistema. No experimento com 60Co, apenas um dos três módulos do TMR diversificado apresentou degradação crítica, enquanto, no experimento com raio-X, os módulos falharam em diferentes doses acumuladas, evidenciando variabilidade associada à diversidade implementada. Posteriormente, foram realizados estudos de simulação elétrica para investigar o mecanismo principal de falha nos conversores SAR (Successive Approximation Register) testados sob TID. As simulações indicaram que a principal vulnerabilidade era associada à degradação de uma chave do tipo bootstrap, responsável pela conexão da tensão de referência à matriz capacitiva do SAR. De modo geral, os resultados experimentais confirmam que a aplicação de TMR combinada com diversidade de projeto e temporal proporciona um aumento significativo na robustez do sistema frente aos efeitos da radiação ionizante e da interferência eletromagnética, utilizando de forma eficiente os recursos internos do SoC, sem introduzir overhead significativo de área ou consumo.Fault tolerance strategies, such as Triple Modular Redundancy (TMR) and design diversity — employing different design approaches to mitigate common-mode failures — have been extensively studied to enhance the reliability of multipurpose System-on-Chips (SoCs), aiming to mitigate the effects of ionizing radiation. This work presents the development, implementation, and experimental evaluation of a TMR technique with diversity applied to analog-to-digital converters (ADCs) operating under ionizing radiation. The fault tolerance technique was implemented on a Programmable System-on-Chip (PSoC), with critical failure points identified through radiation experiments, validation of software-based voting algorithms, and proposals of optimized configurations for various radiation environments. Four experimental campaigns were conducted: two involving heavy-ion irradiation to validate susceptibility to Single Event Effects (SEEs) and to evaluate voting strategies; one campaign addressing Electromagnetic Interference (EMI) to simultaneously analyze voter behavior; and a final campaign involving X-ray irradiation to confirm degradation mechanisms associated with Total Ionizing Dose (TID). In the heavyion experiments, different ADC architectures demonstrated varying levels of susceptibility when diversity was applied among irradiated modules. A total of 98 Silent Data Corruption (SDC) events were observed, of which approximately 22% occurred within the bit-by-bit voting scheme. These results highlight specific vulnerabilities in certain voting strategies and emphasize the importance of considering execution time and algorithmic complexity. The word-level voter demonstrated greater robustness, being approximately 77% more resistant to radiation-induced failures, and showing significant differences in the measured cross-sections compared to the bit-by-bit voter. In the cumulative radiation experiments (TID), the use of redundancy combined with design and temporal diversity proved effective in extending the system’s operational lifetime. The system reached a total dose of 242 krad(Si) under Cobalt-60 (60Co) irradiation and up to 30.6 krad(Si) under X-ray exposure before exhibiting total system failure. In the Cobalt-60 experiment, only one of the three diversified TMR modules showed critical degradation, while in the Xray experiment, module failures occurred at different accumulated doses, highlighting the variability associated with the implemented diversity. Subsequently, electrical simulation studies were performed to investigate the main failure mechanism in the SAR (Successive Approximation Register) converters tested under TID conditions. Simulations indicated that the primary vulnerability was associated with the degradation of a bootstrap switch, responsible for connecting the reference voltage to the SAR capacitive array. Overall, the experimental results confirm that the application of TMR combined with design and temporal diversity significantly enhances system robustness against ionizing radiation and electromagnetic interference, while efficiently utilizing internal SoC resources without introducing significant area or power overhead.application/pdfporDiversidadeTolerância a falhasEfeitos da radiaçãoRedundância modular triplaProgrammable System-On-ChipEstudo da confiabilidade de interfaces de sinal misto em dispositivos programáveis para aplicações críticasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em MicroeletrônicaPorto Alegre, BR-RS2024doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001294405.pdf.txt001294405.pdf.txtExtracted Texttext/plain284406http://www.lume.ufrgs.br/bitstream/10183/297677/2/001294405.pdf.txtd1f56c659f1d84fd804209b2ec36a427MD52ORIGINAL001294405.pdfTexto completoapplication/pdf5727846http://www.lume.ufrgs.br/bitstream/10183/297677/1/001294405.pdfaf8cb5da3723820e417b740cbc62924aMD5110183/2976772025-10-02 06:58:34.081829oai:www.lume.ufrgs.br:10183/297677Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br || lume@ufrgs.bropendoar:18532025-10-02T09:58:34Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Estudo da confiabilidade de interfaces de sinal misto em dispositivos programáveis para aplicações críticas
title Estudo da confiabilidade de interfaces de sinal misto em dispositivos programáveis para aplicações críticas
spellingShingle Estudo da confiabilidade de interfaces de sinal misto em dispositivos programáveis para aplicações críticas
Aguilera, Carlos Julio González
Diversidade
Tolerância a falhas
Efeitos da radiação
Redundância modular tripla
Programmable System-On-Chip
title_short Estudo da confiabilidade de interfaces de sinal misto em dispositivos programáveis para aplicações críticas
title_full Estudo da confiabilidade de interfaces de sinal misto em dispositivos programáveis para aplicações críticas
title_fullStr Estudo da confiabilidade de interfaces de sinal misto em dispositivos programáveis para aplicações críticas
title_full_unstemmed Estudo da confiabilidade de interfaces de sinal misto em dispositivos programáveis para aplicações críticas
title_sort Estudo da confiabilidade de interfaces de sinal misto em dispositivos programáveis para aplicações críticas
author Aguilera, Carlos Julio González
author_facet Aguilera, Carlos Julio González
author_role author
dc.contributor.author.fl_str_mv Aguilera, Carlos Julio González
dc.contributor.advisor1.fl_str_mv Balen, Tiago Roberto
contributor_str_mv Balen, Tiago Roberto
dc.subject.por.fl_str_mv Diversidade
Tolerância a falhas
Efeitos da radiação
Redundância modular tripla
topic Diversidade
Tolerância a falhas
Efeitos da radiação
Redundância modular tripla
Programmable System-On-Chip
dc.subject.eng.fl_str_mv Programmable System-On-Chip
description Estratégias de tolerância a falhas, como a Redundância Modular Tripla (TMR, Triple Modular Redundancy) e a diversidade de projeto — utilização de diferentes abordagens de projeto para mitigar falhas de modo comum — têm sido amplamente estudadas para aumentar a confiabilidade de System-on-Chip (SoCs) multipropósito, visando mitigar os efeitos da radiação ionizante. Este trabalho apresenta o desenvolvimento, implementação e avaliação experimental de uma técnica de TMR com diversidade aplicada a conversores analógico-digitais (ADCs) operando sob radiação ionizante. A técnica de tolerância a falhas foi implementada em um Programmable System-on-Chip (PSoC), identificando pontos críticos de falha após experimentos de radiação, validando algoritmos de votação por software e propondo configurações otimizadas para diversos ambientes de radiação. Foram realizadas quatro campanhas experimentais; duas envolvendo irradiação com íons pesados, para validar a suscetibilidade a efeitos de evento único (SEEs, Single Event Effects) e avaliar estratégias de votação; uma campanha abordou a Interferência Eletromagnética (EMI), para analisar simultaneamente o comportamento dos votadores. Por fim, realizou-se um experimento com raios-X para confirmar os mecanismos de degradação associados a dose total ionizante (TID, Total Ionizing Dose). Nos experimentos com íons pesados, diferentes arquiteturas de conversores apresentaram diferentes níveis de suscetibilidade quando aplicada a diversidade entre módulos irradiados. Foram observadas 98 ocorrências de erros do tipo Silent Data Corruption, das quais cerca de 22% ocorreram no esquema de votação bit a bit implementado. Esses resultados evidenciam vulnerabilidades específicas em determinadas estratégias de votação e ressaltam a importância de considerar o tempo de execução e a complexidade do algoritmo. O votador de palavra mostrou-se mais robusto, sendo aproximadamente 77% mais resistente a falhas induzidas por radiação, destacando diferenças significativas nas seções de choque obtidas quando comparado com um votador do tipo bit-a-bit. Nos experimentos de radiação acumulativa (TID), a utilização da redundância com diversidade de projeto e temporal, demostrouse eficaz na extensão da vida útil do sistema. O sistema atingindo uma dose total de 242 krad(Si) para 60Co (Cobalto-60) e até 30,6 krad(Si) sob exposição a raios-X antes de apresentar falha total do sistema. No experimento com 60Co, apenas um dos três módulos do TMR diversificado apresentou degradação crítica, enquanto, no experimento com raio-X, os módulos falharam em diferentes doses acumuladas, evidenciando variabilidade associada à diversidade implementada. Posteriormente, foram realizados estudos de simulação elétrica para investigar o mecanismo principal de falha nos conversores SAR (Successive Approximation Register) testados sob TID. As simulações indicaram que a principal vulnerabilidade era associada à degradação de uma chave do tipo bootstrap, responsável pela conexão da tensão de referência à matriz capacitiva do SAR. De modo geral, os resultados experimentais confirmam que a aplicação de TMR combinada com diversidade de projeto e temporal proporciona um aumento significativo na robustez do sistema frente aos efeitos da radiação ionizante e da interferência eletromagnética, utilizando de forma eficiente os recursos internos do SoC, sem introduzir overhead significativo de área ou consumo.
publishDate 2024
dc.date.issued.fl_str_mv 2024
dc.date.accessioned.fl_str_mv 2025-10-01T07:55:40Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/297677
dc.identifier.nrb.pt_BR.fl_str_mv 001294405
url http://hdl.handle.net/10183/297677
identifier_str_mv 001294405
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/297677/2/001294405.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/297677/1/001294405.pdf
bitstream.checksum.fl_str_mv d1f56c659f1d84fd804209b2ec36a427
af8cb5da3723820e417b740cbc62924a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br || lume@ufrgs.br
_version_ 1854319310248345600