Analisi e verifica della mitigazione dei turbamenti di singoli eventi - Semiwiki

Analisi e verifica della mitigazione del turbamento del singolo evento – Semiwiki

Nodo di origine: 3003638

L’evoluzione delle applicazioni spaziali continua a guidare l’innovazione tra enti governativi e privati. Le nuove richieste di capacità e set di funzionalità avanzati hanno un impatto diretto sull’hardware sottostante, spingendo le aziende a migrare verso geometrie più piccole per offrire i vantaggi richiesti in termini di prestazioni, area e potenza.

Allo stesso tempo, lo spazio applicativo si sta evolvendo e i parametri di missione per queste nuove applicazioni stanno spingendo le aziende a valutare approcci non tradizionali. I processi commerciali ad alta affidabilità (cioè quelli sviluppati per la progettazione automobilistica) vengono presi in considerazione per il settore aerospaziale poiché soddisfano sia i requisiti di sopravvivenza di determinati scenari sia forniscono tempi e costi di sviluppo ridotti.

Sfortunatamente, i vantaggi offerti dalle geometrie più basse hanno un costo e uno di questi svantaggi è che l’hardware sottostante è più suscettibile agli errori soft, comunemente definiti SEU (single event sconvolge). Gli approcci tradizionali di ridondanza o triplicazione delle funzioni salienti (se non di tutte) all'interno del chip stanno rapidamente diventando proibitivi in ​​termini di costi.

Fortunatamente, i nuovi flussi e l’automazione forniscono ai team di progetto informazioni approfondite sulla mitigazione del SEU e offrono la possibilità di ottimizzare l’architettura di mitigazione del SEU, denominata anche indurimento selettivo.

Figura 1 Tendenze di guida
Figura 1. Tendenze determinanti verso la mitigazione selettiva delle radiazioni

Innanzitutto, esaminiamo le sfide.

Sfide di rafforzamento selettivo

Il feedback proveniente dall’industria aerospaziale suggerisce che l’approccio tradizionale alla mitigazione della SEU presenta molte insidie ​​e lascia senza risposta due importanti domande.

  1. Per gli elementi di progettazione noti per essere mission-critical, quanto è efficace la mitigazione implementata?
  2. Come posso identificare il potenziale di guasto dovuto a guasti negli elementi di progettazione non protetti?

L’approccio tradizionale alla mitigazione della SEU è meglio riassunto in un flusso di lavoro in tre fasi.

  • Passaggio 1: identificare i punti di errore attraverso l'analisi guidata da esperti
  • Passo 2: I progettisti inseriscono la mitigazione (HW e/o SW)
  • Passaggio 3: verificare l'efficacia della mitigazione
    • Simulazione che sfrutta regressioni funzionali e comandi forzati per iniettare SEU
    • Test funzionali post-silicio con esposizione a ioni pesanti
Figura 2 vecchio flusso di lavoro
Figura 2: L’approccio tradizionale alla mitigazione del SEU

Sfortunatamente, l’approccio tradizionale presenta numerosi inconvenienti, tra cui:

  • Nessuna misurazione comune (metrica) che determini l’efficacia della mitigazione del SEU.
  • L'analisi condotta da esperti non è ripetibile o scalabile con l'aumentare della complessità.
  • Forzare manualmente i guasti nella simulazione funzionale richiede un notevole sforzo ingegneristico.
  • L'incapacità di analizzare l'intero spazio degli stati di guasto utilizzando la simulazione funzionale e le dichiarazioni di forza.
  • Identificazione del ciclo tardivo dei guasti durante i test in un ambiente con travi insieme a una visibilità di debug limitata quando si verificano.
Automazione e flussi di lavoro che supportano la protezione selettiva

L’obiettivo generale dell’hardening selettivo è proteggere le funzioni di progettazione che sono fondamentali per la funzione della missione e risparmiare sui costi (energia e area) lasciando le funzioni non critiche non protette. Riducendo il tutto a un livello inferiore, la metodologia ha tre obiettivi:

  1. Fornire fiducia nelle prime fasi del ciclo di progettazione che la mitigazione sia ottimale.
  2. Fornire prove empiriche che ciò che viene lasciato non protetto non può provocare comportamenti anormali.
  3. Fornire una valutazione quantitativa che dettaglia l’efficacia della mitigazione implementata.

Siemens ha sviluppato una metodologia e un flusso di lavoro integrato per fornire un approccio sistematico nel misurare l’efficacia della mitigazione esistente e nel determinare la criticità della logica non protetta. Il flusso di lavoro è suddiviso in quattro fasi.

Figura 3 flusso di mitigazione
Figura 3. Il flusso di lavoro di mitigazione SEU di Siemens

Partizionamento strutturale: Il primo passaggio del flusso sfrutta i motori di analisi strutturale per valutare le funzioni di progettazione in combinazione con la mitigazione hardware implementata che protegge la funzione. Il risultato del partizionamento strutturale è un rapporto che indica l'efficacia della mitigazione dell'hardware esistente nonché approfondimenti sulle lacune esistenti.

Analisi dell'iniezione dei guasti: Le mitigazioni che non possono essere verificate strutturalmente sono candidate per l'inserimento di guasti. In questa fase, i SEU vengono immessi, propagati e l’impatto valutato. L'output dell'analisi di inserimento dei guasti è un report di classificazione dei guasti che elenca quali guasti sono stati rilevati dalla mitigazione hardware o software e quali guasti non sono stati rilevati.

Analisi della propagazione: I siti SEU lasciati non protetti vengono valutati strutturalmente sotto lo stimolo del carico di lavoro previsto per determinare la criticità per sito e la sua probabilità di provocare un guasto funzionale. L'output dell'analisi della propagazione è un elenco di guasti attualmente non protetti che sono stati identificati per incidere sul comportamento funzionale.

Calcolo delle metriche: I dati provenienti dall'analisi strutturale, di iniezione e di propagazione alimentano il motore di calcolo delle metriche e il cruscotto di visualizzazione. La cabina di pilotaggio fornisce informazioni visive sul tasso di guasto, sull'efficacia della mitigazione e su eventuali lacune esistenti.

Ogni programma di sviluppo di semiconduttori ha caratteristiche uniche. La metodologia sopra descritta è flessibile e altamente configurabile e consente ai team di progetto di adattarsi secondo necessità.

Conclusione

La mitigazione dei problemi derivanti da singoli eventi continua a rappresentare una sfida anche per i team di progetto più veterani, e questa sfida è aggravata dall’aumento della complessità della progettazione e dalla riduzione dei nodi tecnologici. Esistono nuove metodologie per fornire risultati quantitativi che descrivono in dettaglio l’efficacia della mitigazione della SEU.

Per una visione più dettagliata della metodologia SEU di Siemens e delle sfide che aiuterà a superare, fare riferimento al libro bianco, Mitigazione selettiva delle radiazioni per circuiti integrati, a cui è possibile accedere anche all'indirizzo Verification Academy: mitigazione selettiva delle radiazioni.

Jacob Wiltgen è il responsabile delle soluzioni di sicurezza funzionale per Siemens EDA. Jacob è responsabile della definizione e dell'allineamento delle tecnologie di sicurezza funzionale nel portafoglio di soluzioni di verifica IC. Ha conseguito una laurea in ingegneria elettrica e informatica presso l'Università del Colorado Boulder. Prima di Mentor, Jacob ha ricoperto diversi ruoli di progettazione, verifica e leadership eseguendo lo sviluppo di circuiti integrati e SoC presso Xilinx, Micron e Broadcom.

Leggi anche:

Siemens Digital Industries Software collabora con AWS e Arm per realizzare un digital twin automobilistico

Gestione della metastabilità durante Clock Domain Crossing (CDC)

Comprendere in modo univoco le sfide della progettazione e della verifica dei chip

Condividi questo post tramite:

Timestamp:

Di più da Semiwiki