Analyse und Überprüfung der Minderung von Störungen bei Einzelereignissen – Semiwiki

Analyse und Überprüfung der Minderung von Störungen bei Einzelereignissen – Semiwiki

Quellknoten: 3003638

The evolution of space-based applications continues to drive innovation across government and private entities. The new demands for advanced capabilities and feature sets have a direct impact on the underlying hardware, driving companies to migrate to smaller geometries to deliver the required performance, area, and power benefits.

Simultaneously, the application space is evolving, and mission parameters for these new applications are causing companies to evaluate non-traditional approaches. Commercial high-reliability processes (i.e., those developed for automotive designs) are being considered for aerospace as they meet both the survivability requirements of certain scenarios and provide reduced development timelines and cost.

Leider sind die Vorteile niedrigerer Geometrien mit Kosten verbunden, und einer dieser Nachteile besteht darin, dass die zugrunde liegende Hardware anfälliger für Soft Errors ist, die üblicherweise als Single Event Upsets (SEU) bezeichnet werden. Herkömmliche Ansätze der Redundanz oder Verdreifachung wichtiger (wenn nicht aller) Funktionen innerhalb des Chips werden schnell zu kostenintensiv.

Fortunately, new flows and automation provide project teams insights into SEU mitigation and offer the ability to optimize the SEU mitigation architecture, also referred to as selective hardening.

Figure 1 Driving trends
Figure 1. Driving trends to selective radiation mitigation

Schauen wir uns zunächst die Herausforderungen an.

Selective Hardening Challenges

Feedback from the aerospace industry suggests that the traditional approach to SEU mitigation has many pitfalls and leaves two important questions unanswered.

  1. Wie effektiv ist die implementierte Schadensbegrenzung für die Designelemente, die bekanntermaßen geschäftskritisch sind?
  2. Wie kann ich das Fehlerpotenzial aufgrund von Fehlern in nicht geschützten Konstruktionselementen erkennen?

The traditional approach to SEU mitigation is best summarized in a three-step workflow.

  • Step 1: Identify failure points through expert driven analysis
  • Step 2: Design engineers insert the mitigation (HW and/or SW)
  • Step 3: Verify the effectiveness of the mitigation
    • Simulation, die funktionale Regressionen nutzt und Befehle erzwingt, um SEUs zu injizieren
    • Post-Silizium-Funktionstest unter Schwerionenexposition
Figure 2 old workflow
Figure 2: The traditional approach to SEU mitigation

Leider hat der traditionelle Ansatz mehrere Nachteile, darunter:

  • Keine gemeinsame Messung (Metrik), die die Wirksamkeit der SEU-Abschwächung bestimmt.
  • Eine von Experten durchgeführte Analyse ist bei steigender Komplexität nicht wiederholbar oder skalierbar.
  • Das manuelle Erzwingen von Fehlern in der Funktionssimulation erfordert einen erheblichen technischen Aufwand.
  • Die Unfähigkeit, den gesamten Fehlerzustandsraum mithilfe funktionaler Simulation und Kraftanweisungen zu analysieren.
  • Späte Zykluserkennung von Fehlern beim Testen in einer Beam-Umgebung bei gleichzeitig eingeschränkter Debug-Sichtbarkeit, wenn sie auftreten.
Automation and Workflows Supporting Selective Hardening

Das übergeordnete Ziel der selektiven Härtung besteht darin, Designfunktionen zu schützen, die für die Missionsfunktion von entscheidender Bedeutung sind, und Kosten (Energie und Fläche) zu sparen, indem unkritische Funktionen ungeschützt bleiben. Auf den Punkt gebracht verfolgt die Methodik drei Ziele:

  1. Sorgen Sie schon früh im Entwurfszyklus dafür, dass die Schadensbegrenzung optimal ist.
  2. Erbringen Sie empirische Belege dafür, dass ungeschütztes Verhalten nicht zu abnormalem Verhalten führen kann.
  3. Liefern Sie eine quantitative Bewertung, in der die Wirksamkeit der implementierten Schadensbegrenzung detailliert beschrieben wird.

Siemens hat eine Methodik und einen integrierten Workflow entwickelt, um einen systematischen Ansatz zur Messung der Wirksamkeit vorhandener Schadensbegrenzungen sowie zur Bestimmung der Kritikalität ungeschützter Logik zu liefern. Der Arbeitsablauf ist in vier Phasen unterteilt.

Figure 3 mitigation flow
Figure 3. The Siemens SEU mitigation workflow

Strukturelle Partitionierung: Der erste Schritt im Ablauf nutzt Strukturanalyse-Engines, um Entwurfsfunktionen in Kombination mit der implementierten Hardware-Entschärfung zum Schutz der Funktion zu bewerten. Das Ergebnis der strukturellen Partitionierung ist ein Bericht, der die Wirksamkeit der vorhandenen Hardware-Entschärfung sowie Einblicke in die vorhandenen Lücken angibt.

Fehlerinjektionsanalyse: Abhilfemaßnahmen, die strukturell nicht verifiziert werden konnten, sind Kandidaten für die Fehlerinjektion. In dieser Phase werden SEUs injiziert, verbreitet und die Auswirkungen bewertet. Das Ergebnis der Fehlerinjektionsanalyse ist ein Fehlerklassifizierungsbericht, in dem aufgeführt ist, welche Fehler durch Hardware- oder Softwareminderung erkannt wurden und welche Fehler nicht erkannt wurden.

Ausbreitungsanalyse: Die ungeschützten SEU-Standorte werden strukturell unter dem erwarteten Arbeitslastreiz bewertet, um die Kritikalität pro Standort und die Wahrscheinlichkeit eines Funktionsausfalls zu bestimmen. Das Ergebnis der Ausbreitungsanalyse ist eine Liste derzeit ungeschützter Fehler, bei denen festgestellt wurde, dass sie sich auf das Funktionsverhalten auswirken.

Berechnung der Metriken: Daten aus Struktur-, Injektions- und Ausbreitungsanalysen speisen die Metrik-Berechnungs-Engine und das Visualisierungs-Cockpit. Das Cockpit bietet visuelle Einblicke in die Ausfallrate, die Wirksamkeit der Schadensbegrenzung und eventuell vorhandene Lücken.

Jedes Halbleiterentwicklungsprogramm weist einzigartige Merkmale auf. Die oben beschriebene Methodik ist flexibel und hochgradig konfigurierbar, sodass Projektteams sich je nach Bedarf anpassen können.

Zusammenfassung

Die Eindämmung von Störungen durch einzelne Ereignisse stellt weiterhin selbst für die erfahrensten Projektteams eine Herausforderung dar, und diese Herausforderung verschärft sich, wenn die Designkomplexität zunimmt und die Technologieknoten schrumpfen. Es gibt neue Methoden, um quantitative Ergebnisse zu liefern, die die Wirksamkeit der SEU-Abschwächung detailliert beschreiben.

Für einen detaillierteren Überblick über die SEU-Methodik von Siemens und die Herausforderungen, die sie Ihnen bei der Bewältigung helfen wird, lesen Sie bitte das Whitepaper. Selektive Strahlungsminderung für integrierte Schaltkreise, die auch unter abgerufen werden kann Verification Academy: Selektive Strahlungsminderung.

Jacob Wiltgen is the Functional Safety Solutions Manager for Siemens EDA. Jacob is responsible for defining and aligning functional safety technologies across the portfolio of IC Verification Solutions. He holds a Bachelor of Science degree in Electrical and Computer Engineering from the University of Colorado Boulder. Prior to Mentor, Jacob has held various design, verification, and leadership roles performing IC and SoC development at Xilinx, Micron, and Broadcom.

Lesen Sie auch:

Siemens Digital Industries Software Collaborates with AWS and Arm To Deliver an Automotive Digital Twin

Handling metastability during Clock Domain Crossing (CDC)

Einzigartiges Verständnis der Herausforderungen des Chip-Designs und der Chip-Verifizierung

Teile diesen Beitrag über:

Zeitstempel:

Mehr von Semiwiki