Analiza i weryfikacja łagodzenia sytuacji zdenerwowanych pojedynczym zdarzeniem – Semiwiki

Analiza i weryfikacja łagodzenia sytuacji zdenerwowanych pojedynczym zdarzeniem – Semiwiki

Węzeł źródłowy: 3003638

Ewolucja zastosowań kosmicznych w dalszym ciągu napędza innowacje w podmiotach rządowych i prywatnych. Nowe wymagania w zakresie zaawansowanych możliwości i zestawów funkcji mają bezpośredni wpływ na podstawowy sprzęt, zmuszając firmy do migracji do mniejszych geometrii, aby zapewnić wymaganą wydajność, powierzchnię i korzyści w zakresie mocy.

Jednocześnie przestrzeń aplikacji ewoluuje, a parametry misji nowych aplikacji powodują, że firmy oceniają nietradycyjne podejścia. Komercyjne procesy o wysokiej niezawodności (tj. te opracowane na potrzeby projektów motoryzacyjnych) są rozważane w przemyśle lotniczym i kosmonautycznym, ponieważ spełniają one zarówno wymagania dotyczące trwałości określone scenariusze, jak i zapewniają krótsze terminy i koszty rozwoju.

Niestety zalety niższych geometrii mają swoją cenę, a jedną z tych wad jest to, że podstawowy sprzęt jest bardziej podatny na błędy programowe, powszechnie określane jako zakłócenia spowodowane pojedynczym zdarzeniem (SEU). Tradycyjne podejście do redundancji lub potrojenia najważniejszych (jeśli nie wszystkich) funkcji chipa szybko staje się zbyt kosztowne.

Na szczęście nowe przepływy i automatyzacja zapewniają zespołom projektowym wgląd w łagodzenie SEU i oferują możliwość optymalizacji architektury łagodzenia SEU, zwanej również selektywne utwardzanie.

Rysunek 1 Trendy w prowadzeniu pojazdu
Rysunek 1. Trendy zmierzające do selektywnej redukcji promieniowania

Najpierw przeanalizujmy wyzwania.

Wyzwania dotyczące selektywnego hartowania

Informacje zwrotne z branży lotniczej sugerują, że tradycyjne podejście do łagodzenia SEU ma wiele pułapek i pozostawia dwa ważne pytania bez odpowiedzi.

  1. W przypadku elementów projektu, o których wiadomo, że są krytyczne dla misji, jak skuteczne jest wdrożone środki łagodzące?
  2. Jak mogę zidentyfikować potencjał awarii z powodu usterek w niechronionych elementach projektu?

Tradycyjne podejście do łagodzenia SEU najlepiej podsumować w trzyetapowym przepływie pracy.

  • Krok 1: Zidentyfikuj punkty awarii poprzez analizę opartą na ekspertach
  • Krok 2: Inżynierowie projektujący wstawiają łagodzenie (sprzęt i/lub oprogramowanie)
  • Krok 3: Sprawdź skuteczność łagodzenia
    • Symulacja wykorzystująca regresje funkcjonalne i polecenia wymuszające wstrzyknięcie SEU
    • Testy funkcjonalne po krzemie pod wpływem silnych jonów
Rysunek 2 stary przepływ pracy
Rysunek 2: Tradycyjne podejście do łagodzenia SEU

Niestety tradycyjne podejście ma wiele wad, do których należą:

  • Brak wspólnego miernika (metryki), który określałby skuteczność łagodzenia SEU.
  • Analiza oparta na ekspertach nie jest powtarzalna ani skalowalna w miarę wzrostu złożoności.
  • Ręczne wymuszanie błędów w symulacji funkcjonalnej wymaga znacznego wysiłku inżynieryjnego.
  • Niemożność analizy całej przestrzeni stanów uszkodzeń przy użyciu symulacji funkcjonalnej i instrukcji siłowych.
  • Identyfikacja awarii w późnym cyklu podczas testowania w środowisku wiązki wraz z ograniczoną widocznością debugowania, gdy one wystąpią.
Automatyzacja i przepływy pracy wspierające hartowanie selektywne

Nadrzędnym celem selektywnego hartowania jest ochrona funkcji projektowych, które są krytyczne dla funkcjonowania misji, oraz oszczędność kosztów (moc i powierzchnia) poprzez pozostawienie funkcji niekrytycznych bez ochrony. Krótko mówiąc, metodologia ma trzy cele:

  1. Zapewnij pewność już na początku cyklu projektowania, że ​​środki łagodzące są optymalne.
  2. Przedstaw dowody empiryczne na to, że to, co pozostanie bez ochrony, nie może skutkować nieprawidłowym zachowaniem.
  3. Dostarcz ocenę ilościową szczegółowo opisującą skuteczność wdrożonych środków łagodzących.

Firma Siemens opracowała metodologię i zintegrowany przepływ pracy, aby zapewnić systematyczne podejście do pomiaru skuteczności istniejących środków łagodzących, a także określenia krytyczności niechronionej logiki. Przepływ pracy jest podzielony na cztery fazy.

Rysunek 3. Przepływ łagodzenia
Rysunek 3. Przepływ pracy związany z łagodzeniem SEU firmy Siemens

Podział strukturalny: Pierwszy krok w tym procesie wykorzystuje silniki analizy strukturalnej do oceny funkcji projektowych w połączeniu z zaimplementowanym zabezpieczeniem sprzętowym chroniącym tę funkcję. Wynikiem podziału strukturalnego jest raport wskazujący skuteczność istniejącego łagodzenia sprzętu, a także wgląd w istniejące luki.

Analiza wtrysku usterek: Środki łagodzące, których nie można zweryfikować strukturalnie, są kandydatami do wstrzyknięcia usterek. Na tym etapie SEU są wstrzykiwane, propagowane i oceniany wpływ. Wynikiem analizy wstrzykiwania usterek jest raport klasyfikacji usterek zawierający listę usterek wykrytych w wyniku łagodzenia skutków sprzętowych lub programowych, a które nie zostały wykryte.

Analiza propagacji: Miejsca SEU pozostawione bez ochrony są oceniane strukturalnie pod wpływem oczekiwanego obciążenia pracą, aby określić krytyczność poszczególnych ośrodków i prawdopodobieństwo, że spowodują awarię funkcjonalną. Wynikiem analizy propagacji jest lista aktualnie niechronionych usterek, które zostały zidentyfikowane jako mające wpływ na zachowanie funkcjonalne.

Obliczenia metryk: Dane z analizy strukturalnej, wtrysku i propagacji zasilają silnik obliczeniowy metryk i kokpit wizualizacji. Kokpit zapewnia wizualny wgląd w wskaźnik awaryjności, skuteczność środków łagodzących i wszelkie istniejące luki.

Każdy program rozwoju półprzewodników ma unikalne cechy. Metodologia opisana powyżej jest elastyczna i wysoce konfigurowalna, co pozwala zespołom projektowym na dostosowanie się do potrzeb.

Wnioski

Łagodzenie zakłóceń spowodowanych pojedynczym zdarzeniem w dalszym ciągu stanowi wyzwanie nawet dla najbardziej doświadczonych zespołów projektowych, a wyzwanie to staje się jeszcze trudniejsze w miarę wzrostu złożoności projektu i kurczenia się węzłów technologicznych. Istnieją nowe metodologie umożliwiające uzyskanie wyników ilościowych szczegółowo opisujących skuteczność łagodzenia SEU.

Bardziej szczegółowy obraz metodologii Siemens SEU i wyzwań, które pomoże Ci przezwyciężyć, można znaleźć w białej księdze, Selektywne łagodzenie promieniowania w układach scalonych, do którego można również dotrzeć pod adresem Akademia Weryfikacji: Selektywna redukcja promieniowania.

Jacob Wiltgen jest menedżerem ds. rozwiązań w zakresie bezpieczeństwa funkcjonalnego w firmie Siemens EDA. Jacob jest odpowiedzialny za definiowanie i dostosowywanie technologii bezpieczeństwa funkcjonalnego w całym portfolio rozwiązań do weryfikacji układów scalonych. Uzyskał tytuł licencjata w dziedzinie inżynierii elektrycznej i komputerowej na Uniwersytecie Colorado Boulder. Przed objęciem stanowiska Mentor Jacob zajmował różne stanowiska związane z projektowaniem, weryfikacją i kierownictwem, wykonując prace nad rozwojem układów scalonych i SoC w firmach Xilinx, Micron i Broadcom.

Przeczytaj także:

Siemens Digital Industries Software współpracuje z AWS i Arm, aby dostarczyć samochodowego cyfrowego bliźniaka

Obsługa metastabilności podczas Crossing Domain Crossing (CDC)

Wyjątkowe zrozumienie wyzwań związanych z projektowaniem i weryfikacją chipów

Udostępnij ten post przez:

Znak czasu:

Więcej z Półwiki