Análisis y verificación de la mitigación de perturbaciones por eventos únicos - Semiwiki

Análisis y verificación de la mitigación de perturbaciones por eventos únicos - Semiwiki

Nodo de origen: 3003638

La evolución de las aplicaciones espaciales continúa impulsando la innovación en entidades gubernamentales y privadas. Las nuevas demandas de capacidades y conjuntos de funciones avanzadas tienen un impacto directo en el hardware subyacente, lo que lleva a las empresas a migrar a geometrías más pequeñas para ofrecer los beneficios de rendimiento, área y energía necesarios.

Al mismo tiempo, el espacio de las aplicaciones está evolucionando y los parámetros de misión para estas nuevas aplicaciones están provocando que las empresas evalúen enfoques no tradicionales. Se están considerando procesos comerciales de alta confiabilidad (es decir, aquellos desarrollados para diseños automotrices) para el sector aeroespacial, ya que cumplen con los requisitos de supervivencia de ciertos escenarios y proporcionan plazos y costos de desarrollo reducidos.

Desafortunadamente, las ventajas que ofrecen las geometrías más bajas tienen un costo, y uno de esos inconvenientes es que el hardware subyacente es más susceptible a errores leves, comúnmente conocidos como alteraciones de evento único (SEU). Los enfoques tradicionales de redundancia o triplicación de funciones destacadas (si no todas) dentro del chip se están volviendo rápidamente prohibitivos en términos de costos.

Afortunadamente, los nuevos flujos y la automatización brindan a los equipos de proyecto información sobre la mitigación de SEU y ofrecen la capacidad de optimizar la arquitectura de mitigación de SEU, también conocida como endurecimiento selectivo.

Figura 1 Tendencias impulsoras
Figura 1. Tendencias impulsoras hacia la mitigación selectiva de la radiación

Primero, repasemos los desafíos.

Desafíos del endurecimiento selectivo

Los comentarios de la industria aeroespacial sugieren que el enfoque tradicional para la mitigación del SEU tiene muchos inconvenientes y deja dos preguntas importantes sin respuesta.

  1. Para los elementos de diseño que se sabe que son críticos para la misión, ¿qué tan efectiva es la mitigación implementada?
  2. ¿Cómo puedo identificar el potencial de falla debido a fallas en elementos de diseño no protegidos?

El enfoque tradicional para la mitigación del SEU se resume mejor en un flujo de trabajo de tres pasos.

  • Paso 1: Identificar los puntos de falla mediante un análisis impulsado por expertos
  • Paso 2: Los ingenieros de diseño insertan la mitigación (HW y/o SW)
  • Paso 3: Verificar la efectividad de la mitigación
    • Simulación que aprovecha regresiones funcionales y comandos de fuerza para inyectar SEU
    • Pruebas funcionales posteriores al silicio bajo fuerte exposición a iones
Figura 2 flujo de trabajo antiguo
Figura 2: El enfoque tradicional para la mitigación del SEU

Desafortunadamente, el enfoque tradicional tiene múltiples inconvenientes, entre ellos:

  • No existe una medida común (métrica) que determine la efectividad de la mitigación del SEU.
  • El análisis impulsado por expertos no es repetible ni escalable a medida que aumenta la complejidad.
  • Forzar fallos manualmente en la simulación funcional requiere un esfuerzo de ingeniería sustancial.
  • Incapacidad para analizar el espacio completo del estado de falla mediante simulación funcional y declaraciones de fuerza.
  • Identificación de fallas en el ciclo tardío al realizar pruebas en un entorno de haz junto con una visibilidad de depuración limitada cuando ocurren.
Automatización y flujos de trabajo que respaldan el endurecimiento selectivo

El objetivo general del endurecimiento selectivo es proteger las funciones de diseño que son críticas para la función de la misión y ahorrar costos (energía y área) al dejar desprotegidas las funciones no críticas. Reduciéndolo a un nivel, la metodología tiene tres objetivos:

  1. Brinde confianza desde el principio del ciclo de diseño de que la mitigación es óptima.
  2. Proporcionar evidencia empírica de que lo que se deja desprotegido no puede resultar en un comportamiento anormal.
  3. Entregar una evaluación cuantitativa que detalle la efectividad de la mitigación implementada.

Siemens ha desarrollado una metodología y un flujo de trabajo integrado para ofrecer un enfoque sistemático para medir la efectividad de la mitigación existente, así como para determinar la criticidad de la lógica desprotegida. El flujo de trabajo se divide en cuatro fases.

Figura 3 flujo de mitigación
Figura 3. Flujo de trabajo de mitigación de Siemens SEU

Partición estructural: El primer paso del flujo aprovecha los motores de análisis estructural para evaluar las funciones de diseño en combinación con la mitigación de hardware implementada que protege la función. El resultado de la partición estructural es un informe que indica la efectividad de la mitigación del hardware existente, así como información sobre las brechas que existen.

Análisis de inyección de fallas: Las mitigaciones que no se pudieron verificar estructuralmente son candidatas a la inyección de fallas. En esta fase, se inyectan, propagan y se evalúa el impacto de las USE. El resultado del análisis de inyección de fallas es un informe de clasificación de fallas que enumera qué fallas se detectaron mediante la mitigación de hardware o software y cuáles no se detectaron.

Análisis de propagación: Los sitios SEU que quedan desprotegidos se evalúan estructuralmente bajo el estímulo de carga de trabajo esperado para determinar la criticidad de cada sitio y su probabilidad de resultar en una falla funcional. El resultado del análisis de propagación es una lista de fallas actualmente desprotegidas que se identificaron para afectar el comportamiento funcional.

Cálculo de métricas: Los datos del análisis estructural, de inyección y de propagación alimentan el motor de cálculo de métricas y la cabina de visualización. La cabina proporciona información visual sobre la tasa de fallas, la efectividad de la mitigación y cualquier brecha que exista.

Cada programa de desarrollo de semiconductores tiene características únicas. La metodología descrita anteriormente es flexible y altamente configurable, lo que permite a los equipos de proyecto ajustarse según sea necesario.

Conclusión

La mitigación de perturbaciones por eventos únicos continúa desafiando incluso a los equipos de proyectos más veteranos, y este desafío se exacerba a medida que aumenta la complejidad del diseño y se reducen los nodos tecnológicos. Existen nuevas metodologías para proporcionar resultados cuantitativos que detallen la efectividad de la mitigación del SEU.

Para obtener una visión más detallada de la metodología Siemens SEU y los desafíos que le ayudará a superar, consulte el documento técnico, Mitigación selectiva de la radiación para circuitos integrados., al que también se puede acceder en Academia de Verificación: Mitigación selectiva de la radiación.

Jacob Wiltgen es el director de soluciones de seguridad funcional de Siemens EDA. Jacob es responsable de definir y alinear las tecnologías de seguridad funcional en toda la cartera de soluciones de verificación de IC. Tiene una licenciatura en Ingeniería Eléctrica e Informática de la Universidad de Colorado Boulder. Antes de Mentor, Jacob ocupó varios puestos de diseño, verificación y liderazgo en el desarrollo de circuitos integrados y SoC en Xilinx, Micron y Broadcom.

Lea también

Siemens Digital Industries Software colabora con AWS y Arm para ofrecer un gemelo digital automotriz

Manejo de la metaestabilidad durante el cruce de dominio del reloj (CDC)

Comprensión única de los desafíos del diseño y la verificación de chips

Comparte esta publicación a través de:

Sello de tiempo:

Mas de Semiwiki