Análise e verificação de mitigação de transtornos de eventos únicos - Semiwiki

Análise e verificação de mitigação de transtornos de eventos únicos – Semiwiki

Nó Fonte: 3003638

A evolução das aplicações baseadas no espaço continua a impulsionar a inovação em entidades governamentais e privadas. As novas demandas por recursos avançados e conjuntos de recursos têm um impacto direto no hardware subjacente, levando as empresas a migrar para geometrias menores para oferecer os benefícios necessários de desempenho, área e energia.

Simultaneamente, o espaço de aplicações está evoluindo e os parâmetros de missão para essas novas aplicações estão fazendo com que as empresas avaliem abordagens não tradicionais. Processos comerciais de alta confiabilidade (ou seja, aqueles desenvolvidos para projetos automotivos) estão sendo considerados para o setor aeroespacial, pois atendem aos requisitos de sobrevivência de determinados cenários e proporcionam prazos e custos de desenvolvimento reduzidos.

Infelizmente, as vantagens oferecidas em geometrias mais baixas têm um custo, e uma dessas desvantagens é que o hardware subjacente é mais suscetível a erros leves, comumente chamados de SEU (single event perturbações). As abordagens tradicionais de redundância ou triplicação de funções importantes (se não de todas) dentro do chip estão rapidamente se tornando proibitivas em termos de custos.

Felizmente, novos fluxos e automação fornecem às equipes de projeto insights sobre a mitigação de SEU e oferecem a capacidade de otimizar a arquitetura de mitigação de SEU, também conhecida como endurecimento seletivo.

Figura 1 Tendências impulsionadoras
Figura 1. Tendências impulsionadoras para a mitigação seletiva da radiação

Primeiro, vamos revisar os desafios.

Desafios de endurecimento seletivo

O feedback da indústria aeroespacial sugere que a abordagem tradicional à mitigação do SEU tem muitas armadilhas e deixa duas questões importantes sem resposta.

  1. Para os elementos de design conhecidos por serem de missão crítica, quão eficaz é a mitigação implementada?
  2. Como posso identificar o potencial de falha devido a falhas em elementos de projeto não protegidos?

A abordagem tradicional para a mitigação de SEU é melhor resumida em um fluxo de trabalho de três etapas.

  • Etapa 1: Identifique pontos de falha por meio de análise conduzida por especialistas
  • Etapa 2: Engenheiros de projeto inserem a mitigação (HW e/ou SW)
  • Passo 3: Verifique a eficácia da mitigação
    • Simulação aproveitando regressões funcionais e comandos de força para injetar SEUs
    • Teste funcional pós-silício sob exposição a íons pesados
Figura 2 fluxo de trabalho antigo
Figura 2: A abordagem tradicional para mitigação de SEU

Infelizmente, a abordagem tradicional tem várias desvantagens, incluindo:

  • Nenhuma medida (métrica) comum que determine a eficácia da mitigação do SEU.
  • A análise orientada por especialistas não é repetível ou escalável à medida que a complexidade aumenta.
  • Forçar falhas manualmente na simulação funcional requer um esforço substancial de engenharia.
  • Incapacidade de analisar o espaço completo de estados de falha usando simulação funcional e declarações de força.
  • Identificação de falhas no ciclo tardio ao testar em um ambiente de feixe, juntamente com visibilidade limitada de depuração quando elas ocorrem.
Automação e fluxos de trabalho que apoiam o endurecimento seletivo

O objetivo geral do endurecimento seletivo é proteger as funções de projeto que são críticas para a função da missão e economizar custos (energia e área), deixando desprotegidas funções não críticas. Resumindo isso, a metodologia tem três objetivos:

  1. Forneça confiança no início do ciclo de design de que a mitigação é ideal.
  2. Fornecer evidências empíricas de que o que é deixado desprotegido não pode resultar em comportamento anormal.
  3. Entregar uma avaliação quantitativa detalhando a eficácia da mitigação implementada.

A Siemens desenvolveu uma metodologia e um fluxo de trabalho integrado para fornecer uma abordagem sistemática na medição da eficácia da mitigação existente, bem como na determinação da criticidade da lógica desprotegida. O fluxo de trabalho é dividido em quatro fases.

Figura 3 fluxo de mitigação
Figura 3. O fluxo de trabalho de mitigação SEU da Siemens

Particionamento Estrutural: A primeira etapa do fluxo aproveita mecanismos de análise estrutural para avaliar funções de projeto em combinação com a mitigação de hardware implementada que protege a função. O resultado do particionamento estrutural é um relatório que indica a eficácia da mitigação de hardware existente, bem como informações sobre as lacunas existentes.

Análise de injeção de falhas: A mitigação que não pôde ser verificada estruturalmente é candidata à injeção de falhas. Nesta fase, os SEUs são injetados, propagados e o impacto avaliado. A saída da análise de injeção de falhas é um relatório de classificação de falhas listando quais falhas foram detectadas pela mitigação de hardware ou software e quais falhas não foram detectadas.

Análise de propagação: Os sites SEU deixados desprotegidos são avaliados estruturalmente sob o estímulo de carga de trabalho esperado para determinar a criticidade por site e sua probabilidade de resultar em falha funcional. A saída da análise de propagação é uma lista de falhas atualmente desprotegidas que foram identificadas para impactar o comportamento funcional.

Computação de métricas: Dados de análise estrutural, de injeção e de propagação alimentam o mecanismo de cálculo de métricas e o cockpit de visualização. O cockpit fornece insights visuais sobre a taxa de falhas, a eficácia da mitigação e quaisquer lacunas existentes.

Cada programa de desenvolvimento de semicondutores possui características únicas. A metodologia descrita acima é flexível e altamente configurável, permitindo que as equipes de projeto se ajustem conforme necessário.

Conclusão

A mitigação de perturbações de eventos únicos continua a desafiar até mesmo as equipes de projeto mais veteranas, e esse desafio é exacerbado à medida que a complexidade do projeto aumenta e os nós de tecnologia diminuem. Existem novas metodologias para fornecer resultados quantitativos que detalham a eficácia da mitigação do SEU.

Para uma visão mais detalhada da metodologia SEU da Siemens e dos desafios que ela o ajudará a superar, consulte o white paper, Mitigação seletiva de radiação para circuitos integrados, que também pode ser acessado em Academia de Verificação: Mitigação Seletiva de Radiação.

Jacob Wiltgen é gerente de soluções de segurança funcional da Siemens EDA. Jacob é responsável por definir e alinhar tecnologias de segurança funcional em todo o portfólio de soluções de verificação de IC. Ele é bacharel em Engenharia Elétrica e de Computação pela Universidade do Colorado Boulder. Antes de Mentor, Jacob ocupou vários cargos de design, verificação e liderança, realizando desenvolvimento de IC e SoC na Xilinx, Micron e Broadcom.

Leia também:

Siemens Digital Industries Software colabora com AWS e Arm para fornecer um gêmeo digital automotivo

Lidando com a metaestabilidade durante o cruzamento de domínio de relógio (CDC)

Compreender exclusivamente os desafios de design e verificação de chips

Compartilhe esta postagem via:

Carimbo de hora:

Mais de Semiwiki