От заведомо хорошей матрицы к заведомо хорошей системе с UCIe IP

От заведомо хорошей матрицы к заведомо хорошей системе с UCIe IP

Исходный узел: 2645197

Многокристальные системы состоят из нескольких специализированных функциональных кристаллов (или чиплетов), которые собираются в одном корпусе и образуют целостную систему. Многокристальные системы недавно появились в качестве решения для преодоления замедления закона Мура, предоставляя возможность масштабирования функциональности упакованного чипа таким образом, чтобы его можно было производить с хорошей производительностью.

Кроме того, системы с несколькими кристаллами обеспечивают гибкость артикула продукта с точки зрения масштабирования производительности для соответствия потребностям различных сегментов рынка, оптимизации узла процесса для каждой функции путем смешивания и сопоставления различных узлов процесса в одном продукте, ускорения вывода продукта на рынок и снижения рисков.

Чтобы обеспечить более высокую плотность маршрутизации между кристаллами и поддерживать трафик с более высокой пропускной способностью между кристаллами, технология пакетов была развита для создания новых, усовершенствованных пакетов, основанных на кремниевых промежуточных устройствах (с TSV) или кремниевых мостах, а в последнее время и на уровнях перераспределения (RDL). , разветвления и подложки HD.

Ключевым аспектом успеха многокристальных систем является способность обеспечить проверяемость системы на различных этапах производства и сборки, а также надежность работы в полевых условиях. Благодаря использованию дополнительных этапов сборки и более сложных технологий сборки и упаковки многокристальные системы требуют процедур испытаний и обеспечения надежности, которые выходят за рамки того, что было современным для монолитных конструкций.

Голые штампы и сама упаковка должны быть предварительно проверены, чтобы гарантировать обнаружение всех дефектных штампов или корпусов до их сборки в упаковку. Если дефектная матрица обнаруживается только после сборки, то всю систему с несколькими матрицами придется утилизировать, что серьезно повлияет на стоимость. Процесс тестирования голых штампов называется тестированием «Known Good Die» (KGD).

Сам процесс сборки варьируется в зависимости от выбранной технологии упаковки. Например, технологии «Chip First», при которых кристаллы размещаются первыми, а межсоединение строится поверх них, не позволяют проводить тестирование «заведомо исправного корпуса», что потенциально может привести к отказу от исправных кристаллов, если межсоединение неисправно. С другой стороны, в технологиях «чип-последний», когда межсоединение строится отдельно, а кристаллы собираются поверх него, обеспечивается возможность предварительного тестирования корпуса перед сборкой, что снижает вероятность списания хороших кристаллов.

Решение для тестирования многокристальной системы можно разделить на несколько аспектов:

  1. Тестирование покрытия отдельных блоков внутри матрицы
  2. Тестовое покрытие отдельных штампов (голые штампы)
  3. Тест собранной системы (с сквозным покрытием)
  4. Доступ к тестируемой ткани в голых штампах
  5. Иерархический доступ к тестовой ткани после сборки

В этой статье описываются преимущества комплексного решения для тестирования, которое использует UCIe IP для обеспечения надежности системы с несколькими кристаллами.

DFT для интерфейса UCIe

Решение с высоким охватом тестирования для интерфейса UCIe достигается за счет реализации расширенных функций тестируемости в UCIe IP для исключения дефектных кристаллов на этапе тестирования голого кристалла. Некоторые из функций включают в себя:

  1. Цепи сканирования, охватывающие все синтезированные цифровые схемы
  2. Выделенная функциональность BIST для конкретного блока
  3. Встроенная функция самотестирования Loopback (BIST), охватывающая всю сигнальную цепочку вплоть до контакта IO.
  4. Программируемые псевдослучайные двоичные последовательности (PRBS) и определяемые пользователем генераторы и средства проверки тестовых шаблонов
  5. Внесение ошибок для устранения ложных проходов

Кроме того, функциональные возможности расширения покрытия на соединение между кристаллами после сборки корпуса могут помочь достичь высокого уровня покрытия тестами, включая:

  1. Функциональность шлейфа BIST на дальней стороне (прямая связь)
  2. Непосредственная связь BIST
  3. 2D глазок для анализа маргинальности
  4. Функциональность тестирования и ремонта каждой полосы движения

UCIe тестирование и ремонт

Расширенные пакеты обеспечивают маршрутизацию высокой плотности с микровыступами с мелким шагом и маршрутизацию на кремниевых переходниках или переходниках RDL. В процессе сборки некоторые соединения с микровыступами могут получиться неправильной формы и могут сломаться. UCIe предлагает возможность тестировать и ремонтировать эти соединения после сборки таким образом, чтобы компенсировать потенциальную потерю производительности.

Тестирование и восстановление UCIe выполняется во время производственного тестирования и при инициализации канала. На этапе тестирования каждое отдельное звено проверяется на наличие дефектов на низкой скорости. Дефектные ссылки восстанавливаются путем перенаправления данных на запасные ссылки, которые заранее определены стандартом UCIe.

Конфигурации UCIe, предназначенные для расширенных пакетов, включают до 8 запасных контактов в каждом направлении (TX и RX), чтобы обеспечить возможность ремонта всех функциональных каналов:

  1. Четыре запасных контакта для ремонта контактов данных, по 2 контакта на каждую группу из 32 контактов данных.
  2. Один запасной штифт для часов, часов и ремонта штифта гусеницы.
  3. Три запасных контакта, каждый для действующего контакта, контакта данных боковой полосы и ремонта контакта данных часов.

Выполнение тестирования и восстановления происходит, когда в канале связи между кристаллами нет допустимого трафика. После завершения восстановления и инициализации канала предполагается, что он исправен и трафик может передаваться без проблем. Результирующая конфигурация PHY, называемая сигнатурой восстановления PHY, сохраняется во внутренних регистрах на обоих концах канала.

Ухудшение характеристик микроударов во время работы из-за старения или по другим причинам может повлиять на производительность линии связи. Это будет обнаружено на уровне протокола по увеличению частоты ошибок по битам (BER) или, что еще хуже, по потере данных. В этом случае ожидается, что соединение будет прервано и будет выполнен новый этап тестирования и ремонта.

Однако к некоторым приложениям предъявляются жёсткие требования к непрерывности трафика по линии связи «кривая-к-матрице» — они не допускают прерывания трафика во время работы. В таких случаях решение для тестирования добавляет мониторы целостности сигнала (SIM) к каждому выводу приемника UCIe.

Рис. 1: Восстановление ссылок с использованием встроенных запасных ссылок.

Мониторы целостности сигнала

SIM-мониторы представляют собой небольшие блоки, встроенные в ресивер. Они постоянно считывают сигнал на выводе приемника во время нормальной работы, чтобы выявить изменения в характеристиках сигнала, которые могут повлиять на производительность канала или указать, что канал больше не исправен и может выйти из строя в ближайшем будущем.

Данные, собранные отдельными датчиками, собираются в контроллере мониторинга, тестирования и ремонта (MTR) за пределами интерфейса для дальнейшей обработки. Агрегирование данных из нескольких каналов UCIe может обеспечить мгновенное понимание состояния многокристальной системы и обеспечить прогнозное обслуживание каналов.

Если в результате этой процедуры прогнозируется, что определенный канал может выйти из строя, его можно отключить и перенаправить данные на один из резервных каналов, используя механизм восстановления UCIe PHY, даже без прерывания трафика.

Рис. 2. Решение для мониторинга работоспособности каналов UCIe.

Ускорение времени пробуждения

Хотя шаблон трафика для большинства случаев использования интерфейса «компьютер-компьютер», например, при разделении или масштабировании серверов, считается стабильным во время работы, в некоторых случаях трафик может проявлять пульсирующее поведение. В таких случаях желательно перевести интерфейс в режим пониженного энергопотребления, чтобы экономить электроэнергию при отсутствии трафика. Повторную инициализацию канала можно ускорить, избегая процесса тестирования и восстановления и полагаясь на подпись восстановления UCIe PHY, созданную во время предыдущей инициализации PHY.

Эту концепцию можно распространить и на ситуации, когда кристалл полностью отключен. В этих случаях подпись восстановления PHY извлекается из PHY и сохраняется во встроенной постоянной памяти (eFuse или флэш-памяти). В памяти можно хранить несколько подписей, охватывающих различные варианты использования или условия, что обеспечивает дополнительную гибкость для пользователя.

Ускорение тестирования штампов с помощью UCIe

Время испытаний — дорогой товар. Можно ускорить время тестирования, разделив стратегию тестирования иерархически для параллельного запуска тестов различных штампов. Иерархию можно расширить на несколько кристаллов в многокристальной системе, иерархически соединив тестовую инфраструктуру двух кристаллов. Такой подход обеспечивает доступ ко всем кристаллам в системе с несколькими кристаллами из одного тестового интерфейса JTAG (или аналогичного) в основном кристалле.

Часто ограничением времени тестирования является время загрузки или считывания тестовых векторов в матрицы. Интерфейсы JTAG могут стать узким местом в скорости. Чтобы преодолеть это ограничение, разработчики могут использовать существующие высокоскоростные интерфейсы, такие как PCI Express (PCIe) или USB и т. д., в качестве интерфейсов к испытательному оборудованию. Векторы тестирования и команды пакетируются для этого интерфейса и распаковываются на кристалле на этапе производственного тестирования.

Многие кристаллы не имеют высокоскоростного интерфейса, однако межкристальный интерфейс UCIe можно использовать во время испытаний для передачи больших тестовых векторов и команд между кристаллами на высокой скорости. Межкристальный интерфейс UCI расширяет высокоскоростной доступ DFT по всей многокристальной системе без увеличения количества выводов, что особенно важно для ввода-вывода и кристаллов с ограниченной площадью.

Обзор

Помимо сквозного интерфейса UCIe, общим знаменателем, который обеспечивает все эти функции тестирования и повышения надежности, является фабрика тестирования, ремонта и мониторинга, которая может соединять все внутренние блоки. Структура тестирования, ремонта и мониторинга охватывает различные штампы многокристальной системы, обеспечивая структурированную иерархическую инфраструктуру, которая выполняет следующие важные функции:

  1. Управляет тестированием отдельных штампов в системе с несколькими штампами.
  2. Оптимизирует планирование тестирования для сокращения времени тестирования.
  3. Поддерживает высокоскоростной тестовый доступ ко всем штампам через интерфейс UCIe.
  4. Собирает информацию из интерфейсов мониторинга работоспособности, встроенных в интерфейс UCIe, и обеспечивает дальнейшую обработку на уровне системы.
  5. Управляет хранением подписи восстановления PHY в энергонезависимой памяти.
  6. И многое другое

Synopsys предлагает комплексное и масштабируемое многокристальное системное решение, включая EDA и IP, для быстрой гетерогенной интеграции. Для безопасного и надежного соединения между кристаллами Synopsys предлагает комплексное решение для контроллера UCIe, PHY и проверки IP. В составе семейства Synopsys SLM & Test доступно комплексное решение UCIe для мониторинга, тестирования и восстановления (MTR), а также решение STAR Hierarchical System (SHS). Решение MTR включает в себя монитор целостности сигнала для измерения качества сигнала на линиях UCIe, BIST для самотестирования и логику восстановления для выделения резервных полос, а решение SHS служит в качестве связующей структуры, поддерживающей отраслевые стандарты IEEE 1687, IEEE 1149.1 и IEEE 1838. интерфейсы. Это комплексное решение обеспечивает эффективный и экономичный мониторинг состояния UCIe на всех этапах жизненного цикла кремния, что имеет решающее значение для надежной работы многокристальных систем.

Ресурсы:


Отметка времени:

Больше от Полуинжиниринг