Реконфигурируемые массивы, ориентированные на обработку данных (Принстон)

Переиздано Платоном

Читают: 0

Технический документ под названием «Массивный дата-центричный параллелизм в эпоху чиплетов» был опубликован исследователями Принстонского университета.

Абстрактные:

«Традиционно приложения с массовым параллелизмом выполняются в распределенных системах, где вычислительные узлы расположены достаточно далеко, поэтому схемы распараллеливания должны минимизировать обмен данными и синхронизацию для достижения масштабируемости. Сопоставление ресурсоемких рабочих нагрузок с распределенными системами требует сложного разделения проблем и предварительной обработки набора данных. Учитывая текущую тенденцию использования искусственного интеллекта, заключающуюся в наличии тысяч взаимосвязанных процессоров на одном кристалле, появляется возможность переосмыслить эти рабочие нагрузки, связанные с узкими местами связи. Это узкое место часто возникает из-за обхода структуры данных, что приводит к нерегулярному доступу к памяти и плохой локальности кэша.
В недавних работах были представлены схемы распараллеливания на основе задач для ускорения обхода графа и других разреженных рабочих нагрузок. Обход структуры данных разбивается на задачи и распределяется по конвейерам между процессорами (PU). Dalorex продемонстрировал высочайшую масштабируемость (до тысяч PU на одном чипе), имея весь набор данных на кристалле, разбросанный по PU и выполняя задачи на том PU, где данные являются локальными. Однако это также подняло вопросы о том, как масштабироваться для более крупных наборов данных, когда вся память находится на кристалле, и какой ценой.

Для решения этих проблем мы предлагаем масштабируемую архитектуру, состоящую из сетки микросхем Data-Centric Reconfigurable Array (DCRA). Реконфигурация во время пакета позволяет создавать продукты на основе микросхем, которые оптимизируются для различных целевых показателей, таких как время принятия решения, энергопотребление или стоимость, а реконфигурация программного обеспечения позволяет избежать перенасыщения сети при масштабировании до миллионов PU во многих пакетах микросхем. Мы оцениваем шесть приложений и четыре набора данных с несколькими конфигурациями и технологиями памяти, чтобы обеспечить подробный анализ производительности, мощности и стоимости локального выполнения данных в масштабе. Наше распараллеливание поиска в ширину с RMAT-26 на миллионе PU достигает 3323 GTEPS».

Найдите техническое бумага здесь. Опубликовано в апреле 2023 г. (препринт).

Оренеш-Вера, Марсело, Эсин Туречи, Дэвид Венцлаф и Маргарет Мартоноси. «Массовый параллелизм, ориентированный на данные, в эпоху чиплетов». Препринт arXiv arXiv: 2304.09389 (2023).

Похожие страницы:
Мини-консорциумы формируются вокруг чиплетов
Коммерческие рынки чиплетов все еще находятся на отдаленном горизонте, но компании начинают рано начинать с более ограниченного партнерства.
Риски безопасности чипсетов недооценены
Масштабы проблем безопасности для коммерческих чиплетов пугают.
Гонка за чипсетами смешанного производства
Проблемы сборки чиплетов на разных литейных заводах только начинают проявляться.
Аспекты проектирования и последние достижения в области чиплетов (Калифорнийский университет в Беркли/Пекинский университет)

SEO-контент и PR-распределение. Получите усиление сегодня.
Платоблокчейн. Интеллект метавселенной Web3. Расширение знаний. Доступ здесь.
Чеканка будущего с Эдриенн Эшли. Доступ здесь.
Источник: https://semiengineering.com/data-centric-reconfigurable-array-dcra-chiplets-princeton/

Отметка времени: 21 апреля 2023

Отметка времени: Июнь 6, 2023

Data-Centric Reconfigurable Array Chiplets (Принстон)

Переиздано Платоном

Больше от Полуинжиниринг

Проблемы тестирования растут по мере увеличения требований к надежности

Исследовательские биты: 14 февраля.

Измерение 3D-топографии боковой стенки и LER для рисунков фоторезиста с использованием технологии АСМ с наклоном наконечника

DeepGBASS: глубоко управляемая семантическая сегментация с учетом границ

Разделение процессоров для рабочих нагрузок ИИ

Программируемый ввод-вывод общего назначения

Чиплеты: нужно больше стандартов

Многомерный анализ для полной видимости процесса

О Нас

Вертикальный поиск и AI

Платформа

Оставайтесь на связи

Учетная запись