GDDR6 обеспечивает производительность для вывода AI/ML

Переиздано Платоном

Читают: 0

Низкая мощность - высокая производительность

МНЕНИЕ

Скорость пропускной способности памяти и низкая задержка имеют решающее значение, поскольку логические выводы перемещаются от центра обработки данных к границе сети.

AI/ML развивается молниеносными темпами. Сейчас не проходит и недели без новых интересных разработок в этой области, а такие приложения, как ChatGPT, прочно выдвинули возможности генеративного ИИ на передний план общественного внимания.

На самом деле AI/ML — это два приложения: обучение и вывод. Каждый из них зависит от производительности памяти, и каждый имеет уникальный набор требований, которые определяют выбор лучшего решения для памяти.

При обучении решающими требованиями являются пропускная способность и емкость памяти. Это особенно актуально, учитывая размер и сложность моделей данных нейронных сетей, которые растут со скоростью 10 раз в год. Точность нейронной сети зависит от качества и количества примеров в наборе обучающих данных, что приводит к необходимости огромных объемов данных и, следовательно, к пропускной способности и емкости памяти.

Учитывая ценность, создаваемую тренировками, существует мощный стимул выполнять тренировочные заезды как можно быстрее. Поскольку обучающие приложения работают в центрах обработки данных, все более ограниченных в мощности и пространстве, предпочтение отдается решениям, обеспечивающим энергоэффективность и меньший размер. Учитывая все эти требования, HBM3 является идеальным решением памяти для оборудования для обучения ИИ. Он обеспечивает превосходную пропускную способность и пропускную способность.

Результатом обучения нейронной сети является модель вывода, которую можно широко применять. С помощью этой модели устройство вывода может обрабатывать и интерпретировать входные данные за пределами обучающих данных. Для вывода критически важны скорость пропускной способности памяти и низкая задержка, особенно когда необходимы действия в реальном времени. Поскольку все больше и больше выводов искусственного интеллекта перемещаются из центра обработки данных на периферию сети, эти функции памяти становятся еще более важными.

У проектировщиков есть несколько вариантов памяти для вывода AI/ML, но по критическому параметру пропускной способности память GDDR6 действительно превосходна. При скорости передачи данных 24 гигабит в секунду (Гбит/с) и 32-битном интерфейсе устройство GDDR6 может обеспечить пропускную способность памяти 96 гигабит в секунду (ГБ/с), что более чем вдвое превышает любую альтернативную DDR или Решения LPDDR. Память GDDR6 предлагает отличное сочетание скорости, пропускной способности и задержки для вывода AI/ML, в частности для вывода на периферии.

Подсистема интерфейса памяти Rambus GDDR6 обеспечивает производительность 24 Гбит/с и основана на более чем 30-летнем опыте обеспечения целостности высокоскоростного сигнала и целостности питания (SI/PI), что крайне важно для работы GDDR6 на высоких скоростях. Он состоит из PHY и цифрового контроллера, обеспечивая полную подсистему интерфейса памяти GDDR6.

Присоединяйтесь ко мне на вебинаре Rambus в этом месяце на тему «Высокопроизводительный вывод AI/ML с памятью 24 ГБ GDDR6», чтобы узнать, как GDDR6 поддерживает требования к памяти и производительности рабочих нагрузок вывода AI/ML, а также узнать о некоторых ключевых аспектах проектирования и реализации подсистем интерфейса памяти GDDR6.

Ресурсы:

Фрэнк Ферро

(все сообщения)
Фрэнк Ферро — старший директор по маркетингу ядер IP в Rambus.

SEO-контент и PR-распределение. Получите усиление сегодня.
ПлатонАйСтрим. Анализ данных Web3. Расширение знаний. Доступ здесь.
Чеканка будущего с Эдриенн Эшли. Доступ здесь.
Покупайте и продавайте акции компаний PREIPO® с помощью PREIPO®. Доступ здесь.
Источник: https://semiengineering.com/gddr6-delivers-the-performance-for-ai-ml-inference/

Отметка времени: 15 мая 2023