Скорость пропускной способности памяти и низкая задержка имеют решающее значение, поскольку логические выводы перемещаются от центра обработки данных к границе сети.
AI/ML развивается молниеносными темпами. Сейчас не проходит и недели без новых интересных разработок в этой области, а такие приложения, как ChatGPT, прочно выдвинули возможности генеративного ИИ на передний план общественного внимания.
На самом деле AI/ML — это два приложения: обучение и вывод. Каждый из них зависит от производительности памяти, и каждый имеет уникальный набор требований, которые определяют выбор лучшего решения для памяти.
При обучении решающими требованиями являются пропускная способность и емкость памяти. Это особенно актуально, учитывая размер и сложность моделей данных нейронных сетей, которые растут со скоростью 10 раз в год. Точность нейронной сети зависит от качества и количества примеров в наборе обучающих данных, что приводит к необходимости огромных объемов данных и, следовательно, к пропускной способности и емкости памяти.
Учитывая ценность, создаваемую тренировками, существует мощный стимул выполнять тренировочные заезды как можно быстрее. Поскольку обучающие приложения работают в центрах обработки данных, все более ограниченных в мощности и пространстве, предпочтение отдается решениям, обеспечивающим энергоэффективность и меньший размер. Учитывая все эти требования, HBM3 является идеальным решением памяти для оборудования для обучения ИИ. Он обеспечивает превосходную пропускную способность и пропускную способность.
Результатом обучения нейронной сети является модель вывода, которую можно широко применять. С помощью этой модели устройство вывода может обрабатывать и интерпретировать входные данные за пределами обучающих данных. Для вывода критически важны скорость пропускной способности памяти и низкая задержка, особенно когда необходимы действия в реальном времени. Поскольку все больше и больше выводов искусственного интеллекта перемещаются из центра обработки данных на периферию сети, эти функции памяти становятся еще более важными.
У проектировщиков есть несколько вариантов памяти для вывода AI/ML, но по критическому параметру пропускной способности память GDDR6 действительно превосходна. При скорости передачи данных 24 гигабит в секунду (Гбит/с) и 32-битном интерфейсе устройство GDDR6 может обеспечить пропускную способность памяти 96 гигабит в секунду (ГБ/с), что более чем вдвое превышает любую альтернативную DDR или Решения LPDDR. Память GDDR6 предлагает отличное сочетание скорости, пропускной способности и задержки для вывода AI/ML, в частности для вывода на периферии.
Подсистема интерфейса памяти Rambus GDDR6 обеспечивает производительность 24 Гбит/с и основана на более чем 30-летнем опыте обеспечения целостности высокоскоростного сигнала и целостности питания (SI/PI), что крайне важно для работы GDDR6 на высоких скоростях. Он состоит из PHY и цифрового контроллера, обеспечивая полную подсистему интерфейса памяти GDDR6.
Присоединяйтесь ко мне на вебинаре Rambus в этом месяце на тему «Высокопроизводительный вывод AI/ML с памятью 24 ГБ GDDR6», чтобы узнать, как GDDR6 поддерживает требования к памяти и производительности рабочих нагрузок вывода AI/ML, а также узнать о некоторых ключевых аспектах проектирования и реализации подсистем интерфейса памяти GDDR6.
Ресурсы:
- SEO-контент и PR-распределение. Получите усиление сегодня.
- ПлатонАйСтрим. Анализ данных Web3. Расширение знаний. Доступ здесь.
- Чеканка будущего с Эдриенн Эшли. Доступ здесь.
- Покупайте и продавайте акции компаний PREIPO® с помощью PREIPO®. Доступ здесь.
- Источник: https://semiengineering.com/gddr6-delivers-the-performance-for-ai-ml-inference/
- :имеет
- :является
- :нет
- 24
- 26
- 27
- 30
- 8
- a
- О нас
- точность
- Действие
- AI
- AI обучение
- AI / ML
- Все
- Все сообщения
- альтернатива
- суммы
- an
- и
- любой
- Приложения
- МЫ
- AS
- At
- внимание
- Пропускная способность
- BE
- становление
- было
- ЛУЧШЕЕ
- широко
- принес
- построенный
- но
- by
- CAN
- возможности
- Пропускная способность
- Центр
- Центры
- ChatGPT
- выбор
- выбор
- сочетание
- полный
- сложность
- соображения
- контроллер
- создали
- критической
- данным
- Центр обработки данных
- центров обработки данных
- набор данных
- доставить
- обеспечивает
- зависит
- развернуть
- Проект
- события
- устройство
- Интернет
- директор
- обнаружить
- двойной
- управлять
- каждый
- Edge
- затрат
- огромный
- особенно
- Даже
- развивается
- Примеры
- отлично
- захватывающий
- опыта
- Особенности
- поле
- твердо
- Что касается
- Передний край
- Год основания
- от
- генеративный
- Генеративный ИИ
- данный
- идет
- большой
- Рост
- Аппаратные средства
- Есть
- Сердце
- следовательно
- High
- Как
- HTTPS
- идеальный
- реализация
- in
- стимул
- все больше и больше
- затраты
- целостность
- Интерфейс
- в
- IP
- IT
- JPG
- Основные
- Задержка
- УЧИТЬСЯ
- молния
- такое как
- Низкий
- Маркетинг
- Память
- модель
- Модели
- Месяц
- БОЛЕЕ
- необходимый
- нуждающихся
- сеть
- Сетевые данные
- нервный
- нейронной сети
- Новые
- сейчас
- номер
- of
- предлагают
- Предложения
- on
- операционный
- or
- выходной
- внешнюю
- за
- Темп
- параметр
- особый
- особенно
- производительность
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- популярность
- возможное
- Блог
- мощностью
- мощный
- процесс
- Продукт
- приводит
- обеспечение
- что такое варган?
- количество
- быстро
- Обменный курс
- реального времени
- на самом деле
- Требования
- правую
- РЯД
- Run
- Во-вторых
- старший
- набор
- СДВИГАЯ
- Смены
- сигнал
- Размер
- меньше
- So
- Решение
- Решения
- некоторые
- Space
- скорость
- скорость
- Поддержка
- чем
- который
- Ассоциация
- Там.
- Эти
- этой
- Через
- пропускная способность
- миниатюрами
- в
- Обучение
- два
- созданного
- ценностное
- webinar
- неделя
- когда
- который
- широкий
- без
- год
- лет
- зефирнет