IBM каже, що використовує «суперкомп’ютер зі штучним інтелектом» з травня, але вирішила зараз розповісти про це світові

IBM каже, що використовує «суперкомп’ютер зі штучним інтелектом» з травня, але вирішила зараз розповісти про це світові

Вихідний вузол: 1950471

IBM — останній технологічний гігант, який представив власний «суперкомп’ютер зі штучним інтелектом», який складається з групи віртуальних машин, що працюють у IBM Cloud.

Система, відома як Vela, яка, як стверджує компанія, працює в Інтернеті з травня минулого року, рекламується як перший хмарний суперкомп’ютер IBM, оптимізований для ШІ, створений з метою розробки та навчання великомасштабних моделей ШІ.

Перш ніж хтось поспішить зареєструватися для доступу, IBM заявила, що платформа наразі зарезервована для використання спільнотою IBM Research. Насправді Vela стала «основним середовищем» компанії для дослідників, які створюють розширені можливості штучного інтелекту з травня 2022 року, включаючи роботу над основними моделями, йдеться в повідомленні.

IBM заявляє, що обрала цю архітектуру, оскільки вона дає компанії більшу гнучкість для масштабування за потреби, а також можливість розгорнути подібну інфраструктуру в будь-якому центрі обробки даних IBM Cloud по всьому світу.

Але Vela не працює на жодному старому стандартному обладнанні IBM Cloud node; кожна з них є подвійною системою з процесорами Xeon Scalable 2-го покоління, налаштованими на 1.5 ТБ DRAM і чотирма флеш-накопичувачами NVMe по 3.2 ТБ, а також вісьмома графічними процесорами Nvidia A80 на 100 ГБ, останні підключені за допомогою NVLink і NVSwitch.

Це робить інфраструктуру Vela ближчою до інфраструктури високопродуктивних обчислень (HPC), ніж до типової хмарної інфраструктури, незважаючи на наполягання IBM, що вона вибрала інший шлях, оскільки «традиційні суперкомп’ютери не були розроблені для ШІ».

Примітно також, що IBM вирішила використовувати процесори x86, а не власні мікросхеми Power 10, особливо тому, що вони були рекламований Big Blue ідеально підходить для робочих навантажень, що потребують інтенсивного використання пам’яті, наприклад для штучного інтелекту для великих моделей.

Вузли з’єднані між собою за допомогою кількох мережевих інтерфейсів 100 Гбіт/с, організованих у дворівневу структуру Clos, яка розроблена таким чином, що існує кілька шляхів для даних для забезпечення надлишковості.

Однак IBM пояснює в дописі в блозі причини свого вибору хмарної архітектури, яка зосереджена на максимальному скороченні часу, необхідного для створення та розгортання великомасштабних моделей ШІ.

«Ми створюємо нашу систему локально, використовуючи традиційну модель суперкомп’ютера, чи ми будуємо цю систему в хмарі, по суті будуючи суперкомп’ютер, який також є хмарою?» запитує блог.

IBM стверджує, що, застосувавши останній підхід, вона дещо знизила продуктивність, але значно підвищила продуктивність. Це зводиться до можливості конфігурувати всі необхідні ресурси за допомогою програмного забезпечення, а також мати доступ до послуг, доступних у ширшому IBM Cloud, наприклад, завантажувати набори даних у IBM Cloud Object Store замість того, щоб створювати спеціальну інфраструктуру зберігання.

Big Blue також заявив, що вирішив використовувати всі вузли в Vela як віртуальні машини, а не як голі екземпляри, оскільки це спростило створення та повторне надання інфраструктури з різними стеками програмного забезпечення, які потрібні різним користувачам ШІ.

«Віртуальні машини полегшать нашій команді підтримки гнучке динамічне масштабування кластерів ШІ та переміщення ресурсів між робочими навантаженнями різного типу за лічені хвилини», — пояснюється в блозі IBM.

Але компанія стверджує, що знайшла спосіб оптимізувати продуктивність і мінімізувати накладні витрати на віртуалізацію до рівня менш ніж 5 відсотків, близького до продуктивності на «голому металі».

Це включало налаштування базового хосту для віртуалізації з підтримкою розширень віртуальної машини (VMX), однокореневої віртуалізації вводу-виводу (SR-IOV) і величезних сторінок, серед інших невизначених апаратних і програмних конфігурацій.

Додаткову інформацію про інфраструктуру Vela можна знайти на Блог IBM.

IBM — не єдина компанія, яка використовує хмару для розміщення суперкомп’ютера зі штучним інтелектом. Минулого року Microsoft представила власну платформу використовуючи інфраструктуру Azure у поєднанні з прискорювачами графічного процесора Nvidia, мережевим комплектом і пакетом програмного забезпечення AI Enterprise. Очікувалося, що це буде доступно для клієнтів Azure, але часові рамки не вказано.

Інші компанії, які створюють суперкомп’ютери зі штучним інтелектом, але дотримуються традиційного маршруту локальної інфраструктури, включають Meta та Tesla. ®

Часова мітка:

Більше від Реєстр