Az IBM azt állítja, hogy május óta használja az „AI szuperszámítógépet”, de most úgy döntött, hogy elmondja a világnak

Az IBM azt állítja, hogy május óta használja az „AI szuperszámítógépet”, de most úgy döntött, hogy elmondja a világnak

Forrás csomópont: 1950471

Az IBM a legújabb technológiai óriás, amely bemutatta saját „AI szuperszámítógépét”, amely egy csomó, IBM Cloudon belül futó virtuális gépből áll.

A Vela néven ismert rendszert, amely a cég állítása szerint tavaly május óta működik online, az IBM első mesterségesintelligencia-optimalizált, felhőalapú szuperszámítógépeként emlegetik, amelyet azzal a céllal hoztak létre, hogy nagyszabású mesterségesintelligencia-modelleket fejlesszenek és tanítsanak.

Mielőtt bárki elsietne, hogy regisztráljon a hozzáférésre, az IBM kijelentette, hogy a platform jelenleg az IBM Research közösség számára van fenntartva. Valójában a Vela 2022 májusa óta a vállalat „go-to-környezete” azoknak a kutatóknak, akik fejlett mesterséges intelligencia-képességeket hoznak létre, beleértve az alapmodelleken végzett munkát is.

Az IBM kijelenti, hogy azért választotta ezt az architektúrát, mert ez nagyobb rugalmasságot biztosít a vállalatnak a szükséges méretezéshez, valamint lehetőséget biztosít arra, hogy hasonló infrastruktúrát telepítsen bármely IBM Cloud adatközpontba szerte a világon.

A Vela azonban nem fut egyetlen régi szabványos IBM Cloud csomóponti hardveren sem; mindegyik egy dupla foglalatos rendszer 2. generációs Xeon Scalable processzorokkal, 1.5 TB DRAM-mal és négy 3.2 TB-os NVMe flash meghajtóval, valamint nyolc 80 GB-os Nvidia A100 GPU-val, utóbbiakat NVLink és NVSwitch köti össze.

Ez közelebb teszi a Vela infrastruktúrát a nagy teljesítményű számítási (HPC) helyekhez, mint a tipikus felhő infrastruktúrához, annak ellenére, hogy az IBM ragaszkodott ahhoz, hogy más utat járjon be, mivel „a hagyományos szuperszámítógépeket nem mesterséges intelligencia számára tervezték”.

Figyelemre méltó az is, hogy az IBM az x86-os processzorok használatát választotta a saját Power 10 chipjei helyett, különösen azért, mert ezek Big Blue reklámozta mint ideális a memóriaigényes munkaterhelésekhez, mint például a nagyméretű AI-következtetéshez.

A csomópontok több 100 Gbps-os hálózati interfészen keresztül kapcsolódnak össze, amelyek kétszintű Clos-struktúrában vannak elrendezve, amely úgy van kialakítva, hogy több útvonalon keresztül az adatok redundanciát biztosítsanak.

Az IBM azonban egy blogbejegyzésben kifejti, hogy miért választotta a felhőalapú architektúrát, amelynek középpontjában a nagyszabású AI-modellek elkészítéséhez és telepítéséhez szükséges idő lehető legnagyobb mértékű csökkentése áll.

„Helyben építjük fel a rendszerünket, a hagyományos szuperszámítástechnikai modell segítségével, vagy ezt a rendszert építjük a felhőbe, lényegében egy olyan szuperszámítógépet építünk, amely egyben felhő is?” – kérdezi a blog.

Az IBM azt állítja, hogy az utóbbi megközelítés elfogadásával némileg rontott a teljesítményen, de jelentős mértékben növelte a termelékenységet. Ez az összes szükséges erőforrás szoftveren keresztüli konfigurálásának képességén, valamint a szélesebb körű IBM Cloudon elérhető szolgáltatások elérésén múlik, például az adatkészletek betöltése az IBM Cloud Object Store-jába a dedikált tárolási infrastruktúra kiépítése helyett.

A Big Blue azt is elmondta, hogy úgy döntött, hogy a Vela összes csomópontját virtuális gépként üzemelteti, nem pedig csupasz fém példányként, mivel ez egyszerűbbé tette az infrastruktúra kiépítését és újbóli rendelkezésre bocsátását a különböző mesterséges intelligencia-felhasználók által igényelt különböző szoftvercsomagokkal.

„A virtuális gépek megkönnyítenék támogató csapatunk számára az AI-fürtök rugalmas, dinamikus méretezését, és az erőforrások különböző típusú munkaterhelések közötti átcsoportosítását percek alatt” – magyarázza az IBM blogja.

A vállalat azonban azt állítja, hogy megtalálta a módját a teljesítmény optimalizálásának és a virtualizációs többletköltség 5 százalék alá csökkentésének, közel a csupasz fém teljesítményéhez.

Ez magában foglalta a csupasz fém gazdagép virtualizációhoz való konfigurálását a Virtual Machine Extensions (VMX), az egygyökerű IO-virtualizáció (SR-IOV) és a hatalmas oldalak támogatásával, többek között nem meghatározott hardver- és szoftverkonfigurációkkal.

A Vela infrastruktúrával kapcsolatos további részletek a címen találhatók Az IBM blogja.

Az IBM nem az egyetlen vállalat, amely a felhőt használja mesterséges intelligencia-szuperszámítógép üzemeltetésére. Tavaly a Microsoft bemutatta saját platformját Az Azure-infrastruktúra az Nvidia GPU-gyorsítóival, hálózati készletével és AI Enterprise szoftvercsomagjával kombinálva. Ez várhatóan elérhető lesz az Azure-ügyfelek számára, de időkeretet nem adtak meg.

Más cégek is, amelyek mesterséges intelligencia-szuperszámítógépeket építettek, de a hagyományos helyszíni infrastruktúra útját követik meta és a Tesla. ®

Időbélyeg:

Még több A regisztráció