IBM pravi, da uporablja "superračunalnik z umetno inteligenco" od maja, a se je odločil zdaj povedati svetu

Ponovno objavil Platon

Spremljevalci: 0

IBM je najnovejši tehnološki velikan, ki je razkril lasten "superračunalnik z umetno inteligenco", ta pa je sestavljen iz množice virtualnih strojev, ki delujejo v IBM Cloudu.

Sistem, znan kot Vela, za katerega podjetje trdi, da je na spletu od maja lani, se oglašuje kot prvi IBM-ov superračunalnik, optimiziran za AI, v oblaku, ustvarjen z namenom razvoja in usposabljanja obsežnih modelov AI.

Preden se kdo požene, da bi se prijavil za dostop, je IBM izjavil, da je platforma trenutno rezervirana za uporabo IBM-ove raziskovalne skupnosti. Pravzaprav je Vela od maja 2022 postala »okolje podjetja« za raziskovalce, ki ustvarjajo napredne zmogljivosti umetne inteligence, vključno z delom na temeljnih modelih, so zapisali.

IBM navaja, da je to arhitekturo izbral, ker podjetju daje večjo prilagodljivost za povečanje po potrebi in tudi možnost uvajanja podobne infrastrukture v kateri koli podatkovni center IBM Cloud po vsem svetu.

Toda Vela ne deluje na nobeni stari standardni strojni opremi vozlišča IBM Cloud; vsak je sistem z dvema vtičnicama s procesorji Xeon Scalable 2. generacije, konfiguriranimi z 1.5 TB DRAM-a in štirimi 3.2 TB bliskovnimi pogoni NVMe ter osmimi 80 GB grafičnimi procesorji Nvidia A100, ki so povezani z NVLink in NVSwitch.

Zaradi tega je infrastruktura Vela bližja infrastrukturi visoko zmogljivega računalništva (HPC) kot tipični infrastrukturi v oblaku, kljub IBM-ovemu vztrajanju, da je ubral drugačno pot, saj »tradicionalni superračunalniki niso bili zasnovani za AI«.

Opazno je tudi, da se je IBM odločil za uporabo procesorjev x86 namesto lastnih čipov Power 10, zlasti ker so bili ti oglašuje Big Blue kot idealno primeren za pomnilniško intenzivne delovne obremenitve, kot je sklepanje z umetno inteligenco velikih modelov.

Vozlišča so medsebojno povezana z uporabo več omrežnih vmesnikov 100 Gbps, urejenih v dvonivojski strukturi Clos, ki je zasnovana tako, da obstaja več poti za podatke, ki zagotavljajo redundanco.

Vendar pa IBM v objavi na spletnem dnevniku pojasnjuje svoje razloge, zakaj se je odločil za izvorno arhitekturo v oblaku, ki se osredotoča na zmanjšanje časa, potrebnega za izdelavo in uvajanje obsežnih modelov umetne inteligence, kolikor je to mogoče.

"Ali zgradimo naš sistem na mestu uporabe, z uporabo tradicionalnega superračunalniškega modela, ali ta sistem zgradimo v oblaku, v bistvu zgradimo superračunalnik, ki je tudi oblak?" se sprašuje blog.

IBM trdi, da je s sprejetjem slednjega pristopa nekoliko zmanjšal zmogljivost, vendar je znatno pridobil na produktivnosti. To se zmanjša na zmožnost konfiguriranja vseh potrebnih virov prek programske opreme, pa tudi na dostop do storitev, ki so na voljo v širšem IBM Cloudu, s primerom nalaganja nizov podatkov v IBM-ovo Cloud Object Store, namesto da bi morali graditi namensko infrastrukturo za shranjevanje.

Big Blue je tudi povedal, da se je odločil upravljati vsa vozlišča v Veli kot virtualne stroje in ne kot gole kovinske primerke, saj je to poenostavilo zagotavljanje in ponovno zagotavljanje infrastrukture z različnimi nizi programske opreme, ki jih potrebujejo različni uporabniki AI.

»VM-ji bi naši ekipi za podporo olajšali prožno dinamično prilagajanje gruč AI in prestavljanje virov med delovnimi obremenitvami različnih vrst v nekaj minutah,« pojasnjuje IBM-ov blog.

Toda podjetje trdi, da je našlo način za optimizacijo zmogljivosti in zmanjšanje stroškov virtualizacije na manj kot 5 odstotkov, kar je blizu goli zmogljivosti.

To je vključevalo konfiguracijo golega gostitelja za virtualizacijo s podporo za razširitve virtualnih strojev (VMX), enokorensko virtualizacijo IO (SR-IOV) in ogromne strani, med drugimi nedoločenimi konfiguracijami strojne in programske opreme.

Dodatne podrobnosti o infrastrukturi Vela najdete na IBM-ov blog.

IBM ni edino podjetje, ki uporablja oblak za gostovanje superračunalnika z umetno inteligenco. Lani Microsoft predstavil svojo platformo z uporabo infrastrukture Azure v kombinaciji s pospeševalniki GPU Nvidia, omrežnim kompletom in zbirko programske opreme AI Enterprise. Pričakovano je bilo, da bo to na voljo za dostop strankam Azure, vendar časovni okvir ni bil določen.

Druga podjetja, ki izdelujejo superračunalnike z umetno inteligenco, vendar sledijo tradicionalni poti lokalne infrastrukture, vključujejo Meta in Tesla. ®