IBM ütleb, et on AI superarvutit kasutanud alates maikuust, kuid otsustas nüüd maailmale rääkida

IBM ütleb, et on AI superarvutit kasutanud alates maikuust, kuid otsustas nüüd maailmale rääkida

Allikasõlm: 1950471

IBM on uusim tehnoloogiahiiglane, kes tutvustas oma tehisintellekti superarvutit, mis koosneb paljudest IBM Cloudis töötavatest virtuaalmasinatest.

Süsteemi nimega Vela, mis ettevõtte väitel on võrgus olnud alates eelmise aasta maist, reklaamitakse kui IBMi esimest tehisintellektile optimeeritud pilvepõhise superarvutit, mis on loodud suuremahuliste AI mudelite arendamiseks ja koolitamiseks.

Enne kui keegi kiirustab juurdepääsu saamiseks registreeruma, teatas IBM, et platvorm on praegu reserveeritud IBM Researchi kogukonnale. Tegelikult on Velast saanud ettevõtte „go-to-keskkond” teadlastele, kes loovad alates 2022. aasta maist täiustatud tehisintellekti võimalusi, sealhulgas vundamentide mudelite kallal töötamist.

IBM märgib, et valis selle arhitektuuri, kuna see annab ettevõttele suurema paindlikkuse vajaduse korral suurendamiseks ja ka võimaluse juurutada sarnane infrastruktuur mis tahes IBM Cloudi andmekeskusesse üle maailma.

Kuid Vela ei tööta ühelgi vanal standardsel IBM Cloudi sõlme riistvaral; igaüks neist on kahe pesaga süsteem, millel on 2. põlvkonna Xeon Scalable protsessorid, mis on konfigureeritud 1.5 TB DRAM-iga ja nelja 3.2 TB NVMe välkmäluseadmega ning kaheksa 80 GB Nvidia A100 GPU-ga, millest viimane on ühendatud NVLinki ja NVSwitchiga.

See muudab Vela taristu lähedasemaks suure jõudlusega arvutamise (HPC) saidile kui tavaline pilveinfrastruktuur, hoolimata IBMi nõudmisest, et see valis teist teed, kuna "traditsioonilised superarvutid ei olnud AI jaoks loodud".

Samuti on tähelepanuväärne, et IBM valis oma Power 86 kiipide asemel kasutada x10 protsessoreid, eriti kuna need olid reklaamib Big Blue kui see sobib ideaalselt mälumahukate töökoormuste jaoks, näiteks suurte mudelite tehisintellekti järelduste tegemiseks.

Sõlmed on omavahel ühendatud mitme 100 Gbps võrguliidese abil, mis on paigutatud kahetasandilisse Clos-struktuuri, mis on loodud nii, et andmetel on liiasuse tagamiseks mitu teed.

IBM selgitab aga ajaveebipostituses põhjuseid, miks valis pilvepõhise arhitektuuri, mis keskendub suuremahuliste AI-mudelite ehitamiseks ja juurutamiseks kuluva aja lühendamisele nii palju kui võimalik.

"Kas me ehitame oma süsteemi kohapeal, kasutades traditsioonilist superarvuti mudelit, või ehitame selle süsteemi pilve, luues sisuliselt superarvuti, mis on ka pilv?" küsib blogija.

IBM väidab, et viimase lähenemisviisi kasutuselevõtuga on see jõudluses mõnevõrra järeleandmisi teinud, kuid tootlikkus on oluliselt tõusnud. See taandub võimalusele konfigureerida tarkvara kaudu kõiki vajalikke ressursse, samuti juurdepääsu laiemas IBM Cloudis saadaolevatele teenustele, näiteks andmekogumite laadimise kohta IBMi pilveobjektide poodi, selle asemel et luua spetsiaalne salvestusinfrastruktuur.

Big Blue ütles ka, et otsustas kasutada kõiki Vela sõlmi virtuaalmasinatena, mitte metallist eksemplaridena, kuna see hõlbustas erinevate tehisintellekti kasutajate jaoks vajalike erinevate tarkvarapakkidega infrastruktuuri varustamist ja uuesti varustamist.

"VM-id hõlbustaksid meie tugimeeskonnal AI-klastrite paindlikku dünaamilist skaleerimist ja ressursside nihutamist erinevate töökoormuste vahel mõne minutiga," selgitatakse IBMi ajaveebis.

Kuid ettevõte väidab, et leidis viisi jõudluse optimeerimiseks ja virtualiseerimise üldkulude minimeerimiseks alla 5 protsendi, mis on peaaegu metallist.

See hõlmas metallist hosti virtualiseerimiseks konfigureerimist virtuaalse masina laienduste (VMX), ühe juurega IO virtualiseerimise (SR-IOV) ja tohutute lehtede toega, muu hulgas täpsustamata riist- ja tarkvarakonfiguratsioone.

Lisateavet Vela infrastruktuuri kohta leiate aadressilt IBMi ajaveeb.

IBM ei ole ainus ettevõte, mis kasutab pilve AI superarvuti majutamiseks. Eelmisel aastal Microsoft avalikustas oma platvormi kasutades Azure'i infrastruktuuri koos Nvidia GPU kiirendite, võrgukomplekti ja selle AI Enterprise'i tarkvarakomplektiga. See pidi olema Azure'i klientidele kättesaadav, kuid ajavahemikku ei määratud.

Teised ettevõtted, kes on ehitanud tehisintellekti superarvuteid, kuid järgivad traditsioonilist kohapealset infrastruktuuri marsruuti, hõlmavad ka Meta ja Teslal🇧🇷 🇧🇷

Ajatempel:

Veel alates Register