IBM sanoo, että se on käyttänyt "AI-supertietokonetta" toukokuusta lähtien, mutta päätti nyt kertoa maailmalle

IBM sanoo, että se on käyttänyt "AI-supertietokonetta" toukokuusta lähtien, mutta päätti nyt kertoa maailmalle

Lähdesolmu: 1950471

IBM on uusin teknologiajätti, joka on julkistanut oman "AI-supertietokoneensa", joka koostuu joukosta IBM Cloudissa toimivia virtuaalikoneita.

Vela-nimistä järjestelmää, jonka yhtiö väittää olleen verkossa viime vuoden toukokuusta lähtien, mainostetaan IBM:n ensimmäisenä tekoälylle optimoituna, pilvipohjaisena supertietokoneena, jonka tarkoituksena on kehittää ja kouluttaa suuria tekoälymalleja.

Ennen kuin kukaan kiirehtii rekisteröitymään, IBM ilmoitti, että alusta on tällä hetkellä varattu IBM Research -yhteisön käyttöön. Itse asiassa Velasta on tullut yrityksen "go-to-ympäristö" tutkijoille, jotka ovat luoneet edistyneitä tekoälyominaisuuksia toukokuusta 2022 lähtien, mukaan lukien perusmallien työstäminen, se sanoi.

IBM ilmoittaa valinneensa tämän arkkitehtuurin, koska se antaa yritykselle enemmän joustavuutta skaalautua tarpeen mukaan ja myös mahdollisuuden ottaa käyttöön samanlainen infrastruktuuri mihin tahansa IBM Cloud -tietokeskukseen ympäri maailmaa.

Mutta Vela ei toimi millään vanhalla standardi IBM Cloud -solmulaitteistolla; jokainen on kaksikantinen järjestelmä, jossa on 2. sukupolven Xeon Scalable -prosessorit, jotka on konfiguroitu 1.5 Tt:n DRAM-muistilla ja neljällä 3.2 Tt:n NVMe-flash-asemalla sekä kahdeksalla 80 Gt:n Nvidia A100 GPU:lla, joista jälkimmäinen on yhdistetty NVLinkillä ja NVSwitchillä.

Tämä tekee Vela-infrastruktuurista lähempänä korkean suorituskyvyn laskennan (HPC) infrastruktuuria kuin tyypillistä pilviinfrastruktuuria, vaikka IBM väitti, että se valitsi eri polun, koska "perinteisiä supertietokoneita ei ole suunniteltu tekoälylle".

On myös huomionarvoista, että IBM valitsi x86-prosessorin omien Power 10 -sirujensa sijaan, varsinkin kun nämä olivat mainostaa Big Blue soveltuu ihanteellisesti muistiintensiivisiin työkuormiin, kuten suurten mallien tekoälyn päättelyyn.

Solmut on kytketty toisiinsa useilla 100 Gbps verkkoliitännöillä, jotka on järjestetty kaksitasoiseen Clos-rakenteeseen, joka on suunniteltu niin, että datalle on useita polkuja redundanssin tuottamiseksi.

IBM kuitenkin selittää blogiviestissään syynsä pilvipohjaisen arkkitehtuurin valinnalle, joka keskittyy suurten tekoälymallien rakentamiseen ja käyttöönottoon tarvittavan ajan lyhentämiseen niin paljon kuin mahdollista.

"Rakennammeko järjestelmämme paikan päällä käyttämällä perinteistä superlaskentamallia vai rakennammeko tämän järjestelmän pilveen, pohjimmiltaan rakentaen supertietokoneen, joka on myös pilvi?" blogi kysyy.

IBM väittää, että ottamalla käyttöön jälkimmäisen lähestymistavan se on heikentänyt jonkin verran suorituskykyä, mutta lisännyt huomattavasti tuottavuutta. Tämä johtuu mahdollisuudesta määrittää kaikki tarvittavat resurssit ohjelmiston avulla sekä pääsy laajemmassa IBM Cloudissa saatavilla oleviin palveluihin. Esimerkkinä voidaan mainita tietojoukkojen lataaminen IBM:n Cloud Object Storeen sen sijaan, että joutuisi rakentamaan omaa tallennusinfrastruktuuria.

Big Blue sanoi myös, että se päätti käyttää kaikkia Velan solmuja virtuaalikoneena paljain metallin sijasta, koska tämä helpotti infrastruktuurin tarjoamista ja uudelleenkäyttöä eri AI-käyttäjien vaatimilla ohjelmistopinoilla.

"VM:iden avulla tukitiimimme olisi helppo skaalata tekoälyklustereita joustavasti dynaamisesti ja siirtää resursseja erilaisten työkuormien välillä muutamassa minuutissa", IBM:n blogi selittää.

Mutta yritys väittää löytäneensä tavan optimoida suorituskykyä ja minimoida virtualisoinnin ylimääräiset kustannukset alle 5 prosenttiin, lähellä paljaan metallin suorituskykyä.

Tämä sisälsi paljaan metallin isännän konfiguroinnin virtualisointia varten Virtual Machine Extensions (VMX), yhden juuren IO-virtualisoinnin (SR-IOV) ja valtavien sivujen tuella muiden määrittelemättömien laitteisto- ja ohjelmistokokoonpanojen ohella.

Lisätietoja Velan infrastruktuurista löytyy osoitteesta IBM:n blogi.

IBM ei ole ainoa yritys, joka käyttää pilvipalvelua tekoälysupertietokoneen isännöintiin. Viime vuonna Microsoft julkisti oman alustansa käyttämällä Azure-infrastruktuuria yhdistettynä Nvidian GPU-kiihdyttimiin, verkkosarjaan ja sen AI Enterprise -ohjelmistopakettiin. Tämän odotettiin olevan Azure-asiakkaiden käytettävissä, mutta aikarajaa ei määritetty.

Muita yrityksiä, jotka ovat rakentaneet tekoälysupertietokoneita, mutta noudattavat perinteistä paikallista infrastruktuurireittiä, ovat mm Meta ja Tesla. ®

Aikaleima:

Lisää aiheesta Rekisteri