Meta za uvajanje čipov umetne inteligence po meri poleg grafičnih procesorjev AMD, Nvidia

Meta za uvajanje čipov umetne inteligence po meri poleg grafičnih procesorjev AMD, Nvidia

Izvorno vozlišče: 3093660

Po letih razvoja bo Meta morda letos končno uvedla svoje domače pospeševalnike umetne inteligence na smiseln način.

Imperij Facebook je ta teden potrdil svojo željo po dopolnitvi uvajanja grafičnih procesorjev Nvidia H100 in AMD MI300X s svojo družino čipov Meta Training Inference Accelerator (MTIA). Natančneje, Meta bo uvedla procesor, optimiziran za sklepanje, domnevno s kodnim imenom Artemis, ki temelji na delih prve generacije velikana iz Silicijeve doline draga lansko leto.

"Navdušeni smo nad napredkom, ki smo ga dosegli pri naših notranjih prizadevanjih za silicij z MTIA, in smo na dobri poti, da leta 2024 začnemo uvajati našo različico sklepanja v proizvodnji," je povedal tiskovni predstavnik Mete. Register v četrtek.

»Vidimo, da so naši interno razviti pospeševalniki zelo komplementarni komercialno dostopnim GPE-jem pri zagotavljanju optimalne mešanice zmogljivosti in učinkovitosti pri delovnih obremenitvah, specifičnih za Meta,« je nadaljeval predstavnik. podrobnosti? Ne. Tiskovni predstavnik nam je povedal: "Veselimo se, da bomo kasneje v tem letu delili več posodobitev o naših prihodnjih načrtih MTIA."

To razumemo tako, da pomeni, da se čip druge generacije, osredotočen na sklepanje, široko širi po različici prve generacije, ki je namenjena samo laboratoriju za sklepanje, in morda bomo pozneje izvedeli za dele, namenjene predvsem usposabljanju ali usposabljanju in sklepanju.

Meta je postala ena najboljših strank Nvidie in AMD, saj je njena uvedba delovnih obremenitev z umetno inteligenco narasla, kar je povečalo njeno potrebo in uporabo specializiranega silicija, da bi njena programska oprema za strojno učenje delovala čim hitreje. Zato odločitev velikana Instagram, da razvije lastne procesorje po meri, ni tako presenetljiva.

Pravzaprav je mega-korporacija na prvi pogled razmeroma pozna za skupino silicija po meri AI v smislu uvajanja v resničnem svetu. Amazon in Google že nekaj let uporabljata domače komponente za pospešitev notranjih sistemov strojnega učenja, kot so priporočljivi modeli in koda ML za stranke. Medtem je Microsoft lani razkril svoje domače pospeševalnike.

Toda poleg dejstva, da Meta uvaja čip za sklepanje MTIA v velikem obsegu, socialno omrežje ni razkrilo svoje natančne arhitekture niti tega, katere delovne obremenitve rezervira za notranji silicij in katere prenaša na AMD in Nvidia GPE.

Verjetno bo Meta izvajala uveljavljene modele na svojih ASIC-jih po meri, da bi sprostila vire GPE za bolj dinamične ali razvijajoče se aplikacije. Videli smo, da je Meta že šla po tej poti s pospeševalniki po meri, zasnovanimi za razbremenitev podatkov in računanje intenzivnih video obremenitev.

Kar zadeva osnovno zasnovo, nam opazovalci industrije pri SemiAnalysis pravijo, da novi čip tesno temelji na arhitekturi v delih prve generacije Mete.

Odskočne deske

Napovedan v začetku leta 2023 po treh letih razvoja, Metin MTIA v1 deli, ki so ga naši prijatelji na Naslednja platforma Pogledal lansko pomlad, so bili zasnovani posebej za priporočljive modele poglobljenega učenja.

Čip prve generacije je bil zgrajen okoli gruče CPE RISC-V in izdelan s 7nm procesom TSMC. Pod pokrovom je komponenta uporabljala matriko procesorskih elementov osem krat osem, od katerih je vsak opremljen z dvema jedroma CPE RV, od katerih je eno opremljeno z razširitvami vektorske matematike. Ta jedra so se napajala iz izdatnih 128 MB SRAM-a na čipu in do 128 GB pomnilnika LPDDR5.

Kot je Meta trdila lani, je čip deloval pri 800 MHz in dosegel 102.4 bilijona operacij na sekundo zmogljivosti INT8 ali 51.2 teraFLOPS pri polovični natančnosti (FP16). Za primerjavo, Nvidijin H100 zmore skoraj štiri petaFLOPS redke zmogljivosti FP8. Čeprav še zdaleč ni tako zmogljiv kot grafični procesorji Nvidia ali AMD, je imel čip eno veliko prednost: porabo energije. Sam čip je imel toplotno moč le 25 vatov.

Glede na Polanaliza, Metin najnovejši čip se ponaša z izboljšanimi jedri in zamenja LPDDR5 za pomnilnik z visoko pasovno širino, pakiran s tehnologijo TSMC čip-na-rezini na substratu (CoWoS).

Druga opazna razlika je, da bo Metin čip druge generacije dejansko široko uveden v infrastrukturo podatkovnega centra. Po navedbah Facebook titana, čeprav je bil del prve generacije uporabljen za zagon proizvodnih oglaševalskih modelov, ni nikoli zapustil laboratorija.

Lov na umetno splošno inteligenco

Če ne upoštevamo delov po meri, je starš Facebooka in Instagrama opustil milijardah dolarjev za GPU v zadnjih letih za pospešitev vseh vrst nalog, ki niso primerne za običajne platforme CPE. Vendar pa je vzpon velikih jezikovnih modelov, kot sta GPT-4 in Metina lastna Llama 2, spremenil pokrajino in spodbudil uvajanje ogromnih gruč GPE.

V obsegu delovanja Meta so ti trendi zahtevali drastične spremembe njene infrastrukture, vključno z preoblikovanje več podatkovnih središč za podporo ogromnim zahtevam po energiji in hlajenju, povezanih z velikimi uvedbami umetne inteligence.

Metine uvedbe se bodo v naslednjih nekaj mesecih le še povečale, ko bo podjetje preusmerilo fokus z metaverse na Razvoj umetne splošne inteligence. Domnevno bo delo, opravljeno na AI, pomagalo oblikovati metaverzum ali kaj podobnega.

Po besedah ​​izvršnega direktorja Marka Zuckerberga namerava Meta samo letos namestiti kar 350,000 Nvidia H100.

Podjetje je tudi objavilo načrte za novo uvedbo AMD-ja začela MI300X GPE v svojih podatkovnih centrih. Zuckerberg je trdil, da bo njegova korporacija zaključila leto z enako računalniško močjo 600,000 H100. Jasno je torej, da Metini čipi MTIA ne bodo kmalu nadomestili grafičnih procesorjev. ®

Časovni žig:

Več od Register