Meta kohandatud AI-kiipide juurutamiseks koos AMD, Nvidia GPU-dega

Taasavaldanud Platon

järgijaid: 0

Pärast aastatepikkust arendustegevust võib Meta sel aastal lõpuks oma kodumaised tehisintellekti kiirendid sisukalt kasutusele võtta.

Facebooki impeerium kinnitas sel nädalal soovi täiendada Nvidia H100 ja AMD MI300X GPU-de kasutuselevõttu oma Meta Training Inference Accelerator (MTIA) kiibide perekonnaga. Täpsemalt, Meta juurutab järelduste jaoks optimeeritud protsessori, väidetavalt koodnimega Artemis, mis põhineb Silicon Valley hiiglase esimese põlvkonna osadel teased eelmisel aastal.

"Oleme põnevil edusammude üle, mida oleme MTIA-ga oma sisemistes räniprojektides saavutanud, ja oleme õigel teel, et alustada meie järeldusvariandi kasutuselevõttu tootmises 2024. aastal," ütles Meta pressiesindaja. Register neljapäeval.

"Me näeme, et meie sisemiselt arendatud kiirendid täiendavad suurel määral kaubanduslikult saadaolevaid GPU-sid, pakkudes optimaalset jõudluse ja tõhususe kombinatsiooni meta-spetsiifiliste töökoormuste korral," jätkas esindaja. Üksikasjad? Ei. Pressiesindaja ütles meile: "Ootame selle aasta lõpus jagada rohkem värskendusi meie tulevaste MTIA plaanide kohta."

Peame seda nii, et teise põlvkonna järeldustele keskendunud kiip levib laialdaselt, järgides järelduste tegemiseks ainult esimese põlvkonna laboris kasutatavat versiooni, ja me võime hiljem teada saada osade kohta, mis on mõeldud peamiselt koolituseks või väljaõppeks ja järelduste tegemiseks.

Metast on saanud üks Nvidia ja AMD parimaid kliente, kuna tema tehisintellekti töökoormus on kasvanud, suurendades selle vajadust ja kasutamist spetsiaalse räni järele, et muuta oma masinõppetarkvara nii kiiresti kui võimalik. Seega pole Instagrami hiiglase otsus arendada oma kohandatud protsessoreid sugugi üllatav.

Tegelikult on megakorpus reaalses maailmas kasutuselevõtu osas kohandatud tehisintellekti ränipartei suhtes suhteliselt hiljaks jäänud. Amazon ja Google on juba mitu aastat kasutanud sisemiste masinõppesüsteemide kiirendamiseks omakasvatatud komponente, näiteks soovitusmudeleid ja kliendi ML-koodi. Vahepeal avalikustas Microsoft eelmisel aastal oma kodumaised kiirendid.

Kuid peale tõsiasja, et Meta juurutab MTIA järelduskiipi laialdaselt, ei ole sotsiaalvõrgustik avalikustanud oma täpset arhitektuuri ega ka seda, millist töökoormust see reserveerib ettevõttesisese räni jaoks ja mida see AMD ja Nvidia GPU-dele maha laadib.

Tõenäoliselt käivitab Meta oma kohandatud ASIC-idel väljakujunenud mudeleid, et vabastada GPU ressursse dünaamilisemate või arenevate rakenduste jaoks. Oleme varem näinud, kuidas Meta on seda teed läinud kohandatud kiirenditega, mis on loodud andmete mahalaadimiseks ja intensiivse videotöökoormuse arvutamiseks.

Mis puudutab aluseks olevat disaini, siis SemiAnalysisi tööstuse jälgijad ütlevad meile, et uus kiip põhineb tihedalt Meta esimese põlvkonna osade arhitektuuril.

Hüppekivid

Pärast kolmeaastast arendustööd kuulutati välja 2023. aasta alguses, Meta MTIA v1 osad, mida meie sõbrad aadressil Järgmine platvorm vaadeldi Eelmisel kevadel olid need loodud spetsiaalselt süvaõppega soovitajate mudeleid silmas pidades.

Esimese põlvkonna kiip ehitati ümber RISC-V CPU klastri ja valmistati TSMC 7 nm protsessi abil. Kapoti all kasutas komponent kaheksa korda kaheksa töötluselementide maatriksit, millest igaüks oli varustatud kahe RV CPU südamikuga, millest üks on varustatud vektormatemaatikalaienditega. Neid tuumasid toidetakse rikkalikust 128 MB kiibisisesest SRAM-ist ja kuni 128 GB LPDDR5 mälust.

Nagu Meta eelmisel aastal väitis, töötas kiip sagedusel 800 MHz ja saavutas 102.4 triljoni toimingu sekundis INT8 jõudluse või 51.2 teraFLOPSi poole täpsusega (FP16). Võrdluseks, Nvidia H100 on võimeline peaaegu nelja petaFLOPSi hõreda FP8 jõudlusega. Ehkki see pole kaugeltki nii võimas kui Nvidia või AMD GPU-d, oli kiibil siiski üks suur eelis: energiatarve. Kiibi enda soojuslik projekteerimisvõimsus oli vaid 25 vatti.

Järgi PoolanalüüsMeta uusimal kiibil on täiustatud südamikud ja see vahetab LPDDR5 suure ribalaiusega mälu vastu, mis on pakitud TSMC kiip-vahvel-alusel (CoWoS) tehnoloogiasse.

Teine märkimisväärne erinevus on see, et Meta teise põlvkonna kiip hakkab tegelikult oma andmekeskuse infrastruktuuris laialdaselt kasutusele võtma. Facebooki titaani sõnul kasutati esimese põlvkonna osa reklaamimudelite tootmiseks, kuid see ei lahkunud kunagi laborist.

Tehisintellekti tagaajamine

Kui kohandatud osad kõrvale jätta, on Facebooki ja Instagrami vanem loobunud miljardeid viimastel aastatel graafikaprotsessoritel dollareid, et kiirendada igasuguste tavapärastele protsessoriplatvormidele sobimatute ülesannete täitmist. Suurte keelemudelite, nagu GPT-4 ja Meta enda Llama 2, tõus on aga muutnud maastikku ja ajendanud kasutama tohutuid GPU-klastreid.

Meta mastaabis on need suundumused tinginud vajaduse teha drastilisi muudatusi tema infrastruktuuris, sealhulgas ümber kujundada mitmest andmekeskusest, mis toetavad suurte tehisintellekti kasutuselevõtuga seotud tohutuid toite- ja jahutusnõudeid.

Ja Meta kasutuselevõtt muutub järgmise paari kuu jooksul ainult suuremaks, kuna ettevõte nihkub fookuse metaversumilt areng tehisintellektist. Väidetavalt aitab AI kallal tehtud töö moodustada metaversumi või midagi sellist.

Tegevjuhi Mark Zuckerbergi sõnul plaanib Meta ainuüksi sel aastal kasutusele võtta 350,000 100 Nvidia HXNUMX.

Äriettevõte teatas ka plaanidest AMD äsja kasutusele võtta käivitatud MI300X GPU-d oma andmekeskustes. Zuckerberg väitis, et tema ettevõte lõpetab aasta samaväärse arvutusvõimsusega 600,000 100 HXNUMX. Seega on selge, et Meta MTIA kiibid ei asenda GPU-sid niipea. ®