Meta ottaa käyttöön mukautettuja AI-siruja AMD- ja Nvidia-grafiikkasuorittimien rinnalla

Meta ottaa käyttöön mukautettuja AI-siruja AMD- ja Nvidia-grafiikkasuorittimien rinnalla

Lähdesolmu: 3093660

Vuosien kehitystyön jälkeen Meta saattaa vihdoin tuoda kotitekoisia tekoälykiihdyttimiä mielekkäällä tavalla käyttöön tänä vuonna.

Facebook-imperiumi vahvisti haluavansa täydentää Nvidia H100- ja AMD MI300X -grafiikkasuorittimien käyttöönottoa Meta Training Inference Accelerator (MTIA) -siruperheellä tällä viikolla. Erityisesti Meta ottaa käyttöön päätelmiin optimoidun prosessorin, kerrotaan olevan koodinimeltään Artemis, joka perustuu Piilaakson jättiläisen ensimmäisen sukupolven osiin kiusoitteli viime vuonna.

"Olemme innoissamme edistymisestä, jota olemme saavuttaneet sisäisissä piiponnisteluissamme MTIA:n kanssa, ja olemme oikealla tiellä aloittaaksemme päätelmävarianttimme käyttöönoton tuotannossa vuonna 2024", Metan tiedottaja kertoi. Rekisteri torstaina.

"Näemme sisäisesti kehitettyjen kiihdyttimiemme täydentävän hyvin kaupallisesti saatavilla olevia GPU:ita tarjoamalla optimaalisen yhdistelmän suorituskykyä ja tehokkuutta Meta-kohtaisissa työkuormissa", edustaja jatkoi. Yksityiskohdat? Ei. Tiedottaja kertoi meille: "Odotamme saavamme jakaa lisää päivityksiä tulevista MTIA-suunnitelmistamme myöhemmin tänä vuonna."

Ymmärrämme tämän tarkoittavan, että toisen sukupolven päätelmiin keskittyvä siru on leviämässä laajalti, seuraamalla ensimmäisen sukupolven laboratorioversiota johtopäätösten tekemiseksi, ja saatamme myöhemmin saada selville osista, jotka on tarkoitettu ensisijaisesti koulutukseen tai koulutukseen ja päättelyyn.

Metasta on tullut yksi Nvidian ja AMD:n parhaista asiakkaista, kun sen tekoälytyökuormien käyttöönotto on kasvanut, mikä lisää sen tarvetta ja käyttöä erikoistuneelle piille, jotta sen koneoppimisohjelmisto toimisi mahdollisimman nopeasti. Näin ollen Instagram-jätin päätös kehittää omia mukautettuja prosessoreita ei ole kovinkaan yllättävää.

Itse asiassa mega-konserni on suhteellisen myöhässä mukautetun tekoälyn piipuolueesta tosielämän käyttöönoton suhteen. Amazon ja Google ovat käyttäneet kotitekoisia komponentteja nopeuttaakseen sisäisiä koneoppimisjärjestelmiä, kuten suositusmalleja ja asiakkaiden ML-koodia jo muutaman vuoden ajan. Samaan aikaan Microsoft paljasti kotimaiset kiihdytinnsä viime vuonna.

Mutta sen lisäksi, että Meta ottaa käyttöön MTIA-päätelmäsirun laajassa mittakaavassa, sosiaalinen verkosto ei ole paljastanut sen tarkkaa arkkitehtuuria eikä sitä, mitä työkuormia se varaa sisäiselle piille ja mitä se lataa AMD:n ja Nvidian grafiikkasuorittimille.

On todennäköistä, että Meta käyttää vakiintuneita malleja mukautetuissa ASIC-kortteissaan vapauttaakseen GPU-resursseja dynaamisempia tai kehittyviä sovelluksia varten. Olemme nähneet Metan kulkevan tätä reittiä aiemmin mukautettujen kiihdyttimien avulla, jotka on suunniteltu purkamaan tietoja ja laskemaan intensiivistä videotyökuormaa.

Mitä tulee taustalla olevaan suunnitteluun, SemiAnalysis-alan tarkkailijat kertovat meille, että uusi siru perustuu tiiviisti Metan ensimmäisen sukupolven osien arkkitehtuuriin.

Ponnahduskivet

Kolmen vuoden kehitystyön jälkeen vuoden 2023 alussa julkistettu Metan MTIA v1 osat, jotka ystävämme Seuraava alusta Katsoin viime keväänä, ne suunniteltiin erityisesti syväoppimisen suosittelumalleja ajatellen.

Ensimmäisen sukupolven siru rakennettiin RISC-V CPU -klusterin ympärille ja valmistettiin TSMC:n 7 nm:n prosessilla. Konepellin alla komponentti käytti kahdeksan kertaa kahdeksaan prosessointielementtien matriisia, joista jokainen oli varustettu kahdella RV-suoritinytimellä, joista toinen on varustettu vektorimatematiikan laajennuksilla. Nämä ytimet syötetään runsaalla 128 Mt:n sirulla olevasta SRAM-muistista ja jopa 128 Gt:n LPDDR5-muistista.

Kuten Meta väitti viime vuonna, siru toimi 800 MHz:n taajuudella ja ylitti 102.4 biljoonaa toimintoa sekunnissa INT8-suorituskyvyllä tai 51.2 teraFLOPSia puolitarkkuudella (FP16). Vertailun vuoksi, Nvidian H100 pystyy lähes neljä petaFLOPS harvaan FP8 suorituskykyä. Vaikka se ei ole läheskään yhtä tehokas kuin Nvidian tai AMD:n grafiikkasuorittimet, sirulla oli yksi tärkeä etu: virrankulutus. Itse sirun lämpösuunnitteluteho oli vain 25 wattia.

Mukaan Puolianalyysi, Metan uusimmassa sirussa on parannettuja ytimiä, ja se vaihtaa LPDDR5:n suuren kaistanleveyden muistiin, joka on pakattu TSMC:n CoWoS-tekniikalla (chip-on-wafer-on-substrate).

Toinen merkittävä ero on, että Metan toisen sukupolven siru tulee itse asiassa näkemään laajan käyttöönoton koko datakeskusinfrastruktuurissaan. Facebook-titaanin mukaan vaikka ensimmäisen sukupolven osaa käytettiin tuotantomainonnan mallien pyörittämiseen, se ei koskaan poistunut laboratoriosta.

Jahtaa yleistä tekoälyä

Mukautettuja osia lukuun ottamatta Facebook- ja Instagram-emoyhtiö on jättänyt myymättä miljardeja dollareita GPU:illa viime vuosina nopeuttaakseen kaikenlaisia ​​tehtäviä, jotka eivät sovellu perinteisille suoritinalustoille. Suurten kielimallien, kuten GPT-4:n ja Metan oman Llama 2:n, nousu on kuitenkin muuttanut maisemaa ja vauhdittanut massiivisten GPU-klusterien käyttöönottoa.

Metan toiminnassa nämä trendit ovat edellyttäneet rajuja muutoksia sen infrastruktuuriin, mukaan lukien uudistamiseksi useista datakeskuksista tukemaan suuriin tekoälyn käyttöönotoihin liittyviä valtavia teho- ja jäähdytysvaatimuksia.

Ja Metan käyttöönotot vain lisääntyvät seuraavien kuukausien aikana, kun yritys siirtää painopisteen metaversummista kehitys yleisestä tekoälystä. Oletettavasti tekoälyn parissa tehty työ auttaa muodostamaan metaversumia tai jotain vastaavaa.

Toimitusjohtaja Mark Zuckerbergin mukaan Meta aikoo ottaa käyttöön jopa 350,000 100 Nvidia HXNUMX -laitetta pelkästään tänä vuonna.

Yritys ilmoitti myös suunnitelmistaan ​​ottaa käyttöön AMD: n uusia käynnistettiin MI300X GPU:t palvelinkeskuksissaan. Zuckerberg väitti, että hänen yrityksensä lopettaisi vuoden vastaavalla 600,000 100 HXNUMX:n laskentateholla. On siis selvää, että Metan MTIA-sirut eivät tule pian korvaamaan grafiikkasuorituksia. ®

Aikaleima:

Lisää aiheesta Rekisteri