Posodobitve panela Synopsys o stanju sistemov z več matricami – Semiwiki

Posodobitve panela Synopsys o stanju sistemov z več matricami – Semiwiki

Izvorno vozlišče: 2931383

Synopsys je pred kratkim gostil medpanožni panel o stanju sistemov z več čipi, ki se mi je zdel zanimiv nenazadnje zaradi njegovega pomena za hitro pospeševanje strojne opreme, osredotočene na AI. Več o tem spodaj. Panelisti, vsi s pomembnimi vlogami v sistemih z več die, so bili Shekhar Kapoor (višji direktor produktnega upravljanja, Synopsys), Cheolmin Park (korporacijski podpredsednik, Samsung), Lalitha Immaneni (podpredsednica za arhitekturo, oblikovanje in tehnološke rešitve, Intel), Michael Schaffert (višji podpredsednik, Bosch) in Murat Becer (podpredsednik raziskav in razvoja, Ansys). Panel je moderiral Marco Chiappetta (soustanovitelj in glavni analitik, HotTech Vision and Analysis).

multi die 525x315 light

Pogon velikega povpraševanja

Običajno je pod tem naslovom predstaviti vse običajne osumljence (HPC, avtomobilska industrija itd.), vendar ta seznam zaostaja za morda največji osnovni dejavnik – trenutni boj za prevlado v vsem LLM in generativni AI. Veliki jezikovni modeli ponujajo nove ravni storitev SaaS pri iskanju, ustvarjanju dokumentov in drugih zmožnostih, z velikimi konkurenčnimi prednostmi tistemu, ki prvi dobi to pravico. Na mobilnih napravah in v avtu bodo zaradi vrhunskega nadzora in povratnih informacij, ki temeljijo na naravnem jeziku, obstoječe glasovne možnosti videti primitivne. Medtem lahko generativne metode za ustvarjanje novih slik z uporabo difuzijskih in poissonovih modelov toka ustvarijo spektakularne grafične risbe na besedilu ali fotografiji, ki jih dopolnjujejo knjižnice slik. Kot privabljanje potrošnikov bi se to lahko izkazalo za naslednjo veliko stvar za prihodnje izdaje telefonov.

Medtem ko umetna inteligenca, ki temelji na transformatorjih, predstavlja ogromno $$$ priložnosti, prihaja z izzivi. Tehnologije, ki omogočajo takšne metode, so že preizkušene v oblaku in se pojavljajo na robu, vendar so slavno lačne pomnilnika. Proizvodni LLM-ji izvajajo od milijard do trilijonov parametrov, ki jih je treba naložiti v transformator. Enako visoko je povpraševanje po delovnem prostoru med procesom; slikanje na podlagi difuzije postopoma dodaja šum celotni sliki, nato pa se vrne k spremenjeni sliki, spet prek platform, ki temeljijo na transformatorjih.

Razen začetne obremenitve si noben od teh procesov ne more privoščiti dodatnih stroškov interakcije z zunanjim DRAM-om. Zakasnitve bi bile nesprejemljive in povpraševanje po energiji bi izpraznilo baterijo telefona ali pa bi razstrelilo proračun za napajanje podatkovnega centra. Ves pomnilnik mora biti blizu – zelo blizu – računalnika. Ena rešitev je zlaganje SRAM-a na pospeševalnik (kot sta AMD in zdaj Intel pokazala za svoje strežniške čipe). Pomnilnik z visoko pasovno širino v paketu doda še eno nekoliko počasnejšo možnost, vendar še vedno ne tako počasen kot DRAM zunaj čipa.

Vse to zahteva sisteme z več matricami. Kje smo torej pri pripravi te možnosti za proizvodnjo?

Pogledi na to, kje smo

Slišal sem veliko navdušenja nad rastjo na tem področju, pri sprejemanju, aplikacijah in orodjih. Intel, AMD, Qualcomm, Samsung so vsi očitno zelo aktivni na tem področju. Znano je, da ima Apple M2 Ultra zasnovo z dvojno matrico, AWS Graviton 3 pa sistem z več matricami. Prepričan sem, da je med velikimi sistemi in polprevodniškimi hišami še veliko drugih primerov. Imam vtis, da se matrice še vedno večinoma pridobivajo interno (razen morda za sklade HBM) in sestavljajo v livarskih embalažnih tehnologijah TSMC, Samsung ali Intel. Vendar pa je Tenstorrent pravkar objavil, da so izbrali Samsung za izdelavo njihove naslednje generacije zasnove AI kot čipleta (matrice, primerne za uporabo v sistemu z več matrikami), tako da se ta prostor že premika proti širši nabavi matric.

Vsi panelisti so bili seveda navdušeni nad splošno usmeritvijo in jasno je, da se tehnologije in orodja hitro razvijajo, kar je razlog za vznemirjenje. Lalitha je to navdušenje utemeljil z ugotovitvijo, da je način, na katerega se sistemi z več matricami trenutno načrtujejo in načrtujejo, še vedno v povojih in še ni pripravljen za lansiranje obsežnega trga za večkratno uporabo matric. To me ne preseneča. Zdi se, da bi morala tako zapletena tehnologija najprej dozoreti v tesnih partnerstvih med oblikovalci sistemov, livarnami in podjetji EDA, morda čez nekaj let, preden se lahko razširi na večje občinstvo.

Prepričan sem, da livarne, proizvajalci sistemov in podjetja EDA ne pokažejo vseh svojih kartic in so morda dlje, kot se odločijo oglaševati. Veselim se več. Panelno razpravo si lahko ogledate TUKAJ.

Delite to objavo prek:

Časovni žig:

Več od Semiwiki