Lühikokkuvõte paneeli värskendused mitme distantsiga süsteemide seisu kohta – Semiwiki

Taasavaldanud Platon

järgijaid: 0

Hiljuti korraldas Synopsys valdkonnaülese paneeli multi-die süsteemide olukorra kohta, mis oli minu arvates huvitav muu hulgas selle olulisuse tõttu tehisintellekti-keskse riistvara kiire kiirenduse jaoks. Sellest lähemalt allpool. Paneeliliikmed, kellel kõigil oli oluline roll mitme stantsiga süsteemides, olid Shekhar Kapoor (Synopsysi tootejuhtimise vanemdirektor), Cheolmin Park (Samsungi ettevõtte asepresident), Lalitha Immaneni (Intel arhitektuuri, disaini ja tehnoloogialahenduste asepresident), Michael Schaffert (Boschi vanem asepresident) ja Murat Becer (Ansysi uurimis- ja arendustegevuse asepresident). Paneeli modereeris Marco Chiappetta (HotTech Vision and Analysis kaasasutaja ja peaanalüütik).

multi die 525x315 valgus

Suure nõudluse juht

Selle pealkirja all on tavaline levitada kõiki tavalisi kahtlusaluseid (HPC, autotööstus jne), kuid see nimekiri müüb lühikeseks võib-olla suurima aluseks oleva teguri – praegune võitlus domineerimise nimel kõiges LLM-is ja generatiivses tehisintellektis. Suured keelemudelid pakuvad SaaS-i teenuste uut taset otsingus, dokumentide loomises ja muudes võimalustes, millel on suured konkurentsieelised sellele, kes selle esimesena saab. Mobiilseadmetes ja autos muudab parem loomuliku keelepõhine juhtimine ja tagasiside olemasolevad häälepõhised valikud võrreldes primitiivseks. Samal ajal võivad generatiivsed meetodid uute kujutiste loomiseks difusiooni ja Poissoni voolumudelite abil välja pumbata suurejoonelist graafikat tekstile või fotole, mida täiendavad pildikogud. Tarbijate loosina võib see osutuda tulevaste telefoniväljaannete jaoks järgmiseks suureks asjaks.

Kuigi trafopõhine tehisintellekt pakub tohutut $$$ võimalust, kaasnevad sellega väljakutsed. Tehnoloogiad, mis selliseid meetodeid võimalikuks teevad, on juba pilves end tõestanud ja ilmuvad äärepealt, kuid need on tuntud mälunäljased. Tootmis-LLM-id töötavad igal pool miljarditest kuni triljoniteni parameetreid, mis tuleb trafosse laadida. Nõudlus protsessisisese tööruumi järele on sama suur; difusioonipõhine pildistamine lisab järk-järgult täiskujutisele müra, seejärel naaseb muudetud kujutisele, jällegi trafopõhiste platvormide kaudu.

Peale esialgse koormuse ei saa ükski neist protsessidest endale lubada välise DRAM-iga suhtlemist. Latentsid oleksid vastuvõetamatud ja energianõudlus tühjendaks telefoni akut või vähendaks andmekeskuse energiaeelarvet. Kogu mälu peab olema arvuti lähedal – väga lähedal. Üks lahendus on SRAM-i virnastamine kiirendi peale (nagu AMD ja nüüd Intel on oma serverikiipide puhul näidanud). Pakendis olev suure ribalaiusega mälu lisab veel ühe mõnevõrra aeglasema valiku, kuid siiski mitte nii aeglase kui kiibiväline DRAM.

Kõik see nõuab mitme stantsiga süsteeme. Niisiis, kus me oleme selle võimaluse tootmiseks valmis seadmisel?

Vaateid sellele, kus me asume

Olen kuulnud palju entusiasmi selle valdkonna, kasutuselevõtu, rakenduste ja tööriistade kasvuks. Intel, AMD, Qualcomm, Samsung on kõik selles valdkonnas selgelt väga aktiivsed. Apple M2 Ultra on teadaolevalt kahe stantsiga konstruktsioon ja AWS Graviton 3 mitme stantsiga süsteem. Olen kindel, et suurte süsteemide ja pooljuhtmajade hulgas on palju muid näiteid. Mulle jääb mulje, et stantsid tarnitakse endiselt valdavalt sisemiselt (välja arvatud võib-olla HBM-i virnad) ja monteeritakse TSMC, Samsungi või Inteli valukoja pakendamise tehnoloogiates. Kuid Tenstorrent teatas äsja, et nad on valinud Samsungi oma järgmise põlvkonna tehisintellekti disaini tootmiseks kiibina (mitmevormimissüsteemis kasutamiseks sobiv matriit), nii et see ruum on juba laienemas laiema stantsi hankimise suunas.

Kõik panelistid olid üldisest suunast loomulikult entusiastlikud ning selgelt arenevad tehnoloogiad ja tööriistad kiiresti, mis on põhjuseks. Lalitha põhjendas seda entusiasmi, märkides, et praegune mitmest stantsist koosnevate süsteemide arhitektuur ja projekteerimine on alles lapsekingades ega ole veel valmis laialdase korduvkasutatavate stantside turu käivitamiseks. See ei üllata mind. Tundub, et sellise keerukusega tehnoloogia peaks esmalt küpsema tihedas partnerluses süsteemidisainerite, valukodade ja EDA ettevõtete vahel, võib-olla mitme aasta jooksul, enne kui see laieneb suuremale publikule.

Olen kindel, et valukojad, süsteemiehitajad ja EDA-ettevõtted ei näita kõiki oma kaarte ja võivad olla kaugemale jõudnud, kui nad otsustavad reklaamida. Ootan huviga lisateavet. Saate vaadata paneeldiskussiooni SIIN.

Jaga seda postitust: