RISC-V 64 bitars IP för hög prestanda - Semiwiki

RISC-V 64 bitars IP för hög prestanda – Semiwiki

Källnod: 2855188

RISC-V som en instruktionsuppsättningsarkitektur (ISA) har vuxit snabbt i kommersiell betydelse och relevans sedan den släpptes till det öppna samhället 2015, vilket lockar många IP-leverantörer som nu tillhandahåller en mängd olika RTL-kärnor. Roger Espasa, VD och grundare av Semidynamik, har presenterat vid RISC-V-evenemang om hur deras IP är anpassad för datorutmaningar som kräver hög bandbredd och högpresterande kärnor med vektorenheter. Semidynamics grundades 2016, har Barcelona för huvudkontoret och har redan kunder i USA och Asien genom att erbjuda två anpassningsbara RISC-V IP:er:

  • Avispado – i beställning RISCV64GCV, stöder AXI och CHI
  • Atrevido – out-of-order RISCV64GC, stöder AXI och CHI

En typisk CPU har en handfull stora kärnor och stora cacher, vilket gör dem lätta att programmera, men inte hög prestanda.

GPU:er, däremot, har många små kärnor som ger hög prestanda för parallell kod, men är svårare att programmera och lägga till kommunikationslatens genom PCIe-bussen när data behöver skickas fram och tillbaka mellan CPU:n och GPU:n.

CPU, GPU min
CPU, GPU jämförelse

Tillvägagångssättet hos Espasa är att använda en RISC-V-kärna kopplad till beräkningskärnor som gör den enkel att programmera, högre prestanda för parallella koder och erbjuder noll kommunikationslatens. CPU plus vektorenhet ger det bästa av två världar.

RISC-V CPU plus Vector-enhet, högre prestanda
CPU plus vektorenhet

RISC-V-specifikationen dokumenterar 32 vektorregister, och du kan lägga till ett antal vektorkärnor, tillsammans med en anslutning till din cache inuti en vektorenhet.

Vektorenhet min
vektor Enhet

Med Semidynamics IP kan du anpassa antalet vektorkärnor: 4, 8, 16, 32. Ett annat sätt att se på detta är att notera att 4 vektorkärnor är 256-bitar, upp till 32 vektorkärnor som är 2,048 XNUMX-bitar.

IP-användare väljer också vilka datatyper: FP64, FP32, FP16, BF16, INT64, INT32, INT16, INT8. För en AI-applikation kan de välja datatyperna FP16, BF16, medan en HPC-applikation kan välja FP64, FP32.

Den tredje anpassningen är Vector Register Length, där du för mer prestanda och lägre effekt kan göra vektorregistret större än vektorenheten.

Här är blockschemat för Atrevideo 423-V8:

Atrevido min
Atrevido 423 + V8 vektorenhet

Vektorenheten är helt ur funktion, vilket är unikt bland RISC-V IP-leverantörer. Kombinationen av vektorenheten plus Gazzillion-enheten kan strömma data med över 60 byte/cykler.

Vektor + Gazzillion, byte/cykelprestanda
Hög bandbredd: Vektor + Gazzillion

Den lila linjen visar läsprestandan och i L1-cachen är det 20-60 byte/cykel, andra maskiner visar en snabb minskning av bandbredden efter att ha lämnat L1-cachen, medan detta tillvägagångssätt fortsätter, med en utjämning vid 56. Går även till DDR-minne visar en bandbredd på 40. Med en klockfrekvens på 1.0GHz gör det 40 GB/s bandbredd.

IP-kunder kan till och med lägga till sin egen RTL-kod kopplad till Vector Unit för sina egna ändamål.

Prestanda för matrismultiplikation är viktig i AI-arbetsbelastningar, och på OOO V8 Vector Unit finns en topp på 16 FP64 FLOPS/cykel och en topp på 99 % för en matrisstorlek >= 400. För en liten matrisstorlek på 24×24 prestandan är 7 FP64 FLOPS/cykel, eller 50 % av topp. Matrismultiplikation för FP16 med en vektorenhet med 8 vektorkärnor har en topp på 64 FP16 FLOPS/cykel och 99% av toppen för M >= 600.

Ett riktmärke för objektdetektering i realtid som heter YOLO (You Only Look Once) kördes på Atrevido 423-V8-plattformen, och den visade 58 % högre prestanda per vektorkärna än konkurrenterna. Dessa resultat var för video med 24 lager. 5.56 Gops/ram och ca 9M parametrar.

YOLO prestanda
YOLO Jämförelse

Sammanfattning

Att välja en RISC-V IP-leverantör är en komplicerad uppgift, så att känna till leverantörer som Semidynamics kan hjälpa dig att bättre förstå hur ett anpassat tillvägagångssätt mest effektivt kan köra dina specifika arbetsbelastningar. Med Semidynamics kan du välja mellan arkitektoniska val som i ordning eller ur ordning, med eller utan vektorenheter. De rapporterade siffrorna från denna IP-leverantör ser lovande ut, och jag ser fram emot deras framtida tillkännagivanden.

Related Videos

Dela det här inlägget via:

Tidsstämpel:

Mer från Semiwiki