RISC-V 64-bittinen IP korkealle suorituskyvylle - Semiwiki

RISC-V 64-bittinen IP korkealle suorituskyvylle – Semiwiki

Lähdesolmu: 2855188

RISC-V ohjesarjaarkkitehtuurina (ISA) on kasvanut nopeasti kaupallisesti merkitykseltään ja merkitykseltään sen jälkeen, kun se julkaistiin avoimelle yhteisölle vuonna 2015, ja se houkutteli monia IP-toimittajia, jotka tarjoavat nyt erilaisia ​​RTL-ytimiä. Roger Espasa, toimitusjohtaja ja perustaja Semidynamiikka, on esitellyt RISC-V-tapahtumissa kuinka heidän IP-osoitteensa on mukautettu laskentahaasteisiin, jotka vaativat suurta kaistanleveyttä ja korkean suorituskyvyn ytimiä vektoriyksiköillä. Semidynamics perustettiin vuonna 2016, sen pääkonttori on Barcelona, ​​ja sillä on jo asiakkaita Yhdysvalloissa ja Aasiassa tarjoamalla kaksi muokattavissa olevaa RISC-V IP:tä:

  • Avispado – tilauksessa oleva RISCV64GCV, joka tukee AXI:ta ja CHI:tä
  • Atrevido – epäkunnossa oleva RISCV64GC, joka tukee AXI:ta ja CHI:tä

Tyypillisessä suorittimessa on kourallinen suuria ytimiä ja suuria välimuistia, joten ne on helppo ohjelmoida, vaikkakaan ei suorituskykyä.

Grafiikkasuorittimissa on sitä vastoin monia pieniä ytimiä, jotka tarjoavat korkean suorituskyvyn rinnakkaiskoodille, mutta niitä on vaikeampi ohjelmoida ja lisätä viestintäviivettä PCIe-väylän kautta, kun dataa on siirrettävä edestakaisin CPU:n ja GPU:n välillä.

CPU, GPU min
CPU, GPU vertailu

Espasan lähestymistapa on käyttää RISC-V-ydintä, joka on yhdistetty laskentaytimiin, mikä tekee ohjelmoinnista helppoa, parempaa suorituskykyä rinnakkaisille koodeille ja tarjoaa nollaviestinnän latenssia. CPU plus vektoriyksikkö tarjoaa molempien maailmojen parhaat puolet.

RISC-V CPU plus Vector-yksikkö, parempi suorituskyky
CPU plus Vector-yksikkö

RISC-V-spesifikaatio dokumentoi 32 vektorirekisteriä, ja voit lisätä useita vektoriytimiä sekä yhteyden välimuistiin vektoriyksikön sisällä.

Vektoriyksikkö min
Vektoriyksikkö

Semidynamics IP:n avulla voit mukauttaa vektoriytimien lukumäärää: 4, 8, 16, 32. Toinen tapa tarkastella tätä on huomata, että 4 vektoriydintä on 256-bittinen, jopa 32 vektoriydintä, joka on 2,048-bittinen.

IP-käyttäjät valitsevat myös mitkä tietotyypit: FP64, FP32, FP16, BF16, INT64, INT32, INT16, INT8. Tekoälysovellukselle he voivat valita tietotyypit FP16, BF16, kun taas HPC-sovellus voi valita FP64, FP32.

Kolmas räätälöinti on Vector Register Length, jossa voit tehdä vektorirekisteristä vektoriyksikköä suuremman suorituskyvyn ja pienemmän tehon saamiseksi.

Tässä on Atrevideo 423-V8:n lohkokaavio:

Atrevido min
Atrevido 423 + V8 vektoriyksikkö

Vektoriyksikkö on täysin epäkunnossa, mikä on ainutlaatuinen RISC-V IP -toimittajien keskuudessa. Vektoriyksikön ja Gazzillion-yksikön yhdistelmä kykenee suoratoistamaan dataa yli 60 tavua/sykliä.

Vector + Gazzillion, tavua/sykli suorituskyky
Suuri kaistanleveys: Vector + Gazzillion

Violetti viiva osoittaa Read-suorituskyvyn ja L1-välimuistissa se on 20-60 tavua/jakso, muut koneet osoittavat nopean kaistanleveyden pudotuksen L1-välimuistista poistuttuaan, kun taas tämä lähestymistapa jatkuu ja tasoittuu 56:een. Jopa DDR-muistiin siirtyminen kaistanleveys on 40. Kellotaajuudella 1.0 GHz, mikä tekee 40 Gt/s kaistanleveydestä.

IP-asiakkaat voivat jopa lisätä oman vektoriyksikköön liitetyn RTL-koodin omiin tarkoituksiinsa.

Matriisin kertolasku on tärkeää tekoälyn työkuormissa, ja OOO V8 Vector Unit -yksikössä huippu on 16 FP64 FLOPS/sykli ja 99 % huipusta matriisin koolla >= 400. Pienelle matriisikoolle 24×24 suorituskyky on 7 FP64 FLOPS/sykli eli 50 % huipusta. Matriisikertolasku FP16:lle käyttämällä vektoriyksikköä, jossa on 8 vektoriydintä, on huippu 64 FP16 FLOPS/sykli ja 99 % huipusta, kun M >= 600.

Atrevido 423-V8 -alustalla suoritettiin reaaliaikainen objektien havaitsemisvertailu, nimeltään YOLO (You Only Look Once), ja sen suorituskyky vektoriydintä kohden oli 58 % parempi kuin kilpailijoilla. Nämä tulokset koskivat 24-tasoista videota. 5.56 Gops/frame ja noin 9M parametria.

YOLO-esitys
YOLO vertailu

Yhteenveto

RISC-V IP -toimittajan valitseminen on monimutkainen tehtävä, joten Semidynamicsin kaltaisten toimittajien tunteminen voi auttaa sinua ymmärtämään paremmin, kuinka räätälöity lähestymistapa voisi tehokkaimmin suorittaa tietyt työkuormit. Semidynamiikan avulla voit valita arkkitehtonisten valintojen välillä, kuten järjestyksessä tai poissa, vektoriyksiköillä tai ilman. Tämän IP-toimittajan raportoimat luvut näyttävät lupaavilta, ja odotan innolla heidän tulevia ilmoituksiaan.

Related Videos

Jaa tämä viesti:

Aikaleima:

Lisää aiheesta Semiwiki