RISC-V as an Instruction Set Architecture (ISA) har vokst raskt i kommersiell betydning og relevans siden utgivelsen til det åpne fellesskapet i 2015, og tiltrekker seg mange IP-leverandører som nå tilbyr en rekke RTL-kjerner. Roger Espasa, administrerende direktør og grunnlegger av Semidynamikk, har presentert på RISC-V-arrangementer om hvordan deres IP er tilpasset for datautfordringer som krever høy båndbredde og høyytelseskjerner med vektorenheter. Semidynamics ble grunnlagt i 2016, har Barcelona for hovedkvarteret, og har allerede kunder i USA og Asia ved å tilby to tilpassbare RISC-V IP-er:
- Avispado – i rekkefølge RISCV64GCV, støtter AXI og CHI
- Atrevido – RISCV64GC som ikke er i bruk, støtter AXI og CHI
En typisk CPU har en håndfull store kjerner og store cacher, noe som gjør dem enkle å programmere, men ikke høy ytelse.
GPUer, derimot, har mange bittesmå kjerner som gir høy ytelse for parallell kode, men er vanskeligere å programmere og legge til kommunikasjonsforsinkelse gjennom PCIe-bussen når data må sendes frem og tilbake mellom CPU og GPU.
Tilnærmingen hos Espasa er å bruke en RISC-V-kjerne koblet til datakjerner som gjør det enkelt å programmere, høyere ytelse for parallelle koder og gir null kommunikasjonsforsinkelse. CPU pluss vektorenhet gir det beste fra begge verdener.
RISC-V-spesifikasjonen dokumenterer 32 vektorregistre, og du kan legge til en rekke vektorkjerner, sammen med en tilkobling til cachen din inne i en vektorenhet.
Med Semidynamics IP kan du tilpasse antall vektorkjerner: 4, 8, 16, 32. En annen måte å se dette på er å merke seg at 4 vektorkjerner er 256-bit, opptil 32 vektorkjerner som er 2,048-bit.
IP-brukere velger også hvilke datatyper: FP64, FP32, FP16, BF16, INT64, INT32, INT16, INT8. For en AI-applikasjon kan de velge datatyper av FP16, BF16, mens en HPC-applikasjon kan velge FP64, FP32.
Den tredje tilpasningen er Vector Register Length, hvor du for mer ytelse og lavere effekt kan gjøre vektorregisteret større enn vektorenheten.
Her er blokkskjemaet til Atrevideo 423-V8:
Vektorenheten er helt ute av drift, noe som er unikt blant RISC-V IP-leverandører. Kombinasjonen av vektorenheten pluss Gazzillion-enheten er i stand til å strømme data med over 60 byte/sykluser.
Den lilla linjen viser leseytelsen og i L1 Cache er den 20-60 byte/syklus, andre maskiner viser et raskt fall i båndbredde etter å ha forlatt L1 Cache, mens denne tilnærmingen fortsetter, med en utflating på 56. Går til og med til DDR-minne viser en båndbredde på 40. Med en klokkefrekvens på 1.0GHz gir det 40 GB/s båndbredde.
IP-kunder kan til og med legge til sin egen RTL-kode koblet til Vector Unit for sine egne formål.
Ytelsen til matrisemultiplikasjon er viktig i AI-arbeidsbelastninger, og på OOO V8 Vector Unit er det en topp på 16 FP64 FLOPS/syklus, og en topp på 99 % for en matrisestørrelse >= 400. For en liten matrisestørrelse på 24×24 ytelsen er 7 FP64 FLOPS/syklus, eller 50 % av topp. Matrisemultiplikasjon for FP16 ved bruk av en vektorenhet med 8 vektorkjerner har en topp på 64 FP16 FLOPS/syklus, og 99 % av topp for M >= 600.
En benchmark for gjenstandsdeteksjon i sanntid kalt YOLO (You Only Look Once) ble kjørt på Atrevido 423-V8-plattformen, og den viste 58 % høyere ytelse per vektorkjerne enn konkurrentene. Disse resultatene var for video med 24 lag. 5.56 Gops/ramme og ca 9M parametere.
Oppsummering
Å velge en RISC-V IP-leverandør er en komplisert oppgave, så å vite om leverandører som Semidynamics kan hjelpe deg å bedre forstå hvordan en tilpasset tilnærming mest effektivt kan kjøre dine spesifikke arbeidsbelastninger. Med Semidynamics kan du velge mellom arkitektoniske valg som i rekkefølge eller ute av rekkefølge, med eller uten vektorenheter. De rapporterte tallene fra denne IP-leverandøren ser lovende ut, og jeg ser frem til fremtidige kunngjøringer.
Relaterte videoer
Del dette innlegget via:
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- PlatoData.Network Vertical Generative Ai. Styrk deg selv. Tilgang her.
- PlatoAiStream. Web3 Intelligence. Kunnskap forsterket. Tilgang her.
- PlatoESG. Bil / elbiler, Karbon, CleanTech, Energi, Miljø, Solenergi, Avfallshåndtering. Tilgang her.
- PlatoHelse. Bioteknologisk og klinisk etterretning. Tilgang her.
- ChartPrime. Hev handelsspillet ditt med ChartPrime. Tilgang her.
- BlockOffsets. Modernisering av eierskap for miljøkompensasjon. Tilgang her.
- kilde: https://semiwiki.com/ip/333718-risc-v-64-bit-ip-for-high-performance/
- : har
- :er
- :ikke
- :hvor
- $OPP
- 1
- 16
- 200
- 2015
- 2016
- 24
- 32
- 40
- 60
- 7
- 8
- a
- Om oss
- legge til
- Etter
- AI
- langs
- allerede
- også
- blant
- an
- og
- Kunngjøringer
- En annen
- Søknad
- tilnærming
- arkitektonisk
- arkitektur
- ER
- AS
- asia
- At
- tiltrekker
- tilbake
- Båndbredde
- barcelona
- BE
- benchmark
- BEST
- Bedre
- mellom
- Stor
- større
- Bit
- Blokker
- både
- buss
- men
- by
- cache
- som heter
- CAN
- stand
- konsernsjef
- Administrerende direktør og grunnlegger
- utfordringer
- valg
- Velg
- klokke
- kode
- koder
- kombinasjon
- kommersiell
- Kommunikasjon
- samfunnet
- konkurrenter
- komplisert
- Beregn
- tilkoblet
- tilkobling
- kontrast
- Kjerne
- kunne
- prosessor
- Kunder
- tilpasses
- tilpasning
- tilpasse
- tilpasset
- dato
- Gjenkjenning
- dokumenter
- Drop
- lett
- effektivt
- Selv
- hendelser
- Til
- videre
- Forward
- Stiftet
- Grunnleggeren
- fra
- fullt
- framtid
- få
- skal
- GPU
- voksen
- håndfull
- hardere
- Ha
- hjelpe
- Høy
- høyere
- Hvordan
- hpc
- hq
- HTTPS
- i
- betydning
- viktig
- in
- innsiden
- IP
- IT
- DET ER
- jpg
- Knowing
- stor
- Ventetid
- lag
- forlater
- Lengde
- i likhet med
- linje
- Se
- lavere
- maskiner
- gjøre
- GJØR AT
- Making
- mange
- Matrix
- max bredde
- Kan..
- Minne
- minutter
- mer
- mest
- behov
- note
- nå
- Antall
- tall
- objekt
- Objektdeteksjon
- of
- tilby
- on
- gang
- bare
- åpen
- or
- rekkefølge
- Annen
- ut
- enn
- egen
- Parallel
- parametere
- bestått
- Topp
- for
- ytelse
- plattform
- plato
- Platon Data Intelligence
- PlatonData
- i tillegg til
- Post
- makt
- presentert
- program
- lovende
- gi
- gir
- formål
- raskt
- rask
- Sats
- Lese
- sanntids
- registrere
- registre
- slipp
- relevans
- rapportert
- krever
- Resultater
- Kjør
- sett
- Vis
- viste
- Viser
- siden
- Størrelse
- liten
- So
- spesifikk
- spesifikasjon
- streaming
- Støtte
- Oppgave
- enn
- Det
- De
- Blokken
- deres
- Dem
- Disse
- de
- Tredje
- denne
- selv om?
- Gjennom
- til
- to
- typer
- typisk
- forstå
- unik
- enhet
- lomper
- us
- bruke
- Brukere
- ved hjelp av
- variasjon
- leverandør
- leverandører
- av
- video
- var
- Vei..
- var
- når
- hvilken
- mens
- med
- uten
- Verdens
- Yolo
- du
- Din
- zephyrnet
- null