RISC-V en tant qu'architecture de jeu d'instructions (ISA) a rapidement gagné en importance et en pertinence commerciales depuis sa sortie dans la communauté ouverte en 2015, attirant de nombreux fournisseurs IP qui proposent désormais une variété de cœurs RTL. Roger Espasa, PDG et fondateur de Semidynamique, a présenté lors d'événements RISC-V comment son IP est personnalisée pour les défis de calcul qui nécessitent une bande passante élevée et des cœurs hautes performances avec des unités vectorielles. Semidynamics a été fondée en 2016, a son siège social à Barcelone et compte déjà des clients aux États-Unis et en Asie en proposant deux IP RISC-V personnalisables :
- Avispado – RISCV64GCV en ordre, prenant en charge AXI et CHI
- Atrevido – RISCV64GC en panne, prenant en charge AXI et CHI
Un processeur typique possède une poignée de gros cœurs et de grands caches, ce qui les rend faciles à programmer, mais pas très performants.
Les GPU, en revanche, possèdent de nombreux cœurs minuscules qui offrent des performances élevées pour le code parallèle, mais sont plus difficiles à programmer et à ajouter une latence de communication via le bus PCIe lorsque les données doivent être transmises entre le CPU et le GPU.
L'approche d'Espasa consiste à utiliser un cœur RISC-V connecté aux cœurs de calcul, ce qui facilite la programmation, offre des performances plus élevées pour les codes parallèles et offre une latence de communication nulle. Le processeur et l'unité vectorielle offrent le meilleur des deux mondes.
La spécification RISC-V documente 32 registres vectoriels et vous pouvez ajouter un certain nombre de cœurs vectoriels, ainsi qu'une connexion à votre cache à l'intérieur d'une unité vectorielle.
Avec Semidynamics IP, vous pouvez personnaliser le nombre de cœurs vectoriels : 4, 8, 16, 32. Une autre façon de voir les choses est de noter que 4 cœurs vectoriels font 256 bits, jusqu'à 32 cœurs vectoriels, soit 2,048 XNUMX bits.
Les utilisateurs IP choisissent également les types de données : FP64, FP32, FP16, BF16, INT64, INT32, INT16, INT8. Pour une application d'IA, ils peuvent choisir les types de données FP16, BF16, tandis qu'une application HPC peut sélectionner FP64, FP32.
La troisième personnalisation est la longueur du registre vectoriel, où pour plus de performances et une consommation réduite, vous pouvez rendre le registre vectoriel plus grand que l'unité vectorielle.
Voici le schéma fonctionnel de l'Atrevideo 423-V8 :
L'unité vectorielle est complètement hors service, ce qui est unique parmi les fournisseurs IP RISC-V. La combinaison de l'unité vectorielle et de l'unité Gazzillion est capable de diffuser des données en continu à plus de 60 octets/cycles.
La ligne violette montre les performances de lecture et dans le cache L1, elles sont de 20 à 60 octets/cycle, d'autres machines affichent une baisse rapide de la bande passante après avoir quitté le cache L1, tandis que cette approche continue, avec un aplatissement à 56. Même en passant à la mémoire DDR affiche une bande passante de 40. Avec une fréquence d'horloge de 1.0 GHz, ce qui donne une bande passante de 40 Go/s.
Les clients IP peuvent même ajouter leur propre code RTL connecté à l'unité Vector pour leurs propres besoins.
Les performances de multiplication matricielle sont importantes dans les charges de travail d'IA, et sur l'unité vectorielle OOO V8, il y a un pic de 16 FP64 FLOPS/cycle, et un pic de 99 % pour une taille de matrice >= 400. Pour une petite taille de matrice de 24×24 la performance est de 7 FP64 FLOPS/cycle, soit 50 % du pic. La multiplication matricielle pour FP16 à l'aide d'une unité vectorielle avec 8 cœurs vectoriels a un pic de 64 FLOPS FP16/cycle et 99 % du pic pour M >= 600.
Un test de détection d'objets en temps réel appelé YOLO (You Only Look Once) a été exécuté sur la plate-forme Atrevido 423-V8 et a montré des performances par cœur vectoriel 58 % supérieures à celles des concurrents. Ces résultats concernaient une vidéo à 24 couches. 5.56 Gops/frame et environ 9M de paramètres.
Résumé
Le choix d'un fournisseur IP RISC-V est une tâche compliquée, donc connaître des fournisseurs comme Semidynamics peut vous aider à mieux comprendre comment une approche personnalisée pourrait exécuter plus efficacement vos charges de travail spécifiques. Avec Semidynamics, vous avez le choix entre des choix architecturaux comme dans l'ordre ou dans le désordre, avec ou sans unités vectorielles. Les chiffres rapportés par ce fournisseur IP semblent prometteurs et j'attends avec impatience leurs futures annonces.
Related Videos
Partagez cet article via:
- Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
- PlatoData.Network Ai générative verticale. Autonomisez-vous. Accéder ici.
- PlatoAiStream. Intelligence Web3. Connaissance Amplifiée. Accéder ici.
- PlatonESG. Automobile / VE, Carbone, Technologie propre, Énergie, Environnement, Solaire, La gestion des déchets. Accéder ici.
- PlatoHealth. Veille biotechnologique et essais cliniques. Accéder ici.
- GraphiquePrime. Élevez votre jeu de trading avec ChartPrime. Accéder ici.
- Décalages de bloc. Modernisation de la propriété des compensations environnementales. Accéder ici.
- La source: https://semiwiki.com/ip/333718-risc-v-64-bit-ip-for-high-performance/
- :possède
- :est
- :ne pas
- :où
- $UP
- 1
- 16
- 200
- 2015
- 2016
- 24
- 32
- 40
- 60
- 7
- 8
- a
- Qui sommes-nous
- ajouter
- Après
- AI
- le long de
- déjà
- aussi
- parmi
- an
- ainsi que le
- Nombre d'annonces
- Une autre
- Application
- une approche
- architectural
- architecture
- SONT
- AS
- Asie
- At
- attirer
- RETOUR
- Bande passante
- Barcelona
- BE
- référence
- LES MEILLEURS
- Améliorée
- jusqu'à XNUMX fois
- Big
- plus gros
- Bit
- Block
- tous les deux
- bus
- mais
- by
- cachette
- appelé
- CAN
- capable
- CEO
- PDG et fondateur
- globaux
- choix
- Selectionnez
- horloge
- code
- codes
- combinaison
- commercial
- Communication
- Communautés
- concurrents
- compliqué
- calcul
- connecté
- connexion
- contraste
- Core
- pourriez
- Processeur
- Clients
- personnalisables
- personnalisation
- personnaliser
- sont adaptées
- données
- Détection
- INSTITUTIONNELS
- Goutte
- Easy
- efficacement
- Pourtant, la
- événements
- Pour
- en avant
- Avant
- Fondée
- fondateur
- De
- d’étiquettes électroniques entièrement
- avenir
- obtenez
- aller
- GPU
- cultivé
- poignée
- Plus fort
- Vous avez
- vous aider
- Haute
- augmentation
- Comment
- hpc
- hq
- HTTPS
- i
- importance
- important
- in
- à l'intérieur
- IP
- IT
- SES
- jpg
- connaissance
- gros
- Latence
- poules pondeuses
- départ
- Longueur
- comme
- Gamme
- Style
- baisser
- Les machines
- a prendre une
- FAIT DU
- Fabrication
- de nombreuses
- Matrice
- largeur maximale
- Mai..
- Mémoire
- m.
- PLUS
- (en fait, presque toutes)
- Besoins
- noter
- maintenant
- nombre
- numéros
- objet
- Détection d'objet
- of
- offrant
- on
- une fois
- uniquement
- ouvert
- or
- de commander
- Autre
- ande
- plus de
- propre
- Parallèle
- paramètres
- passé
- Courant
- /
- performant
- plateforme
- Platon
- Intelligence des données Platon
- PlatonDonnées
- plus
- Post
- power
- présenté
- Programme
- prometteur
- fournir
- fournit
- des fins
- vite.
- Nos tests de diagnostic produisent des résultats rapides et précis sans nécessiter d'équipement de laboratoire complexe et coûteux,
- Tarif
- Lire
- en temps réel
- vous inscrire
- registres
- libérer
- pertinence
- Signalé
- exigent
- Résultats
- Courir
- set
- montrer
- montré
- Spectacles
- depuis
- Taille
- petit
- So
- groupe de neurones
- spécification
- streaming
- Appuyer
- Tâche
- que
- qui
- Les
- Le bloc
- leur
- Les
- Ces
- l'ont
- Troisièmement
- this
- bien que?
- Avec
- à
- deux
- types
- débutante
- comprendre
- expérience unique et authentique
- unité
- unités
- us
- utilisé
- utilisateurs
- en utilisant
- variété
- vendeur
- fournisseurs
- via
- Vidéo
- était
- Façon..
- ont été
- quand
- qui
- tout en
- comprenant
- sans
- monde
- Yolo
- you
- Votre
- zéphyrnet
- zéro