Yüksek Performans için RISC-V 64 bit IP - Semiwiki

Yüksek Performans için RISC-V 64 bit IP – Semiwiki

Kaynak Düğüm: 2855188

Bir Komut Seti Mimarisi (ISA) olarak RISC-V, 2015 yılında açık topluluğa sunulmasından bu yana ticari önemi ve alaka düzeyi açısından hızla büyüdü ve artık çeşitli RTL çekirdekleri sağlayan birçok IP satıcısının ilgisini çekti. Roger Espasa, CEO ve Kurucu yarı dinamikRISC-V etkinliklerinde, yüksek bant genişliği ve vektör birimlerine sahip yüksek performanslı çekirdekler gerektiren bilgi işlem zorlukları için IP'lerinin nasıl özelleştirildiğini anlattı. Semidynamics 2016 yılında kuruldu, genel merkezi Barselona'da bulunuyor ve iki özelleştirilebilir RISC-V IP sunarak halihazırda ABD ve Asya'da müşterileri var:

  • Avispado – sıralı RISCV64GCV, AXI ve CHI'yi destekler
  • Atrevido - AXI ve CHI'yi destekleyen arızalı RISCV64GC

Tipik bir CPU'nun bir avuç büyük çekirdeği ve büyük önbellekleri vardır, bu da yüksek performans olmasa da programlanmalarını kolaylaştırır.

GPU'lar ise aksine, paralel kod için yüksek performans sağlayan çok sayıda küçük çekirdeğe sahiptir, ancak verilerin CPU ile GPU arasında ileri geri iletilmesi gerektiğinde PCIe veri yolu üzerinden programlamak ve iletişim gecikmesi eklemek daha zordur.

CPU, GPU dk.
CPU, GPU karşılaştırması

Espasa'daki yaklaşım, programlamayı kolaylaştıran, paralel kodlar için daha yüksek performans sağlayan ve sıfır iletişim gecikmesi sunan bilgi işlem çekirdeklerine bağlı bir RISC-V çekirdeği kullanmaktır. CPU artı vektör birimi her iki dünyanın da en iyisini sağlar.

RISC-V CPU plus Vektör ünitesi, daha yüksek performans
CPU artı Vektör birimi

RISC-V spesifikasyonu 32 vektör kaydını belgelemektedir ve bir vektör birimi içindeki önbelleğinize bir bağlantıyla birlikte bir dizi vektör çekirdeği ekleyebilirsiniz.

Vektör Birimi min
Vektör Birimi

Semidynamics IP ile Vektör Çekirdeği sayısını özelleştirebilirsiniz: 4, 8, 16, 32. Buna bakmanın başka bir yolu da, 4 Vektör Çekirdeğinin 256 bit, en fazla 32 Vektör Çekirdeğinin ise 2,048 bit olduğunu not etmektir.

IP kullanıcıları ayrıca hangi veri türlerini seçerler: FP64, FP32, FP16, BF16, INT64, INT32, INT16, INT8. Bir AI uygulaması için FP16, BF16 veri türlerini seçebilirken, bir HPC uygulaması FP64, FP32'yi seçebilir.

Üçüncü özelleştirme, daha fazla performans ve daha düşük güç için vektör kaydını vektör biriminden daha büyük hale getirebileceğiniz Vektör Kayıt Uzunluğudur.

Atrevideo 423-V8'in blok şeması:

Atrevido dk.
Atrevido 423 + V8 Vektör Birimi

Vektör birimi tamamen arızalı; bu, RISC-V IP satıcıları arasında benzersiz bir durum. Vektör birimi artı Gazzillion biriminin birleşimi, 60 Bayt/döngünün üzerinde veri akışı kapasitesine sahiptir.

Vektör + Gazzilyon, Bayt/Döngü performansı
Yüksek Bant Genişliği: Vektör + Gazzilyon

Mor çizgi Okuma performansını gösterir ve L1 Önbellekte 20-60 bayt/döngüdür, diğer makineler L1 Önbellekten çıktıktan sonra bant genişliğinde hızlı bir düşüş gösterirken bu yaklaşım 56'da düzleşmeyle devam eder. Hatta DDR belleğe bile gidiyor 40 bant genişliğini gösterir. 1.0 GHz saat hızıyla 40 GB/s bant genişliği yapar.

IP müşterileri, kendi amaçları doğrultusunda Vektör Birimi'ne bağlı kendi RTL kodlarını bile ekleyebilirler.

Yapay zeka iş yüklerinde matris çarpımının performansı önemlidir ve OOO V8 Vektör Biriminde 16 FP64 FLOPS/döngülük bir tepe noktası vardır ve >= 99 matris boyutu için %400'luk bir tepe noktası vardır. 24×24'lük küçük bir matris boyutu için performans 7 FP64 FLOPS/döngü veya zirvenin %50'sidir. 16 vektör çekirdekli bir Vektör Birimi kullanılarak FP8 için matris çarpımı, 64 FP16 FLOPS/döngülük bir zirveye ve M >= 99 için %600'luk bir zirveye sahiptir.

YOLO (Yalnızca Bir Kez Bakarsınız) adı verilen gerçek zamanlı nesne algılama kıyaslaması Atrevido 423-V8 platformunda çalıştırıldı ve rakiplere göre vektör çekirdeği başına %58 daha yüksek performans gösterdi. Bu sonuçlar 24 katmanlı video içindi. 5.56 Gops/kare ve yaklaşık 9M parametre.

YOLO performansı
YOLO Karşılaştırması

Özet

Bir RISC-V IP tedarikçisini seçmek karmaşık bir iştir; dolayısıyla Semidynamics gibi sağlayıcılar hakkında bilgi sahibi olmak, özelleştirilmiş bir yaklaşımın belirli iş yüklerinizi en verimli şekilde nasıl çalıştırabileceğini daha iyi anlamanıza yardımcı olabilir. Semidynamics ile sıralı veya sırasız, vektör birimleri olsun veya olmasın mimari seçenekler arasında seçim yapabilirsiniz. Bu IP satıcısından bildirilen rakamlar umut verici görünüyor ve gelecekteki duyurularını sabırsızlıkla bekliyorum.

İlgili Videolar

Bu gönderiyi şu yolla paylaş:

Zaman Damgası:

Den fazla yarı wiki