IP RISC-V 64 bit cho hiệu suất cao - Semiwiki

IP RISC-V 64 bit cho hiệu suất cao – Semiwiki

Nút nguồn: 2855188

RISC-V với tư cách là Kiến trúc tập lệnh (ISA) đã phát triển nhanh chóng về tầm quan trọng và mức độ phù hợp về mặt thương mại kể từ khi phát hành ra cộng đồng mở vào năm 2015, thu hút nhiều nhà cung cấp IP hiện cung cấp nhiều loại lõi RTL. Roger Espasa, Giám đốc điều hành và Người sáng lập của bán động lực học, đã trình bày tại các sự kiện RISC-V về cách tùy chỉnh IP của họ cho các thách thức điện toán đòi hỏi băng thông cao và lõi hiệu suất cao với các đơn vị vectơ. Semidynamics được thành lập vào năm 2016, có trụ sở chính là Barcelona và đã có khách hàng ở Hoa Kỳ và Châu Á bằng cách cung cấp hai IP RISC-V có thể tùy chỉnh:

  • Avispado – theo thứ tự RISCV64GCV, hỗ trợ AXI và CHI
  • Atrevido – RISCV64GC không theo thứ tự, hỗ trợ AXI và CHI

Một CPU thông thường có một số lõi lớn và bộ đệm lớn, giúp chúng dễ dàng lập trình, mặc dù hiệu năng không cao.

Ngược lại, GPU có nhiều lõi nhỏ mang lại hiệu suất cao cho mã song song nhưng khó lập trình hơn và tăng độ trễ giao tiếp qua bus PCIe khi dữ liệu cần được truyền qua lại giữa CPU và GPU.

CPU, GPU tối thiểu
So sánh CPU, GPU

Cách tiếp cận tại Espasa là sử dụng lõi RISC-V được kết nối với lõi điện toán, giúp lập trình dễ dàng, hiệu suất cao hơn cho các mã song song và không có độ trễ giao tiếp. Đơn vị CPU cộng với vectơ cung cấp những gì tốt nhất của cả hai thế giới.

CPU RISC-V cộng với đơn vị Vector, hiệu suất cao hơn
Đơn vị CPU cộng với Vector

Đặc tả RISC-V ghi lại 32 thanh ghi vectơ và bạn có thể thêm một số lõi vectơ, cùng với kết nối tới bộ đệm của bạn bên trong đơn vị vectơ.

Đơn vị vectơ tối thiểu
Vector Unit

Với Semidynamics IP bạn có thể tùy chỉnh số lượng Lõi Vector: 4, 8, 16, 32. Một cách khác để xem xét điều này là lưu ý rằng 4 Lõi Vector là 256-bit, tối đa 32 Lõi Vector là 2,048-bit.

Người dùng IP cũng chọn các loại dữ liệu: FP64, FP32, FP16, BF16, INT64, INT32, INT16, INT8. Đối với ứng dụng AI, chúng có thể chọn loại dữ liệu FP16, BF16, trong khi ứng dụng HPC có thể chọn FP64, FP32.

Tùy chỉnh thứ ba là Độ dài thanh ghi vectơ, trong đó để có hiệu suất cao hơn và tiêu thụ điện năng thấp hơn, bạn có thể làm cho thanh ghi vectơ lớn hơn đơn vị vectơ.

Đây là sơ đồ khối của Atrevideo 423-V8:

Atrevido phút
Đơn vị vectơ Atrevido 423 + V8

Đơn vị vectơ hoàn toàn không hoạt động, đây là đơn vị duy nhất trong số các nhà cung cấp IP RISC-V. Sự kết hợp giữa đơn vị vectơ và đơn vị Gazzillion có khả năng truyền dữ liệu với tốc độ trên 60 Byte/chu kỳ.

Hiệu suất Vector + Gazzillion, Byte/Chu kỳ
Băng thông cao: Vector + Gazzillion

Đường màu tím hiển thị hiệu suất Đọc và trong L1 Cache là 20-60 byte/chu kỳ, các máy khác cho thấy băng thông giảm nhanh sau khi rời khỏi L1 Cache, trong khi phương pháp này vẫn tiếp tục, với mức ổn định ở mức 56. Ngay cả khi chuyển sang bộ nhớ DDR hiển thị băng thông là 40. Với tốc độ xung nhịp 1.0GHz tạo ra băng thông 40 GB/s.

Khách hàng IP thậm chí có thể thêm mã RTL của riêng họ được kết nối với Đơn vị Vector cho mục đích riêng của họ.

Hiệu suất của phép nhân ma trận rất quan trọng trong khối lượng công việc AI và trên Đơn vị Vector OOO V8 có mức cao nhất là 16 FP64 FLOPS/chu kỳ và 99% mức cao nhất cho kích thước ma trận >= 400. Đối với kích thước ma trận nhỏ 24×24 hiệu suất là 7 FP64 FLOPS/chu kỳ, hoặc 50% mức đỉnh. Phép nhân ma trận cho FP16 sử dụng Đơn vị vectơ có 8 lõi vectơ có mức đỉnh là 64 FP16 FLOPS/chu kỳ và 99% mức đỉnh cho M >= 600.

Điểm chuẩn phát hiện đối tượng theo thời gian thực có tên YOLO (Bạn chỉ nhìn một lần) đã được chạy trên nền tảng Atrevido 423-V8 và nó cho thấy hiệu suất trên mỗi lõi vectơ cao hơn 58% so với đối thủ cạnh tranh. Những kết quả này dành cho video có 24 lớp. 5.56 Gops/frame và khoảng 9M thông số.

Hiệu suất YOLO
So sánh YOLO

Tổng kết

Chọn nhà cung cấp IP RISC-V là một nhiệm vụ phức tạp, vì vậy, việc biết về các nhà cung cấp như Semidynamics có thể giúp bạn hiểu rõ hơn về cách tiếp cận tùy chỉnh có thể chạy khối lượng công việc cụ thể của bạn một cách hiệu quả nhất. Với Semidynamics, bạn có thể chọn giữa các lựa chọn kiến ​​trúc như theo thứ tự hoặc không theo thứ tự, có hoặc không có đơn vị vectơ. Những con số được báo cáo từ nhà cung cấp IP này có vẻ đầy hứa hẹn và tôi rất mong chờ những thông báo trong tương lai của họ.

Video liên quan

Chia sẻ bài đăng này qua:

Dấu thời gian:

Thêm từ bánwiki