Bộ chip mảng có thể định cấu hình lại trung tâm dữ liệu (Princeton)

Bộ chip mảng có thể định cấu hình lại trung tâm dữ liệu (Princeton)

Nút nguồn: 2602549

Một bài báo kỹ thuật có tiêu đề “Song song tập trung vào dữ liệu lớn trong kỷ nguyên Chiplet” đã được các nhà nghiên cứu tại Đại học Princeton xuất bản.

Tóm tắt:

“Theo truyền thống, các ứng dụng song song ồ ạt được thực thi trên các hệ thống phân tán, trong đó các nút tính toán đủ xa để các sơ đồ song song hóa phải giảm thiểu giao tiếp và đồng bộ hóa để đạt được khả năng mở rộng. Việc ánh xạ các khối lượng công việc đòi hỏi nhiều giao tiếp tới các hệ thống phân tán đòi hỏi phải phân vùng vấn đề phức tạp và xử lý trước tập dữ liệu. Với xu hướng dựa trên AI hiện nay là có hàng nghìn bộ xử lý được kết nối với nhau trên mỗi chip, có cơ hội để suy nghĩ lại về khối lượng công việc bị tắc nghẽn truyền thông này. Nút thắt cổ chai này thường phát sinh từ việc truyền tải cấu trúc dữ liệu, gây ra tình trạng truy cập bộ nhớ không đều và vị trí bộ nhớ đệm kém.
Các công trình gần đây đã giới thiệu các sơ đồ song song hóa dựa trên nhiệm vụ để tăng tốc quá trình truyền tải đồ thị và các khối lượng công việc thưa thớt khác. Việc truyền tải cấu trúc dữ liệu được chia thành các nhiệm vụ và được dẫn truyền qua các đơn vị xử lý (PU). Dalorex đã thể hiện khả năng mở rộng cao nhất (lên tới hàng nghìn PU trên một chip) bằng cách có toàn bộ tập dữ liệu trên chip, rải rác trên các PU và thực thi các tác vụ tại PU nơi dữ liệu cục bộ. Tuy nhiên, nó cũng đặt ra câu hỏi về cách mở rộng quy mô sang các tập dữ liệu lớn hơn khi tất cả bộ nhớ đều nằm trên chip và với chi phí bao nhiêu.

Để giải quyết những thách thức này, chúng tôi đề xuất một kiến ​​trúc có thể mở rộng bao gồm một lưới các chiplet Mảng có thể cấu hình lại tập trung dữ liệu (DCRA). Cấu hình lại theo thời gian đóng gói cho phép tạo ra các sản phẩm chip tối ưu hóa cho các số liệu mục tiêu khác nhau, chẳng hạn như thời gian tạo ra giải pháp, năng lượng hoặc chi phí, trong khi cấu hình lại phần mềm tránh bão hòa mạng khi mở rộng tới hàng triệu PU trên nhiều gói chip. Chúng tôi đánh giá sáu ứng dụng và bốn bộ dữ liệu, với một số cấu hình và công nghệ bộ nhớ, để cung cấp phân tích chi tiết về hiệu suất, công suất và chi phí thực thi dữ liệu cục bộ trên quy mô lớn. Sự song song hóa Tìm kiếm theo chiều rộng đầu tiên của chúng tôi với RMAT-26 trên một triệu PU đạt tới 3323 GTEPS.”

Tìm kỹ thuật giấy ở đây. Xuất bản tháng 2023 năm XNUMX (bản in trước).

Orenes-Vera, Marcelo, Esin Tureci, David Wentzlaf và Margaret Martonosi. “Song song tập trung vào dữ liệu lớn trong kỷ nguyên Chiplet.” arXiv bản in trước arXiv: 2304.09389 (2023).

Sản phẩm liên quan
Mini-Consortia hình thành xung quanh Chiplets
Thị trường chiplet thương mại vẫn còn ở rất xa, nhưng các công ty đang bắt đầu sớm với nhiều mối quan hệ đối tác hạn chế hơn.
Rủi ro bảo mật chiplet bị đánh giá thấp
Mức độ của những thách thức bảo mật đối với các chiplet thương mại là rất khó khăn.
Cuộc đua hướng tới chiplets hỗn hợp
Những thách thức trong việc lắp ráp chiplets từ các xưởng đúc khác nhau mới bắt đầu xuất hiện.
Những cân nhắc về thiết kế và những tiến bộ gần đây trong Chiplets (UC Berkeley/Đại học Bắc Kinh)

Dấu thời gian:

Thêm từ Bán kỹ thuật