ชิปเล็ตอาร์เรย์ที่กำหนดค่าใหม่ได้เป็นศูนย์กลางข้อมูล (พรินซ์ตัน)

ชิปเล็ตอาร์เรย์ที่กำหนดค่าใหม่ได้เป็นศูนย์กลางข้อมูล (พรินซ์ตัน)

โหนดต้นทาง: 2602549

บทความทางเทคนิคเรื่อง "Massive Data-Centric Parallelism in the Chiplet Era" ได้รับการตีพิมพ์โดยนักวิจัยจากมหาวิทยาลัยพรินซ์ตัน

นามธรรม:

“ตามธรรมเนียมแล้ว แอปพลิเคชันแบบขนานขนาดใหญ่จะดำเนินการบนระบบแบบกระจาย โดยที่โหนดการประมวลผลอยู่ห่างจากกันมากพอที่แผนการทำงานแบบขนานจะต้องลดการสื่อสารและการซิงโครไนซ์ให้เหลือน้อยที่สุดเพื่อให้บรรลุความสามารถในการปรับขนาดได้ การแมปปริมาณงานที่เน้นการสื่อสารกับระบบแบบกระจายจำเป็นต้องมีการแบ่งพาร์ติชันปัญหาที่ซับซ้อนและการประมวลผลชุดข้อมูลล่วงหน้า ด้วยแนวโน้มที่ขับเคลื่อนด้วย AI ในปัจจุบันในการมีโปรเซสเซอร์ที่เชื่อมต่อถึงกันหลายพันตัวต่อชิป จึงเป็นโอกาสที่จะคิดใหม่เกี่ยวกับปริมาณงานที่ติดขัดในการสื่อสารเหล่านี้ คอขวดนี้มักเกิดจากการข้ามผ่านโครงสร้างข้อมูล ซึ่งทำให้การเข้าถึงหน่วยความจำไม่สม่ำเสมอและตำแหน่งแคชไม่ดี
งานล่าสุดได้แนะนำแผนการทำงานแบบขนานตามงานเพื่อเร่งการข้ามกราฟและเวิร์กโหลดอื่นๆ ที่กระจัดกระจาย การสำรวจโครงสร้างข้อมูลจะแบ่งออกเป็นงานและไปป์ไลน์ระหว่างหน่วยประมวลผล (PU) Dalorex แสดงให้เห็นถึงความสามารถในการปรับขนาดสูงสุด (มากถึงหลายพัน PU บนชิปตัวเดียว) โดยการมีชุดข้อมูลทั้งหมดบนชิป กระจัดกระจายไปตาม PU และดำเนินการงานที่ PU ซึ่งมีข้อมูลอยู่ในเครื่อง อย่างไรก็ตาม ยังทำให้เกิดคำถามเกี่ยวกับวิธีการปรับขนาดเป็นชุดข้อมูลขนาดใหญ่ขึ้นเมื่อหน่วยความจำทั้งหมดอยู่บนชิป และราคาเท่าไหร่

เพื่อจัดการกับความท้าทายเหล่านี้ เราขอเสนอสถาปัตยกรรมที่ปรับขนาดได้ซึ่งประกอบด้วยตารางของชิปเล็ต Data-Centric Reconfigurable Array (DCRA) การกำหนดค่าเวลาแพ็คเกจใหม่ทำให้สามารถสร้างผลิตภัณฑ์ชิปที่ปรับให้เหมาะสมสำหรับตัวชี้วัดเป้าหมายที่แตกต่างกัน เช่น เวลาในการแก้ปัญหา พลังงาน หรือต้นทุน ในขณะที่การกำหนดค่าซอฟต์แวร์ใหม่จะหลีกเลี่ยงความอิ่มตัวของเครือข่ายเมื่อปรับขนาดเป็น PU หลายล้านตัวในแพ็คเกจชิปจำนวนมาก เราประเมินแอปพลิเคชัน 26 รายการและชุดข้อมูล 3323 ชุด พร้อมด้วยการกำหนดค่าและเทคโนโลยีหน่วยความจำที่หลากหลาย เพื่อให้การวิเคราะห์โดยละเอียดเกี่ยวกับประสิทธิภาพ พลังงาน และต้นทุนของการดำเนินการภายในข้อมูลในระดับต่างๆ การนำ Breadth-First-Search ไปใช้กับ RMAT-XNUMX ใน PU จำนวนหนึ่งล้านตัวของเรานั้นมีความขนานกันถึง XNUMX GTEPS”

ค้นหาเทคนิค กระดาษที่นี่. เผยแพร่เมื่อเดือนเมษายน 2023 (พิมพ์ล่วงหน้า)

โอเรเนส-เวรา, มาร์เซโล, เอซิน ตูเรซี, เดวิด เวนทซลาฟ และมาร์กาเร็ต มาร์โตโนซี่ “ความเท่าเทียมที่มีข้อมูลเป็นศูนย์กลางในยุค Chiplet” arXiv preprint arXiv: 2304.09389 (2023)

ที่เกี่ยวข้อง
Mini-Consortia ก่อตัวขึ้นรอบ Chiplets
ตลาดชิปเล็ตเชิงพาณิชย์ยังคงอยู่บนขอบฟ้าอันไกลโพ้น แต่บริษัทต่างๆ กำลังเริ่มต้นตั้งแต่เนิ่นๆ ด้วยความร่วมมือที่จำกัดมากขึ้น
ความเสี่ยงด้านความปลอดภัยของ Chiplet ถูกประเมินต่ำเกินไป
ขนาดของความท้าทายด้านความปลอดภัยสำหรับชิปเล็ตเชิงพาณิชย์นั้นเป็นเรื่องที่น่ากังวล
การแข่งขันสู่ Chiplets แบบผสม
ความท้าทายในการประกอบชิปเล็ตจากโรงหล่อต่างๆ กำลังเริ่มปรากฏให้เห็น
ข้อควรพิจารณาในการออกแบบและความก้าวหน้าล่าสุดใน Chiplets (UC Berkeley/ มหาวิทยาลัยปักกิ่ง)

ประทับเวลา:

เพิ่มเติมจาก กึ่งวิศวกรรม