บทความทางเทคนิคเรื่อง “WWW: What, When, Where to Compute-in-Memory” ได้รับการตีพิมพ์โดยนักวิจัยจาก Purdue University
นามธรรม:
“การประมวลผลในหน่วยความจำ (CiM) ได้กลายเป็นโซลูชันที่น่าสนใจในการลดต้นทุนการเคลื่อนย้ายข้อมูลที่สูงในเครื่อง von Neumann CiM สามารถดำเนินการคูณเมทริกซ์ทั่วไป (GEMM) แบบขนานจำนวนมากในหน่วยความจำ ซึ่งเป็นการคำนวณที่โดดเด่นในการอนุมานของ Machine Learning (ML) อย่างไรก็ตาม การกำหนดวัตถุประสงค์ใหม่ของหน่วยความจำสำหรับการประมวลผลทำให้เกิดคำถามสำคัญอยู่ที่ 1) CiM ประเภทใดที่จะใช้: เนื่องจากมี CiM แบบอะนาล็อกและดิจิทัลจำนวนมาก จึงจำเป็นต้องมีการพิจารณาความเหมาะสมจากมุมมองของระบบ 2) เมื่อใดควรใช้ CiM: การอนุมาน ML มีปริมาณงานที่มีข้อกำหนดด้านหน่วยความจำและการประมวลผลที่หลากหลาย ทำให้ยากต่อการระบุว่าเมื่อใดที่ CiM มีประโยชน์มากกว่าแกนประมวลผลมาตรฐาน 3) ตำแหน่งที่จะรวม CiM: แต่ละระดับหน่วยความจำมีแบนด์วิดท์และความจุที่แตกต่างกัน ซึ่งส่งผลต่อการเคลื่อนย้ายข้อมูลและประโยชน์ของการรวม CiM
ในบทความนี้ เราจะสำรวจคำตอบของคำถามเหล่านี้เกี่ยวกับการบูรณาการ CiM สำหรับการเร่งการอนุมาน ML เราใช้ Timeloop-Accelergy ในการประเมินระดับระบบเบื้องต้นของต้นแบบ CiM รวมถึงทั้งอนาล็อกและดิจิทัลเบื้องต้น เรารวม CiM เข้ากับหน่วยความจำแคชระดับต่างๆ ในสถาปัตยกรรมพื้นฐานที่คล้ายกับ Nvidia A100 และปรับแต่งโฟลว์ข้อมูลสำหรับปริมาณงาน ML ต่างๆ การทดลองของเราแสดงให้เห็นว่าสถาปัตยกรรม CiM ปรับปรุงประสิทธิภาพการใช้พลังงาน โดยได้รับพลังงานต่ำกว่าค่าพื้นฐานที่กำหนดไว้ถึง 0.12 เท่าด้วยความแม่นยำ INT-8 และประสิทธิภาพเพิ่มขึ้นสูงสุด 4 เท่าด้วยการแทรกสลับและการทำซ้ำของน้ำหนัก งานที่เสนอจะให้ข้อมูลเชิงลึกว่า CiM ประเภทใดที่จะใช้ และเมื่อใดและที่ไหนที่จะรวมไว้ในลำดับชั้นแคชเพื่อการเร่งความเร็ว GEMM ได้อย่างเหมาะสม”
หา เอกสารทางเทคนิคที่นี่ จัดพิมพ์ธันวาคม 2023 (พิมพ์ล่วงหน้า)
ชาร์มา, ตันวี, มุสตาฟา อาลี, อินดรานิล ชากราบอร์ตี และเกาซิก รอย “WWW: อะไร เมื่อไร ที่ไหนที่จะประมวลผลในหน่วยความจำ” arXiv พิมพ์ล่วงหน้า arXiv:2312.15896 (2023)
การอ่านที่เกี่ยวข้อง
การเพิ่มประสิทธิภาพพลังงาน AI ด้วยการประมวลผลในหน่วยความจำ
วิธีประมวลผลปริมาณงานระดับเซ็ตและอยู่ภายในงบประมาณด้านพลังงานคงที่
การสร้างแบบจำลองการคำนวณในหน่วยความจำด้วยประสิทธิภาพทางชีวภาพ
AI เจนเนอเรชั่นบังคับให้ผู้ผลิตชิปใช้ทรัพยากรการประมวลผลอย่างชาญฉลาดยิ่งขึ้น
SRAM ใน AI: อนาคตของความทรงจำ
เหตุใด SRAM จึงถูกมองว่าเป็นองค์ประกอบสำคัญในสถาปัตยกรรมการประมวลผลใหม่และแบบดั้งเดิม
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
- ที่มา: https://semiengineering.com/cim-integration-for-ml-inference-acceleration/
- :มี
- :เป็น
- :ที่ไหน
- $ ขึ้น
- 1
- 2023
- a
- การเร่งความเร็ว
- การบรรลุ
- AI
- บรรเทา
- an
- และ
- คำตอบ
- สถาปัตยกรรม
- AS
- At
- แบนด์วิดธ์
- baseline
- เป็นประโยชน์
- ประโยชน์ที่ได้รับ
- ทั้งสอง
- งบ
- by
- แคช
- CAN
- ความจุ
- จับใจ
- การคำนวณ
- คำนวณ
- ค่าใช้จ่าย
- วิกฤติ
- ข้อมูล
- ธันวาคม
- การกำหนด
- ต่าง
- ยาก
- ดิจิตอล
- เด่น
- แต่ละ
- ก่อน
- อย่างมีประสิทธิภาพ
- ธาตุ
- โผล่ออกมา
- พลังงาน
- ประสิทธิภาพการใช้พลังงาน
- ที่จัดตั้งขึ้น
- การประเมินผล
- การทดลอง
- สำรวจ
- การแก้ไข
- สำหรับ
- กองกำลัง
- ราคาเริ่มต้นที่
- อนาคต
- กําไร
- General
- กำหนด
- โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม
- ลำดับชั้น
- จุดสูง
- อย่างไรก็ตาม
- HTTPS
- แยกแยะ
- ปรับปรุง
- in
- รวมถึง
- รวมทั้ง
- ข้อมูลเชิงลึก
- รวบรวม
- บูรณาการ
- เข้าไป
- IT
- jpg
- คีย์
- การเรียนรู้
- ชั้น
- ระดับ
- ลด
- เครื่อง
- เรียนรู้เครื่อง
- เครื่อง
- การทำ
- อย่างมากมาย
- มดลูก
- หน่วยความจำ
- ML
- ข้อมูลเพิ่มเติม
- การเคลื่อนไหว
- ฝูง
- จำเป็น
- ใหม่
- Nvidia
- of
- on
- เปิด
- การดำเนินการ
- ของเรา
- กระดาษ
- Parallel
- ดำเนินการ
- การปฏิบัติ
- มุมมอง
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- โพสท่า
- อำนาจ
- ความแม่นยำ
- กระบวนการ
- การประมวลผล
- เสนอ
- ต้นแบบ
- ให้
- การตีพิมพ์
- คำถาม
- เกี่ยวกับ
- ความต้องการ
- นักวิจัย
- แหล่งข้อมูล
- รอย
- โชว์
- ทางออก
- มาตรฐาน
- เข้าพัก
- ความเหมาะสม
- ระบบ
- วิชาการ
- กว่า
- ที่
- พื้นที่
- ก้าวสู่อนาคต
- ของพวกเขา
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- นี้
- หัวข้อ
- ไปยัง
- แบบดั้งเดิม
- ชนิด
- มหาวิทยาลัย
- ใช้
- ความหลากหลาย
- ต่างๆ
- ดู
- ของ
- คือ
- we
- น้ำหนัก
- อะไร
- เมื่อ
- กับ
- ภายใน
- งาน
- ลมทะเล