GDDR6 มอบประสิทธิภาพสำหรับการอนุมาน AI/ML

GDDR6 มอบประสิทธิภาพสำหรับการอนุมาน AI/ML

โหนดต้นทาง: 2654216

ความเร็วการรับส่งข้อมูลหน่วยความจำและเวลาแฝงต่ำมีความสำคัญเนื่องจากการอนุมานเปลี่ยนจากศูนย์ข้อมูลไปยังขอบเครือข่าย

ความนิยม

AI/ML กำลังพัฒนาอย่างรวดเร็ว ผ่านไปไม่ถึงหนึ่งสัปดาห์หากไม่มีการพัฒนาใหม่ๆ ที่น่าตื่นเต้นในสาขานี้ และแอปพลิเคชันอย่าง ChatGPT ได้นำความสามารถด้าน AI เชิงสร้างสรรค์มาสู่แถวหน้าของความสนใจของสาธารณชน

AI/ML จริงๆ แล้วเป็นสองแอปพลิเคชัน: การฝึกอบรมและการอนุมาน แต่ละประเภทอาศัยประสิทธิภาพของหน่วยความจำ และแต่ละประเภทมีข้อกำหนดเฉพาะที่ขับเคลื่อนตัวเลือกสำหรับโซลูชันหน่วยความจำที่ดีที่สุด

ด้วยการฝึกอบรม แบนด์วิดธ์หน่วยความจำและความจุถือเป็นข้อกำหนดที่สำคัญ โดยเฉพาะอย่างยิ่งเมื่อพิจารณาจากขนาดและความซับซ้อนของโมเดลข้อมูลโครงข่ายประสาทเทียมซึ่งมีการเติบโตในอัตรา 10 เท่าต่อปี ความแม่นยำของโครงข่ายประสาทเทียมขึ้นอยู่กับคุณภาพและปริมาณของตัวอย่างในชุดข้อมูลการฝึก ซึ่งแปลว่าต้องใช้ข้อมูลจำนวนมหาศาล และด้วยเหตุนี้แบนด์วิดท์และความจุของหน่วยความจำ

เมื่อพิจารณาถึงคุณค่าที่สร้างขึ้นจากการฝึกอบรม จึงมีแรงจูงใจอันทรงพลังในการฝึกซ้อมให้เสร็จสิ้นโดยเร็วที่สุด เนื่องจากแอปพลิเคชันการฝึกอบรมทำงานในศูนย์ข้อมูลที่จำกัดมากขึ้นในด้านพลังงานและพื้นที่ โซลูชันที่ให้ประสิทธิภาพการใช้พลังงานและขนาดที่เล็กกว่าจึงเป็นที่นิยม ด้วยข้อกำหนดทั้งหมดนี้ HBM3 จึงเป็นโซลูชันหน่วยความจำในอุดมคติสำหรับฮาร์ดแวร์การฝึกอบรม AI ให้แบนด์วิธและความจุที่ยอดเยี่ยม

ผลลัพธ์ของการฝึกอบรมโครงข่ายประสาทเทียมเป็นรูปแบบการอนุมานที่สามารถนำไปใช้ในวงกว้างได้ ด้วยโมเดลนี้ อุปกรณ์อนุมานสามารถประมวลผลและตีความอินพุตนอกขอบเขตของข้อมูลการฝึกได้ สำหรับการอนุมาน ความเร็วปริมาณงานของหน่วยความจำและเวลาแฝงต่ำเป็นสิ่งสำคัญ โดยเฉพาะอย่างยิ่งเมื่อจำเป็นต้องดำเนินการแบบเรียลไทม์ เนื่องจากการอนุมาน AI มีการเปลี่ยนแปลงจากศูนย์กลางของศูนย์ข้อมูลไปยังขอบเครือข่ายมากขึ้นเรื่อยๆ ฟีเจอร์หน่วยความจำเหล่านี้จึงมีความสำคัญมากยิ่งขึ้น

นักออกแบบมีตัวเลือกหน่วยความจำมากมายสำหรับการอนุมาน AI/ML แต่ด้วยพารามิเตอร์ที่สำคัญของแบนด์วิดท์ หน่วยความจำ GDDR6 ก็โดดเด่นจริงๆ ที่อัตราข้อมูล 24 กิกะบิตต่อวินาที (Gb/s) และอินเทอร์เฟซแบบกว้าง 32 บิต อุปกรณ์ GDDR6 สามารถส่งแบนด์วิธหน่วยความจำ 96 กิกะไบต์ต่อวินาที (GB/s) ซึ่งมากกว่าสองเท่าของแบนด์วิธ DDR อื่นๆ หรือ โซลูชั่นแอลพีดีอาร์ หน่วยความจำ GDDR6 นำเสนอการผสมผสานที่ยอดเยี่ยมของประสิทธิภาพความเร็ว แบนด์วิดท์ และเวลาแฝงสำหรับการอนุมาน AI/ML โดยเฉพาะอย่างยิ่งสำหรับการอนุมานที่ Edge

ระบบย่อยอินเทอร์เฟซหน่วยความจำ Rambus GDDR6 นำเสนอประสิทธิภาพที่ 24 Gb/s และสร้างขึ้นจากประสบการณ์กว่า 30 ปีของความเชี่ยวชาญด้านความสมบูรณ์ของสัญญาณความเร็วสูงและความสมบูรณ์ของพลังงาน (SI/PI) ซึ่งมีความสำคัญต่อการดำเนินงาน GDDR6 ด้วยความเร็วสูง ประกอบด้วย PHY และตัวควบคุมดิจิทัล – ที่ให้ระบบย่อยอินเทอร์เฟซหน่วยความจำ GDDR6 ที่สมบูรณ์

เข้าร่วมกับฉันที่การสัมมนาผ่านเว็บของ Rambus ในเดือนนี้ในหัวข้อ “การอนุมาน AI/ML ประสิทธิภาพสูงพร้อมหน่วยความจำ 24G GDDR6” เพื่อดูว่า GDDR6 รองรับหน่วยความจำและข้อกำหนดด้านประสิทธิภาพของปริมาณงานการอนุมาน AI/ML ได้อย่างไร และเรียนรู้เกี่ยวกับข้อควรพิจารณาในการออกแบบและการใช้งานที่สำคัญบางประการของระบบย่อยอินเทอร์เฟซหน่วยความจำ GDDR6

แหล่งข้อมูล:

แฟรงค์ เฟอร์โร

แฟรงค์ เฟอร์โร

  (ทุกกระทู้)
Frank Ferro เป็นผู้อำนวยการอาวุโสฝ่ายการตลาดผลิตภัณฑ์สำหรับคอร์ IP ที่ Rambus

ประทับเวลา:

เพิ่มเติมจาก กึ่งวิศวกรรม