ความเร็วการรับส่งข้อมูลหน่วยความจำและเวลาแฝงต่ำมีความสำคัญเนื่องจากการอนุมานเปลี่ยนจากศูนย์ข้อมูลไปยังขอบเครือข่าย
AI/ML กำลังพัฒนาอย่างรวดเร็ว ผ่านไปไม่ถึงหนึ่งสัปดาห์หากไม่มีการพัฒนาใหม่ๆ ที่น่าตื่นเต้นในสาขานี้ และแอปพลิเคชันอย่าง ChatGPT ได้นำความสามารถด้าน AI เชิงสร้างสรรค์มาสู่แถวหน้าของความสนใจของสาธารณชน
AI/ML จริงๆ แล้วเป็นสองแอปพลิเคชัน: การฝึกอบรมและการอนุมาน แต่ละประเภทอาศัยประสิทธิภาพของหน่วยความจำ และแต่ละประเภทมีข้อกำหนดเฉพาะที่ขับเคลื่อนตัวเลือกสำหรับโซลูชันหน่วยความจำที่ดีที่สุด
ด้วยการฝึกอบรม แบนด์วิดธ์หน่วยความจำและความจุถือเป็นข้อกำหนดที่สำคัญ โดยเฉพาะอย่างยิ่งเมื่อพิจารณาจากขนาดและความซับซ้อนของโมเดลข้อมูลโครงข่ายประสาทเทียมซึ่งมีการเติบโตในอัตรา 10 เท่าต่อปี ความแม่นยำของโครงข่ายประสาทเทียมขึ้นอยู่กับคุณภาพและปริมาณของตัวอย่างในชุดข้อมูลการฝึก ซึ่งแปลว่าต้องใช้ข้อมูลจำนวนมหาศาล และด้วยเหตุนี้แบนด์วิดท์และความจุของหน่วยความจำ
เมื่อพิจารณาถึงคุณค่าที่สร้างขึ้นจากการฝึกอบรม จึงมีแรงจูงใจอันทรงพลังในการฝึกซ้อมให้เสร็จสิ้นโดยเร็วที่สุด เนื่องจากแอปพลิเคชันการฝึกอบรมทำงานในศูนย์ข้อมูลที่จำกัดมากขึ้นในด้านพลังงานและพื้นที่ โซลูชันที่ให้ประสิทธิภาพการใช้พลังงานและขนาดที่เล็กกว่าจึงเป็นที่นิยม ด้วยข้อกำหนดทั้งหมดนี้ HBM3 จึงเป็นโซลูชันหน่วยความจำในอุดมคติสำหรับฮาร์ดแวร์การฝึกอบรม AI ให้แบนด์วิธและความจุที่ยอดเยี่ยม
ผลลัพธ์ของการฝึกอบรมโครงข่ายประสาทเทียมเป็นรูปแบบการอนุมานที่สามารถนำไปใช้ในวงกว้างได้ ด้วยโมเดลนี้ อุปกรณ์อนุมานสามารถประมวลผลและตีความอินพุตนอกขอบเขตของข้อมูลการฝึกได้ สำหรับการอนุมาน ความเร็วปริมาณงานของหน่วยความจำและเวลาแฝงต่ำเป็นสิ่งสำคัญ โดยเฉพาะอย่างยิ่งเมื่อจำเป็นต้องดำเนินการแบบเรียลไทม์ เนื่องจากการอนุมาน AI มีการเปลี่ยนแปลงจากศูนย์กลางของศูนย์ข้อมูลไปยังขอบเครือข่ายมากขึ้นเรื่อยๆ ฟีเจอร์หน่วยความจำเหล่านี้จึงมีความสำคัญมากยิ่งขึ้น
นักออกแบบมีตัวเลือกหน่วยความจำมากมายสำหรับการอนุมาน AI/ML แต่ด้วยพารามิเตอร์ที่สำคัญของแบนด์วิดท์ หน่วยความจำ GDDR6 ก็โดดเด่นจริงๆ ที่อัตราข้อมูล 24 กิกะบิตต่อวินาที (Gb/s) และอินเทอร์เฟซแบบกว้าง 32 บิต อุปกรณ์ GDDR6 สามารถส่งแบนด์วิธหน่วยความจำ 96 กิกะไบต์ต่อวินาที (GB/s) ซึ่งมากกว่าสองเท่าของแบนด์วิธ DDR อื่นๆ หรือ โซลูชั่นแอลพีดีอาร์ หน่วยความจำ GDDR6 นำเสนอการผสมผสานที่ยอดเยี่ยมของประสิทธิภาพความเร็ว แบนด์วิดท์ และเวลาแฝงสำหรับการอนุมาน AI/ML โดยเฉพาะอย่างยิ่งสำหรับการอนุมานที่ Edge
ระบบย่อยอินเทอร์เฟซหน่วยความจำ Rambus GDDR6 นำเสนอประสิทธิภาพที่ 24 Gb/s และสร้างขึ้นจากประสบการณ์กว่า 30 ปีของความเชี่ยวชาญด้านความสมบูรณ์ของสัญญาณความเร็วสูงและความสมบูรณ์ของพลังงาน (SI/PI) ซึ่งมีความสำคัญต่อการดำเนินงาน GDDR6 ด้วยความเร็วสูง ประกอบด้วย PHY และตัวควบคุมดิจิทัล – ที่ให้ระบบย่อยอินเทอร์เฟซหน่วยความจำ GDDR6 ที่สมบูรณ์
เข้าร่วมกับฉันที่การสัมมนาผ่านเว็บของ Rambus ในเดือนนี้ในหัวข้อ “การอนุมาน AI/ML ประสิทธิภาพสูงพร้อมหน่วยความจำ 24G GDDR6” เพื่อดูว่า GDDR6 รองรับหน่วยความจำและข้อกำหนดด้านประสิทธิภาพของปริมาณงานการอนุมาน AI/ML ได้อย่างไร และเรียนรู้เกี่ยวกับข้อควรพิจารณาในการออกแบบและการใช้งานที่สำคัญบางประการของระบบย่อยอินเทอร์เฟซหน่วยความจำ GDDR6
แหล่งข้อมูล:
แฟรงค์ เฟอร์โร
(ทุกกระทู้)
Frank Ferro เป็นผู้อำนวยการอาวุโสฝ่ายการตลาดผลิตภัณฑ์สำหรับคอร์ IP ที่ Rambus
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- เพลโตไอสตรีม. ข้อมูลอัจฉริยะ Web3 ขยายความรู้ เข้าถึงได้ที่นี่.
- การสร้างอนาคตโดย Adryenn Ashley เข้าถึงได้ที่นี่.
- ซื้อและขายหุ้นในบริษัท PRE-IPO ด้วย PREIPO® เข้าถึงได้ที่นี่.
- ที่มา: https://semiengineering.com/gddr6-delivers-the-performance-for-ai-ml-inference/
- :มี
- :เป็น
- :ไม่
- 24
- 26
- 27
- 30
- 8
- a
- เกี่ยวกับเรา
- ความถูกต้อง
- การกระทำ
- AI
- การฝึกอบรม AI
- AI / ML
- ทั้งหมด
- โพสต์ทั้งหมด
- ทางเลือก
- จำนวน
- an
- และ
- ใด
- การใช้งาน
- เป็น
- AS
- At
- ความสนใจ
- แบนด์วิดธ์
- BE
- สมควร
- รับ
- ที่ดีที่สุด
- แต้
- นำ
- สร้าง
- แต่
- by
- CAN
- ความสามารถในการ
- ความจุ
- ศูนย์
- ศูนย์
- ChatGPT
- ทางเลือก
- ทางเลือก
- การผสมผสาน
- สมบูรณ์
- ความซับซ้อน
- การพิจารณา
- ตัวควบคุม
- ที่สร้างขึ้น
- วิกฤติ
- ข้อมูล
- ศูนย์ข้อมูล
- ศูนย์ข้อมูล
- ชุดข้อมูล
- ส่งมอบ
- มอบ
- ขึ้นอยู่กับ
- นำไปใช้
- ออกแบบ
- การพัฒนา
- เครื่อง
- ดิจิตอล
- ผู้อำนวยการ
- ค้นพบ
- สอง
- ขับรถ
- แต่ละ
- ขอบ
- อย่างมีประสิทธิภาพ
- มหาศาล
- โดยเฉพาะอย่างยิ่ง
- แม้
- การพัฒนา
- ตัวอย่าง
- ยอดเยี่ยม
- น่าตื่นเต้น
- ความชำนาญ
- คุณสมบัติ
- สนาม
- แน่นหนา
- สำหรับ
- แถวหน้า
- รากฐาน
- ราคาเริ่มต้นที่
- กำเนิด
- กำเนิด AI
- กำหนด
- ไป
- ยิ่งใหญ่
- การเจริญเติบโต
- ฮาร์ดแวร์
- มี
- หัวใจสำคัญ
- ด้วยเหตุนี้
- จุดสูง
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- HTTPS
- ในอุดมคติ
- การดำเนินงาน
- in
- แรงจูงใจ
- ขึ้น
- ปัจจัยการผลิต
- ความสมบูรณ์
- อินเตอร์เฟซ
- เข้าไป
- IP
- IT
- jpg
- คีย์
- ความแอบแฝง
- เรียนรู้
- ฟ้าแลบ
- กดไลก์
- ต่ำ
- การตลาด
- หน่วยความจำ
- แบบ
- โมเดล
- เดือน
- ข้อมูลเพิ่มเติม
- จำเป็น
- ต้อง
- เครือข่าย
- ข้อมูลเครือข่าย
- ประสาท
- เครือข่ายประสาท
- ใหม่
- ตอนนี้
- จำนวน
- of
- เสนอ
- เสนอ
- on
- การดำเนินงาน
- or
- เอาท์พุต
- ด้านนอก
- เกิน
- ก้าว
- พารามิเตอร์
- ในสิ่งที่สนใจ
- โดยเฉพาะ
- การปฏิบัติ
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- ความนิยม
- เป็นไปได้
- โพสต์
- อำนาจ
- ที่มีประสิทธิภาพ
- กระบวนการ
- ผลิตภัณฑ์
- ให้
- การให้
- สาธารณะ
- คุณภาพ
- ปริมาณ
- อย่างรวดเร็ว
- คะแนน
- เรียลไทม์
- จริงๆ
- ความต้องการ
- ขวา
- แถว
- วิ่ง
- ที่สอง
- ระดับอาวุโส
- ชุด
- ขยับ
- กะ
- สัญญาณ
- ขนาด
- มีขนาดเล็กกว่า
- So
- ทางออก
- โซลูชัน
- บาง
- ช่องว่าง
- ความเร็ว
- ความเร็ว
- รองรับ
- กว่า
- ที่
- พื้นที่
- ที่นั่น
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- นี้
- ตลอด
- ปริมาณงาน
- ภาพขนาดย่อ
- ไปยัง
- การฝึกอบรม
- สอง
- เป็นเอกลักษณ์
- ความคุ้มค่า
- webinar
- สัปดาห์
- เมื่อ
- ที่
- กว้าง
- กับ
- ไม่มี
- ปี
- ปี
- ลมทะเล