يوفر GDDR6 الأداء لاستدلال AI/ML

يوفر GDDR6 الأداء لاستدلال AI/ML

عقدة المصدر: 2654216

تعد سرعة إنتاجية الذاكرة وزمن الوصول المنخفض أمرًا بالغ الأهمية حيث ينتقل الاستدلال من مركز البيانات إلى حافة الشبكة.

شعبية

يتطور الذكاء الاصطناعي/التعلم الآلي بوتيرة خاطفة. لا يمر أسبوع الآن دون بعض التطورات الجديدة والمثيرة في هذا المجال، وقد أدت تطبيقات مثل ChatGPT إلى جلب قدرات الذكاء الاصطناعي الإنتاجية بقوة إلى طليعة اهتمام الجمهور.

الذكاء الاصطناعي/التعلم الآلي عبارة عن تطبيقين: التدريب والاستدلال. يعتمد كل منها على أداء الذاكرة، ولكل منها مجموعة فريدة من المتطلبات التي تحدد اختيار أفضل حل للذاكرة.

مع التدريب، يعد النطاق الترددي للذاكرة وسعتها من المتطلبات الحاسمة. وينطبق هذا بشكل خاص على حجم وتعقيد نماذج بيانات الشبكة العصبية التي تنمو بمعدل 10X سنويًا. تعتمد دقة الشبكة العصبية على جودة وكمية الأمثلة في مجموعة بيانات التدريب، مما يترجم إلى الحاجة إلى كميات هائلة من البيانات، وبالتالي عرض النطاق الترددي للذاكرة وسعتها.

ونظرًا للقيمة التي يتم إنشاؤها من خلال التدريب، هناك حافز قوي لإكمال الدورات التدريبية في أسرع وقت ممكن. نظرًا لأن تطبيقات التدريب تعمل في مراكز البيانات المقيدة بشكل متزايد من حيث الطاقة والمساحة، يتم تفضيل الحلول التي توفر كفاءة في استخدام الطاقة وحجم أصغر. نظرًا لجميع هذه المتطلبات، يعد HBM3 حلاً مثاليًا للذاكرة لأجهزة تدريب الذكاء الاصطناعي. ويوفر عرض النطاق الترددي وقدرات القدرة ممتازة.

إن مخرجات تدريب الشبكة العصبية هي نموذج استدلالي يمكن نشره على نطاق واسع. باستخدام هذا النموذج، يمكن لجهاز الاستدلال معالجة وتفسير المدخلات خارج حدود بيانات التدريب. للاستدلال، تعد سرعة إنتاجية الذاكرة وزمن الوصول المنخفض أمرًا بالغ الأهمية، خاصة عندما تكون هناك حاجة إلى اتخاذ إجراء في الوقت الفعلي. مع تحول المزيد والمزيد من استنتاجات الذكاء الاصطناعي من قلب مركز البيانات إلى حافة الشبكة، أصبحت ميزات الذاكرة هذه أكثر أهمية.

لدى المصممين عدد من خيارات الذاكرة لاستدلال AI/ML، ولكن فيما يتعلق بالمعلمة الحرجة لعرض النطاق الترددي، تتألق ذاكرة GDDR6 حقًا. بمعدل بيانات يبلغ 24 جيجابت في الثانية (Gb/s)، وواجهة عريضة 32 بت، يمكن لجهاز GDDR6 توفير 96 جيجابت في الثانية (GB/s) من عرض النطاق الترددي للذاكرة، أي أكثر من ضعف أي جهاز DDR أو بديل. حلول LPDDR. توفر ذاكرة GDDR6 مزيجًا رائعًا من السرعة وعرض النطاق الترددي وأداء زمن الوصول لاستدلال AI/ML، خاصة للاستدلال عند الحافة.

يوفر النظام الفرعي لواجهة الذاكرة Rambus GDDR6 أداءً يصل إلى 24 جيجابت/ثانية وهو مبني على أساس أكثر من 30 عامًا من خبرة سلامة الإشارة عالية السرعة وتكامل الطاقة (SI/PI)، وهو أمر بالغ الأهمية لتشغيل GDDR6 بسرعات عالية. وهو يتألف من وحدة تحكم PHY ورقمية - مما يوفر نظامًا فرعيًا كاملاً لواجهة ذاكرة GDDR6.

انضم إلي في ندوة رامبوس عبر الإنترنت هذا الشهر حول "استدلال AI/ML عالي الأداء مع ذاكرة GDDR24 سعة 6 جيجا بايت" لاكتشاف كيفية دعم GDDR6 لمتطلبات الذاكرة والأداء لأحمال عمل الاستدلال AI/ML والتعرف على بعض اعتبارات التصميم والتنفيذ الأساسية للأنظمة الفرعية لواجهة ذاكرة GDDR6.

الموارد:


فرانك فيرو

فرانك فيرو

  (جميع المشاركات)
فرانك فيرو هو مدير أول لتسويق المنتجات لمراكز الملكية الفكرية في رامبوس.

الطابع الزمني:

اكثر من شبه هندسة