GDDR6 מספק את הביצועים להסקת AI/ML

GDDR6 מספק את הביצועים להסקת AI/ML

צומת המקור: 2654216

מהירות תפוקת זיכרון וזמן אחזור נמוך הם קריטיים כאשר ההסקה עוברת ממרכז הנתונים לקצה הרשת.

פופולריות

AI/ML מתפתח בקצב בזק. לא עובר שבוע כרגע בלי כמה התפתחויות חדשות ומרגשות בתחום, ויישומים כמו ChatGPT הביאו את יכולות הבינה המלאכותית הגנרטיביות לקדמת תשומת הלב הציבורית.

AI/ML הוא בעצם שני יישומים: אימון והסקת מסקנות. כל אחד מהם מסתמך על ביצועי זיכרון, ולכל אחד מהם סט דרישות ייחודי המניע את הבחירה בפתרון הזיכרון הטוב ביותר.

עם אימון, רוחב פס זיכרון וקיבולת הם דרישות קריטיות. זאת במיוחד בהתחשב בגודל ובמורכבות של מודלים של נתוני רשתות עצביות שצמחו בקצב של פי 10 בשנה. דיוק הרשת העצבית תלוי באיכות ובכמות הדוגמאות במערך נתוני האימון, מה שמתורגם לצורך בכמויות אדירות של נתונים, ומכאן ברוחב פס וקיבולת הזיכרון.

לאור הערך שנוצר באמצעות אימון, יש תמריץ רב עוצמה להשלים ריצות אימון במהירות האפשרית. ככל שיישומי הדרכה פועלים במרכזי נתונים מוגבלים יותר ויותר עבור כוח ומרחב, פתרונות המציעים יעילות חשמל וגודל קטן יותר מועדפים. בהתחשב בכל הדרישות הללו, HBM3 הוא פתרון זיכרון אידיאלי עבור חומרת אימון בינה מלאכותית. הוא מספק יכולות רוחב פס וקיבולת מצוינות.

הפלט של אימון רשתות עצביות הוא מודל מסקנות שניתן לפרוס באופן רחב. עם מודל זה, התקן מסקנות יכול לעבד ולפרש תשומות מחוץ לגבולות נתוני האימון. להסקת מסקנות, מהירות תפוקת הזיכרון והשהייה נמוכה הם קריטיים, במיוחד כאשר יש צורך בפעולה בזמן אמת. עם יותר ויותר מסקנות של AI העוברות מלב מרכז הנתונים לקצה הרשת, תכונות הזיכרון הללו הופכות אפילו יותר קריטיות.

למעצבים יש מספר אפשרויות זיכרון להסקת AI/ML, אבל בפרמטר הקריטי של רוחב הפס, זיכרון GDDR6 באמת זורח. בקצב נתונים של 24 גיגה-ביט לשנייה (Gb/s), וממשק רחב של 32 סיביות, מכשיר GDDR6 יכול לספק רוחב פס של 96 גיגה-בייט לשנייה (GB/s) של זיכרון, יותר מכפול מזה של כל DDR חלופי או פתרונות LPDDR. זיכרון GDDR6 מציע שילוב נהדר של מהירות, רוחב פס וביצועי חביון להסקת AI/ML, במיוחד להסקת מסקנות בקצה.

תת-מערכת ממשק הזיכרון Rambus GDDR6 מציעה ביצועים של 24 Gb/s והיא בנויה על בסיס של למעלה מ-30 שנה של מומחיות שלמות אותות במהירות גבוהה ושלמות הספק (SI/PI), קריטית להפעלת GDDR6 במהירויות גבוהות. הוא מורכב מ-PHY ובקר דיגיטלי - מספק תת-מערכת שלמה של ממשק זיכרון GDDR6.

הצטרפו אלי לסמינר האינטרנט של רמבוס החודש ב-"הסקת AI/ML בעלת ביצועים גבוהים עם זיכרון 24G GDDR6כדי לגלות כיצד GDDR6 תומך בדרישות הזיכרון והביצועים של עומסי עבודה של AI/ML וללמוד על כמה משיקולי התכנון והיישום העיקריים של תת-מערכות ממשקי זיכרון GDDR6.

משאבים:

פרנק פרו

פרנק פרו

  (כל הפוסטים)
פרנק פרו הוא מנהל בכיר של שיווק מוצרים עבור ליבות IP ברמבוס.

בול זמן:

עוד מ הנדסה למחצה