עדכוני פאנל סינופסיס על מצב מערכות ריבוי מתים - Semiwiki

עדכוני פאנל סינופסיס על מצבן של מערכות ריבוי מתים - Semiwiki

צומת המקור: 2931383

Synopsys אירחה לאחרונה פאנל חוצה תעשיות על מצבן של מערכות מרובות קוביות, שמצאתי מעניין לא רק בגלל הרלוונטיות שלה להאצה המהירה בחומרה ממוקדת בינה מלאכותית. עוד על כך בהמשך. משתתפי הפאנל, כולם בעלי תפקידים משמעותיים במערכות מרובות קוביות, היו שחר קאפור (מנהל בכיר לניהול מוצר, סינופסיס), צ'אולמין פארק (סמנכ"ל תאגיד, סמסונג), ללית'ה אימנני (סמנכ"לית ארכיטקטורה, פתרונות עיצוב וטכנולוגיה, אינטל), מייקל שפרט. (סמנכ"ל בכיר, בוש), ומורט בצר (סמנכ"ל מו"פ, Ansys). את הפאנל הנחה מרקו צ'יאפטה (מייסד שותף ואנליסט ראשי, חזון וניתוח של HotTech).

multi die 525x315 אור

נהג בביקוש גדול

זה נפוץ תחת הכותרת הזו להפיץ את כל החשודים הרגילים (HPC, רכב וכו'), אבל הרשימה הזו מוכרת בחסר, אולי הגורם הבסיסי הגדול ביותר - ההתמודדות הנוכחית אחר דומיננטיות בכל דבר של LLM ובינה מלאכותית. דגמי שפה גדולים מציעים רמות חדשות של שירותי SaaS בחיפוש, יצירת מסמכים ויכולות אחרות, עם יתרונות תחרותיים גדולים למי שיקבל את זה נכון ראשון. במכשירים ניידים ובמכונית, שליטה מעולה מבוססת שפה טבעית ומשוב יגרמו לאפשרויות קיימות מבוססות קול להיראות פרימיטיביות בהשוואה. בינתיים, שיטות יצירתיות ליצירת תמונות חדשות באמצעות מודלים של דיפוזיה וזרימת Poisson יכולות לשאוב גרפיקה מרהיבה על טקסט או צילום בתוספת ספריות תמונות. כהגרלה צרכנית זה יכול להתגלות כדבר הגדול הבא לשחרור טלפון עתידי.

בעוד שבינה מלאכותית מבוססת שנאים מציגה הזדמנות ענקית של $$$, היא מלווה באתגרים. הטכנולוגיות שמאפשרות שיטות כאלה כבר מוכחות בענן ומופיעות בקצה, ובכל זאת הן רעבות זיכרון מפורסמות. LLMs לייצור פועלים בין מיליארדים לטריליונים של פרמטרים שיש להעמיס על השנאי. הדרישה לסביבת עבודה בתהליך גבוהה באותה מידה; הדמיה מבוססת דיפוזיה מוסיפה בהדרגה רעש לתמונה מלאה ואז חוזרת לתמונה שעברה שינוי, שוב דרך פלטפורמות מבוססות שנאים.

מלבד עומס ראשוני, אף אחד מהתהליכים הללו לא יכול להרשות לעצמו את התקורה של אינטראקציה עם DRAM חיצוני. השהיות יהיו בלתי מתקבלות על הדעת ודרישת החשמל תרוקן את סוללת הטלפון או תפוצץ את תקציב החשמל של מרכז נתונים. כל הזיכרון צריך להיות ליד - קרוב מאוד - למחשב. פתרון אחד הוא ערימת SRAM על גבי המאיץ (כפי שהדגימו AMD ועכשיו אינטל עבור שבבי השרת שלהם). זיכרון ברוחב פס גבוה בחבילה מוסיף עוד אפשרות קצת יותר איטית אבל עדיין לא איטי כמו DRAM מחוץ לשבב.

כל אלה דורשים מערכות מרובות. אז איפה אנחנו בהפיכת האפשרות הזו למוכנה לייצור?

השקפות על המקום בו אנו נמצאים

שמעתי הרבה התלהבות לצמיחה בתחום זה, באימוץ, יישומים וכלי עבודה. אינטל, AMD, קוואלקום, סמסונג כולן בבירור פעילות מאוד בתחום הזה. Apple M2 Ultra ידוע כעיצוב קוביות כפולות, ו-AWS Graviton 3 מערכת מרובת קוביות. אני בטוח שיש עוד המון דוגמאות בין המערכות הגדולות ובתי המוליכים למחצה. אני מתרשם שהמתים עדיין מקורם ברובם פנימי (למעט אולי ערימות HBM), ומורכבים בטכנולוגיות אריזות יציקה מ-TSMC, סמסונג או אינטל. עם זאת, Tenstorrent הודיעה זה עתה כי הם בחרו בסמסונג לייצר את עיצוב הבינה המלאכותית של הדור הבא שלהם כ-chiplet (קוביה המתאימה לשימוש במערכת מרובת קוביות), כך שהמרחב הזה כבר מתקדם לקראת רכישת קוביות רחבות יותר.

כל משתתפי הפאנל התלהבו באופן טבעי מהכיוון הכללי, וברור שהטכנולוגיות והכלים מתפתחים במהירות מה שגורם לבזז. ללית'ה ביססה את ההתלהבות הזו בכך שציינה שהאופן שבו מערכות מרובות קוביות שמתכננות ומתוכננות כרגע עדיין בחיתוליה, עדיין לא מוכנה להשיק שוק רב-פעמי נרחב עבור קוביות. זה לא מפתיע אותי. טכנולוגיה במורכבות זו נראית כאילו היא צריכה להבשיל תחילה בשותפויות הדוקות בין מעצבי מערכות, מפעלי יציקה וחברות EDA, אולי במשך כמה שנים לפני שהיא תוכל להתרחב לקהל גדול יותר.

אני בטוח שמפעלי יציקה, בוני מערכות וחברות EDA לא מציגות את כל הקלפים שלהם ועשויים להיות רחוקים יותר ממה שהם בוחרים לפרסם. אני מצפה לשמוע עוד. ניתן לצפות בדיון בפאנל כאן.

שתף את הפוסט הזה באמצעות:

בול זמן:

עוד מ Semiwiki