מיקרוסופט משפרת את יעילות הבינה המלאכותית עם 'רביעיית מטאל כבד' של מהדרים - פענוח

מיקרוסופט משפרת את יעילות הבינה המלאכותית עם 'רביעיית מטאל כבד' של מהדרים - פענוח

צומת המקור: 2865461

מיקרוסופט חשפה חבילה של ארבעה מהדרים חדשים של בינה מלאכותית שנועדה לייעל את הביצועים של דגמי AI שונים. "רביעיית המתכת הכבדה" של כלי הידור החדשניים נושאת את השמות ראמר, רולר, רתך וטוחן.

הכלים פותחו על ידי Microsoft Research בשיתוף עם מספר מוסדות אקדמיים. הם מספקים פתרונות מתקדמים להידור - בעצם הטרנספורמציה מקוד מקור (ניתן לקריאה אנושית) לקוד מכונה (חבורה של אחדות ואפסים שהופכים מחשב בר-הפעלה) - דגמי AI מיינסטרים והרצתם בצורה יעילה יותר על מאיצי חומרה כמו GPUs.

במחקר של מיקרוסופט בלוג בהדגשת היכולות שלהם, החברה אומרת שהמהדרים מתבססים על המחקר והפיתוח הנרחבים של מיקרוסופט בתחום הבינה המלאכותית.

"מהדרי הבינה המלאכותית שפיתחנו הוכיחו שיפור משמעותי ביעילות הידור הבינה המלאכותית, ובכך הקלו על ההדרכה והפריסה של מודלים של בינה מלאכותית", כתב Jilong Xue, חוקר ראשי ב-MSR Asia. "בעתיד, המודלים בקנה מידה גדול אלה עצמם עשויים לסייע מטבעם בהשגת אופטימיזציה והידור."

ארבעת המהדרים החדשים מתמודדים כל אחד עם אתגרים שונים באופטימיזציה של עומסי עבודה של AI.

מָדוֹך מתמקד במקסום מקביליות החומרה - היכולת של החומרה לעשות דברים שונים בו-זמנית. זהו גורם מפתח בביצועים, ו-Rammer ממזער את תקורה של תזמון זמן ריצה באמצעות ניצול משופר של משאבים מקבילים.

מַכבֵּשׁ נוקט בגישה שונה להאצת הקומפילציה, תוך שימוש באלגוריתם בנייה מהיר כדי למצוא פתרונות, ובסופו של דבר מייצר גרעינים אופטימליים בשניות ולא בשעות. במילים אחרות, רולר עוזר ליצור תוכניות מחשב יעילות עבור AI מהר יותר על ידי פישוט תהליך התכנון.

רתך מפחית תעבורת גישה יקרה לזיכרון על ידי חיבור מפעילים בצינור מרוכז. זה מאחד אופטימיזציות של זיכרון למסגרת אחת ליעילות רבה יותר.

לבסוף, מלתעה מאפשר ביצוע זרימת בקרה על מאיצים על ידי שילובו עם זרימת הנתונים. זה מאפשר אופטימיזציה על פני גבולות זרימת הבקרה. תחשוב על זה כמו מומחה שמנחה את הצעדים של מתלמד, אומר לו מה לעשות כדי לבצע את העבודה מהר יותר.

כאחת מענקיות הטכנולוגיה המובילות, מיקרוסופט הייתה בחזית קידום הבינה המלאכותית. החברה שיתפה פעולה הדוק עם חברת מחקר בינה מלאכותית OpenAI במודלים של שפות גדולות כמו GPT-3.5 ו-GPT-4, המניעים את ChatGPT ו-Bing Chat. לאחרונה, מיקרוסופט שיתף פעולה עם Meta לשלב את LLaMA-2 בפתרון מחשוב הענן שלה והציגה טכניקה בשם אלגוריתם של מחשבות כדי לשפר את ההיגיון במודלים כמו ChatGPT.

בדיקות גילו שהמהדרים עמדו בביצועים גבוהים משמעותית מהפתרונות הקיימים במדדים. Rammer עלה על מהדרים אחרים עד פי 20 במעבדי GPU. רולר התאים או חרג מהביצועים המתקדמים ביותר תוך הורדת זמן הקומפילציה בסדרי גודל. Welder התעלה על מסגרות כמו PyTorch עד פי 21 במעבדי GPU. דגמים מואצים של גריינדר עם שליטה בזרימה של עד פי 8.

רביעיית המתכת הכבדה מדגימה את המשך ההובלה של מיקרוסופט בתכנון מערכות בינה מלאכותית פורצות דרך - ולהמציא שמות מהנים למוצריה. בעוד שותפויות גדולות בתחום הבינה המלאכותית כמו זו עם OpenAI לתפוס כותרות, החברה גם מפתחת באופן פעיל תשתית תוכנה חיונית כדי להעצים AI מאחורי הקלעים.

עם שיפור ניכר בביצועים ביחס לפתרונות הקיימים, Rammer, Roller, Welder ו-Grander יכולים לספק יתרונות תחרותיים מרכזיים ככל שיופיעו עומסי עבודה מורכבים יותר של AI.

הישאר מעודכן בחדשות הקריפטו, קבל עדכונים יומיים בתיבת הדואר הנכנס שלך.

בול זמן:

עוד מ פענוח