Meta لنشر شرائح الذكاء الاصطناعي المخصصة جنبًا إلى جنب مع وحدات معالجة الرسوميات AMD وNvidia

Meta لنشر شرائح الذكاء الاصطناعي المخصصة جنبًا إلى جنب مع وحدات معالجة الرسوميات AMD وNvidia

عقدة المصدر: 3093660

بعد سنوات من التطوير، قد تقوم Meta أخيرًا بطرح مسرعات الذكاء الاصطناعي المحلية الخاصة بها بطريقة ذات معنى هذا العام.

أكدت إمبراطورية Facebook رغبتها في استكمال عمليات نشر وحدات معالجة الرسوميات Nvidia H100 وAMD MI300X مع عائلة شرائح Meta Training Inference Accelerator (MTIA) هذا الأسبوع. على وجه التحديد، ستنشر Meta معالجًا محسّنًا للاستدلال، يقال إن الاسم الرمزي أرتميس، استنادًا إلى أجزاء الجيل الأول لعملاق وادي السيليكون مازحت العام الماضي.

قال متحدث باسم Meta: "نحن متحمسون للتقدم الذي أحرزناه في جهودنا الداخلية في مجال السيليكون مع MTIA ونحن نسير على الطريق الصحيح لبدء نشر متغير الاستدلال الخاص بنا في الإنتاج في عام 2024". السجل يوم الخميس.

"نحن نرى أن المسرعات المطورة داخليًا لدينا تكون مكملة إلى حد كبير لوحدات معالجة الرسوميات المتاحة تجاريًا في تقديم المزيج الأمثل من الأداء والكفاءة في أعباء العمل الخاصة بـ Meta،" تابع الممثل. تفاصيل؟ لا. أخبرنا المتحدث الرسمي: "إننا نتطلع إلى مشاركة المزيد من التحديثات حول خطط MTIA المستقبلية في وقت لاحق من هذا العام."

نحن نعتبر ذلك يعني أن شريحة الجيل الثاني التي تركز على الاستدلال يتم طرحها على نطاق واسع، بعد إصدار الجيل الأول المعملي فقط للاستدلال، وقد نكتشف لاحقًا عن الأجزاء المخصصة في المقام الأول للتدريب أو التدريب والاستدلال.

أصبحت Meta واحدة من أفضل عملاء Nvidia وAMD مع تزايد نشرها لأعباء عمل الذكاء الاصطناعي، مما يزيد من حاجتها واستخدامها للسيليكون المتخصص لجعل برامج التعلم الآلي الخاصة بها تعمل بأسرع ما يمكن. وبالتالي، فإن قرار عملاق Instagram بتطوير معالجاته المخصصة ليس مفاجئًا تمامًا.

في الواقع، فإن الشركة العملاقة، في ظاهر الأمر، متأخرة نسبيًا عن مجموعة السيليكون المخصصة للذكاء الاصطناعي من حيث النشر في العالم الحقيقي. تستخدم أمازون وجوجل المكونات المحلية لتسريع أنظمة التعلم الآلي الداخلية، مثل نماذج التوصية، وكود التعلم الآلي للعملاء لعدة سنوات. وفي الوقت نفسه، كشفت مايكروسوفت عن مسرعاتها المحلية العام الماضي.

ولكن بعيدًا عن حقيقة أن Meta تطرح شريحة استدلال MTIA على نطاق واسع، لم تكشف الشبكة الاجتماعية عن بنيتها الدقيقة ولا عن أحمال العمل التي تحجزها للسيليكون الداخلي والتي يتم تفريغها إلى وحدات معالجة الرسوميات AMD وNvidia.

من المحتمل أن تقوم Meta بتشغيل نماذج ثابتة على ASICs المخصصة لها لتحرير موارد GPU لتطبيقات أكثر ديناميكية أو تطورًا. لقد رأينا Meta تسلك هذا الطريق من قبل باستخدام مسرعات مخصصة مصممة لتفريغ البيانات وحساب أعباء عمل الفيديو المكثفة.

أما بالنسبة للتصميم الأساسي، يخبرنا مراقبو الصناعة في SemiAnalogy أن الشريحة الجديدة تعتمد بشكل وثيق على الهندسة المعمارية في أجزاء الجيل الأول من Meta.

الحجارة يخطو

تم الإعلان عنه في أوائل عام 2023 بعد ثلاث سنوات من التطوير، عن أجزاء Meta's MTIA v1، والتي قام أصدقاؤنا في المنصة التالية نظرت إلى في الربيع الماضي، تم تصميمها خصيصًا مع وضع نماذج التوصية للتعلم العميق في الاعتبار.

تم بناء شريحة الجيل الأول حول مجموعة وحدة المعالجة المركزية RISC-V وتم تصنيعها باستخدام عملية TSMC التي تبلغ 7 نانومتر. تحت الغطاء، استخدم المكون مصفوفة ثمانية × ثمانية من عناصر المعالجة، كل منها مجهز بنواتين لوحدة المعالجة المركزية RV، أحدهما مزود بامتدادات رياضية متجهة. يتم تغذية هذه النوى من ذاكرة SRAM كبيرة الحجم تبلغ 128 ميجابايت على الشريحة وما يصل إلى 128 جيجابايت من ذاكرة LPDDR5.

كما ادعى Meta في العام الماضي، كانت الشريحة تعمل بسرعة 800 ميجاهرتز وتصدرت 102.4 تريليون عملية في الثانية بأداء INT8 أو 51.2 تيرافلوب بنصف الدقة (FP16). بالمقارنة، فإن Nvidia's H100 قادر على أداء ما يقرب من أربعة بيتافلوب من أداء FP8 المتناثر. على الرغم من أنها ليست قوية مثل وحدات معالجة الرسومات Nvidia أو AMD، إلا أن الشريحة تتمتع بميزة رئيسية واحدة: استهلاك الطاقة. تتمتع الشريحة نفسها بقوة تصميم حراري تبلغ 25 واط فقط.

وفقًا شبه تحليل، تتميز أحدث شريحة من Meta بمراكز محسنة وتستبدل LPDDR5 بذاكرة ذات نطاق ترددي عالٍ تم تعبئتها باستخدام تقنية الرقاقة على الرقاقة على الركيزة (CoWoS) من TSMC.

هناك اختلاف ملحوظ آخر وهو أن شريحة الجيل الثاني من Meta ستشهد بالفعل انتشارًا واسع النطاق عبر البنية التحتية لمركز البيانات الخاص بها. وفقًا لعملاق فيسبوك، على الرغم من استخدام الجزء الأول لتشغيل نماذج إعلانات الإنتاج، إلا أنه لم يغادر المختبر أبدًا.

مطاردة الذكاء العام الاصطناعي

وبغض النظر عن الأجزاء المخصصة، فقد تخلصت الشركة الأم على Facebook وInstagram المليارات من الدولارات على وحدات معالجة الرسومات في السنوات الأخيرة لتسريع جميع أنواع المهام غير المناسبة لمنصات وحدة المعالجة المركزية التقليدية. ومع ذلك، فإن ظهور نماذج اللغات الكبيرة، مثل GPT-4 وLlama 2 الخاص بشركة Meta، قد غيّر المشهد ودفع إلى نشر مجموعات ضخمة من وحدات معالجة الرسومات.

على النطاق الذي تعمل فيه Meta، استلزمت هذه الاتجاهات تغييرات جذرية في بنيتها التحتية، بما في ذلك إعادة تصميم العديد من مراكز البيانات لدعم متطلبات الطاقة والتبريد الهائلة المرتبطة بعمليات نشر الذكاء الاصطناعي الكبيرة.

وستصبح عمليات نشر Meta أكبر خلال الأشهر القليلة المقبلة حيث تحول الشركة تركيزها من metaverse إلى تطوير الذكاء العام الاصطناعي. من المفترض أن العمل المنجز على الذكاء الاصطناعي سيساعد في تشكيل metaverse أو شيء من هذا القبيل.

وفقًا للرئيس التنفيذي مارك زوكربيرج، تخطط Meta لنشر ما يصل إلى 350,000 وحدة Nvidia H100 هذا العام وحده.

أعلن عالم الأعمال أيضًا عن خطط لنشر AMD حديثًا أطلقت وحدات معالجة الرسومات MI300X في مراكز البيانات الخاصة بها. ادعى زوكربيرج أن شركته ستنهي العام بقوة حاسوبية تعادل 600,000 ألف جهاز H100. لذا من الواضح أن شرائح Meta's MTIA لن تحل محل وحدات معالجة الرسومات في أي وقت قريب. ®

الطابع الزمني:

اكثر من السجل