ORNL کے فرنٹیئر سپر کمپیوٹر پر اربوں سے ٹریلین پیرامیٹرز کے ساتھ بڑے LLM ماڈلز کی تربیت

سیمی انجینئرنگ

ORNL کے فرنٹیئر سپر کمپیوٹر پر اربوں سے ٹریلین پیرامیٹرز کے ساتھ بڑے LLM ماڈلز کی تربیت

سیمیکمڈکٹرٹائم سٹیمپ: 16 جنوری 2024 صبح 11:43 بجے

ماخذ نوڈ: 3065936

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

A technical paper titled “Optimizing Distributed Training on Frontier for Large Language Models” was published by researchers at Oak Ridge National Laboratory (ORNL) and Universite Paris-Saclay.

خلاصہ:

“Large language models (LLMs) have demonstrated remarkable success as foundational models, benefiting various downstream applications through fine-tuning. Recent studies on loss scaling have demonstrated the superior performance of larger LLMs compared to their smaller counterparts. Nevertheless, training LLMs with billions of parameters poses significant challenges and requires considerable computational resources. For example, training a one trillion parameter GPT-style model on 20 trillion tokens requires a staggering 120 million exaflops of computation. This research explores efficient distributed training strategies to extract this computation from Frontier, the world’s first exascale supercomputer dedicated to open science. We enable and investigate various model and data parallel training techniques, such as tensor parallelism, pipeline parallelism, and sharded data parallelism, to facilitate training a trillion-parameter model on Frontier. We empirically assess these techniques and their associated parameters to determine their impact on memory footprint, communication latency, and GPU’s computational efficiency. We analyze the complex interplay among these techniques and find a strategy to combine them to achieve high throughput through hyperparameter tuning. We have identified efficient strategies for training large LLMs of varying sizes through empirical analysis and hyperparameter tuning. For 22 Billion, 175 Billion, and 1 Trillion parameters, we achieved GPU throughputs of 38.38%, 36.14%، اور 31.96%, respectively. For the training of the 175 Billion parameter model and the 1 Trillion parameter model, we achieved 100% weak scaling efficiency on 1024 and 3072 MI250X GPUs, respectively. We also achieved strong scaling efficiencies of 89% اور 87% for these two models.”

تلاش کریں یہاں تکنیکی کاغذ. شائع شدہ دسمبر 2023 (پری پرنٹ)۔

Dash, Sajal, Isaac Lyngaas, Junqi Yin, Xiao Wang, Romain Egele, Guojing Cong, Feiyi Wang, and Prasanna Balaprakash. “Optimizing Distributed Training on Frontier for Large Language Models.” arXiv preprint arXiv:2312.12705 (2023).

مزید پڑھنا
AI ریس ٹو دی ایج
اندازہ لگانے اور کچھ تربیت کو چھوٹے آلات پر دھکیلا جا رہا ہے کیونکہ AI نئی ایپلی کیشنز میں پھیلتا ہے۔

SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
پلیٹو ای ایس جی۔ کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
پلیٹو ہیلتھ۔ بائیوٹیک اینڈ کلینیکل ٹرائلز انٹیلی جنس۔ یہاں تک رسائی حاصل کریں۔
ماخذ: https://semiengineering.com/training-large-llm-models-with-billions-to-trillion-parameters-on-ornls-frontier-supercomputer/

ٹائم اسٹیمپ: جنوری۳۱، ۲۰۱۹

سے زیادہ سیمی انجینئرنگ

کلاؤڈ بیسڈ تصدیق کے ساتھ اعلیٰ معیار کا سلکان

کلاؤڈ بیسڈ تصدیق کے ساتھ اعلیٰ معیار کا سلکان

ماخذ کلسٹر:

سیمی انجینئرنگ

ماخذ نوڈ: 2882043

ٹائم اسٹیمپ: ستمبر 15، 2023

سسٹم سی پر مبنی پاور سائیڈ چینل اے آئی ایکسلریٹر کے خلاف حملے (یونیوی آف لیوبیک)

سسٹم سی پر مبنی پاور سائیڈ چینل اے آئی ایکسلریٹر کے خلاف حملے (یونیوی آف لیوبیک)

ماخذ کلسٹر:

سیمی انجینئرنگ

ماخذ نوڈ: 3032794

ٹائم اسٹیمپ: دسمبر 21، 2023

بہتر کاریں تیز تر بنانا

بہتر کاریں تیز تر بنانا

ماخذ کلسٹر:

سیمی انجینئرنگ

ماخذ نوڈ: 1935892

ٹائم اسٹیمپ: فروری 2، 2023

تیار ہوتے روبوٹس کے لیے ہارڈ ویئر پلیٹ فارم

تیار ہوتے روبوٹس کے لیے ہارڈ ویئر پلیٹ فارم

ماخذ کلسٹر:

سیمی انجینئرنگ

ماخذ نوڈ: 2884922

ٹائم اسٹیمپ: ستمبر 15، 2023

تازہ ترین E/E آرکیٹیکچرز کی بنیاد پر محفوظ اور لاگت سے موثر اگلی نسل کے ایکچویٹر اور سینسر ایپلی کیشنز بنائیں

تازہ ترین E/E آرکیٹیکچرز کی بنیاد پر محفوظ اور لاگت سے موثر اگلی نسل کے ایکچویٹر اور سینسر ایپلی کیشنز بنائیں

ماخذ کلسٹر:

سیمی انجینئرنگ

ماخذ نوڈ: 3091111

ٹائم اسٹیمپ: جنوری 31، 2024

بلاگ کا جائزہ: جنوری 10

ماخذ کلسٹر:

سیمی انجینئرنگ

ماخذ نوڈ: 3055074

ٹائم اسٹیمپ: جنوری 10، 2024

ماڈیولر FPGA FPGA کو استعمال کرنا آسان بناتا ہے۔

ماڈیولر FPGA FPGA کو استعمال کرنا آسان بناتا ہے۔

ماخذ کلسٹر:

سیمی انجینئرنگ

ماخذ نوڈ: 2689317

ٹائم اسٹیمپ: 31 فرمائے، 2023

ریسرچ بٹس: جنوری 23

ماخذ کلسٹر:

سیمی انجینئرنگ

ماخذ نوڈ: 3079708

ٹائم اسٹیمپ: جنوری 23، 2024

ایم ایل آٹوموٹیو چپ ڈیزائن کا آغاز

ماخذ کلسٹر:

سیمی انجینئرنگ

ماخذ نوڈ: 2628473

ٹائم اسٹیمپ: 4 فرمائے، 2023

مائیکرو آرکیٹیکچرل سائیڈ چینل حملے اور غیر مستحکم RAM پر دفاع

مائیکرو آرکیٹیکچرل سائیڈ چینل حملے اور غیر مستحکم RAM پر دفاع

ماخذ کلسٹر:

سیمی انجینئرنگ

ماخذ نوڈ: 1992348

ٹائم اسٹیمپ: مارچ 4، 2023

آرم ٹوٹل کمپیوٹ: کل کے کام کے بوجھ کے لیے انجینئرنگ

ماخذ کلسٹر:

سیمی انجینئرنگ

ماخذ نوڈ: 2812064

ٹائم اسٹیمپ: اگست 9، 2023

چپلیٹ: مزید معیارات کی ضرورت ہے۔

ماخذ کلسٹر:

سیمی انجینئرنگ

ماخذ نوڈ: 2581581

ٹائم اسٹیمپ: اپریل 13، 2023