The Role Of The CPU In Sustainable AI/ML

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

اشتہار جیسا کہ AI کاروباری کمپیوٹنگ ماحول میں اپنی رسائی کو بڑھا رہا ہے، اس کے اثرات کچھ غیر متوقع دستک کے اثرات کا باعث بن رہے ہیں۔ IDC کا تازہ ترین فیوچر اسکیپ۔ رپورٹ، مثال کے طور پر، پیش گوئی کرتی ہے کہ جیسے جیسے کمپنیاں AI سے بہتر مصنوعات/خدمات متعارف کرانے اور اپنے صارفین کو AI کے نفاذ میں مدد کرنے کی دوڑ میں لگ جائیں گی، ٹیکنالوجی جدت کے لیے ایک اہم محرک بن جائے گی۔

AI سے چلنے والی ایک اور تبدیلی اس حد تک محور ہے کہ ڈیٹا سینٹرز کو CPUs کو مجرد AI ایکسلریٹر، جیسے GPUs یا خصوصی فن تعمیرات کے ساتھ متوازن کرنا پڑ سکتا ہے تاکہ وہ اعلیٰ کارکردگی کی کمپیوٹ صلاحیتیں فراہم کی جا سکیں جو AI ڈویلپرز چاہتے ہیں۔

یہ ایک ایسی بحث ہے جو ڈیٹا سینٹر کے مالکان کے لیے اضافی CAPEX سرمایہ کاری اور اس امکان کے لحاظ سے کہ (جبکہ پیمائش کے طریقے غلط ہیں) کے لیے ہائی اسٹیک مسائل کو جنم دیتا ہے، عام GPU سے چلنے والے AI آپریشنز روایتی IT ورک بوجھ سے زیادہ طاقت استعمال کرتے ہیں۔

AI کی اعلیٰ طاقت/کاربن اوور ہیڈ سے نمٹنا ڈیٹا سینٹر کے آپریشنز کے لیے ایک اضافی تکلیف دہ نقطہ ہے، جس کے لیے یہ بھی یقینی بنانا چاہیے کہ AI کے لیے بہتر بنائے گئے کمپیوٹ فن تعمیر موجودہ ٹیک یا سہولیات کو اوور لوڈ کرنے کے خطرے کے بغیر بجلی کی بڑھتی ہوئی مانگ کو سنبھال سکتے ہیں۔

لہذا جیسا کہ پائیداری کی حکمرانی اور کاربن مینجمنٹ میں توسیعی ضابطہ آئی ٹی ہارڈویئر اور سافٹ ویئر کے تمام پہلوؤں میں توانائی کے استعمال کو کم کرنے کے لیے کارروائیوں کو آگے بڑھاتا ہے، AI موقع اور رکاوٹ دونوں کی نمائندگی کرتا ہے۔

AI بجلی کی کھپت کو کم کرنا

انٹیل کے AI سینٹر آف ایکسیلنس میں آرٹیفیشل انٹیلی جنس GTM کے ڈائریکٹر اسٹیفن گلِچ کی وضاحت کرتے ہوئے، ایک ساتھ مل کر، بجلی کی بڑھتی ہوئی کھپت، اور AI اور مشین لرننگ کے کام کے بوجھ کو ایڈجسٹ کرنے کے لیے ضروری تعمیراتی تشکیل نو ڈیٹا سینٹرز کے لیے ایک ناقابل تلافی چیلنج ہے۔

"یہ عمودی شعبوں اور صنعتوں میں بالکل واضح ہے، جہاں کہیں بھی AI/مشین لرننگ ایپلی کیشنز اور خدمات تیار، تربیت یافتہ اور چلائی جا رہی ہیں، کہ آن پریم اور کلاؤڈ ہوسٹڈ IT سہولیات کی صلاحیتوں کو ڈیٹا کے بڑھتے ہوئے حجم سے نمٹنے کے لیے اپ گریڈ کرنا پڑے گا۔ -گہری کام کا بوجھ،" گلِچ کہتے ہیں۔ "یہ بھی واضح ہے کہ ان اپ گریڈز کو صرف ریمپنگ اپ کمپیوٹ کی صلاحیت سے زیادہ شامل کرنا پڑے گا۔"

AI پر مرکوز ڈیٹا سینٹرز کی پائیداری کو بڑھانے کے لیے بہت کچھ کیا جا سکتا ہے، گلِچ کا خیال ہے کہ، AI/مشین لرننگ کے منظر نامے کے ارد گرد کچھ مفروضوں کا از سر نو جائزہ لینے کے ساتھ۔ پروسیسنگ یونٹس شروع کرنے کے لیے ایک اچھی جگہ ہیں، خاص طور پر جب یہ فیصلہ کیا جائے کہ آیا CPUs یا GPUs کام کے لیے زیادہ موزوں ہیں۔

کیونکہ جب کہ AI مخصوص کمپیوٹ کے لحاظ سے کام کا بوجھ بڑھتا دکھائی دے رہا ہے (کسی کو بھی اس بات کا یقین نہیں ہے کہ کس رفتار سے ہے) ڈیٹا سینٹر کے کام کا بڑا حصہ (غیر اے آئی ورک بوجھ) کو دن بہ دن دور ہونا جاری رکھنا چاہیے - مستقل ایپلیکیشن کی فراہمی اور سروس کی آمدنی کے سلسلے کو پریشان نہ کیا جائے۔

ان میں سے زیادہ تر فی الحال CPUs کے ذریعے ہینڈل کیے جاتے ہیں اور ایک معیاری ڈیٹا سینٹر کو زیادہ مہنگے GPUs کے ساتھ ریفٹ کرنا، بہت سی سہولیات کے لیے، ضروریات سے زیادہ ہو جائے گا۔ عام اصطلاحات میں، ایک جی پی یو اسی طرح کے کام کو انجام دینے کے لیے سی پی یو سے زیادہ واٹج استعمال کرتا ہے۔ دیئے گئے ریک کنفیگریشن کو بجلی کی فراہمی پر منحصر ہے، GPUs کو ڈیٹا سینٹر کے بنیادی ڈھانچے میں ضم کرنے کے لیے پاور ڈسٹری بیوشن سسٹم میں اپ گریڈ کی ضرورت ہوتی ہے، مثال کے طور پر، جو کہ ایک بار چلنے کے بعد انرجی بلوں کے علاوہ اضافی اخراجات اٹھانے کے پابند ہیں۔

مزید یہ کہ انٹیل کی سی پی یو کی ترقی میں جدت آتی رہتی ہے۔ گلیچ کا کہنا ہے کہ متعدد استعمال کے معاملات میں ایک سی پی یو کو جی پی یو کے طور پر مجموعی کارکردگی - اور بعض اوقات بہتر - حاصل کرنے کے لیے ثابت کیا جا سکتا ہے۔ اور ان کی کارکردگی کو Intel® AMX (Advanced Matrix Extensions) جیسی بریک تھرو ٹیک کے ساتھ بڑھایا جا سکتا ہے جو 4th جنریشن Intel Xeon CPUs میں بنایا گیا ایک ایکسلریٹر ہے۔

"Intel Xeon پروسیسر بلٹ ان AI ایکسلریشن کے ذریعے اپنے AI کو اپنانے کے لیے ڈیٹا سینٹر کو قابل بنا سکتے ہیں جو مشین لرننگ، ٹریننگ اور انفرنس کے لیے CPU کی کارکردگی کو بڑھاتا ہے" گلِچ بتاتے ہیں۔ "اس طرح، وہ CAPEX کو کم سے کم کرنے اور موجودہ Intel Xeon پروسیسنگ ماحول سے فائدہ اٹھاتے ہوئے کارکردگی کو زیادہ سے زیادہ کرنے کے لیے مجرد ایکسلریٹر کو اپنا سکتے ہیں۔"

AI اور غیر AI کام کے بوجھ کو ملانے کی ضرورت ہے۔

Intel AMX Intel Xeon Scalable پروسیسر کور پر ایک سرشار ہارڈویئر بلاک ہے جو AI ورک لوڈز کو CPU پر چلانے کے قابل بناتا ہے بجائے اس کے کہ انہیں ایک مجرد ایکسلریٹر پر آف لوڈ کیا جائے، جس سے کارکردگی میں نمایاں اضافہ ہوتا ہے۔ یہ AI کام کے بوجھ کے لیے موزوں ہے جیسے مشین لرننگ تجویز کنندہ سسٹم، تصویر کی شناخت اور قدرتی زبان کی پروسیسنگ، جو میٹرکس ریاضی پر انحصار کرتی ہے۔

بڑھے ہوئے سی پی یوز کے حق میں ایک اور دلیل یہ ہے کہ وہ ڈیٹا سینٹر آپریٹرز کو موجودہ سی پی یو کے زیادہ سے زیادہ وعدے کرنے کے لیے ایک سرمایہ کاری مؤثر راستہ فراہم کرتے ہیں، ان کے اثاثوں کو مستقبل کا ثبوت دیتے ہیں تاکہ وہ مخلوط کام کا بوجھ اٹھا سکیں، اور انہیں بہتر کرنے کی پوزیشن میں رکھیں۔ بجلی کے مجموعی استعمال کو کنٹرول کریں۔

اس کے نتیجے میں، ڈیٹا سینٹر سروسز کے فراہم کنندگان (اور ان کے صارفین) کو پائیداری کے اہداف کو پورا کرنے میں مدد مل سکتی ہے، اور سافٹ ویئر ڈویلپرز (انٹرپرائز یا تھرڈ پارٹی) کے لیے ایک سیلنگ پوائنٹ فراہم کرتا ہے جو اپنی کوڈنگ کی توانائی کی کارکردگی کو ظاہر کرنے کے لیے ایک بہترین پلیٹ فارم کی تلاش میں ہیں۔ آؤٹ پٹ

گلیچ کا کہنا ہے کہ "حقیقت یہ ہے کہ، اے آئی کے کام کے بوجھ سے وعدہ کرنے والے مواقع پر جلدی کرنے کے بجائے، ڈیٹا سینٹر آپریٹرز کو یہ احساس ہو رہا ہے کہ انہیں بہت سی ضروری باتوں پر غور کرنا چاہیے جو تکنیکی انتخاب کے طور پر تجارتی خدشات سے زیادہ سے زیادہ مطلع کیا جاتا ہے،" گلِچ کہتے ہیں۔

ان ضروریات میں شامل ہو سکتے ہیں: AI کام کے بوجھ کا غیر AI کام کے بوجھ کے ساتھ انضمام؛ مختلف ہارڈ ویئر اور سافٹ ویئر کے ڈھیروں کا انضمام؛ اور کیونکہ وہ اس بات کو یقینی بنانا چاہتے ہیں کہ ان کے پاس ایک ایسا فن تعمیر ہے جو متعدد مختلف کام کے بوجھ کے لیے موزوں ہے، مختلف ورک اسٹریم کی اقسام کا انضمام۔

"یہ سوالات پیچیدہ چیلنجوں کی طرف اشارہ کرتے ہیں، کیونکہ ان کو درست کرنے کا زیادہ سے زیادہ تکنیکی اور توانائی کی کارکردگی پر اثر پڑتا ہے - توانائی کی کارکردگی کے ساتھ اب ایک بنیادی کارکردگی کا بینچ مارک ہے جو ڈیٹا سینٹر کی تجارتی عملداری کو تیزی سے متاثر کرے گا،" گلِچ کہتے ہیں۔ "تو پھر، یہ انتہائی اہمیت کا حامل ہے۔"

Gillich کے نقطہ نظر سے، اس ابھرتی ہوئی حقیقت کو اپنانے کی کلید ایک مرحلہ وار عمل ہے جسے 'AI ضم کرنا' کہا جا سکتا ہے۔ یہاں ایک نکتہ یہ ہے کہ AI کام کے بوجھ کو کام کے بوجھ کی دوسری اقسام سے الگ نہیں کیا جاتا ہے – انہیں الگ سے چلانے کے بجائے روایتی کام کے بوجھ میں ضم کیا جائے گا۔

گلیچ اس مرحلہ وار انضمام کی ایک مثال کے طور پر ویڈیو کانفرنسنگ دیتا ہے: "پہلے ہی معیاری ایپلی کیشنز میں معیاری آڈیو/ویڈیو ٹریفک کو اسٹریم کرنے کے دوران، AI کو خلاصہ، ترجمہ، ٹرانسکرپشن جیسے ہم آہنگ کاموں کو انجام دینے کے لیے مربوط کیا گیا ہے۔ اس طرح کی خصوصیات AI کی طرف سے بہت اچھی طرح سے تعاون یافتہ ہیں۔

آخر سے آخر تک توانائی کی بچت

گلیچ کا استدلال ہے کہ توانائی کی افادیت کو حاصل کرنا واقعی ایک آخر سے آخر تک اسٹریٹجک اقدام ہونا چاہیے۔ "یہ سافٹ ویئر کے ساتھ ساتھ ہارڈ ویئر کے فن تعمیر تک پھیلا ہوا ہے - ایک دیئے گئے ورک فلو کے عمل کو فعال کرنے والا مکمل طریقہ کار۔ رسائی کو سب سے زیادہ موثر بنانے کے لیے ڈیٹا کو کہاں ذخیرہ کیا جاتا ہے - کمپیوٹ وار اور اس لیے توانائی کے لحاظ سے - کیا یہ توانائی کی کارکردگی کے لیے بہترین جگہ ہے؟"

اس تشخیص میں لانے کا دوسرا عنصر یہ طے کرنا ہے کہ کام کا بوجھ کہاں چل رہا ہے۔ مثال کے طور پر، کیا یہ کلائنٹس پر چل رہا ہے (جیسے کہ AI PC ڈیٹا سینٹر میں سرورز کی بجائے Intel Core Ultra پروسیسرز سے لیس ہے؟ کیا ان میں سے کچھ AI ورک بوجھ دراصل کلائنٹس پر (سرورز کے ساتھ ساتھ) چلائے جا سکتے ہیں؟

ہر آپشن قابل غور ہے اگر یہ AI-compute/بجلی کی کھپت کے توازن کو بہتر سیدھ میں لانے میں مدد کرنے والا ہے، گلیچ کا کہنا ہے: "یہ تقریباً تقسیم شدہ کمپیوٹنگ کے پرانے اسکول کے تصور کی واپسی کی طرح ہے۔"

گلچ مزید کہتے ہیں: "کبھی کبھی ہمارے گاہک پوچھتے ہیں، 'AI کہاں چلے گا؟' - جواب یہ ہے کہ AI ہر جگہ چلے گا۔ لہذا Intel میں ہماری خواہش اس بات پر مرکوز ہے کہ AI کی عالمگیر رہائش کو کیا کہا جا سکتا ہے، کیونکہ ہمیں یقین ہے کہ یہ تمام ایپلیکیشن فیلڈز میں داخل ہو جائے گا۔

انٹیل میں اس میں APIs جیسے مڈل ویئر شامل ہیں، جو سافٹ ویئر اسٹیک کے کسی دوسرے حصے کی طرح، زیادہ سے زیادہ موثر ہونا چاہیے۔ 'API پھیلاؤ' کے نتیجے میں غیر ضروری پروسیسنگ، ان کے بنیادی ڈھانچے کے نقوش کو کم سے کم، اور نگرانی اور کنٹرول کی کمی ہو سکتی ہے۔

"کے ساتھ انٹیل oneAPI، انٹرپرائزز اپنی ہارڈ ویئر کی مکمل قدر کا احساس کر سکتے ہیں، اعلی کارکردگی کا کراس آرکیٹیکچر کوڈ تیار کر سکتے ہیں، اور اپنی ایپلی کیشنز کو مستقبل کی ضروریات کے لیے تیار کر سکتے ہیں،" گلِچ بتاتے ہیں۔

"Intel oneAPI ایک کھلا، کراس انڈسٹری، معیارات پر مبنی، متحد، ملٹی آرکیٹیکچر، ملٹی وینڈر پروگرامنگ ماڈل ہے جو تیز تر ایپلیکیشن کی کارکردگی، اور بہتر پیداواری صلاحیت کے لیے ایکسلریٹر آرکیٹیکچرز میں ایک مشترکہ ڈویلپر کا تجربہ فراہم کرتا ہے۔ OneAPI اقدام ایکو سسٹم میں OneAPI تفصیلات اور ہم آہنگ OneAPI نفاذ پر تعاون کی حوصلہ افزائی کرتا ہے۔

Gillich مزید کہتے ہیں: "oneAPI ایک مڈل ویئر اسٹیک فراہم کرتا ہے جو AI Frameworks جیسے معیاری چیزیں لیتا ہے - جیسے Pytorch یا TensorFlow [AI اور Machine Learning کے لیے اوپن سورس سافٹ ویئر پلیٹ فارم] - اور انہیں مشین کی سطح پر ترجمہ کرتا ہے، اور oneAPI ایک موثر طریقہ کو قابل بناتا ہے۔ وہ کرو. صارفین Ai فریم ورک کی سطح پر ایک مشترکہ API استعمال کر سکتے ہیں، اور ہمارے پاس ایک API (oneAPI) ہے جو ہارڈویئر کے مختلف ذائقوں کو حل کرتا ہے۔ لہذا ایک عام API کا مطلب ہے کہ صارف اوپن سافٹ ویئر بناسکتے ہیں جسے اوپن سافٹ ویئر اسٹیک پر سپورٹ کیا جاسکتا ہے۔

CPU سطح کے قیمت پوائنٹس پر GPU سطح کی کارکردگی

آئی ٹی میں پیشرفت بڑی حد تک تعیناتی کی حکمت عملیوں میں بصیرت سے چلنے والی بہتری سے وابستہ مسلسل تکنیکی ترقی کی توقع سے چلتی ہے۔ یہ ایک ماڈل ہے جس کی بنیاد بجٹ کے اخراجات اور کاروباری ROI کے درمیان بہترین قابل حصول توازن تلاش کرنے پر ہے، اور اس توقع کے لیے کہ ہمیشہ مزید جدت کی ضرورت ہوتی ہے۔ AI اس آئیڈیل کی علامت کی نمائندگی کرتا ہے – یہ کافی ہوشیار ہے کہ دائمی خود کی بہتری کے ذریعے اپنی قدر کی تجویز کو دوبارہ ایجاد کر سکے۔

AMX ایکسلریٹر کو اپنی 4th جنریشن Intel Xeon CPUs میں بنا کر، Intel دکھاتا ہے کہ کس طرح CPU-سطح کی قیمت پوائنٹس پر GPU-سطح کی کارکردگی حاصل کی جا سکتی ہے۔ یہ ڈیٹا سینٹرز کو ان کی موجودہ Intel Xeon سے چلنے والی پروسیسنگ اسٹیٹس کی واپسی کی قیمت کو زیادہ سے زیادہ کرنے کے ساتھ ساتھ پیمانہ بنانے کی اجازت دیتا ہے، لیکن قیمتوں کا ایک ماڈل بھی فراہم کرتا ہے جو AI کام کے بوجھ لیکن محدود بجٹ والے صارفین کے لیے داخلے کی لاگت کو کم کرتا ہے۔

اور CPUs کی کم بجلی کی کھپت کا مطلب یہ ہے کہ توانائی کی کارکردگی کو ڈیٹا سینٹر کی سہولت کے پورے آپریشنز - جیسے کولنگ اور وینٹیلیشن کے دوران مجموعی طور پر حاصل کیا جا سکتا ہے - اور یہ پائیداری کے پابند سافٹ ویئر آرکیٹیکٹس اور AL سلوشنز کے ڈویلپرز کے لیے ایک اور جیت کا باعث ہے۔

انٹیل کے ذریعہ تعاون کیا گیا۔