فکر کی تبلیغ: بڑی زبان کے ماڈلز کے ساتھ پیچیدہ استدلال کے لیے ایک مشابہ نقطہ نظر - KDnuggets

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

افکار کی تبلیغ: بڑے زبان کے ماڈلز کے ساتھ پیچیدہ استدلال کے لیے ایک مشابہ نقطہ نظر

کلیدی لے لو

تھیٹ پروپیگیشن (TP) ایک نیا طریقہ ہے جو بڑی زبان کے ماڈلز (LLMs) کی پیچیدہ استدلال کی صلاحیتوں کو بڑھاتا ہے۔
TP LLMs کو شروع سے دلیل بنانے کی بجائے استدلال کو بہتر بنانے کے لیے یکساں مسائل اور ان کے حل کا فائدہ اٹھاتا ہے۔
مختلف کاموں کے تجربات سے پتہ چلتا ہے کہ TP 12% سے لے کر 15% تک کی بہتری کے ساتھ بیس لائن طریقوں سے کافی حد تک بہتر کارکردگی کا مظاہرہ کرتا ہے۔

TP سب سے پہلے LLMs کو مشابہ مسائل کا ایک سیٹ تجویز کرنے اور حل کرنے کا اشارہ کرتا ہے جو ان پٹ ون سے متعلق ہیں۔ اس کے بعد، TP یکساں مسائل کے نتائج کو براہ راست ایک نیا حل نکالنے کے لیے دوبارہ استعمال کرتا ہے یا شروع سے حاصل کیے گئے ابتدائی حل میں ترمیم کرنے کے لیے عمل درآمد کے لیے ایک علمی منصوبہ تیار کرتا ہے۔

Large Language Models (LLMs) کی استعداد اور کمپیوٹیشنل طاقت ناقابل تردید ہے، پھر بھی ان کی کوئی حد نہیں ہے۔ LLMs کے لیے سب سے اہم اور مستقل چیلنجوں میں سے ایک مسئلہ حل کرنے کے لیے ان کا عمومی نقطہ نظر ہے، جس میں ہر نئے کام کا سامنا کرنے کے لیے پہلے اصولوں سے استدلال ہوتا ہے۔ یہ مشکل ہے، کیونکہ یہ اعلی درجے کی موافقت کی اجازت دیتا ہے، لیکن غلطیوں کے امکانات کو بھی بڑھاتا ہے، خاص طور پر ایسے کاموں میں جن کے لیے کثیر الجہتی استدلال کی ضرورت ہوتی ہے۔

"شروع سے استدلال" کا چیلنج خاص طور پر پیچیدہ کاموں میں واضح کیا جاتا ہے جو منطق اور تخمینہ کے متعدد مراحل کا مطالبہ کرتے ہیں۔ مثال کے طور پر، اگر کسی LLM سے آپس میں جڑے ہوئے پوائنٹس کے نیٹ ورک میں مختصر ترین راستہ تلاش کرنے کے لیے کہا جاتا ہے، تو یہ عام طور پر حل تلاش کرنے کے لیے پیشگی معلومات یا مشابہ مسائل کا فائدہ نہیں اٹھائے گا۔ اس کے بجائے، یہ مسئلہ کو تنہائی میں حل کرنے کی کوشش کرے گا، جس سے سب سے زیادہ نتائج یا یہاں تک کہ سراسر غلطیاں بھی ہو سکتی ہیں۔ داخل کریں۔ فکر کی تبلیغ (TP)، ایک طریقہ جو LLMs کی استدلال کی صلاحیتوں کو بڑھانے کے لیے ڈیزائن کیا گیا ہے۔ TP کا مقصد LLMs کی موروثی حدود پر قابو پانا ہے تاکہ وہ یکساں مسائل کے ذخیرے اور ان کے متعلقہ حل نکال سکیں۔ یہ اختراعی نقطہ نظر نہ صرف LLM سے تیار کردہ حلوں کی درستگی کو بہتر بناتا ہے بلکہ کثیر مرحلہ، پیچیدہ استدلال کے کاموں سے نمٹنے کی ان کی صلاحیت کو بھی نمایاں طور پر بڑھاتا ہے۔ مشابہت کی طاقت سے فائدہ اٹھاتے ہوئے، TP ایک ایسا فریم ورک فراہم کرتا ہے جو LLMs کی فطری استدلال کی صلاحیتوں کو بڑھاتا ہے، جو ہمیں واقعی ذہین مصنوعی نظاموں کے حصول کے ایک قدم کے قریب لاتا ہے۔

فکر کی تبلیغ میں دو اہم مراحل شامل ہیں:

سب سے پہلے، LLM کو ان پٹ کے مسئلے سے متعلق مشابہ مسائل کا ایک سیٹ تجویز کرنے اور حل کرنے کے لیے کہا جاتا ہے۔
اگلا، ان مشابہ مسائل کے حل کو یا تو براہ راست ایک نیا حل نکالنے یا ابتدائی حل میں ترمیم کرنے کے لیے استعمال کیا جاتا ہے۔

یکساں مسائل کی نشاندہی کرنے کا عمل LLM کو مسئلہ حل کرنے کی حکمت عملیوں اور حلوں کو دوبارہ استعمال کرنے کی اجازت دیتا ہے، اس طرح اس کی استدلال کی صلاحیتوں کو بہتر بناتا ہے۔ TP موجودہ اشارہ دینے کے طریقوں کے ساتھ مطابقت رکھتا ہے، ایک عام حل فراہم کرتا ہے جسے اہم کام کے مخصوص انجینئرنگ کے بغیر مختلف کاموں میں شامل کیا جا سکتا ہے۔

افکار کی تبلیغ کا عمل
چترا 1: فکر کی تبلیغ کا عمل (کاغذ سے تصویر)

مزید یہ کہ ٹی پی کی موافقت کو کم نہیں سمجھا جانا چاہئے۔ موجودہ اشارہ کرنے کے طریقوں کے ساتھ اس کی مطابقت اسے ایک انتہائی ورسٹائل ٹول بناتی ہے۔ اس کا مطلب ہے کہ TP کسی خاص قسم کے مسئلہ حل کرنے والے ڈومین تک محدود نہیں ہے۔ اس سے ٹاسک مخصوص فائن ٹیوننگ اور آپٹیمائزیشن کے لیے دلچسپ راستے کھلتے ہیں، اس طرح ایپلی کیشنز کے وسیع میدان میں LLMs کی افادیت اور افادیت کو بڑھایا جاتا ہے۔

فکر کی تبلیغ کے نفاذ کو موجودہ LLMs کے ورک فلو میں ضم کیا جا سکتا ہے۔ مثال کے طور پر، مختصر ترین راستے کے استدلال کے کام میں، TP پہلے مختلف ممکنہ راستوں کو سمجھنے کے لیے آسان، مشابہ مسائل کا ایک مجموعہ حل کر سکتا ہے۔ اس کے بعد یہ پیچیدہ مسئلے کو حل کرنے کے لیے ان بصیرت کا استعمال کرے گا، اس طرح زیادہ سے زیادہ حل تلاش کرنے کے امکانات بڑھ جائیں گے۔

مثال 1

ٹاسک: مختصر ترین راستہ استدلال
مشابہ مسائل: نقطہ A اور B کے درمیان مختصر ترین راستہ، نقطہ B اور C کے درمیان مختصر ترین راستہ
حتمی حل۔: یکساں مسائل کے حل پر غور کرتے ہوئے پوائنٹ A سے C تک بہترین راستہ

مثال 2

ٹاسک: تخلیقی تحریر
مشابہ مسائل: دوستی کے بارے میں ایک مختصر کہانی لکھیں، اعتماد کے بارے میں ایک مختصر کہانی لکھیں۔
حتمی حل۔: ایک پیچیدہ مختصر کہانی لکھیں جو دوستی اور اعتماد کے موضوعات کو مربوط کرتی ہے۔

اس عمل میں پہلے ان مشابہ مسائل کو حل کرنا، اور پھر ہاتھ میں موجود پیچیدہ کام سے نمٹنے کے لیے حاصل کردہ بصیرت کا استعمال شامل ہے۔ اس طریقہ کار نے متعدد کاموں میں اپنی تاثیر کا مظاہرہ کیا ہے، جس سے کارکردگی کے میٹرکس میں خاطر خواہ بہتری آئی ہے۔

سوچ کی تبلیغ کے مضمرات صرف موجودہ میٹرکس کو بہتر بنانے سے آگے بڑھتے ہیں۔ یہ اشارہ دینے والی تکنیک میں ہمارے LLMs کو سمجھنے اور تعینات کرنے کے طریقے کو تبدیل کرنے کی صلاحیت ہے۔ طریقہ کار الگ تھلگ، جوہری مسائل کے حل سے ایک زیادہ جامع، باہم جڑے ہوئے نقطہ نظر کی طرف تبدیلی کی نشاندہی کرتا ہے۔ یہ ہمیں اس بات پر غور کرنے کی ترغیب دیتا ہے کہ ایل ایل ایم نہ صرف ڈیٹا سے سیکھ سکتے ہیں بلکہ خود مسئلہ حل کرنے کے عمل سے بھی سیکھ سکتے ہیں۔ یکساں مسائل کے حل کے ذریعے اپنی سمجھ کو مسلسل اپ ڈیٹ کرتے ہوئے، TP سے لیس LLMs غیر متوقع چیلنجوں سے نمٹنے کے لیے بہتر طور پر تیار ہوتے ہیں، جو انہیں تیزی سے بدلتے ہوئے ماحول میں مزید لچکدار اور موافق بناتے ہیں۔

LLMs کی صلاحیتوں کو بڑھانے کے مقصد کے لیے پروموٹنگ طریقوں کے ٹول باکس میں تھوٹ پروپیگیشن ایک امید افزا اضافہ ہے۔ LLMs کو یکساں مسائل اور ان کے حل کا فائدہ اٹھانے کی اجازت دے کر، TP ایک زیادہ باریک اور موثر استدلال کا طریقہ فراہم کرتا ہے۔ تجربات اس کی افادیت کی تصدیق کرتے ہیں، جو اسے مختلف کاموں میں LLMs کی کارکردگی کو بہتر بنانے کے لیے امیدوار کی حکمت عملی بناتا ہے۔ TP بالآخر زیادہ قابل AI سسٹمز کی تلاش میں ایک اہم قدم کی نمائندگی کر سکتا ہے۔

میتھیو میو (@mattmayo13) کمپیوٹر سائنس میں ماسٹر ڈگری اور ڈیٹا مائننگ میں گریجویٹ ڈپلومہ رکھتا ہے۔ KDnuggets کے چیف ایڈیٹر کے طور پر، میتھیو کا مقصد ڈیٹا سائنس کے پیچیدہ تصورات کو قابل رسائی بنانا ہے۔ اس کی پیشہ ورانہ دلچسپیوں میں قدرتی زبان کی پروسیسنگ، مشین لرننگ الگورتھم، اور ابھرتی ہوئی AI کی تلاش شامل ہے۔ وہ ڈیٹا سائنس کمیونٹی میں علم کو جمہوری بنانے کے مشن کے ذریعے کارفرما ہے۔ میتھیو 6 سال کی عمر سے ہی کوڈنگ کر رہا ہے۔