Can Data Governance Address AI Fatigue? - KDnuggets

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

کیا ڈیٹا گورننس AI تھکاوٹ کو دور کر سکتا ہے؟
مصنف کی طرف سے تصویر

ڈیٹا گورننس اور AI تھکاوٹ دو مختلف تصورات کی طرح لگتی ہے، لیکن دونوں کے درمیان ایک اندرونی تعلق ہے۔ اسے بہتر طور پر سمجھنے کے لیے، آئیے ان کی تعریف سے آغاز کرتے ہیں۔

یہ ایک طویل عرصے سے ڈیٹا انڈسٹری کا بنیادی مرکز رہا ہے۔

گوگل اسے اچھی طرح سے بیان کرتا ہے - "ڈیٹا گورننس وہ سب کچھ ہے جو آپ اس بات کو یقینی بنانے کے لیے کرتے ہیں کہ ڈیٹا محفوظ، نجی، درست، دستیاب اور قابل استعمال ہے۔ اس میں داخلی معیارات — ڈیٹا کی پالیسیاں — ترتیب دینا شامل ہے جو کہ ڈیٹا کو جمع کرنے، ذخیرہ کرنے، پروسیس کرنے اور ضائع کرنے کے طریقہ پر لاگو ہوتے ہیں۔

جیسا کہ اس تعریف پر روشنی ڈالی گئی ہے، ڈیٹا گورننس ڈیٹا کو منظم کرنے کے بارے میں ہے - خاص طور پر انجن ڈرائیونگ AI ماڈلز۔

اب جبکہ ڈیٹا گورننس اور AI کے درمیان تعلق کی پہلی نشانیاں سامنے آنا شروع ہو گئی ہیں، آئیے اسے AI تھکاوٹ سے جوڑتے ہیں۔ اگرچہ نام اسے دور کرتا ہے، لیکن اس طرح کی تھکاوٹ کی وجوہات کو اجاگر کرنا پوری پوسٹ میں اس اصطلاح کے مستقل استعمال کو یقینی بناتا ہے۔

تنظیموں، ڈویلپرز، یا ٹیموں کو درپیش دھچکاوں اور چیلنجوں کی وجہ سے AI کی تھکاوٹ پیدا ہو جاتی ہے، جو اکثر AI سسٹمز کی قدر کو حاصل کرنے یا لاگو کرنے میں ناکامی کا باعث بنتی ہے۔

یہ زیادہ تر غیر حقیقی توقعات کے ساتھ شروع ہوتا ہے کہ AI کیا کرنے کے قابل ہے۔ AI جیسی جدید ترین ٹیکنالوجیز کے لیے، کلیدی اسٹیک ہولڈرز کو نہ صرف AI کی صلاحیتوں اور امکانات بلکہ اس کی حدود اور خطرات سے بھی ہم آہنگ ہونا چاہیے۔

خطرات کے بارے میں بات کرتے ہوئے، اخلاقیات کو اکثر سوچا سمجھا جاتا ہے جس کی وجہ سے غیر تعمیل شدہ AI اقدامات کو ختم کیا جاتا ہے۔

آپ AI کی تھکاوٹ پیدا کرنے میں ڈیٹا گورننس کے کردار کے بارے میں سوچ رہے ہوں گے - اس پوسٹ کی بنیاد۔

اسی جگہ ہم آگے جا رہے ہیں۔

AI تھکاوٹ کو وسیع پیمانے پر پہلے سے تعیناتی اور پوسٹ تعیناتی کے طور پر درجہ بندی کیا جا سکتا ہے۔ آئیے پہلے پہلے سے پہلے تعیناتی پر توجہ دیں۔

پہلے سے تعیناتی

مختلف عوامل تعیناتی کے لیے تصور کے ثبوت (PoC) کو گریجویشن کرنے میں معاون ہوتے ہیں، جیسے:

ہم کیا حل کرنے کی کوشش کر رہے ہیں؟
اب ترجیح دینا ایک مجبوری مسئلہ کیوں ہے؟
کیا ڈیٹا دستیاب ہے؟
کیا یہ سب سے پہلے ML-solvable ہے؟
کیا ڈیٹا کا کوئی نمونہ ہے؟
کیا رجحان دوبارہ قابل تکرار ہے؟
کون سا اضافی ڈیٹا ماڈل کی کارکردگی کو بڑھا دے گا؟

کیا ڈیٹا گورننس AI تھکاوٹ کو دور کر سکتا ہے؟
سے تصویر Freepik

ایک بار جب ہم نے اندازہ کر لیا کہ ML الگورتھم کا استعمال کرتے ہوئے مسئلہ کو بہترین طریقے سے حل کیا جا سکتا ہے، ڈیٹا سائنس ٹیم ایک تحقیقی ڈیٹا کا تجزیہ کرتی ہے۔ اس مرحلے پر ڈیٹا کے بہت سے بنیادی نمونوں کا پردہ فاش کیا جاتا ہے، جو اس بات پر روشنی ڈالتے ہیں کہ آیا دیا گیا ڈیٹا سگنل سے بھرپور ہے۔ یہ الگورتھم کے سیکھنے کے عمل کو تیز کرنے کے لیے انجینئرڈ فیچرز بنانے میں بھی مدد کرتا ہے۔

اس کے بعد، ٹیم پہلا بیس لائن ماڈل بناتی ہے، اکثر، یہ معلوم ہوتا ہے کہ یہ قابل قبول سطح تک کارکردگی کا مظاہرہ نہیں کر رہا ہے۔ ایک ماڈل جس کا آؤٹ پٹ سکے کے پلٹنے کی طرح اچھا ہے اس کی کوئی قیمت نہیں ہے۔ ایم ایل ماڈلز کی تعمیر کے دوران یہ پہلی ناکامیوں میں سے ایک ہے، عرف اسباق۔

تنظیمیں ایک کاروباری مسئلہ سے دوسرے میں منتقل ہو سکتی ہیں، جس سے تھکاوٹ ہو سکتی ہے۔ پھر بھی، اگر بنیادی ڈیٹا ایک بھرپور سگنل نہیں رکھتا ہے، تو کوئی AI الگورتھم اس پر تعمیر نہیں کر سکتا۔ ماڈل کو تربیتی اعداد و شمار سے شماریاتی انجمنوں کو سیکھنا چاہیے تاکہ ان دیکھے ڈیٹا کو عام کیا جا سکے۔

تعیناتی کے بعد

تربیت یافتہ ماڈل کے توثیق سیٹ پر امید افزا نتائج دکھانے کے باوجود، کوالیفائنگ کاروباری معیار، جیسے 70% درستگی کے مطابق، اگر ماڈل پیداواری ماحول میں مناسب کارکردگی کا مظاہرہ کرنے میں ناکام رہتا ہے تو تھکاوٹ اب بھی پیدا ہو سکتی ہے۔

اس قسم کی AI تھکاوٹ کو پوسٹ تعیناتی کا مرحلہ کہا جاتا ہے۔

بے شمار وجوہات کی وجہ سے کارکردگی خراب ہو سکتی ہے، جہاں ڈیٹا کا ناقص معیار ماڈل کو پریشان کرنے والا سب سے عام مسئلہ ہے۔ یہ ماڈل کی اہم صفات کی عدم موجودگی میں ہدف کے ردعمل کی درست پیش گوئی کرنے کی صلاحیت کو محدود کرتا ہے۔

غور کریں کہ جب ایک ضروری خصوصیت، جو کہ تربیتی ڈیٹا میں صرف 10% غائب تھی، اب پروڈکشن ڈیٹا میں 50% وقت کے لیے خالی ہو جاتی ہے، جس کی وجہ سے غلط پیش گوئیاں ہوتی ہیں۔ اس طرح کی تکرار اور مسلسل کارکردگی دکھانے والے ماڈلز کو یقینی بنانے کی کوششیں ڈیٹا سائنسدانوں اور کاروباری ٹیموں میں تھکاوٹ پیدا کرتی ہیں، اس طرح ڈیٹا پائپ لائنز پر اعتماد ختم ہوتا ہے اور پروجیکٹ میں کی جانے والی سرمایہ کاری خطرے میں پڑ جاتی ہے۔

مضبوط ڈیٹا گورننس کے اقدامات دونوں قسم کی AI تھکاوٹ سے نمٹنے میں اہم ہیں۔ یہ دیکھتے ہوئے کہ ڈیٹا ایم ایل ماڈلز کا مرکز ہے، ایم ایل پروجیکٹ کی کامیابی کے لیے سگنل سے بھرپور، غلطی سے پاک، اور اعلیٰ معیار کا ڈیٹا ضروری ہے۔ AI تھکاوٹ سے نمٹنے کے لیے ڈیٹا گورننس پر مضبوط توجہ کی ضرورت ہے۔ لہٰذا، ہمیں ڈیٹا کے درست معیار کو یقینی بنانے کے لیے سختی سے کام کرنا چاہیے، جدید ترین ماڈلز بنانے اور قابل اعتماد کاروباری بصیرت فراہم کرنے کی بنیاد رکھنی چاہیے۔

ڈیٹا کوالٹی

ڈیٹا کا معیار، ترقی پذیر ڈیٹا گورننس کی کلید، مشین لرننگ الگورتھم کے لیے کامیابی کا ایک اہم عنصر ہے۔ تنظیموں کو ڈیٹا کے معیار میں سرمایہ کاری کرنی چاہیے، جیسے کہ ڈیٹا صارفین کو رپورٹیں شائع کرنا۔ ڈیٹا سائنس پروجیکٹس میں، سوچیں کہ کیا ہوتا ہے جب خراب معیار کا ڈیٹا ماڈلز تک پہنچ جاتا ہے، جو خراب کارکردگی کا باعث بن سکتا ہے۔

صرف خرابی کے تجزیے کے دوران ہی ٹیموں کو ڈیٹا کے معیار کے خدشات کی نشاندہی کرنے کا موقع ملے گا، جو، جب اپ اسٹریم کو درست کرنے کے لیے بھیجا جاتا ہے، تو ٹیموں میں تھکاوٹ کا باعث بنتا ہے۔

واضح طور پر، یہ صرف کوشش ہی نہیں خرچ کی جاتی ہے، بلکہ صحیح اعداد و شمار کے داخل ہونے تک کافی وقت ضائع ہو جاتا ہے۔

اس لیے، یہ ہمیشہ مشورہ دیا جاتا ہے کہ ڈیٹا کے مسائل کو ماخذ پر ٹھیک کریں تاکہ اس طرح کے وقت ضائع ہونے والے تکرار کو روکا جا سکے۔ آخر کار، شائع شدہ ڈیٹا کے معیار کی رپورٹیں آنے والے ڈیٹا کے قابل قبول معیار کی سمجھ کے ساتھ ڈیٹا سائنس ٹیم (یا اس معاملے کے لیے، کسی بھی دوسرے بہاو استعمال کنندگان اور ڈیٹا صارفین) کی طرف اشارہ کرتی ہیں۔

ڈیٹا کوالٹی اور گورننس کے اقدامات کے بغیر، ڈیٹا سائنسدانوں پر ڈیٹا کے مسائل کا بوجھ بڑھ جائے گا، جو AI تھکاوٹ کو چلانے والے ناکام ماڈلز میں حصہ ڈالیں گے۔

پوسٹ نے ان دو مراحل پر روشنی ڈالی جن پر AI تھکاوٹ قائم ہوتی ہے اور یہ پیش کیا گیا کہ کس طرح ڈیٹا گورننس کے اقدامات جیسے کہ ڈیٹا کوالٹی رپورٹس قابل بھروسہ اور مضبوط ماڈلز کی تعمیر میں معاون ثابت ہو سکتی ہیں۔

ڈیٹا گورننس کے ذریعے ایک ٹھوس بنیاد قائم کر کے، تنظیمیں جوش و جذبے کو ابھارتے ہوئے، کامیاب اور بغیر کسی رکاوٹ کے AI کی ترقی اور اپنانے کا روڈ میپ بنا سکتی ہیں۔

اس بات کو یقینی بنانے کے لیے کہ پوسٹ AI کی تھکاوٹ کو دور کرنے کے مختلف طریقوں کا ایک جامع جائزہ پیش کرتی ہے، میں تنظیمی ثقافت کے کردار پر بھی زور دیتا ہوں، جو ڈیٹا گورننس جیسے دیگر بہترین طریقوں کے ساتھ مل کر، ڈیٹا سائنس ٹیموں کو بامعنی AI شراکتیں جلد بنانے کے قابل اور بااختیار بنائے گا۔ تیز تر

ودھی چُگ ایک AI سٹریٹجسٹ اور ایک ڈیجیٹل ٹرانسفارمیشن لیڈر ہے جو پراڈکٹ، سائنسز اور انجینئرنگ کے سنگم پر کام کر رہا ہے تاکہ اسکیل ایبل مشین لرننگ سسٹم بنایا جا سکے۔ وہ ایک ایوارڈ یافتہ اختراعی رہنما، مصنفہ اور بین الاقوامی اسپیکر ہیں۔ وہ مشین لرننگ کو جمہوری بنانے اور ہر ایک کے لیے اس تبدیلی کا حصہ بننے کے لیے اس جملے کو توڑنے کے مشن پر ہے۔