آیا مدیریت داده می تواند خستگی هوش مصنوعی را برطرف کند؟ - KDnuggets

بازنشر افلاطون

دنبال: 0

آیا مدیریت داده می تواند خستگی هوش مصنوعی را برطرف کند؟
تصویر توسط نویسنده

مدیریت داده و خستگی هوش مصنوعی به نظر دو مفهوم متفاوت هستند، اما یک ارتباط ذاتی بین این دو وجود دارد. برای درک بهتر، اجازه دهید با تعریف آنها شروع کنیم.

برای مدت طولانی تمرکز اصلی صنعت داده بوده است.

گوگل به خوبی بیان می کند - «حاکمیت داده هر کاری است که شما انجام می دهید تا مطمئن شوید داده ها امن، خصوصی، دقیق، در دسترس و قابل استفاده هستند. این شامل تنظیم استانداردهای داخلی - سیاست های داده - است که در مورد نحوه جمع آوری، ذخیره، پردازش و دفع داده ها اعمال می شود.

همانطور که این تعریف نشان می‌دهد، حاکمیت داده مربوط به مدیریت داده‌ها است - دقیقاً موتورهای محرک مدل‌های هوش مصنوعی.

اکنون که اولین نشانه‌های ارتباط بین حاکمیت داده و هوش مصنوعی ظاهر شده است، بیایید آن را به خستگی هوش مصنوعی مرتبط کنیم. اگرچه نام آن را نشان می دهد، اما برجسته کردن دلایلی که منجر به چنین خستگی می شود، استفاده مداوم از این اصطلاح را در سراسر پست تضمین می کند.

خستگی هوش مصنوعی به دلیل مشکلات و چالش‌هایی که سازمان‌ها، توسعه‌دهندگان یا تیم‌ها با آن روبرو هستند، ایجاد می‌شود که اغلب منجر به تحقق ارزش یا پیاده‌سازی ناموفق سیستم‌های هوش مصنوعی می‌شود.

بیشتر با انتظارات غیرواقعی از توانایی های هوش مصنوعی شروع می شود. برای فناوری‌های پیچیده‌ای مانند هوش مصنوعی، ذینفعان کلیدی باید نه تنها با قابلیت‌ها و امکانات هوش مصنوعی، بلکه با محدودیت‌ها و خطرات آن همسو شوند.

صحبت در مورد خطرات، اخلاق اغلب به عنوان یک فکر بعدی در نظر گرفته می شود که منجر به حذف ابتکارات هوش مصنوعی غیرمنطبق می شود.

شما باید در مورد نقش حاکمیت داده در ایجاد خستگی هوش مصنوعی تعجب کنید - فرض این پست.

این جایی است که ما در مرحله بعدی قرار داریم.

خستگی هوش مصنوعی را می توان به طور کلی به عنوان پیش از استقرار و پس از استقرار طبقه بندی کرد. اجازه دهید ابتدا روی پیش از استقرار تمرکز کنیم.

پیش از استقرار

عوامل مختلفی در فارغ التحصیلی اثبات مفهوم (PoC) برای استقرار نقش دارند، مانند:

ما برای حل چه چیزی تلاش می کنیم؟
چرا اکنون اولویت بندی یک مشکل قانع کننده ایجاد می کند؟
چه داده هایی در دسترس است؟
آیا در وهله اول ML قابل حل است؟
آیا داده ها الگو دارند؟
آیا این پدیده قابل تکرار است؟
چه داده های اضافی عملکرد مدل را افزایش می دهد؟

آیا مدیریت داده می تواند خستگی هوش مصنوعی را برطرف کند؟
تصویر از Freepik

هنگامی که ارزیابی کردیم که مشکل را می توان با استفاده از الگوریتم های ML به بهترین شکل حل کرد، تیم علم داده تجزیه و تحلیل داده های اکتشافی را انجام می دهد. بسیاری از الگوهای داده های زیربنایی در این مرحله آشکار می شوند، که نشان می دهد داده های داده شده از نظر سیگنال غنی هستند یا خیر. همچنین به ایجاد ویژگی های مهندسی شده برای سرعت بخشیدن به فرآیند یادگیری الگوریتم کمک می کند.

در مرحله بعد، تیم اولین مدل پایه را ایجاد می کند، اغلب، و متوجه می شود که در سطح قابل قبولی عمل نمی کند. مدلی که خروجی آن به خوبی یک سکه است هیچ ارزشی اضافه نمی کند. این یکی از اولین شکست‌ها، دروس مستعار، هنگام ساخت مدل‌های ML است.

سازمان ها ممکن است از یک مشکل تجاری به مشکل دیگر حرکت کنند و باعث خستگی شوند. با این حال، اگر داده‌های زیربنایی سیگنال غنی را حمل نکنند، هیچ الگوریتم هوش مصنوعی نمی‌تواند بر روی آن ایجاد کند. مدل باید ارتباط های آماری را از داده های آموزشی بیاموزد تا داده های دیده نشده را تعمیم دهد.

پس از استقرار

علیرغم اینکه مدل آموزش دیده نتایج امیدوارکننده‌ای را در مجموعه اعتبارسنجی نشان می‌دهد، مطابق با معیارهای کسب‌وکار واجد شرایط، مانند دقت 70 درصد، اگر مدل نتواند به اندازه کافی در محیط تولید عمل کند، خستگی ممکن است ایجاد شود.

این نوع خستگی هوش مصنوعی مرحله پس از استقرار نامیده می شود.

دلایل بی‌شماری می‌تواند منجر به بدتر شدن عملکرد شود، جایی که کیفیت پایین داده رایج‌ترین مشکلی است که مدل را آزار می‌دهد. توانایی مدل را برای پیش‌بینی دقیق پاسخ هدف در غیاب ویژگی‌های حیاتی محدود می‌کند.

زمانی را در نظر بگیرید که یکی از ویژگی‌های اساسی که تنها 10 درصد در داده‌های آموزشی وجود نداشت، اکنون در 50 درصد مواقع در داده‌های تولید باطل می‌شود که منجر به پیش‌بینی‌های اشتباه می‌شود. چنین تکرارها و تلاش‌هایی برای اطمینان از اجرای مداوم مدل‌ها باعث ایجاد خستگی در دانشمندان داده و تیم‌های تجاری می‌شود و در نتیجه اعتماد به خطوط لوله داده را از بین می‌برد و سرمایه‌گذاری‌های انجام شده در پروژه را به خطر می‌اندازد.

اقدامات قوی حاکمیت داده در مقابله با هر دو نوع خستگی هوش مصنوعی بسیار مهم است. با توجه به اینکه داده ها در هسته مدل های ML قرار دارند، داده های غنی از سیگنال، بدون خطا و با کیفیت بالا برای موفقیت یک پروژه ML ضروری است. پرداختن به خستگی هوش مصنوعی نیازمند تمرکز قوی بر مدیریت داده است. بنابراین، ما باید با جدیت کار کنیم تا از کیفیت داده‌های مناسب اطمینان حاصل کنیم، و زمینه را برای ساخت مدل‌های پیشرفته و ارائه بینش‌های تجاری قابل اعتماد فراهم کنیم.

کیفیت داده

کیفیت داده، کلید موفقیت مدیریت داده، یک عامل موفقیت حیاتی برای الگوریتم‌های یادگیری ماشین است. سازمان‌ها باید روی کیفیت داده‌ها سرمایه‌گذاری کنند، مانند انتشار گزارش‌ها برای مصرف‌کنندگان داده. در پروژه‌های علم داده، به این فکر کنید که چه اتفاقی می‌افتد وقتی داده‌های با کیفیت بد به مدل‌ها راه پیدا می‌کنند، که می‌تواند منجر به عملکرد ضعیف شود.

تنها در طول تجزیه و تحلیل خطا، تیم‌ها می‌توانند نگرانی‌های مربوط به کیفیت داده‌ها را شناسایی کنند، که وقتی برای رفع مشکل ارسال می‌شوند، در نهایت باعث خستگی تیم‌ها می‌شوند.

واضح است که این فقط تلاشی نیست که صرف می شود، بلکه زمان زیادی از دست می رود تا داده های مناسب شروع به ورود کنند.

از این رو، همیشه توصیه می شود که مشکلات داده را در منبع رفع کنید تا از تکرارهای وقت گیر جلوگیری شود. در نهایت، گزارش‌های کیفیت داده‌های منتشر شده به تیم علم داده (یا در این مورد، سایر کاربران پایین دستی و مصرف‌کنندگان داده) با درک کیفیت قابل قبول داده‌های ورودی اشاره می‌کنند.

بدون معیارهای نظارتی و کیفیت داده، دانشمندان داده‌ها با مشکلات داده‌ای بیش از حد تحت فشار قرار می‌گیرند که به مدل‌های ناموفق منجر به خستگی هوش مصنوعی کمک می‌کند.

این پست دو مرحله‌ای را که خستگی هوش مصنوعی ایجاد می‌شود برجسته کرد و نشان داد که چگونه اقدامات حاکمیتی داده‌ها مانند گزارش‌های کیفیت داده‌ها می‌تواند عاملی برای ساخت مدل‌های قابل اعتماد و قوی باشد.

با ایجاد یک پایه محکم از طریق حاکمیت داده، سازمان ها می توانند یک نقشه راه برای توسعه و پذیرش موفق و یکپارچه هوش مصنوعی ایجاد کنند و شور و شوق را القا کنند.

برای اطمینان از اینکه این پست یک نمای کلی از روش‌های مختلف رفع خستگی هوش مصنوعی ارائه می‌دهد، من همچنین بر نقش فرهنگ سازمانی تأکید می‌کنم، که همراه با بهترین روش‌ها مانند حاکمیت داده، تیم‌های علم داده را قادر می‌سازد و به آنها قدرت می‌دهد تا زودتر مشارکت‌های معنادار هوش مصنوعی را ایجاد کنند. سریعتر

ویدی چوغ یک استراتژیست هوش مصنوعی و یک رهبر تحول دیجیتال است که در تقاطع محصولات، علوم و مهندسی کار می کند تا سیستم های یادگیری ماشینی مقیاس پذیر را بسازد. او یک رهبر نوآوری برنده جایزه، نویسنده و سخنران بین المللی است. او در ماموریتی است که یادگیری ماشینی را دموکراتیزه کند و این اصطلاح را بشکند تا همه بخشی از این تحول باشند.