Опитування: проекти машинного навчання все ще регулярно не вдається розгорнути - KDnuggets

Перевидано Платоном

читають: 0

Як часто проекти машинного навчання успішно розгортаються? Не досить часто. Є багато of промисловість дослідження показ що проекти ML зазвичай не приносять прибутків, але мало хто оцінює співвідношення невдач і успіху з точки зору спеціалістів із обробки даних – людей, які розробляють ті самі моделі, які ці проекти мають розгортати.

слідом за опитування спеціалістів із обробки даних який я провів з KDnuggets минулого року, цьогорічного провідного дослідження Data Science Survey Rexer Analytics, яку проводить консалтингова компанія з машинного навчання, розглянула це питання – частково тому, що Карл Рексер, засновник і президент компанії, дозволив вашій справді взяти участь, спонукаючи до включення питань про успішне розгортання (частина моєї роботи під час однорічної роботи професора аналітики, яку я обіймав в УВА Дарден).

Новини не чудові. Лише 22% дослідників даних кажуть, що їхні «революційні» ініціативи – моделі, розроблені для впровадження нових процесів чи можливостей – зазвичай застосовуються. 43% кажуть, що 80% або більше не вдається розгорнути.

Через всі види проектів машинного навчання, включаючи оновлення моделей для існуючих розгортань, лише 32% кажуть, що їхні моделі зазвичай розгортаються.

Ось детальні результати цієї частини опитування, представлені компанією Rexer Analytics, з розподілом показників розгортання за трьома видами ініціатив МЛ:

Опитування: проекти машинного навчання все ще регулярно не вдається розгорнути

Умовні позначення:

Існуючі ініціативи: Моделі, розроблені для оновлення/оновлення існуючої моделі, яка вже була успішно розгорнута
Нові ініціативи: Моделі, розроблені для покращення існуючого процесу, для якого ще не було розгорнуто жодної моделі
Революційні ініціативи: Моделі, розроблені для створення нових процесів або можливостей

На мій погляд, ця боротьба за розгортання випливає з двох основних факторів: ендемічного недостатнього планування та відсутності конкретної видимості зацікавлених сторін у бізнесі. Багато фахівців з обробки даних і бізнес-лідерів не усвідомлюють, що передбачувана реалізація ML має бути спланована дуже детально та активно здійснюватися з самого початку кожного проекту ML.

Фактично, я написав нову книгу саме про це: The AI Playbook: Оволодіння рідкісним мистецтвом розгортання машинного навчання. У цій книзі я представляю шестиетапну практику, орієнтовану на розгортання, для впровадження проектів машинного навчання від концепції до розгортання, яку я називаю bizML (попередньо замовте тверду обкладинку або електронну книгу та отримайте безкоштовну розширену копію версії аудіокниги зразу).

Ключова зацікавлена сторона проекту ML – особа, відповідальна за операційну ефективність, яку необхідно покращити, наприклад керівник напряму діяльності – потребує чіткого уявлення про те, як саме ML покращить їхню діяльність і яку цінність очікується від покращення. Їм це потрібно, щоб остаточно дати дозвіл на розгортання моделі, а також щоб перед цим зважити виконання проекту на всіх етапах перед розгортанням.

Але продуктивність ML часто не вимірюється! Коли опитування Rexer запитало: «Як часто ваша компанія/організація оцінює ефективність аналітичних проектів?» лише 48% дослідників даних сказали «Завжди» або «Здебільшого». Це досить дико. Це має бути більше 99% або 100%.

І коли продуктивність вимірюється, то це з точки зору технічних показників, які є загадковими та здебільшого не мають відношення до зацікавлених сторін у бізнесі. Науковці даних знають краще, але зазвичай не дотримуються – частково, оскільки інструменти ML зазвичай обслуговують лише технічні показники. Згідно з опитуванням, спеціалісти з обробки даних оцінюють такі ключові показники ефективності бізнесу, як ROI та дохід, як найважливіші показники, але вони вказують технічні показники, такі як підйом і AUC, як найбільш часто вимірювані.

Технічні показники продуктивності «фундаментально марні для зацікавлених сторін у бізнесі та не пов’язані з ними», відповідно до Harvard Data Science Review. Ось чому: вони лише кажуть вам відносний продуктивність моделі, наприклад її порівняння з припущенням або іншою базовою лінією. Бізнес-метрики говорять вам про це абсолютний бізнес-цінність, яку очікується від моделі, або, під час оцінки після розгортання, що вона довела, що це забезпечує. Такі показники необхідні для проектів ML, орієнтованих на розгортання.

Окрім доступу до бізнес-метрик, бізнес-стейкхолдерам також потрібно наростити. Коли опитування Rexer запитало: «Чи менеджери та особи, які приймають рішення у вашій організації, які повинні схвалити розгортання моделі, достатньо обізнані, щоб приймати такі рішення з достатньою інформацією?» лише 49% респондентів відповіли «Здебільшого» або «Завжди».

Ось що, на мою думку, відбувається. «Клієнт» фахівця з обробки даних, зацікавлена сторона в бізнесі, часто охолоне, коли справа доходить до дозволу на розгортання, оскільки це означатиме внесення значних операційних змін у хліб з маслом компанії, її найбільш масштабні процеси. Вони не мають контекстної рамки. Наприклад, вони дивуються: «Як я можу зрозуміти, наскільки ця модель, яка за своїми характеристиками далеко не досконала, як кришталева куля, насправді допоможе?» Таким чином проект гине. Тоді творче додавання певного позитивного ефекту до «отриманих ідей» служить для того, щоб акуратно заховати невдачу під килим. Ажіотаж ШІ залишається незмінним, навіть якщо потенційна цінність, мета проекту, втрачається.

Щодо цієї теми – заохочення зацікавлених сторін – я викладу свою нову книгу, Посібник зі штучним інтелектом, ще раз. Охоплюючи практику bizML, книга також підвищує кваліфікацію бізнес-професіоналів, надаючи життєво важливу, але дружню дозу напівтехнічних базових знань, необхідних усім зацікавленим сторонам, щоб керувати проектами машинного навчання або брати участь у них від кінця до кінця. Це об’єднує бізнес-професіоналів і фахівців із обробки даних, щоб вони могли тісно співпрацювати, спільно встановлюючи точні для прогнозування чого покликане машинне навчання, наскільки добре воно прогнозує та як його прогнози застосовуються для покращення операцій. Ці основні принципи створюють або руйнують кожну ініціативу – правильне їхнє використання прокладає шлях до розгортання машинного навчання, орієнтованого на цінності.

Можна з упевненістю сказати, що тут все складно, особливо для нових ініціатив МЛ, які вперше пробують. Оскільки абсолютна сила штучного інтелекту втрачає здатність постійно надолужувати

менше реалізованої вартості, ніж обіцяно, буде все більше і більше тиску, щоб довести операційну цінність ML.? Тож я кажу: випередьте це зараз – почніть прищеплювати ефективнішу культуру співпраці між підприємствами та орієнтоване на розгортання керівництво проектом!

Для більш детальних результатів з Наукове дослідження даних Rexer Analytics за 2023 рік, Натисніть тут. Це найбільше опитування професіоналів із науки про дані та аналітики в галузі. Він складається приблизно з 35 відкритих запитань із вибіркою відповідей, які охоплюють набагато більше, ніж лише рівень успішності розгортання – сім загальних галузей науки та практики інтелектуального аналізу даних: (1) Область і цілі, (2) Алгоритми, (3) Моделі, ( 4) Інструменти (використані пакети програмного забезпечення), (5) Технологія, (6) Виклики та (7) Майбутнє. Він проводиться як послуга (без корпоративного спонсорства) для наукової спільноти даних, а результати зазвичай оголошуються на конференція Machine Learning Week і розповсюджуються у вільно доступних підсумкових звітах.

Ця стаття є результатом роботи автора, який протягом одного року обіймав посаду професора аналітики з нагоди 200-річчя тіла в Дарденській школі бізнесу UVA, яка зрештою завершилася публікацією The AI Playbook: Оволодіння рідкісним мистецтвом розгортання машинного навчання (пропозиція безкоштовної аудіокниги).

Ерік Зігель, Ph.D., є провідним консультантом і колишнім професором Колумбійського університету, який робить машинне навчання зрозумілим і захоплюючим. Він є засновником Світ прогнозної аналітики і Світ глибокого навчання серії конференцій, які обслуговували понад 17,000 2009 відвідувачів з XNUMX року, інструктор відомого курсу Лідерство та практика машинного навчання – наскрізна майстерність, популярний оратор, якого замовляли Понад 100 основних виступівта виконавчий редактор Часи машинного навчання. Він автор бестселера Прогнозна аналітика: можливість передбачити, хто натисне, купить, збреше чи помре, який використовувався в курсах у понад 35 університетах, і він отримав нагороди за викладання, коли був професором Колумбійського університету, де він співав навчальні пісні своїм учням. Ерік також публікує доповіді з аналітики та соціальної справедливості. Слідуйте за ним @predictanalytic.

Більше на цю тему

Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
джерело: https://www.kdnuggets.com/survey-machine-learning-projects-still-routinely-fail-to-deploy?utm_source=rss&utm_medium=rss&utm_campaign=survey-machine-learning-projects-still-routinely-fail-to-deploy

Часова мітка: Січень 8, 2024

Часова мітка: Листопад 23, 2023

Перевидано Платоном

Розвиток ChatOps/LMOps

Методи зменшення вибірки за допомогою Python – KDnuggets

7 кроків до оволодіння технікою очищення та попередньої обробки даних – KDnuggets

Введення в ланцюги Маркова

Як вчені з даних можуть конкурувати на глобальному ринку праці

Підробляйте, поки не зробите: створення реалістичних синтетичних наборів даних клієнтів

Представляємо PostHog: платформу для аналізу продуктів з відкритим кодом

Про нас

Вертикальний пошук & Ai

платформа

Залишайтеся на зв'язку

рахунки