Зображення автора
Управління даними та втома ШІ звучать як дві різні концепції, але між ними існує внутрішній зв’язок. Щоб краще це зрозуміти, почнемо з їх визначення.
Це був основний фокус індустрії даних протягом тривалого часу.
Google добре формулює це: «Управління даними — це все, що ви робите, щоб забезпечити безпеку, конфіденційність, точність, доступність і придатність до використання. Це передбачає встановлення внутрішніх стандартів — політики щодо даних — які стосуються того, як дані збираються, зберігаються, обробляються та утилізуються».
Як підкреслює це визначення, управління даними стосується керування даними – саме механізмом, що керує моделями ШІ.
Тепер, коли почали з’являтися перші ознаки зв’язку між управлінням даними та ШІ, давайте пов’яжемо це з втомою ШІ. Хоча назва видає це, висвітлення причин, що призводять до такої втоми, забезпечує послідовне використання цього терміну в усьому дописі.
Втома від штучного інтелекту виникає через невдачі та проблеми, з якими стикаються організації, розробники або команди, що часто призводить до невдалої реалізації цінностей або впровадження систем штучного інтелекту.
Здебільшого все починається з нереалістичних очікувань щодо того, на що здатний ШІ. Для складних технологій, таких як штучний інтелект, ключовим зацікавленим сторонам потрібно узгодити не лише можливості та можливості штучного інтелекту, але й його обмеження та ризики.
Говорячи про ризики, етику часто вважають запізнілою думкою, яка призводить до скасування невідповідних ініціатив ШІ.
Ви, мабуть, задаєтеся питанням про роль управління даними у спричиненні втоми ШІ – передумови цієї публікації.
Ось куди ми прямуємо далі.
Втому штучного інтелекту можна загалом класифікувати як перед розгортанням і після розгортання. Давайте спочатку зосередимося на попередньому розгортанні.
Попереднє розгортання
Різні фактори сприяють переходу підтвердження концепції (PoC) до розгортання, наприклад:
- Що ми намагаємося вирішити?
- Чому визначити пріоритети зараз стає важливою проблемою?
- Які дані доступні?
- Чи можна це розв’язати за допомогою ML?
- Чи є у даних шаблон?
- Чи повторюється явище?
- Які додаткові дані підвищать ефективність моделі?
Зображення з Freepik
Після того, як ми визначили, що проблему можна найкраще вирішити за допомогою алгоритмів машинного навчання, команда аналізу даних проводить дослідницький аналіз даних. На цьому етапі розкривається багато базових шаблонів даних, що підкреслює, чи надані дані багаті сигналом. Це також допомагає створювати інженерні функції для прискорення процесу навчання алгоритму.
Далі команда створює першу базову модель, часто виявляючи, що вона не працює на прийнятному рівні. Модель, продуктивність якої така ж хороша, як підкидання монети, не додає жодної цінності. Це одна з перших невдач, або уроків, під час створення моделей ML.
Організації можуть переходити від однієї бізнес-проблеми до іншої, викликаючи втому. Проте, якщо базові дані не містять насиченого сигналу, жоден алгоритм штучного інтелекту не зможе на них побудуватися. Модель повинна вивчити статистичні асоціації з навчальних даних, щоб узагальнити невидимі дані.
Після розгортання
Незважаючи на те, що навчена модель демонструє багатообіцяючі результати під час перевірки, відповідно до кваліфікаційних бізнес-критеріїв, таких як точність 70%, все одно може виникнути втома, якщо модель не працює належним чином у виробничому середовищі.
Цей тип втоми ШІ називається фазою після розгортання.
Безліч причин може призвести до погіршення продуктивності, де найпоширенішою проблемою моделі є низька якість даних. Це обмежує здатність моделі точно передбачати цільову реакцію за відсутності важливих атрибутів.
Подумайте про те, коли одна з важливих функцій, яка була відсутня лише на 10% у навчальних даних, тепер стає нульовою у 50% випадків у виробничих даних, що призводить до помилкових прогнозів. Подібні ітерації та спроби забезпечити безперебійну роботу моделей викликають втому в дослідників даних і бізнес-команд, тим самим підриваючи довіру до каналів даних і ризикуючи інвестиціями, зробленими в проект.
Надійні заходи управління даними мають вирішальне значення для боротьби з обома типами втоми ШІ. З огляду на те, що дані є основою моделей ML, насичені сигналами, безпомилкові та високоякісні дані є обов’язковими для успіху проекту ML. Для вирішення проблеми втоми штучного інтелекту необхідно зосередитися на управлінні даними. Отже, ми повинні наполегливо працювати над забезпеченням належної якості даних, закладаючи основу для побудови найсучасніших моделей і надання достовірної інформації про бізнес.
Якість даних
Якість даних, ключ до успішного управління даними, є критично важливим фактором успіху для алгоритмів машинного навчання. Організації повинні інвестувати в якість даних, наприклад, публікувати звіти для споживачів даних. У проектах з вивчення даних подумайте, що відбувається, коли дані поганої якості потрапляють до моделей, що може призвести до низької продуктивності.
Лише під час аналізу помилок команди можуть виявити проблеми з якістю даних, які, коли їх надсилають на виправлення, викликають втому серед команд.
Зрозуміло, що це не просто витрачені зусилля, але й багато часу, поки не почнуть надходити потрібні дані.
Тому завжди рекомендується виправляти проблеми з даними в джерелі, щоб запобігти таким трудомістким ітераціям. Зрештою, опубліковані звіти про якість даних посилаються на команду з вивчення даних (або, якщо на те пішло, на будь-яких інших подальших користувачів і споживачів даних) із розумінням прийнятної якості вхідних даних.
Без заходів із забезпечення якості даних і управління науковці будуть перевантажені проблемами з даними, що призведе до невдалих моделей, що призведе до втоми ШІ.
У публікації висвітлено два етапи, на яких виникає втома ШІ, і показано, як заходи управління даними, такі як звіти про якість даних, можуть сприяти створенню надійних і надійних моделей.
Встановивши міцну основу за допомогою управління даними, організації можуть побудувати дорожню карту для успішної та безперебійної розробки та впровадження штучного інтелекту, вселяючи ентузіазм.
Щоб переконатися, що публікація дає цілісний огляд різноманітних способів вирішення проблеми втоми ШІ, я також наголошую на ролі організаційної культури, яка в поєднанні з іншими передовими практиками, як-от керування даними, дозволить і розширить можливості команд з вивчення даних робити суттєвий внесок ШІ швидше та швидше.
Відхі Чуг є стратегом штучного інтелекту та лідером цифрової трансформації, який працює на стику продуктів, науки та інженерії для створення масштабованих систем машинного навчання. Вона є визнаним лідером інновацій, автором і міжнародним доповідачем. Вона прагне демократизувати машинне навчання та позбутися жаргону, щоб кожен міг стати частиною цієї трансформації.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://www.kdnuggets.com/can-data-governance-address-ai-fatigue?utm_source=rss&utm_medium=rss&utm_campaign=can-data-governance-address-ai-fatigue
- : має
- :є
- : ні
- :де
- $UP
- a
- здатність
- МЕНЮ
- прийнятний
- точний
- точно
- Додатковий
- адреса
- адресація
- Додає
- адекватно
- Прийняття
- порадив
- AI
- Моделі AI
- Системи ШІ
- ака
- алгоритм
- алгоритми
- вирівнювати
- Також
- завжди
- серед
- an
- аналіз
- та
- Інший
- будь-який
- Застосовувати
- ЕСТЬ
- виникати
- AS
- асоціаціях
- At
- Атрибути
- автор
- доступний
- нагородами
- геть
- поганий
- Базова лінія
- BE
- стає
- було
- КРАЩЕ
- передового досвіду
- Краще
- між
- обидва
- Перерва
- широко
- будувати
- Створюємо
- Будує
- бізнес
- але
- by
- званий
- CAN
- можливості
- здатний
- нести
- викликаючи
- проблеми
- Монета
- комбінований
- загальний
- переконливий
- концепція
- поняття
- Турбота
- довіра
- зв'язку
- вважається
- послідовний
- послідовно
- Споживачі
- сприяти
- внесок
- внески
- Core
- може
- створювати
- Критерії
- критичний
- вирішальне значення
- культура
- дані
- аналіз даних
- якість даних
- наука про дані
- визначення
- доставляти
- демократизувати
- розгортання
- розробників
- розробка
- різний
- цифровий
- цифрове перетворення
- do
- робить
- водіння
- два
- під час
- зусилля
- зусилля
- з'являтися
- підкреслити
- уповноважувати
- включіть
- активатор
- кінець
- двигун
- інженерії
- Машинобудування
- забезпечувати
- гарантує
- ентузіазм
- Навколишнє середовище
- помилка
- істотний
- налагодження
- Ефір (ETH)
- етика
- оцінюється
- врешті-решт
- все
- все
- очікування
- Дослідницький аналіз даних
- Face
- фактор
- фактори
- зазнає невдачі
- швидше
- втому
- риси
- виявлення
- Перший
- виправляти
- фіксованою
- Flip
- Сфокусувати
- для
- фонд
- від
- зібраний
- отримати
- даний
- дає
- добре
- управління
- основи
- відбувається
- Мати
- Тема
- допомагає
- високоякісний
- Виділено
- виділивши
- основний момент
- цілісний
- Як
- HTTPS
- i
- ідентифікувати
- if
- реалізація
- in
- Вхідний
- промисловість
- ініціативи
- інновація
- розуміння
- внутрішній
- Міжнародне покриття
- перетин
- в
- сутнісний
- Invest
- інвестиції
- включає в себе
- питання
- питання
- IT
- ітерації
- ЙОГО
- жаргон
- просто
- KDnuggets
- ключ
- укладка
- вести
- лідер
- провідний
- Веде за собою
- УЧИТЬСЯ
- вивчення
- Уроки
- дозволяти
- рівень
- як
- недоліки
- рамки
- Лінія
- LINK
- Довго
- багато часу
- втрачений
- серія
- машина
- навчання за допомогою машини
- made
- зробити
- РОБОТИ
- управління
- багато
- Матерія
- Може..
- значущим
- заходи
- середа
- відсутній
- Місія
- ML
- Алгоритми ML
- модель
- Моделі
- найбільш
- в основному
- рухатися
- повинен
- ім'я
- Необхідність
- наступний
- немає
- зараз
- of
- часто
- on
- ONE
- тільки
- or
- організаційної
- організації
- Інше
- вихід
- огляд
- частина
- Викрійки
- моделі
- виконувати
- продуктивність
- виконанні
- виступає
- фаза
- явище
- труба
- місце
- plato
- Інформація про дані Платона
- PlatoData
- PoC
- бідні
- можливостей
- пошта
- практики
- точно
- Точність
- передбачати
- Прогнози
- представлений
- запобігати
- Пріоритетність
- приватний
- Проблема
- процес
- оброблена
- Product
- Production
- проект
- проектів
- перспективний
- доказ
- доказ концепції
- опублікований
- Видавничий
- Ставить
- кваліфікаційний
- якість
- дані про якість
- реалізація
- Причини
- повторюваний
- Звіти
- Вимагається
- відповідь
- результати
- Багаті
- право
- ризикуючи
- ризики
- Дорожня карта
- міцний
- Роль
- масштабовані
- наука
- НАУКИ
- Вчені
- безшовні
- безпечний
- посланий
- комплект
- Невдачі
- набори
- установка
- вона
- показ
- Сигнал
- Ознаки
- So
- solid
- ВИРІШИТИ
- вирішити
- складний
- Звучати
- Source
- Гучномовець
- швидкість
- Стажування
- етапи
- зацікавлених сторін
- старт
- почалася
- починається
- впроваджений
- статистичний
- Як і раніше
- зберігати
- Стратег
- сильний
- успіх
- успішний
- такі
- Systems
- вирішення проблем
- Мета
- команда
- команди
- Технології
- термін
- Що
- Команда
- їх
- Там.
- тим самим
- думати
- це
- хоча?
- процвітає
- через
- по всьому
- час
- трудомісткий
- до
- навчений
- Навчання
- Перетворення
- заслуговуючий довіри
- намагається
- два
- тип
- Типи
- непокритий
- що лежить в основі
- розуміти
- розуміння
- до
- на
- us
- корисний
- використання
- користувачі
- використання
- перевірка достовірності
- значення
- було
- шлях..
- способи
- we
- ДОБРЕ
- Що
- коли
- Чи
- який
- в той час як
- чий
- волі
- з
- цікаво
- Work
- робочий
- б
- ви
- зефірнет