Цю публікацію написано спільно з Джаядіпом Паббісетті, старшим спеціалістом з розробки даних у Merck, і Прабакараном Матхаяном, старшим інженером з ML у Tiger Analytics.
Життєвий цикл розробки моделі великого машинного навчання (ML) вимагає масштабованого процесу випуску моделі, подібного до процесу розробки програмного забезпечення. Розробники моделей часто працюють разом над розробкою моделей ML і потребують надійної платформи MLOps для роботи. Масштабована платформа MLOps повинна містити процес обробки робочого процесу реєстру моделей ML, затвердження та просування на наступний рівень середовища (розробка, тестування). , UAT або виробництво).
Розробник моделі зазвичай починає працювати в окремому середовищі розробки ML Amazon SageMaker. Коли модель навчена та готова до використання, її потрібно затвердити після реєстрації в Реєстр моделей Amazon SageMaker. У цій публікації ми обговорюємо, як команда AWS AI/ML співпрацювала з командою Merck Human Health IT MLOps, щоб створити рішення, яке використовує автоматизований робочий процес для затвердження та просування моделі ML із втручанням людини.
Огляд рішення
Ця публікація зосереджена на рішенні робочого процесу, яке життєвий цикл розробки моделі ML може використовувати між конвеєром навчання та конвеєром висновків. Рішення забезпечує масштабований робочий процес для MLO, підтримуючи процес затвердження моделі ML і просування за допомогою втручання людини. Модель ML, зареєстровану фахівцем із даних, потребує перевірки та схвалення, перш ніж її використовувати для конвеєра висновків і на наступному рівні середовища (тестування, UAT або виробництво). Розчин використовує AWS Lambda, API -шлюз Amazon, Amazon EventBridgeі SageMaker для автоматизації робочого процесу із втручанням людського схвалення посередині. На наступній діаграмі архітектури показано загальний дизайн системи, використовувані сервіси AWS і робочий процес для затвердження та просування моделей ML із втручанням людини від розробки до виробництва.
Робочий процес включає наступні кроки:
- Конвеєр навчання розробляє та реєструє модель у реєстрі моделей SageMaker. На даний момент статус моделі є
PendingManualApproval
. - EventBridge відстежує події зміни статусу, щоб автоматично виконувати дії за простими правилами.
- Правило події реєстрації моделі EventBridge викликає функцію Lambda, яка створює електронний лист із посиланням для схвалення або відхилення зареєстрованої моделі.
- Особа, яка затверджує, отримує електронний лист із посиланням для перегляду та схвалення або відхилення моделі.
- Особа, яка затверджує, затверджує модель, перейшовши за посиланням у електронному листі на кінцеву точку API Gateway.
- Шлюз API викликає функцію Lambda, щоб ініціювати оновлення моделі.
- Реєстр моделей оновлено для стану моделі (
Approved
для середовища розробників, алеPendingManualApproval
для тестування, UAT і виробництва). - Деталі моделі зберігаються в Сховище параметрів AWS, здатність Менеджер систем AWS, включаючи версію моделі, затверджене цільове середовище, пакет моделі.
- Конвеєр виведення отримує модель, затверджену для цільового середовища, зі сховища параметрів.
- Функція лямбда-сповіщень після виводу збирає метрики пакетного висновку та надсилає електронний лист затверджувачу для просування моделі в наступне середовище.
Передумови
Робочий процес у цій публікації передбачає, що середовище для конвеєра навчання налаштовано в SageMaker разом з іншими ресурсами. Вхідними даними в навчальний конвеєр є набір даних функцій. Деталі створення функцій не включені в цю публікацію, але вона зосереджена на реєстрі, затвердженні та просуванні моделей ML після їх навчання. Модель зареєстровано в реєстрі моделей і регулюється системою моніторингу в Монітор моделі Amazon SageMaker виявити будь-який дрейф і перейти до перенавчання у випадку дрейфу моделі.
Деталі робочого процесу
Робочий процес затвердження починається з моделі, розробленої з конвеєра навчання. Коли дослідники даних розробляють модель, вони реєструють її в реєстрі моделей SageMaker зі статусом моделі PendingManualApproval
. EventBridge відстежує SageMaker для події реєстрації моделі та запускає правило події, яке викликає функцію Lambda. Функція Lambda динамічно створює електронний лист для схвалення моделі з посиланням на кінцеву точку API Gateway на іншу функцію Lambda. Коли затверджувач переходить за посиланням, щоб затвердити модель, API Gateway пересилає дію затвердження до функції Lambda, яка оновлює реєстр моделі SageMaker і атрибути моделі в сховищі параметрів. Особа, яка затверджує, має бути автентифікованою та бути частиною групи затверджувачів, якою керує Active Directory. Початкове затвердження позначає модель як Approved
для розробників але PendingManualApproval
для тестування, UAT і виробництва. Атрибути моделі, збережені в Parameter Store, включають версію моделі, пакет моделі та затверджене цільове середовище.
Коли конвеєр виведення потребує отримання моделі, він перевіряє сховище параметрів на наявність останньої версії моделі, затвердженої для цільового середовища, і отримує деталі виведення. Коли конвеєр висновків завершено, зацікавленій стороні надсилається електронний лист зі сповіщенням після висновку із запитом на схвалення для просування моделі на наступний рівень середовища. Електронний лист містить відомості про модель і показники, а також посилання для схвалення на кінцеву точку API Gateway для функції Lambda, яка оновлює атрибути моделі.
Нижче наведено послідовність подій і етапів впровадження для робочого процесу затвердження/просування моделі ML від створення моделі до виробництва. Модель просувається від середовища розробки до середовища тестування, UAT і виробництва з чітким схваленням людини на кожному кроці.
Ми починаємо з навчального конвеєра, який готовий до розробки моделі. Версія моделі починається з 0 у реєстрі моделей SageMaker.
- Конвеєр навчання SageMaker розробляє та реєструє модель у реєстрі моделей SageMaker. Модель версії 1 зареєстрована і починається з Очікує на затвердження вручну Статус.Метадані реєстру моделей мають чотири спеціальні поля для середовищ:
dev, test, uat
таprod
. - EventBridge відстежує реєстр моделі SageMaker на предмет зміни статусу, щоб автоматично виконувати дії за простими правилами.
- Правило події реєстрації моделі викликає функцію Lambda, яка створює електронний лист із посиланням для схвалення або відхилення зареєстрованої моделі.
- Особа, яка затверджує, отримує електронний лист із посиланням для перегляду та схвалення (або відхилення) моделі.
- Особа, яка затверджує, затверджує модель, перейшовши за посиланням на кінцеву точку API Gateway в електронному листі.
- API Gateway викликає функцію Lambda, щоб ініціювати оновлення моделі.
- Реєстр моделей SageMaker оновлюється відповідно до статусу моделі.
- Детальна інформація про модель зберігається в Parameter Store, включаючи версію моделі, затверджене цільове середовище та пакет моделі.
- Конвеєр виведення отримує модель, затверджену для цільового середовища, зі сховища параметрів.
- Функція лямбда-сповіщень після виводу збирає метрики пакетного висновку та надсилає електронний лист затверджувачу для просування моделі в наступне середовище.
- Особа, яка затверджує, затверджує просування моделі на наступний рівень, перейшовши за посиланням на кінцеву точку шлюзу API, що запускає функцію Lambda для оновлення реєстру моделей SageMaker і сховища параметрів.
Повна історія версії та затвердження моделі зберігається для перегляду в сховищі параметрів.
Висновок
Великий життєвий цикл розробки моделі ML вимагає масштабованого процесу затвердження моделі ML. У цій публікації ми поділилися реалізацією робочого процесу реєстру моделей ML, затвердження та просування за допомогою людського втручання за допомогою реєстру моделей SageMaker, EventBridge, API Gateway і Lambda. Якщо ви розглядаєте процес розробки масштабованої моделі ML для своєї платформи MLOps, ви можете виконати кроки, наведені в цій публікації, щоб реалізувати подібний робочий процес.
Про авторів
Том Кім є старшим архітектором рішень в AWS, де він допомагає своїм клієнтам досягати їхніх бізнес-цілей, розробляючи рішення на AWS. Він має значний досвід архітектури корпоративних систем і роботи в кількох галузях, зокрема в охороні здоров’я та науках про життя. Том постійно вивчає нові технології, які ведуть до бажаних бізнес-результатів для клієнтів – напр. AI/ML, GenAI та аналіз даних. Він також любить подорожувати в нові місця та грати на нових полях для гольфу, коли знаходить час.
Шаміка Аріяванса, обіймаючи посаду старшого архітектора рішень AI/ML у відділі охорони здоров’я та наук про життя в Amazon Web Services (AWS), спеціалізується на генеративному штучному інтелекті, зосереджуючись на навчанні Large Language Model (LLM), оптимізації висновків і MLOps (машинне навчання). Операції). Він скеровує клієнтів у впровадженні вдосконаленого Generative AI у їхні проекти, забезпечуючи надійні процеси навчання, ефективні механізми висновків і спрощені практики MLOps для ефективних і масштабованих рішень AI. Окрім своїх професійних зобов’язань, Шаміка пристрасно займається лижним спортом та пригодами на бездоріжжі.
Джаядіп Паббісетті є старшим інженером з ML/Data в Merck, де він проектує та розробляє рішення ETL і MLOps, щоб розблокувати науку про дані та аналітику для бізнесу. Він завжди з ентузіазмом вивчає нові технології, досліджує нові шляхи та отримує навички, необхідні для розвитку в ІТ-галузі, що постійно змінюється. У вільний час він займається спортом і любить подорожувати та досліджувати нові місця.
Прабакаран Матхаян є старшим інженером з машинного навчання в Tiger Analytics LLC, де він допомагає своїм клієнтам досягати їхніх бізнес-цілей, надаючи рішення для побудови моделей, навчання, перевірки, моніторингу, CICD та вдосконалення рішень машинного навчання на AWS. Prabakaran постійно вивчає нові технології, які ведуть до бажаних бізнес-результатів для клієнтів – напр. AI/ML, GenAI, GPT і LLM. Він також із задоволенням грає в крикет, коли знаходить час.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://aws.amazon.com/blogs/machine-learning/build-an-amazon-sagemaker-model-registry-approval-and-promotion-workflow-with-human-intervention/
- : має
- :є
- : ні
- :де
- $UP
- 1
- 100
- 110
- 116
- a
- МЕНЮ
- Achieve
- придбання
- через
- дію
- дії
- активний
- Active Directory
- просунутий
- пригод
- після
- AI
- AI / ML
- по
- Також
- завжди
- Amazon
- Amazon SageMaker
- Amazon Web Services
- Веб-служби Amazon (AWS)
- an
- аналітика
- та
- Інший
- будь-який
- API
- твердження
- схвалювати
- затверджений
- архітектура
- ЕСТЬ
- AS
- передбачає
- At
- Атрибути
- автентифіковано
- автоматизувати
- Автоматизований
- автоматично
- проспекти
- AWS
- BE
- перед тим
- буття
- між
- За
- дно
- будувати
- Створюємо
- автобус
- бізнес
- але
- by
- CAN
- можливості
- який
- випадок
- зміна
- Перевірки
- код
- співпрацював
- збирає
- зобов'язань
- повний
- беручи до уваги
- курси
- створення
- крикет
- виготовлений на замовлення
- Клієнти
- дані
- Analytics даних
- наука про дані
- вчений даних
- дизайн
- конструкцій
- бажаний
- деталь
- деталі
- виявляти
- DEV
- розвивати
- розвиненою
- Розробник
- розробників
- розвивається
- розробка
- розвивається
- обговорювати
- Роздільна
- динамічно
- e
- кожен
- Ефективний
- ефективний
- вбудовування
- Кінцева точка
- інженер
- Машинобудування
- забезпечення
- підприємство
- захоплений
- Навколишнє середовище
- середовищах
- Ефір (ETH)
- Event
- Події
- постійно змінюється
- еволюціонувати
- досвід
- дослідити
- Дослідження
- обширний
- Великий досвід
- особливість
- риси
- Поля
- знайти
- Сфокусувати
- фокусується
- стежити
- після
- слідує
- для
- чотири
- Рамки
- від
- функція
- шлюз
- покоління
- генеративний
- Генеративний ШІ
- гольф
- управляється
- Group
- Гід
- Обробка
- he
- здоров'я
- Охорона здоров'я
- охорона здоров'я
- допомагає
- його
- історія
- Як
- HTML
- HTTPS
- людина
- if
- здійснювати
- реалізація
- поліпшення
- in
- включати
- включені
- includes
- У тому числі
- індивідуальний
- промисловості
- промисловість
- інформація
- початковий
- ініціювати
- вхід
- інтеграція
- втручання
- в
- викликає
- IT
- ІТ-індустрія
- JPG
- мова
- великий
- останній
- вести
- вивчення
- рівень
- життя
- Науки про життя
- Life Sciences
- Життєвий цикл
- Сподобалося
- LINK
- LLC
- машина
- навчання за допомогою машини
- вдалося
- керівництво
- механізми
- Merck
- метадані
- Метрика
- Середній
- ML
- MLOps
- модель
- Моделі
- моніторинг
- монітори
- повинен
- необхідно
- потреби
- Нові
- Нові технології
- наступний
- сповіщення
- цілей
- of
- часто
- on
- операції
- or
- Інше
- Результат
- загальний
- пакет
- параметр
- частина
- особливо
- пристрасть
- Викрійки
- трубопровід
- місця
- платформа
- plato
- Інформація про дані Платона
- PlatoData
- ігри
- точка
- портрет
- пошта
- практики
- продовжити
- процес
- процеси
- Production
- професійний
- проектів
- сприяти
- Підвищено
- сприяння
- просування
- забезпечує
- забезпечення
- Переслідування
- готовий
- реєструвати
- зареєстрований
- регістри
- Реєстрація
- реєстру
- звільнити
- прохання
- вимагати
- Вимагається
- ресурси
- перепідготовка
- огляд
- міцний
- Маршрут
- Правило
- Правила
- s
- мудрець
- зберігаються
- масштабовані
- наука
- НАУКИ
- вчений
- Вчені
- посилає
- старший
- посланий
- Послідовність
- Послуги
- виступаючої
- комплект
- кілька
- загальні
- Шоу
- аналогічний
- простий
- навички
- Софтвер
- розробка програмного забезпечення
- рішення
- Рішення
- спеціаліст
- спеціалізується
- SPORTS
- зацікавлені сторони
- старт
- починається
- Статус
- Крок
- заходи
- зберігати
- зберігати
- обтічний
- Підтримуючий
- система
- Systems
- Приймати
- Мета
- команда
- Технології
- тест
- Що
- Команда
- їх
- вони
- це
- Тигр
- час
- до
- разом
- Том
- навчений
- Навчання
- подорожувати
- Подорож
- типово
- відімкнути
- Оновити
- оновлений
- Updates
- використання
- використовуваний
- використовує
- використання
- перевірка достовірності
- версія
- we
- Web
- веб-сервіси
- ДОБРЕ
- коли
- коли б ні
- який
- з
- в
- Work
- працювати разом
- робочий
- ви
- вашу
- зефірнет