Bài đăng này được đồng viết với Jayadeep Pabbisetty, Chuyên gia kỹ thuật dữ liệu cấp cao tại Merck và Prabakaran Mathaiyan, Kỹ sư cấp cao ML tại Tiger Analytics.
Vòng đời phát triển mô hình học máy (ML) quy mô lớn yêu cầu quy trình phát hành mô hình có thể mở rộng tương tự như quy trình phát triển phần mềm. Các nhà phát triển mô hình thường làm việc cùng nhau trong việc phát triển các mô hình ML và yêu cầu nền tảng MLOps mạnh mẽ để hoạt động. Nền tảng MLOps có thể mở rộng cần bao gồm quy trình xử lý quy trình đăng ký, phê duyệt và quảng bá mô hình ML lên cấp độ môi trường tiếp theo (phát triển, thử nghiệm). , UAT hoặc sản xuất).
Nhà phát triển mô hình thường bắt đầu làm việc trong môi trường phát triển ML riêng lẻ trong Amazon SageMaker. Khi một mô hình được đào tạo và sẵn sàng sử dụng, nó cần được phê duyệt sau khi được đăng ký trong Cơ quan đăng ký mô hình Amazon SageMaker. Trong bài đăng này, chúng tôi thảo luận về cách nhóm AWS AI/ML cộng tác với nhóm MLOps CNTT của Merck Human Health để xây dựng giải pháp sử dụng quy trình làm việc tự động hóa để phê duyệt và quảng bá mô hình ML với sự can thiệp của con người ở giữa.
Tổng quan về giải pháp
Bài đăng này tập trung vào giải pháp quy trình làm việc mà vòng đời phát triển mô hình ML có thể sử dụng giữa quy trình đào tạo và quy trình suy luận. Giải pháp này cung cấp quy trình làm việc có thể mở rộng cho MLOps trong việc hỗ trợ quá trình quảng bá và phê duyệt mô hình ML với sự can thiệp của con người. Mô hình ML do nhà khoa học dữ liệu đăng ký cần có người phê duyệt để xem xét và phê duyệt trước khi mô hình đó được sử dụng cho quy trình suy luận và ở cấp độ môi trường tiếp theo (thử nghiệm, UAT hoặc sản xuất). Giải pháp sử dụng AWS Lambda, Cổng API Amazon, Sự kiện Amazonvà SageMaker để tự động hóa quy trình làm việc với sự can thiệp phê duyệt của con người ở giữa. Sơ đồ kiến trúc sau đây thể hiện thiết kế hệ thống tổng thể, các dịch vụ AWS được sử dụng cũng như quy trình phê duyệt và quảng bá các mô hình ML với sự can thiệp của con người từ quá trình phát triển đến sản xuất.
Quy trình làm việc bao gồm các bước sau:
- Quy trình đào tạo sẽ phát triển và đăng ký một mô hình trong sổ đăng ký mô hình SageMaker. Tại thời điểm này, trạng thái của mô hình là
PendingManualApproval
. - EventBridge giám sát các sự kiện thay đổi trạng thái để tự động thực hiện hành động bằng các quy tắc đơn giản.
- Quy tắc sự kiện đăng ký mô hình EventBridge gọi hàm Lambda để xây dựng một email có liên kết để phê duyệt hoặc từ chối mô hình đã đăng ký.
- Người phê duyệt nhận được email có liên kết để xem xét và phê duyệt hoặc từ chối mô hình.
- Người phê duyệt phê duyệt mô hình bằng cách nhấp vào liên kết trong email tới điểm cuối API Gateway.
- API Gateway gọi hàm Lambda để bắt đầu cập nhật mô hình.
- Sổ đăng ký mô hình được cập nhật cho trạng thái mô hình (
Approved
cho môi trường dev, nhưngPendingManualApproval
để thử nghiệm, UAT và sản xuất). - Chi tiết mô hình được lưu trữ trong Kho lưu trữ thông số AWS, một khả năng của Người quản lý hệ thống AWS, bao gồm phiên bản mô hình, môi trường mục tiêu được phê duyệt, gói mô hình.
- Đường dẫn suy luận tìm nạp mô hình đã được phê duyệt cho môi trường đích từ Cửa hàng tham số.
- Hàm Lambda thông báo sau suy luận thu thập số liệu suy luận hàng loạt và gửi email đến người phê duyệt để quảng bá mô hình sang môi trường tiếp theo.
Điều kiện tiên quyết
Quy trình làm việc trong bài đăng này giả định môi trường cho quy trình đào tạo được thiết lập trong SageMaker, cùng với các tài nguyên khác. Đầu vào của quy trình đào tạo là tập dữ liệu tính năng. Thông tin chi tiết về việc tạo tính năng không được đưa vào bài đăng này nhưng nó tập trung vào việc đăng ký, phê duyệt và quảng bá các mô hình ML sau khi chúng được đào tạo. Mô hình được đăng ký trong sổ đăng ký mô hình và được quản lý bởi khung giám sát trong Giám sát mô hình Amazon SageMaker để phát hiện bất kỳ sự sai lệch nào và tiến hành đào tạo lại trong trường hợp sai lệch mô hình.
Chi tiết quy trình làm việc
Quy trình phê duyệt bắt đầu bằng một mô hình được phát triển từ quy trình đào tạo. Khi các nhà khoa học dữ liệu phát triển một mô hình, họ đăng ký mô hình đó vào Cơ quan đăng ký mô hình SageMaker với trạng thái mô hình là PendingManualApproval
. EventBridge giám sát SageMaker về sự kiện đăng ký mô hình và kích hoạt quy tắc sự kiện gọi hàm Lambda. Hàm Lambda tự động tạo một email để phê duyệt mô hình kèm theo liên kết đến điểm cuối API Gateway tới một hàm Lambda khác. Khi người phê duyệt nhấp vào liên kết để phê duyệt mô hình, API Gateway sẽ chuyển tiếp hành động phê duyệt đến hàm Lambda, hàm này sẽ cập nhật Sổ đăng ký mô hình SageMaker và các thuộc tính mô hình trong Kho lưu trữ tham số. Người phê duyệt phải được xác thực và là thành viên của nhóm phê duyệt do Active Directory quản lý. Sự phê duyệt ban đầu đánh dấu mô hình là Approved
dành cho nhà phát triển nhưng PendingManualApproval
để thử nghiệm, UAT và sản xuất. Các thuộc tính mô hình được lưu trong Cửa hàng tham số bao gồm phiên bản mô hình, gói mô hình và môi trường đích được phê duyệt.
Khi một đường dẫn suy luận cần tìm nạp một mô hình, nó sẽ kiểm tra Cửa hàng tham số để biết phiên bản mô hình mới nhất được phê duyệt cho môi trường đích và nhận các chi tiết suy luận. Khi quy trình suy luận hoàn tất, email thông báo sau suy luận sẽ được gửi đến bên liên quan yêu cầu phê duyệt để nâng cấp mô hình lên cấp độ môi trường tiếp theo. Email này có thông tin chi tiết về mô hình và số liệu cũng như liên kết phê duyệt tới điểm cuối API Gateway cho hàm Lambda cập nhật các thuộc tính mô hình.
Sau đây là trình tự các sự kiện và các bước triển khai cho quy trình phê duyệt/quảng bá mô hình ML từ tạo mô hình đến sản xuất. Mô hình này được thúc đẩy từ môi trường phát triển sang thử nghiệm, UAT và sản xuất với sự phê duyệt rõ ràng của con người trong từng bước.
Chúng tôi bắt đầu với quy trình đào tạo đã sẵn sàng để phát triển mô hình. Phiên bản mô hình bắt đầu bằng 0 trong Sổ đăng ký mô hình SageMaker.
- Quy trình đào tạo SageMaker phát triển và đăng ký một mô hình trong Sổ đăng ký mô hình SageMaker. Phiên bản mô hình 1 được đăng ký và bắt đầu bằng Đang chờ phê duyệt thủ công trạng thái.Siêu dữ liệu của Sổ đăng ký mô hình có bốn trường tùy chỉnh cho các môi trường:
dev, test, uat
vàprod
. - EventBridge giám sát Sổ đăng ký mô hình SageMaker để biết thay đổi trạng thái nhằm tự động thực hiện hành động với các quy tắc đơn giản.
- Quy tắc sự kiện đăng ký mô hình gọi hàm Lambda xây dựng một email có liên kết để phê duyệt hoặc từ chối mô hình đã đăng ký.
- Người phê duyệt nhận được email có liên kết để xem xét và phê duyệt (hoặc từ chối) mô hình.
- Người phê duyệt phê duyệt mô hình bằng cách nhấp vào liên kết đến điểm cuối API Gateway trong email.
- API Gateway gọi hàm Lambda để bắt đầu cập nhật mô hình.
- Sổ đăng ký mô hình SageMaker được cập nhật trạng thái mô hình.
- Thông tin chi tiết về mô hình được lưu trữ trong Cửa hàng tham số, bao gồm phiên bản mô hình, môi trường đích được phê duyệt và gói mô hình.
- Đường dẫn suy luận tìm nạp mô hình đã được phê duyệt cho môi trường đích từ Cửa hàng tham số.
- Hàm Lambda thông báo sau suy luận thu thập số liệu suy luận hàng loạt và gửi email đến người phê duyệt để quảng bá mô hình sang môi trường tiếp theo.
- Người phê duyệt phê duyệt việc nâng cấp mô hình lên cấp độ tiếp theo bằng cách nhấp vào liên kết đến điểm cuối Cổng API, điểm này sẽ kích hoạt hàm Lambda để cập nhật Kho tham số và Sổ đăng ký mô hình SageMaker.
Toàn bộ lịch sử của việc lập phiên bản và phê duyệt mô hình sẽ được lưu để xem lại trong Cửa hàng Thông số.
Kết luận
Vòng đời phát triển mô hình ML lớn đòi hỏi quy trình phê duyệt mô hình ML có thể mở rộng. Trong bài đăng này, chúng tôi đã chia sẻ cách triển khai quy trình đăng ký, phê duyệt và quảng bá mô hình ML với sự can thiệp của con người bằng cách sử dụng Sổ đăng ký mô hình SageMaker, EventBridge, API Gateway và Lambda. Nếu bạn đang xem xét quy trình phát triển mô hình ML có thể mở rộng cho nền tảng MLOps của mình, bạn có thể làm theo các bước trong bài đăng này để triển khai quy trình làm việc tương tự.
Giới thiệu về tác giả
Tô Kim là Kiến trúc sư giải pháp cấp cao tại AWS, nơi ông giúp khách hàng của mình đạt được mục tiêu kinh doanh bằng cách phát triển các giải pháp trên AWS. Ông có nhiều kinh nghiệm về kiến trúc và vận hành hệ thống doanh nghiệp trong nhiều ngành - đặc biệt là trong lĩnh vực Chăm sóc sức khỏe và Khoa học đời sống. Tom luôn học hỏi các công nghệ mới mang lại kết quả kinh doanh mong muốn cho khách hàng – ví dụ: AI/ML, GenAI và Phân tích dữ liệu. Anh ấy cũng thích đi du lịch đến những địa điểm mới và chơi những sân gôn mới bất cứ khi nào có thời gian.
Shamika Ariyawansa, là Kiến trúc sư giải pháp AI/ML cấp cao trong bộ phận Chăm sóc sức khỏe và Khoa học đời sống tại Amazon Web Services (AWS), chuyên về AI sáng tạo, tập trung vào đào tạo Mô hình ngôn ngữ lớn (LLM), tối ưu hóa suy luận và MLOps (Học máy) Hoạt động). Ông hướng dẫn khách hàng nhúng Generative AI tiên tiến vào các dự án của họ, đảm bảo quy trình đào tạo mạnh mẽ, cơ chế suy luận hiệu quả và các phương pháp thực hành MLOps hợp lý để có các giải pháp AI hiệu quả và có thể mở rộng. Ngoài những cam kết nghề nghiệp của mình, Shamika còn đam mê theo đuổi các cuộc phiêu lưu trượt tuyết và địa hình.
Jayadeep Pabbistty là Kỹ sư ML/Dữ liệu cao cấp tại Merck, nơi ông thiết kế và phát triển các giải pháp ETL và MLOps để mở khóa khoa học và phân tích dữ liệu cho doanh nghiệp. Anh ấy luôn nhiệt tình học hỏi các công nghệ mới, khám phá những con đường mới và tiếp thu những kỹ năng cần thiết để phát triển theo ngành CNTT luôn thay đổi. Khi rảnh rỗi, anh theo đuổi niềm đam mê thể thao và thích đi du lịch, khám phá những địa điểm mới.
Prabakaran Mathaiyan là Kỹ sư máy học cao cấp tại Tiger Analytics LLC, nơi anh giúp khách hàng của mình đạt được mục tiêu kinh doanh bằng cách cung cấp các giải pháp xây dựng mô hình, đào tạo, xác thực, giám sát, CICD và cải tiến các giải pháp máy học trên AWS. Prabakaran luôn học hỏi các công nghệ mới mang lại kết quả kinh doanh mong muốn cho khách hàng – ví dụ: AI/ML, GenAI, GPT và LLM. Anh ấy cũng thích chơi cricket bất cứ khi nào có thời gian.
- Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
- PlatoData.Network Vertical Generative Ai. Trao quyền cho chính mình. Truy cập Tại đây.
- PlatoAiStream. Thông minh Web3. Kiến thức khuếch đại. Truy cập Tại đây.
- Trung tâmESG. Than đá, công nghệ sạch, Năng lượng, Môi trường Hệ mặt trời, Quản lý chất thải. Truy cập Tại đây.
- PlatoSức khỏe. Tình báo thử nghiệm lâm sàng và công nghệ sinh học. Truy cập Tại đây.
- nguồn: https://aws.amazon.com/blogs/machine-learning/build-an-amazon-sagemaker-model-registry-approval-and-promotion-workflow-with-human-intervention/
- : có
- :là
- :không phải
- :Ở đâu
- $ LÊN
- 1
- 100
- 110
- 116
- a
- Giới thiệu
- Đạt được
- có được
- ngang qua
- Hoạt động
- hành động
- hoạt động
- active Directory
- tiên tiến
- cuộc phiêu lưu
- Sau
- AI
- AI / ML
- dọc theo
- Ngoài ra
- luôn luôn
- đàn bà gan dạ
- Amazon SageMaker
- Amazon Web Services
- Amazon Web Services (AWS)
- an
- phân tích
- và
- Một
- bất kì
- api
- phê duyệt
- phê duyệt
- phê duyệt
- kiến trúc
- LÀ
- AS
- giả định
- At
- thuộc tính
- chứng thực
- tự động hóa
- Tự động
- tự động
- đại lộ
- AWS
- BE
- trước
- được
- giữa
- Ngoài
- đáy
- xây dựng
- Xây dựng
- xe buýt
- kinh doanh
- nhưng
- by
- CAN
- khả năng
- mà
- trường hợp
- thay đổi
- Séc
- mã
- hợp tác
- thu thập
- cam kết
- hoàn thành
- xem xét
- các khóa học
- tạo
- dế
- khách hàng
- khách hàng
- dữ liệu
- Phân tích dữ liệu
- khoa học dữ liệu
- nhà khoa học dữ liệu
- Thiết kế
- thiết kế
- mong muốn
- chi tiết
- chi tiết
- phát hiện
- Dev
- phát triển
- phát triển
- Nhà phát triển
- phát triển
- phát triển
- Phát triển
- phát triển
- thảo luận
- Phòng
- năng động
- e
- mỗi
- Hiệu quả
- hiệu quả
- nhúng
- Điểm cuối
- ky sư
- Kỹ Sư
- đảm bảo
- Doanh nghiệp
- nhiệt tình
- Môi trường
- môi trường
- Ether (ETH)
- Sự kiện
- sự kiện
- luôn thay đổi
- phát triển
- kinh nghiệm
- khám phá
- Khám phá
- mở rộng
- Trải nghiệm sâu sắc
- Đặc tính
- Tính năng
- Lĩnh vực
- Tìm kiếm
- Tập trung
- tập trung
- theo
- tiếp theo
- sau
- Trong
- 4
- Khung
- từ
- chức năng
- cửa ngõ
- thế hệ
- thế hệ
- Trí tuệ nhân tạo
- golf
- cai quản
- Nhóm
- Hướng dẫn
- Xử lý
- he
- cho sức khoẻ
- Chăm sóc sức khỏe
- chăm sóc sức khỏe
- giúp
- của mình
- lịch sử
- Độ đáng tin của
- HTML
- HTTPS
- Nhân loại
- if
- thực hiện
- thực hiện
- cải thiện
- in
- bao gồm
- bao gồm
- bao gồm
- Bao gồm
- hệ thống riêng biệt,
- các ngành công nghiệp
- ngành công nghiệp
- thông tin
- ban đầu
- bắt đầu
- đầu vào
- hội nhập
- can thiệp
- trong
- viện dẫn
- IT
- Công nghiệp CNTT
- jpg
- Ngôn ngữ
- lớn
- mới nhất
- dẫn
- học tập
- Cấp
- Cuộc sống
- Life Science
- Khoa học đời sống
- vòng đời
- Lượt thích
- LINK
- LLC
- máy
- học máy
- quản lý
- nhãn hiệu
- cơ chế
- Merck
- Siêu dữ liệu
- Metrics
- Tên đệm
- ML
- MLOps
- kiểu mẫu
- mô hình
- giám sát
- màn hình
- phải
- cần thiết
- nhu cầu
- Mới
- Công nghệ mới
- tiếp theo
- thông báo
- mục tiêu
- of
- thường
- on
- Hoạt động
- or
- Nền tảng khác
- Kết quả
- tổng thể
- gói
- tham số
- một phần
- đặc biệt
- niềm đam mê
- Họa tiết
- đường ống dẫn
- Nơi
- nền tảng
- plato
- Thông tin dữ liệu Plato
- PlatoDữ liệu
- chơi
- Điểm
- chân dung
- Bài đăng
- thực hành
- tiến hành
- quá trình
- Quy trình
- Sản lượng
- chuyên nghiệp
- dự án
- thúc đẩy
- Promoted
- Thúc đẩy
- xúc tiến
- cung cấp
- cung cấp
- Theo đuổi
- sẵn sàng
- ghi danh
- đăng ký
- đăng ký
- Đăng Ký
- đăng ký
- phát hành
- yêu cầu
- yêu cầu
- đòi hỏi
- Thông tin
- đào tạo lại
- xem xét
- mạnh mẽ
- Route
- Quy tắc
- quy tắc
- s
- nhà làm hiền triết
- lưu
- khả năng mở rộng
- Khoa học
- KHOA HỌC
- Nhà khoa học
- các nhà khoa học
- gửi
- cao cấp
- gởi
- Trình tự
- DỊCH VỤ
- phục vụ
- định
- một số
- chia sẻ
- Chương trình
- tương tự
- Đơn giản
- kỹ năng
- Phần mềm
- phát triển phần mềm
- giải pháp
- Giải pháp
- chuyên gia
- chuyên
- Thể thao
- các bên liên quan
- Bắt đầu
- bắt đầu
- Trạng thái
- Bước
- Các bước
- hàng
- lưu trữ
- sắp xếp hợp lý
- Hỗ trợ
- hệ thống
- hệ thống
- Hãy
- Mục tiêu
- nhóm
- Công nghệ
- thử nghiệm
- việc này
- Sản phẩm
- cung cấp their dịch
- họ
- điều này
- Tiger
- thời gian
- đến
- bên nhau
- tom
- đào tạo
- Hội thảo
- đi du lịch
- Đi du lịch
- thường
- mở khóa
- Cập nhật
- cập nhật
- Cập nhật
- sử dụng
- đã sử dụng
- sử dụng
- sử dụng
- xác nhận
- phiên bản
- we
- web
- các dịch vụ web
- TỐT
- khi nào
- bất cứ khi nào
- cái nào
- với
- ở trong
- Công việc
- làm việc cùng nhau
- quy trình làm việc
- bạn
- trên màn hình
- zephyrnet