ตรวจจับการดริฟท์ข้อมูล NLP โดยใช้ Amazon SageMaker Model Monitor แบบกำหนดเอง

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

ความเข้าใจภาษาธรรมชาติถูกนำไปใช้ในกรณีการใช้งานที่หลากหลาย ตั้งแต่แชทบอทและผู้ช่วยเสมือน ไปจนถึงการแปลด้วยเครื่องและการสรุปข้อความ เพื่อให้แน่ใจว่าแอปพลิเคชันเหล่านี้กำลังทำงานในระดับประสิทธิภาพที่คาดไว้ ข้อมูลในสภาพแวดล้อมการฝึกอบรมและการผลิตจะต้องมาจากการแจกจ่ายเดียวกัน เมื่อข้อมูลที่ใช้สำหรับการอนุมาน (ข้อมูลการผลิต) แตกต่างจากข้อมูลที่ใช้ระหว่างการฝึกโมเดล เราพบปรากฏการณ์ที่เรียกว่า data drift เมื่อเกิดการเคลื่อนตัวของข้อมูล โมเดลจะไม่เกี่ยวข้องกับข้อมูลในการผลิตอีกต่อไป และมีแนวโน้มว่าจะทำงานได้แย่กว่าที่คาดไว้ สิ่งสำคัญคือต้องตรวจสอบข้อมูลการอนุมานอย่างต่อเนื่องและเปรียบเทียบกับข้อมูลที่ใช้ในการฝึกอบรม

คุณสามารถใช้ได้ อเมซอน SageMaker เพื่อสร้าง ฝึกฝน และปรับใช้โมเดลแมชชีนเลิร์นนิง (ML) ในทุกขนาดอย่างรวดเร็ว คุณสามารถใช้ .เป็นมาตรการเชิงรุกในการต่อต้านการเสื่อมของแบบจำลองได้ การตรวจสอบโมเดล Amazon SageMaker เพื่อตรวจสอบคุณภาพของโมเดล ML ของคุณอย่างต่อเนื่องแบบเรียลไทม์ ด้วย Model Monitor คุณยังสามารถกำหนดค่าการแจ้งเตือนเพื่อแจ้งและทริกเกอร์การดำเนินการ หากสังเกตพบการเบี่ยงเบนในประสิทธิภาพของแบบจำลอง การตรวจจับความเบี่ยงเบนเหล่านี้ตั้งแต่เนิ่นๆและเชิงรุกช่วยให้คุณดำเนินการแก้ไขได้ เช่น การรวบรวมข้อมูลการฝึกความจริงภาคพื้นดิน แบบจำลองการฝึกซ้ำ และการตรวจสอบระบบต้นน้ำ โดยไม่ต้องตรวจสอบแบบจำลองด้วยตนเองหรือสร้างเครื่องมือเพิ่มเติม

Model Monitor นำเสนอความสามารถในการตรวจสอบสี่ประเภทที่แตกต่างกันเพื่อตรวจจับและบรรเทาการเบี่ยงเบนของแบบจำลองในแบบเรียลไทม์:

ข้อมูลที่มีคุณภาพ – ช่วยตรวจจับการเปลี่ยนแปลงในสคีมาข้อมูลและคุณสมบัติทางสถิติของตัวแปรอิสระและการแจ้งเตือนเมื่อตรวจพบการเลื่อนลอย
คุณภาพของรุ่น – สำหรับการตรวจสอบคุณลักษณะประสิทธิภาพของแบบจำลอง เช่น ความแม่นยำหรือความแม่นยำแบบเรียลไทม์ Model Monitor ช่วยให้คุณสามารถนำเข้าป้ายกำกับความจริงภาคพื้นดินที่รวบรวมจากแอปพลิเคชันของคุณ Model Monitor จะผสานข้อมูลความจริงพื้นฐานกับข้อมูลการทำนายโดยอัตโนมัติเพื่อคำนวณเมตริกประสิทธิภาพของแบบจำลอง
ความลำเอียงของโมเดล –Model Monitor ถูกรวมเข้ากับ Amazon SageMaker ชี้แจง เพื่อปรับปรุงการมองเห็นอคติที่อาจเกิดขึ้น แม้ว่าข้อมูลหรือแบบจำลองเริ่มต้นของคุณอาจไม่มีความเอนเอียง แต่การเปลี่ยนแปลงในโลกอาจทำให้อคติพัฒนาเมื่อเวลาผ่านไปในแบบจำลองที่ได้รับการฝึกอบรมแล้ว
แบบจำลองอธิบายได้ – การตรวจจับการดริฟท์จะแจ้งเตือนคุณเมื่อมีการเปลี่ยนแปลงในความสำคัญเชิงสัมพันธ์ของการระบุแหล่งที่มาของคุณลักษณะ

ในโพสต์นี้ เราจะพูดถึงประเภทของการเลื่อนคุณภาพข้อมูลที่ใช้กับข้อมูลข้อความ นอกจากนี้เรายังนำเสนอวิธีการตรวจจับการเคลื่อนตัวของข้อมูลในข้อมูลข้อความโดยใช้ Model Monitor

การเลื่อนข้อมูลใน NLP

การเลื่อนข้อมูลสามารถจำแนกได้เป็นสามประเภทขึ้นอยู่กับว่ากะการกระจายเกิดขึ้นที่อินพุตหรือด้านเอาต์พุต หรือความสัมพันธ์ระหว่างอินพุตและเอาต์พุตมีการเปลี่ยนแปลงหรือไม่

โควาเรียตกะ

ใน ความแปรปรวนร่วมกะการกระจายของอินพุตเปลี่ยนแปลงตลอดเวลา แต่การกระจายแบบมีเงื่อนไข พี(ย|x) ไม่เปลี่ยนแปลง การเลื่อนประเภทนี้เรียกว่าการเปลี่ยนแปลงร่วมกันเนื่องจากปัญหาเกิดขึ้นเนื่องจากการเปลี่ยนแปลงในการกระจายของตัวแปรร่วม (คุณลักษณะ) ตัวอย่างเช่น ในรูปแบบการจำแนกประเภทสแปมอีเมล การกระจายข้อมูลการฝึกอบรม (องค์กรอีเมล) อาจแตกต่างไปจากการกระจายข้อมูลระหว่างการให้คะแนน

ป้ายกะ

ในขณะที่การเปลี่ยนแปลงร่วมกันมุ่งเน้นไปที่การเปลี่ยนแปลงในการกระจายคุณลักษณะ ป้ายกะ มุ่งเน้นไปที่การเปลี่ยนแปลงในการกระจายของตัวแปรคลาส การขยับประเภทนี้โดยพื้นฐานแล้วเป็นการย้อนกลับของการเปลี่ยนตัวแปรร่วม วิธีคิดแบบสัญชาตญาณอาจเป็นการพิจารณาชุดข้อมูลที่ไม่สมดุล หากอัตราส่วนสแปมต่อไม่ใช่สแปมของอีเมลในชุดการฝึกอบรมของเราคือ 50% แต่ในความเป็นจริง 10% ของอีเมลไม่ใช่สแปม การกระจายป้ายกำกับเป้าหมายก็เปลี่ยนไป

การเปลี่ยนแนวคิด

การเปลี่ยนแนวคิด แตกต่างจาก covariate และ label shift โดยที่ไม่เกี่ยวข้องกับการกระจายข้อมูลหรือการกระจายคลาส แต่สัมพันธ์กับความสัมพันธ์ระหว่างตัวแปรทั้งสองแทน ตัวอย่างเช่น ผู้ส่งอีเมลขยะมักใช้แนวคิดที่หลากหลายเพื่อส่งต่อแบบจำลองตัวกรองจดหมายขยะ และแนวคิดของอีเมลที่ใช้ระหว่างการฝึกอบรมอาจเปลี่ยนแปลงเมื่อเวลาผ่านไป

ตอนนี้เราเข้าใจประเภทต่าง ๆ ของการเคลื่อนตัวของข้อมูลแล้ว มาดูกันว่าเราจะใช้ Model Monitor เพื่อตรวจจับการเปลี่ยนแปลงร่วมในข้อมูลข้อความได้อย่างไร

ภาพรวมโซลูชัน

ข้อมูลแบบข้อความนั้นซับซ้อน มีมิติสูง และรูปแบบอิสระไม่เหมือนกับข้อมูลแบบตารางซึ่งมีโครงสร้างและมีขอบเขต เพื่อตรวจจับการเคลื่อนตัวใน NLP อย่างมีประสิทธิภาพ เราทำงานร่วมกับ ฝัง, ซึ่งเป็นการแสดงข้อความที่มีมิติต่ำ คุณสามารถรับการฝังโดยใช้โมเดลภาษาต่างๆ เช่น Word2Vec และโมเดลที่ใช้หม้อแปลงไฟฟ้า เช่น BERT. โมเดลเหล่านี้ฉายข้อมูลมิติสูงลงในช่องว่างมิติต่ำในขณะที่รักษาข้อมูลความหมายของข้อความ ผลลัพธ์ที่ได้คือเวกเตอร์ที่มีความหนาแน่นและมีความหมายตามบริบท ซึ่งสามารถใช้กับงานดาวน์สตรีมต่างๆ ได้ รวมถึงการเฝ้าติดตามการเลื่อนข้อมูล

ในโซลูชันของเรา เราใช้การฝังเพื่อตรวจหาการเปลี่ยนแปลงของประโยคภาษาอังกฤษที่ต่างกัน เราใช้ Model Monitor เพื่ออำนวยความสะดวกในการตรวจสอบอย่างต่อเนื่องสำหรับตัวแยกประเภทข้อความที่ปรับใช้กับสภาพแวดล้อมการผลิต แนวทางของเราประกอบด้วยขั้นตอนต่อไปนี้:

ปรับแต่งโมเดล BERT โดยใช้ SageMaker
ปรับใช้ตัวแยกประเภท BERT ที่ปรับแต่งแล้วเป็นจุดปลายทางแบบเรียลไทม์ด้วย การจับข้อมูล เปิดการใช้งาน
สร้างชุดข้อมูลพื้นฐานที่ประกอบด้วยตัวอย่างของประโยคที่ใช้ฝึกตัวแยกประเภท BERT
สร้าง งานตรวจสอบ SageMaker แบบกำหนดเอง เพื่อคำนวณความคล้ายคลึงของโคไซน์ระหว่างข้อมูลที่บันทึกในการผลิตและชุดข้อมูลพื้นฐาน

ไดอะแกรมต่อไปนี้แสดงเวิร์กโฟลว์โซลูชัน:

ปรับแต่งโมเดล BERT

ในโพสต์นี้เราใช้ คลังข้อมูลการยอมรับทางภาษาศาสตร์ (CoLA)ชุดข้อมูลประโยคภาษาอังกฤษ 10,657 ประโยคที่มีป้ายกำกับว่าถูกไวยากรณ์หรือผิดไวยากรณ์จากวรรณคดีภาษาศาสตร์ที่ตีพิมพ์ เราใช้การฝึกอบรม SageMaker เพื่อปรับแต่งโมเดล BERT โดยใช้ชุดข้อมูล CoLa โดยกำหนดคลาสตัวประมาณ PyTorch สำหรับข้อมูลเพิ่มเติมเกี่ยวกับวิธีใช้ SDK นี้กับ PyTorch โปรดดูที่ ใช้ PyTorch กับ SageMaker Python SDK. โทรหา fit() วิธีการประมาณการเริ่มงานฝึกอบรม:

from sagemaker.pytorch import PyTorch # place to save model artifact
output_path = f"s3://{bucket}/{model_prefix}" estimator = PyTorch( entry_point="train_deploy.py", source_dir="code", role=role, framework_version="1.7.1", py_version="py3", instance_count=1, instance_type="ml.p3.2xlarge", output_path=output_path, hyperparameters={ "epochs": 1, "num_labels": 2, "backend": "gloo", }, disable_profiler=True, # disable debugger
)
estimator.fit({"training": inputs_train, "testing": inputs_test})

ปรับใช้โมเดล

หลังจากฝึกโมเดลของเราแล้ว เราก็โฮสต์ไว้บนจุดปลาย SageMaker เพื่อให้ปลายทางโหลดโมเดลและให้บริการการคาดคะเน เราใช้วิธีการสองสามวิธีใน train_deploy.py:

model_fn() – โหลดโมเดลที่บันทึกไว้และส่งคืนอ็อบเจ็กต์โมเดลที่สามารถใช้สำหรับการให้บริการโมเดล เซิร์ฟเวอร์รุ่น SageMaker PyTorch โหลดโมเดลของเราโดยเรียกใช้ model_fn.
input_fn() – ยกเลิกการซีเรียลไลซ์และเตรียมอินพุตการทำนาย ในตัวอย่างนี้ เนื้อหาคำขอของเราจะถูกจัดลำดับเป็น JSON ก่อน จากนั้นจึงส่งไปยังจุดสิ้นสุดการให้บริการโมเดล ดังนั้นใน input_fn()ก่อนอื่นเราทำการดีซีเรียลไลซ์เนื้อหาคำขอที่จัดรูปแบบ JSON และคืนค่าอินพุตเป็นa torch.tensorตามข้อกำหนดของ BERT
ทำนาย_fn() – ดำเนินการทำนายและส่งคืนผลลัพธ์

เปิดใช้งานการเก็บข้อมูล Model Monitor

เราเปิดใช้งาน การเก็บข้อมูลการตรวจสอบโมเดล เพื่อบันทึกข้อมูลอินพุตลงใน บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon (Amazon S3) ที่ฝากข้อมูลเพื่ออ้างอิงในภายหลัง:

data_capture_config = DataCaptureConfig(enable_capture=True, sampling_percentage=100, destination_s3_uri=s3_capture_upload_path)

จากนั้นเราจะสร้างจุดสิ้นสุด SageMaker แบบเรียลไทม์ด้วยโมเดลที่สร้างขึ้นในขั้นตอนก่อนหน้า:

predictor = estimator.deploy(endpoint_name='nlp-data-drift-bert-endpoint', initial_instance_count=1, instance_type="ml.m4.xlarge", data_capture_config=data_capture_config)

การอนุมาน

เราเรียกใช้การทำนายโดยใช้วัตถุตัวทำนายที่เราสร้างในขั้นตอนก่อนหน้า เราตั้งค่า JSON serializer และ deserializer ซึ่งใช้โดยจุดสิ้นสุดการอนุมาน:

print("Sending test traffic to the endpoint {}. nPlease wait...".format(endpoint_name)) result = predictor.predict([ "Thanks so much for driving me home", "Thanks so much for cooking dinner. I really appreciate it", "Nice to meet you, Sergio. So, where are you from"
])

ปลายทางแบบเรียลไทม์ได้รับการกำหนดค่าให้บันทึกข้อมูลจากคำขอ และการตอบสนองและข้อมูลจะถูกจัดเก็บไว้ใน Amazon S3 คุณสามารถดูข้อมูลที่บันทึกไว้ในกำหนดการตรวจสอบก่อนหน้าได้

สร้างเส้นฐาน

เราใช้โมเดล BERT ที่ปรับแต่งมาอย่างดีเพื่อดึงคุณสมบัติการฝังประโยคจากข้อมูลการฝึก เราใช้เวกเตอร์เหล่านี้เป็นอินพุตคุณสมบัติคุณภาพสูงสำหรับการเปรียบเทียบระยะทางโคไซน์ เนื่องจาก BERT สร้างการแสดงคำแบบไดนามิกพร้อมบริบทเชิงความหมาย ทำตามขั้นตอนต่อไปนี้เพื่อรับการฝังประโยค:

ใช้ BERT tokenizer เพื่อรับรหัสโทเค็นสำหรับแต่ละโทเค็น (input_id) ในประโยคอินพุตและมาสก์เพื่อระบุว่าองค์ประกอบใดในลำดับอินพุตเป็นโทเค็นเทียบกับองค์ประกอบการเติม (attention_mask_id). เราใช้ BERT tokenizer.encode_plus ฟังก์ชั่นเพื่อรับค่าเหล่านี้สำหรับแต่ละประโยคอินพุต:

#Add instantiation of tokenizer
encoded_dict = tokenizer.encode_plus( sent, # Input Sentence to encode. add_special_tokens = True, # Add '[CLS]' and '[SEP]' max_length = 64, # Pad sentence to max_length pad_to_max_length = True, # Truncate sentence to max_length return_attention_mask = True, #BERT model needs attention_mask return_tensors = 'pt', # Return pytorch tensors. )
input_ids = encoded_dict['input_ids']
attention_mask_ids = encoded_dict['attention_mask']

input_ids และ attention_mask_ids ถูกส่งไปยังโมเดลและดึงสถานะที่ซ่อนอยู่ของเครือข่าย ดิ hidden_states มีสี่มิติตามลำดับต่อไปนี้:

หมายเลขเลเยอร์ (BERT มี 12 ชั้น)
หมายเลขชุด (1 ประโยค)
ดัชนีโทเค็นของ Word
หน่วยที่ซ่อนอยู่ (768 คุณสมบัติ)

ใช้เลเยอร์ที่ซ่อนอยู่สองเลเยอร์สุดท้ายเพื่อรับเวกเตอร์เดียว (การฝังประโยค) โดยการคำนวณค่าเฉลี่ยของโทเค็นอินพุตทั้งหมดในประโยค:

outputs = model(input_ids, attention_mask_ids) # forward pass to model
hidden_states = outputs[2] # token vectors
token_vecs = hidden_states[-2][0] # last 2 layer hidden states
sentence_embedding = torch.mean(token_vecs, dim=0) # average token vectors

แปลงการฝังประโยคเป็นอาร์เรย์ NumPy และจัดเก็บไว้ในตำแหน่ง Amazon S3 เป็นข้อมูลพื้นฐานที่ใช้โดย Model Monitor:

sentence_embeddings_list = []for i in sentence_embeddings:sentence_embeddings_list.append(i.numpy()) np.save('embeddings.npy', sentence_embeddings_list) #Upload the sentence embedding to S3
!aws s3 cp embeddings.npy s3://{bucket}/{model_prefix}/embeddings/

สคริปต์การประเมินผล

Model Monitor จัดเตรียมคอนเทนเนอร์ที่สร้างไว้ล่วงหน้าพร้อมความสามารถในการวิเคราะห์ข้อมูลที่บันทึกจากปลายทางสำหรับชุดข้อมูลแบบตาราง หากคุณต้องการนำคอนเทนเนอร์มาเอง Model Monitor มีจุดต่อขยายที่คุณสามารถใช้ได้ เมื่อคุณสร้าง MonitoringSchedule, Model Monitor ได้เริ่มดำเนินการประมวลผลในที่สุด ดังนั้นตู้คอนเทนเนอร์จึงจำเป็นต้องทราบสัญญาจ้างงานแปรรูป เราจำเป็นต้องสร้างสคริปต์การประเมินที่เข้ากันได้กับคอนเทนเนอร์ ปัจจัยการผลิตสัญญา และ เอาท์พุท.

Model Monitor ใช้รหัสการประเมินกับตัวอย่างทั้งหมดที่จับได้ระหว่างกำหนดการตรวจสอบ สำหรับแต่ละจุดข้อมูลการอนุมาน เราจะคำนวณการฝังประโยคโดยใช้ตรรกะเดียวกันกับที่อธิบายไว้ก่อนหน้านี้ ความคล้ายคลึงของโคไซน์ถูกใช้เป็นตัววัดระยะทางเพื่อวัดความคล้ายคลึงกันของจุดข้อมูลการอนุมานและการฝังประโยคในเส้นฐาน ในทางคณิตศาสตร์ มันวัดมุมโคไซน์ระหว่างเวกเตอร์ที่ฝังสองประโยค คะแนนความคล้ายคลึงกันของโคไซน์สูงบ่งบอกถึงการฝังประโยคที่คล้ายคลึงกัน คะแนนความคล้ายคลึงกันของโคไซน์ที่ต่ำกว่าบ่งชี้ถึงความเบี่ยงเบนของข้อมูล เราคำนวณค่าเฉลี่ยของคะแนนความคล้ายคลึงกันโคไซน์ทั้งหมด และหากน้อยกว่าเกณฑ์ ก็จะบันทึกในรายงานการละเมิด ตามกรณีการใช้งาน คุณสามารถใช้ตัววัดระยะทางอื่นๆ เช่น manhattan or euclidean เพื่อวัดความคล้ายคลึงของการฝังประโยค

ไดอะแกรมต่อไปนี้แสดงวิธีที่เราใช้ SageMaker Model Monitoring เพื่อสร้างเส้นฐานและตรวจจับการเบี่ยงเบนของข้อมูลโดยใช้ความคล้ายคลึงกันของระยะทางโคไซน์

ต่อไปนี้เป็นรหัสสำหรับคำนวณการละเมิด สคริปต์ประเมินผลฉบับสมบูรณ์มีอยู่ใน GitHub:

for embed_item in embedding_list: # all sentence embeddings from baseline cosine_score += (1 - cosine(input_sentence_embedding, embed_item)) # cosine distance between input sentence embedding and baseline embedding
cosine_score_avg = cosine_score/(len(embedding_list)) # average cosine score of input sentence
if cosine_score_avg < env.max_ratio_threshold: # compare averge cosine score against a threshold sent_cosine_dict[record] = cosine_score_avg # capture details for violation report violations.append({ "sentence": record, "avg_cosine_score": cosine_score_avg, "feature_name": "sent_cosine_score", "constraint_check_type": "baseline_drift_check", "endpoint_name" : env.sagemaker_endpoint_name, "monitoring_schedule_name": env.sagemaker_monitoring_schedule_name })

วัดความเบี่ยงเบนของข้อมูลโดยใช้ Model Monitor

ในส่วนนี้ เราเน้นการวัดความเบี่ยงเบนของข้อมูลโดยใช้ Model Monitor จอภาพที่สร้างไว้ล่วงหน้าของ Model Monitor ใช้พลังงานจาก ดีคิวซึ่งเป็นไลบรารีที่สร้างขึ้นบน Apache Spark สำหรับกำหนดการทดสอบหน่วยข้อมูล ซึ่งวัดคุณภาพข้อมูลในชุดข้อมูลขนาดใหญ่ คุณไม่จำเป็นต้องเขียนโค้ดเพื่อใช้ความสามารถในการตรวจสอบที่สร้างไว้ล่วงหน้าเหล่านี้ คุณยังมีความยืดหยุ่นในการตรวจสอบโมเดลด้วยการเข้ารหัสเพื่อให้การวิเคราะห์แบบกำหนดเอง คุณสามารถรวบรวมและตรวจสอบตัวชี้วัดทั้งหมดที่ปล่อยออกมาโดย Model Monitor ใน สตูดิโอ Amazon SageMakerดังนั้น คุณจึงสามารถวิเคราะห์ประสิทธิภาพของโมเดลได้อย่างชัดเจนโดยไม่ต้องเขียนโค้ดเพิ่มเติม

ในบางสถานการณ์ เช่น เมื่อข้อมูลไม่เป็นตาราง งานการประมวลผลเริ่มต้น (สนับสนุนโดย ดีคิว) ไม่เพียงพอเพราะรองรับเฉพาะชุดข้อมูลแบบตารางเท่านั้น จอภาพที่สร้างไว้ล่วงหน้าอาจไม่เพียงพอที่จะสร้างตัววัดที่ซับซ้อนเพื่อตรวจจับการเคลื่อนตัว และอาจจำเป็นต้องนำตัววัดของคุณเองมาใช้ ในส่วนถัดไป เราจะอธิบายการตั้งค่าเพื่อนำตัวชี้วัดของคุณเข้ามาโดยการสร้างคอนเทนเนอร์ที่กำหนดเอง

สร้างคอนเทนเนอร์ Model Monitor แบบกำหนดเอง

เราใช้ สคริปต์การประเมิน จากส่วนก่อนหน้าเพื่อสร้างคอนเทนเนอร์ Docker แล้วดันไปที่ การลงทะเบียน Amazon Elastic Container (อเมซอน ECR):

#Build a docker container and push to ECR account_id = boto3.client('sts').get_caller_identity().get('Account')
ecr_repository = 'nlp-data-drift-bert-v1'
tag = ':latest'
region = boto3.session.Session().region_name
sm = boto3.client('sagemaker')
uri_suffix = 'amazonaws.com'
if region in ['cn-north-1', 'cn-northwest-1']: uri_suffix = 'amazonaws.com.cn' processing_repository_uri = f'{account_id}.dkr.ecr.{region}.{uri_suffix}/{ecr_repository + tag}'
# Creating the ECR repository and pushing the container image !docker build -t $ecr_repository docker !$(aws ecr get-login --region $region --registry-ids $account_id --no-include-email) !aws ecr create-repository --repository-name $ecr_repository !docker tag {ecr_repository + tag} $processing_repository_uri!docker push $processing_repository_uri

เมื่อคอนเทนเนอร์ Docker ของลูกค้าอยู่ใน Amazon ECR เราสามารถกำหนดเวลางาน Model Monitoring และสร้างรายงานการละเมิดตามที่แสดงในหัวข้อถัดไป

จัดกำหนดการงานการตรวจสอบแบบจำลอง

ในการจัดกำหนดการงานการตรวจสอบแบบจำลอง เราสร้างอินสแตนซ์ของ Model Monitor และใน image_uriเราอ้างถึงคอนเทนเนอร์ Docker ที่เราสร้างขึ้นในส่วนก่อนหน้า:

from sagemaker.model_monitor import ModelMonitor monitor = ModelMonitor( base_job_name='nlp-data-drift-bert-v1', role=role, image_uri=processing_repository_uri, instance_count=1, instance_type='ml.m5.large', env={ 'THRESHOLD':'0.5', 'bucket': bucket },
)

เรากำหนดเวลางานการตรวจสอบโดยใช้ create_monitoring_schedule API. คุณสามารถกำหนดเวลางานตรวจสอบเป็นรายชั่วโมงหรือรายวันได้ คุณกำหนดค่างานโดยใช้ destination พารามิเตอร์ดังแสดงในรหัสต่อไปนี้:

from sagemaker.model_monitor import CronExpressionGenerator, MonitoringOutput
from sagemaker.processing import ProcessingInput, ProcessingOutput destination = f's3://{sagemaker_session.default_bucket()}/{prefix}/{endpoint_name}/monitoring_schedule' processing_output = ProcessingOutput( output_name='result', source='/opt/ml/processing/resultdata', destination=destination,
)
output = MonitoringOutput(source=processing_output.source, destination=processing_output.destination) monitor.create_monitoring_schedule( monitor_schedule_name='nlp-data-drift-bert-schedule', output=output, endpoint_input=predictor.endpoint_name, schedule_cron_expression=CronExpressionGenerator.hourly(),
)

เพื่ออธิบายและแสดงรายการกำหนดการตรวจสอบและการรัน คุณสามารถใช้คำสั่งต่อไปนี้:

monitor.describe_schedule()
print(monitor.list_executions())

รายงานการละเมิดดริฟท์ข้อมูล

เมื่องานการตรวจสอบแบบจำลองเสร็จสมบูรณ์ คุณสามารถนำทางไปยังเส้นทาง S3 ปลายทางเพื่อเข้าถึงรายงานการละเมิด รายงานนี้มีข้อมูลป้อนเข้าทั้งหมดที่มีคะแนนโคไซน์เฉลี่ย (avg_cosine_score) ต่ำกว่าเกณฑ์ที่กำหนดเป็นตัวแปรสภาพแวดล้อม THRESHOLD:0.5 ใน รุ่นจอภาพ ตัวอย่าง. นี่เป็นข้อบ่งชี้ว่าข้อมูลที่สังเกตได้ระหว่างการอนุมานนั้นลอยเกินพื้นฐานที่กำหนดไว้

รหัสต่อไปนี้แสดงรายงานการละเมิดที่สร้างขึ้น:

{ "violations": [ { "feature_name": "sent_cosine_score", "constraint_check_type": "baseline_drift_check", "sentence": "Thanks so much for driving me home", "avg_cosine_score": 0.36653404209142876 }, { "feature_name": "sent_cosine_score", "constraint_check_type": "baseline_drift_check", "sentence": "Thanks so much for cooking dinner. I really appreciate it", "avg_cosine_score": 0.34974955975723576 }, { "feature_name": "sent_cosine_score", "constraint_check_type": "baseline_drift_check", "sentence": "Nice to meet you, Sergio. So, where are you from", "avg_cosine_score": 0.378982806084463 } ]
}

สุดท้าย จากการสังเกตนี้ คุณสามารถกำหนดค่าโมเดลของคุณสำหรับการฝึกใหม่ได้ คุณยังสามารถเปิดใช้งาน บริการแจ้งเตือนแบบง่ายของ Amazon (Amazon SNS) การแจ้งเตือนเพื่อส่งการแจ้งเตือนเมื่อมีการละเมิดเกิดขึ้น

สรุป

Model Monitor ช่วยให้คุณสามารถรักษาคุณภาพสูงของแบบจำลองของคุณในการผลิต ในโพสต์นี้ เราเน้นย้ำถึงความท้าทายด้วยการตรวจสอบการเคลื่อนตัวของข้อมูลบนข้อมูลที่ไม่มีโครงสร้าง เช่น ข้อความ และให้วิธีการที่ใช้งานง่ายในการตรวจหาการเคลื่อนตัวของข้อมูลโดยใช้สคริปต์การตรวจสอบแบบกำหนดเอง คุณสามารถค้นหารหัสที่เกี่ยวข้องกับโพสต์ต่อไปนี้ พื้นที่เก็บข้อมูล GitHub. นอกจากนี้ คุณสามารถปรับแต่งโซลูชันเพื่อใช้ตัววัดระยะทางอื่นๆ เช่น ความคลาดเคลื่อนเฉลี่ยสูงสุด (MMD) เมตริกระยะทางที่ไม่ใช่พารามิเตอร์เพื่อคำนวณการกระจายส่วนเพิ่มระหว่างการกระจายต้นทางและเป้าหมายบนพื้นที่ฝังตัว

เกี่ยวกับผู้เขียน

วิกรม เอลังโก เป็นสถาปนิก AI/ML Specialist Solutions Architect ที่ Amazon Web Services ซึ่งตั้งอยู่ในเมืองเวอร์จิเนีย ประเทศสหรัฐอเมริกา Vikram ช่วยเหลือลูกค้าในอุตสาหกรรมการเงินและประกันภัยด้วยการออกแบบ ความเป็นผู้นำทางความคิด เพื่อสร้างและปรับใช้แอปพลิเคชันการเรียนรู้ของเครื่องในวงกว้าง ปัจจุบันเขามุ่งเน้นไปที่การประมวลผลภาษาธรรมชาติ AI ที่รับผิดชอบ การเพิ่มประสิทธิภาพการอนุมาน และการปรับสเกล ML ทั่วทั้งองค์กร ในเวลาว่าง เขาสนุกกับการเดินทาง เดินป่า ทำอาหาร และตั้งแคมป์กับครอบครัว

ราหู ราเมชา เป็นสถาปนิกโซลูชัน ML กับทีมบริการ Amazon SageMaker เขามุ่งเน้นที่การช่วยเหลือลูกค้าในการย้ายปริมาณงานการผลิต ML ไปยัง SageMaker ในปริมาณมาก เขาเชี่ยวชาญด้านแมชชีนเลิร์นนิง, AI และโดเมนวิชันซิสเต็ม และสำเร็จการศึกษาระดับปริญญาโทด้านวิทยาการคอมพิวเตอร์จาก UT Dallas ในเวลาว่าง เขาชอบการเดินทางและการถ่ายภาพ

โทนี่เฉิน เป็นสถาปนิกโซลูชัน Machine Learning Solutions ที่ Amazon Web Services ซึ่งช่วยให้ลูกค้าออกแบบความสามารถในการเรียนรู้ของเครื่องที่ปรับขนาดได้และมีประสิทธิภาพในระบบคลาวด์ ในฐานะอดีตนักวิทยาศาสตร์ข้อมูลและวิศวกรข้อมูล เขาใช้ประสบการณ์เพื่อช่วยจัดการกับปัญหาที่ท้าทายที่สุดที่องค์กรต้องเผชิญในการดำเนินการแมชชีนเลิร์นนิง