اكتشف انجراف بيانات البرمجة اللغوية العصبية باستخدام مراقب نموذج Amazon SageMaker المخصص

أعاد نشره أفلاطون

المتابعون: 0

يتم تطبيق فهم اللغة الطبيعية في مجموعة واسعة من حالات الاستخدام ، من روبوتات المحادثة والمساعدات الافتراضية ، إلى الترجمة الآلية وتلخيص النص. لضمان تشغيل هذه التطبيقات بمستوى أداء متوقع ، من المهم أن تكون البيانات في بيئات التدريب والإنتاج من نفس التوزيع. عندما تختلف البيانات المستخدمة للاستدلال (بيانات الإنتاج) عن البيانات المستخدمة أثناء تدريب النموذج ، فإننا نواجه ظاهرة تُعرف باسم انحراف البيانات. عند حدوث انحراف في البيانات ، لم يعد النموذج ذا صلة بالبيانات في الإنتاج ومن المحتمل أن يكون أداؤه أسوأ من المتوقع. من المهم مراقبة بيانات الاستدلال باستمرار ومقارنتها بالبيانات المستخدمة أثناء التدريب.

يمكنك استخدام الأمازون SageMaker لبناء نماذج التعلم الآلي (ML) وتدريبها ونشرها بسرعة على أي نطاق. كإجراء استباقي ضد تدهور النموذج ، يمكنك استخدامه الأمازون SageMaker نموذج مراقب لمراقبة جودة نماذج ML الخاصة بك باستمرار في الوقت الفعلي. باستخدام Model Monitor ، يمكنك أيضًا تكوين التنبيهات لإخطار الإجراءات وتشغيلها في حالة ملاحظة أي انحراف في أداء النموذج. يمكّنك الاكتشاف المبكر والاستباقي لهذه الانحرافات من اتخاذ إجراءات تصحيحية ، مثل جمع بيانات جديدة للتدريب على الحقيقة الأرضية ، ونماذج إعادة التدريب ، ومراجعة أنظمة المنبع ، دون الحاجة إلى مراقبة النماذج يدويًا أو إنشاء أدوات إضافية.

يوفر Model Monitor أربعة أنواع مختلفة من إمكانيات المراقبة لاكتشاف انحراف النموذج وتخفيفه في الوقت الفعلي:

جودة البيانات – يساعد على اكتشاف التغيير في مخططات البيانات والخصائص الإحصائية للمتغيرات المستقلة والتنبيهات عند اكتشاف الانحراف.
جودة النموذج – لمراقبة خصائص أداء النموذج مثل الدقة أو الدقة في الوقت الفعلي، يتيح لك Model Monitor استيعاب تسميات الحقيقة الأساسية التي تم جمعها من تطبيقاتك. يقوم Model Monitor تلقائيًا بدمج معلومات الحقيقة الأساسية مع بيانات التنبؤ لحساب مقاييس أداء النموذج.
تحيز النموذج -تم دمج مراقب النموذج مع توضيح Amazon SageMaker لتحسين الرؤية في التحيز المحتمل. على الرغم من أن بياناتك أو نموذجك الأولي قد لا يكون متحيزًا، إلا أن التغييرات في العالم قد تتسبب في تطور التحيز بمرور الوقت في النموذج الذي تم تدريبه بالفعل.
شرح النموذج - ينبهك اكتشاف الانجراف عند حدوث تغيير في الأهمية النسبية لنسب الميزات.

في هذا المنشور ، نناقش أنواع انحراف جودة البيانات التي تنطبق على البيانات النصية. نقدم أيضًا طريقة لاكتشاف انحراف البيانات في البيانات النصية باستخدام Model Monitor.

انجراف البيانات في البرمجة اللغوية العصبية

يمكن تصنيف انجراف البيانات إلى ثلاث فئات اعتمادًا على ما إذا كان تحول التوزيع يحدث على جانب الإدخال أو على جانب الإخراج، أو ما إذا كانت العلاقة بين المدخلات والمخرجات قد تغيرت.

التحول المتغير

في باقة التحول المتغيريتغير توزيع المدخلات مع مرور الوقت، ولكن التوزيع المشروط ف(ص|س) لا يتغير. يسمى هذا النوع من الانجراف التحول المتغير لأن المشكلة تنشأ بسبب تحول في توزيع المتغيرات المشتركة (الميزات). على سبيل المثال ، في نموذج تصنيف البريد الإلكتروني العشوائي ، قد يختلف توزيع بيانات التدريب (مجموعة البريد الإلكتروني) عن توزيع البيانات أثناء التسجيل.

تحول التسمية

بينما يركز التحول المتغير على التغييرات في توزيع الميزات، تحول التسمية يركز على التغييرات في توزيع متغير الفئة. هذا النوع من التحول هو في الأساس عكس التحول المتغير. قد يكون التفكير في مجموعة بيانات غير متوازنة طريقة بديهية للتفكير فيها. إذا كانت نسبة الرسائل غير المرغوب فيها إلى الرسائل غير المرغوب فيها في مجموعة التدريب لدينا هي 50٪ ، ولكن في الواقع 10٪ من رسائل البريد الإلكتروني ليست بريدًا عشوائيًا ، فإن توزيع التسمية المستهدفة قد تغير.

تحول المفهوم

تحول المفهوم يختلف عن المتغير المشترك وتحول التسمية من حيث أنه لا يتعلق بتوزيع البيانات أو توزيع الفئة ، ولكنه يرتبط بدلاً من ذلك بالعلاقة بين المتغيرين. على سبيل المثال ، غالبًا ما يستخدم مرسلو البريد الإلكتروني العشوائي مجموعة متنوعة من المفاهيم لتمرير نماذج عامل تصفية البريد العشوائي ، وقد يتغير مفهوم رسائل البريد الإلكتروني المستخدمة أثناء التدريب بمرور الوقت.

الآن بعد أن فهمنا الأنواع المختلفة لانحراف البيانات ، دعنا نرى كيف يمكننا استخدام Model Monitor لاكتشاف التحول المتغير في البيانات النصية.

حل نظرة عامة

على عكس البيانات الجدولية ، المنظمة والمقيدة ، فإن البيانات النصية معقدة وعالية الأبعاد وشكل حر. لاكتشاف الانجراف بكفاءة في البرمجة اللغوية العصبية ، نعمل مع حفلات الزفاف وهي تمثيلات ذات أبعاد منخفضة للنص. يمكنك الحصول على حفلات الزفاف باستخدام نماذج لغة مختلفة مثل Word2Vec والنماذج القائمة على المحولات مثل بيرت. تعرض هذه النماذج بيانات عالية الأبعاد في مساحات منخفضة الأبعاد مع الحفاظ على المعلومات الدلالية للنص. النتائج هي نواقل كثيفة وذات مغزى للسياق ، والتي يمكن استخدامها لمختلف المهام النهائية ، بما في ذلك مراقبة انحراف البيانات.

في حلنا ، نستخدم حفلات الزفاف لاكتشاف التحول المتغير للجمل الإنجليزية. نحن نستخدم Model Monitor لتسهيل المراقبة المستمرة لمصنف النص الذي يتم نشره في بيئة الإنتاج. يتكون نهجنا من الخطوات التالية:

صقل نموذج BERT باستخدام SageMaker.
انشر مصنف BERT دقيق الضبط كنقطة نهاية في الوقت الحقيقي مع التقاط البيانات تمكين.
قم بإنشاء مجموعة بيانات أساسية تتكون من عينة من الجمل المستخدمة لتدريب مصنف BERT.
إنشاء وظيفة مراقبة SageMaker المخصصة لحساب تشابه جيب التمام بين البيانات التي تم التقاطها في الإنتاج ومجموعة البيانات الأساسية.

يوضح الرسم التخطيطي التالي سير عمل الحل:

صقل نموذج BERT

في هذا المنشور ، نستخدم مجموعة القبول اللغوي (CoLA)، مجموعة بيانات من 10,657 جملة إنجليزية مصنفة على أنها نحوية أو غير نحوية من الأدبيات اللغوية المنشورة. نحن نستخدم تدريب SageMaker لضبط نموذج BERT باستخدام مجموعة بيانات CoLa من خلال تحديد فئة مقدر PyTorch. لمزيد من المعلومات حول كيفية استخدام SDK مع PyTorch ، راجع استخدم PyTorch مع SageMaker Python SDK. استدعاء fit() طريقة المقدر يبدأ العمل التدريبي:

from sagemaker.pytorch import PyTorch # place to save model artifact
output_path = f"s3://{bucket}/{model_prefix}" estimator = PyTorch( entry_point="train_deploy.py", source_dir="code", role=role, framework_version="1.7.1", py_version="py3", instance_count=1, instance_type="ml.p3.2xlarge", output_path=output_path, hyperparameters={ "epochs": 1, "num_labels": 2, "backend": "gloo", }, disable_profiler=True, # disable debugger
)
estimator.fit({"training": inputs_train, "testing": inputs_test})

انشر النموذج

بعد تدريب نموذجنا ، قمنا باستضافته على نقطة نهاية SageMaker. لجعل نقطة النهاية تقوم بتحميل النموذج وخدمة التنبؤات ، نقوم بتنفيذ بعض الطرق في Train_deploy.py:

model_fn () - يقوم بتحميل النموذج المحفوظ وإرجاع كائن نموذج يمكن استخدامه لخدمة النموذج. يقوم الخادم النموذجي SageMaker PyTorch بتحميل نموذجنا عن طريق استدعاء model_fn.
input_fn () - يقوم بإلغاء تسلسل مدخلات التنبؤ وإعداده. في هذا المثال ، يتم تسلسل نص الطلب أولاً إلى JSON ثم إرساله إلى نقطة نهاية خدمة النموذج. لذلك ، في input_fn()، نقوم أولاً بإلغاء تسلسل نص طلب بتنسيق JSON وإرجاع الإدخال بتنسيق torch.tensor، كما هو مطلوب لـ BERT.
التنبؤ_fn () - يقوم بالتنبؤ ويعيد النتيجة.

تمكين التقاط بيانات مراقب النموذج

نحن نمكن نموذج مراقب التقاط البيانات لتسجيل بيانات الإدخال في ملف خدمة تخزين أمازون البسيطة (Amazon S3) للرجوع إليه لاحقًا:

data_capture_config = DataCaptureConfig(enable_capture=True, sampling_percentage=100, destination_s3_uri=s3_capture_upload_path)

ثم نقوم بإنشاء نقطة نهاية SageMaker في الوقت الفعلي مع النموذج الذي تم إنشاؤه في الخطوة السابقة:

predictor = estimator.deploy(endpoint_name='nlp-data-drift-bert-endpoint', initial_instance_count=1, instance_type="ml.m4.xlarge", data_capture_config=data_capture_config)

الإستنباط

نقوم بتشغيل التنبؤ باستخدام كائن التوقع الذي أنشأناه في الخطوة السابقة. قمنا بتعيين جهاز تسلسل JSON ومزيل التسلسل ، والذي يتم استخدامه بواسطة نقطة نهاية الاستدلال:

print("Sending test traffic to the endpoint {}. nPlease wait...".format(endpoint_name)) result = predictor.predict([ "Thanks so much for driving me home", "Thanks so much for cooking dinner. I really appreciate it", "Nice to meet you, Sergio. So, where are you from"
])

يتم تكوين نقطة النهاية في الوقت الفعلي لالتقاط البيانات من الطلب ، ويتم تخزين الاستجابة والبيانات في Amazon S3. يمكنك عرض البيانات التي تم التقاطها في جدول المراقبة السابق.

أنشئ خطًا أساسيًا

نستخدم نموذج BERT دقيقًا لاستخراج ميزات تضمين الجملة من بيانات التدريب. نحن نستخدم هذه المتجهات كمدخلات ميزة عالية الجودة لمقارنة مسافة جيب التمام لأن BERT تنتج تمثيلًا ديناميكيًا للكلمات مع السياق الدلالي. أكمل الخطوات التالية للحصول على تضمين الجملة:

استخدم رمز BERT المميز للحصول على معرفات الرمز المميز لكل رمز مميز (input_id) في جملة الإدخال والقناع للإشارة إلى العناصر في تسلسل الإدخال هي الرموز المميزة مقابل عناصر الحشو (attention_mask_id). نحن نستخدم BERT tokenizer.encode_plus وظيفة للحصول على هذه القيم لكل جملة إدخال:

#Add instantiation of tokenizer
encoded_dict = tokenizer.encode_plus( sent, # Input Sentence to encode. add_special_tokens = True, # Add '[CLS]' and '[SEP]' max_length = 64, # Pad sentence to max_length pad_to_max_length = True, # Truncate sentence to max_length return_attention_mask = True, #BERT model needs attention_mask return_tensors = 'pt', # Return pytorch tensors. )
input_ids = encoded_dict['input_ids']
attention_mask_ids = encoded_dict['attention_mask']

input_ids و attention_mask_ids يتم تمريرها إلى النموذج وجلب الحالات المخفية للشبكة. ال hidden_states لها أربعة أبعاد بالترتيب التالي:

رقم الطبقة (BERT بها 12 طبقة)
رقم الدفعة (جملة واحدة)
فهارس رمز كلمة
الوحدات المخفية (768 ميزة)

استخدم آخر طبقتين مخفيتين للحصول على متجه واحد (تضمين الجملة) عن طريق حساب متوسط جميع رموز الإدخال في الجملة:

outputs = model(input_ids, attention_mask_ids) # forward pass to model
hidden_states = outputs[2] # token vectors
token_vecs = hidden_states[-2][0] # last 2 layer hidden states
sentence_embedding = torch.mean(token_vecs, dim=0) # average token vectors

قم بتحويل تضمين الجملة كمصفوفة NumPy وتخزينها في موقع Amazon S3 كخط أساس يستخدمه Model Monitor:

sentence_embeddings_list = []for i in sentence_embeddings:sentence_embeddings_list.append(i.numpy()) np.save('embeddings.npy', sentence_embeddings_list) #Upload the sentence embedding to S3
!aws s3 cp embeddings.npy s3://{bucket}/{model_prefix}/embeddings/

نص التقييم

يوفر Model Monitor حاوية مسبقة الصنع مع القدرة على تحليل البيانات الملتقطة من نقاط النهاية لمجموعات البيانات المجدولة. إذا كنت تريد إحضار الحاوية الخاصة بك ، فإن Model Monitor يوفر نقاط امتداد يمكنك استخدامها. عندما تقوم بإنشاء ملف MonitoringSchedule، يبدأ Model Monitor في النهاية مهام المعالجة. لذلك ، يجب أن تكون الحاوية على دراية بعقد عمل المعالجة. نحتاج إلى إنشاء برنامج نصي تقييم متوافق مع الحاوية مدخلات العقد و النتائج.

يستخدم Model Monitor رمز التقييم على جميع العينات التي تم التقاطها أثناء جدول المراقبة. لكل نقطة بيانات استدلال ، نحسب تضمين الجملة باستخدام نفس المنطق الموصوف سابقًا. يتم استخدام تشابه جيب التمام كمقياس مسافة لقياس تشابه نقطة بيانات الاستدلال ودمج الجملة في خط الأساس. رياضيًا ، يقيس زاوية جيب التمام بين متجهي تضمين جملتين. تشير درجة التشابه العالية لجيب التمام إلى حفلات زفاف مماثلة في الجملة. تشير درجة تشابه جيب التمام الأقل إلى انحراف البيانات. نحسب متوسط جميع درجات تشابه جيب التمام ، وإذا كانت أقل من الحد الأدنى ، يتم تسجيلها في تقرير الانتهاك. بناءً على حالة الاستخدام ، يمكنك استخدام مقاييس المسافة الأخرى مثل manhattan or euclidean لقياس التشابه في زخرفة الجملة.

يوضح الرسم البياني التالي كيف نستخدم SageMaker Model Monitoring لتحديد خط الأساس واكتشاف انحراف البيانات باستخدام تشابه مسافة جيب التمام.

فيما يلي رمز احتساب الانتهاكات ؛ البرنامج النصي الكامل للتقييم متاح على GitHub جيثب::

for embed_item in embedding_list: # all sentence embeddings from baseline cosine_score += (1 - cosine(input_sentence_embedding, embed_item)) # cosine distance between input sentence embedding and baseline embedding
cosine_score_avg = cosine_score/(len(embedding_list)) # average cosine score of input sentence
if cosine_score_avg < env.max_ratio_threshold: # compare averge cosine score against a threshold sent_cosine_dict[record] = cosine_score_avg # capture details for violation report violations.append({ "sentence": record, "avg_cosine_score": cosine_score_avg, "feature_name": "sent_cosine_score", "constraint_check_type": "baseline_drift_check", "endpoint_name" : env.sagemaker_endpoint_name, "monitoring_schedule_name": env.sagemaker_monitoring_schedule_name })

قياس انحراف البيانات باستخدام Model Monitor

في هذا القسم ، نركز على قياس انحراف البيانات باستخدام Model Monitor. يتم تشغيل الشاشات المبنية مسبقًا في Model Monitor بواسطة ديكو، وهي مكتبة مبنية على Apache Spark لتحديد اختبارات الوحدة للبيانات ، والتي تقيس جودة البيانات في مجموعات البيانات الكبيرة. لا تحتاج إلى ترميز للاستفادة من إمكانيات المراقبة المبنية مسبقًا. لديك أيضًا المرونة في مراقبة النماذج عن طريق الترميز لتوفير تحليل مخصص. يمكنك جمع ومراجعة جميع المقاييس المنبعثة من Model Monitor في أمازون ساجميكر ستوديو، حتى تتمكن من تحليل أداء النموذج بشكل مرئي دون كتابة تعليمات برمجية إضافية.

في سيناريوهات معينة ، على سبيل المثال عندما تكون البيانات غير مجدولة ، فإن مهمة المعالجة الافتراضية (مدعومة من ديكو) لا يكفي لأنه يدعم مجموعات البيانات المجدولة فقط. قد لا تكون الشاشات المبنية مسبقًا كافية لإنشاء مقاييس معقدة لاكتشاف الانجرافات ، وقد تستلزم إحضار المقاييس الخاصة بك. في الأقسام التالية ، نصف الإعداد لإحضار المقاييس الخاصة بك عن طريق إنشاء حاوية مخصصة.

قم ببناء حاوية Model Monitor المخصصة

نستخدم السيناريو التقييم من القسم السابق لبناء حاوية Docker ودفعها إلى سجل الأمازون المرنة للحاويات (أمازون ECR):

#Build a docker container and push to ECR account_id = boto3.client('sts').get_caller_identity().get('Account')
ecr_repository = 'nlp-data-drift-bert-v1'
tag = ':latest'
region = boto3.session.Session().region_name
sm = boto3.client('sagemaker')
uri_suffix = 'amazonaws.com'
if region in ['cn-north-1', 'cn-northwest-1']: uri_suffix = 'amazonaws.com.cn' processing_repository_uri = f'{account_id}.dkr.ecr.{region}.{uri_suffix}/{ecr_repository + tag}'
# Creating the ECR repository and pushing the container image !docker build -t $ecr_repository docker !$(aws ecr get-login --region $region --registry-ids $account_id --no-include-email) !aws ecr create-repository --repository-name $ecr_repository !docker tag {ecr_repository + tag} $processing_repository_uri!docker push $processing_repository_uri

عندما تكون حاوية Docker الخاصة بالعميل في Amazon ECR ، يمكننا جدولة مهمة مراقبة النموذج وإنشاء تقرير بالمخالفات ، كما هو موضح في الأقسام التالية.

جدولة مهمة مراقبة النموذج

لجدولة مهمة مراقبة النموذج ، نقوم بإنشاء مثيل لـ Model Monitor وفي image_uri، نشير إلى حاوية Docker التي أنشأناها في القسم السابق:

from sagemaker.model_monitor import ModelMonitor monitor = ModelMonitor( base_job_name='nlp-data-drift-bert-v1', role=role, image_uri=processing_repository_uri, instance_count=1, instance_type='ml.m5.large', env={ 'THRESHOLD':'0.5', 'bucket': bucket },
)

نقوم بجدولة مهمة المراقبة باستخدام create_monitoring_schedule API. يمكنك جدولة مهمة المراقبة على أساس كل ساعة أو على أساس يومي. يمكنك تكوين الوظيفة باستخدام ملف destination المعلمة ، كما هو موضح في الكود التالي:

from sagemaker.model_monitor import CronExpressionGenerator, MonitoringOutput
from sagemaker.processing import ProcessingInput, ProcessingOutput destination = f's3://{sagemaker_session.default_bucket()}/{prefix}/{endpoint_name}/monitoring_schedule' processing_output = ProcessingOutput( output_name='result', source='/opt/ml/processing/resultdata', destination=destination,
)
output = MonitoringOutput(source=processing_output.source, destination=processing_output.destination) monitor.create_monitoring_schedule( monitor_schedule_name='nlp-data-drift-bert-schedule', output=output, endpoint_input=predictor.endpoint_name, schedule_cron_expression=CronExpressionGenerator.hourly(),
)

لوصف وسرد جدول المراقبة وتشغيله ، يمكنك استخدام الأوامر التالية:

monitor.describe_schedule()
print(monitor.list_executions())

تقرير انتهاك انحراف البيانات

عند اكتمال مهمة مراقبة النموذج ، يمكنك الانتقال إلى مسار الوجهة S3 للوصول إلى تقارير الانتهاك. يحتوي هذا التقرير على جميع المدخلات التي متوسط درجات جيب التمام (avg_cosine_score) أقل من الحد الذي تم تكوينه كمتغير بيئة THRESHOLD:0.5 في ال ModelMonitor نموذج. هذا مؤشر على أن البيانات التي لوحظت أثناء الاستدلال تنجرف إلى ما وراء خط الأساس المحدد.

يوضح الكود التالي تقرير الانتهاك الناتج:

{ "violations": [ { "feature_name": "sent_cosine_score", "constraint_check_type": "baseline_drift_check", "sentence": "Thanks so much for driving me home", "avg_cosine_score": 0.36653404209142876 }, { "feature_name": "sent_cosine_score", "constraint_check_type": "baseline_drift_check", "sentence": "Thanks so much for cooking dinner. I really appreciate it", "avg_cosine_score": 0.34974955975723576 }, { "feature_name": "sent_cosine_score", "constraint_check_type": "baseline_drift_check", "sentence": "Nice to meet you, Sergio. So, where are you from", "avg_cosine_score": 0.378982806084463 } ]
}

أخيرًا ، بناءً على هذه الملاحظة ، يمكنك تكوين نموذجك لإعادة التدريب. يمكنك أيضًا تمكين خدمة إعلام أمازون البسيطة (Amazon SNS) لإرسال تنبيهات عند حدوث انتهاكات.

وفي الختام

يُمكّنك Model Monitor من الحفاظ على الجودة العالية لنماذجك في الإنتاج. في هذا المنشور ، سلطنا الضوء على التحديات المتعلقة بمراقبة انجراف البيانات على البيانات غير المهيكلة مثل النص ، وقدمنا نهجًا بديهيًا لاكتشاف انحراف البيانات باستخدام برنامج نصي مخصص للمراقبة. يمكنك العثور على الكود المرتبط بالمنشور فيما يلي مستودع جيثب. بالإضافة إلى ذلك ، يمكنك تخصيص الحل لاستخدام مقاييس المسافة الأخرى مثل الحد الأقصى لمتوسط التباين (MMD) ، مقياس مسافة غير حدودي لحساب التوزيع الهامشي بين توزيع المصدر والهدف على المساحة المضمنة.

حول المؤلف

فيكرام إيلانجو هو مهندس حلول متخصص في الذكاء الاصطناعي / التعلم الآلي في Amazon Web Services ، ومقرها في فرجينيا ، الولايات المتحدة الأمريكية. يساعد Vikram عملاء الصناعة المالية والتأمينية في التصميم والقيادة الفكرية لبناء ونشر تطبيقات التعلم الآلي على نطاق واسع. يركز حاليًا على معالجة اللغة الطبيعية ، والذكاء الاصطناعي المسؤول ، وتحسين الاستدلال وتوسيع ML عبر المؤسسة. في أوقات فراغه ، يستمتع بالسفر والتنزه والطهي والتخييم مع عائلته.

راغو راميشا هو مهندس حلول ML مع فريق Amazon SageMaker Service. يركز على مساعدة العملاء على ترحيل أعباء عمل إنتاج ML إلى SageMaker على نطاق واسع. وهو متخصص في مجالات التعلم الآلي والذكاء الاصطناعي ورؤية الكمبيوتر ، وهو حاصل على درجة الماجستير في علوم الكمبيوتر من جامعة UT Dallas. في أوقات فراغه يستمتع بالسفر والتصوير.

توني تشن هو مهندس حلول التعلم الآلي في Amazon Web Services ، مما يساعد العملاء على تصميم إمكانات تعلم آلي قوية وقابلة للتطوير في السحابة. بصفته عالم بيانات سابقًا ومهندس بيانات ، فقد استفاد من خبرته للمساعدة في معالجة بعض أكثر المشكلات تحديًا التي تواجهها المؤسسات مع تفعيل التعلم الآلي.