هذا هو الجزء الأول من سلسلة من جزأين على الحقيقة الأمازون SageMaker الأرض وسير عمل التوسيم الهرمي ولوحات المعلومات. في الجزء الأول ، ننظر إلى إنشاء مهام سير عمل متعددة الخطوات لوضع العلامات لتصنيفات الملصقات الهرمية باستخدام وظائف خطوة AWS. في الجزء 2 (قريبًا) ، ننظر في كيفية إنشاء لوحات معلومات لتحليل التعليقات التوضيحية لمجموعة البيانات ومقاييس أداء العمال في بحيرات البيانات الناتجة عن عمليات سير العمل المعقدة واستنباط الرؤى.
غالبًا ما تتطلب تسمية البيانات كائن بيانات واحدًا لتضمين أنواع متعددة من التعليقات التوضيحية ، أو متعدد نوع، مثل المربعات ثنائية الأبعاد (المربعات المحيطة) والخطوط وأقنعة التجزئة ، كل ذلك في صورة واحدة. بالإضافة إلى ذلك ، لإنشاء نماذج عالية الجودة للتعلم الآلي (ML) باستخدام البيانات المصنفة ، تحتاج إلى طريقة لمراقبة جودة الملصقات. يمكنك القيام بذلك عن طريق إنشاء سير عمل يتم فيه تدقيق البيانات المسماة وتعديلها حسب الحاجة. يقدم هذا المنشور حلاً لمعالجة كل من تحديات وضع العلامات هذه باستخدام مجموعة بيانات السيارات ، ويمكنك توسيع هذا الحل للاستخدام مع أي نوع من مجموعات البيانات.
بالنسبة لحالة الاستخدام الخاصة بنا ، افترض أن لديك كمية كبيرة من بيانات فيديو السيارات تم تصويرها من زاوية واحدة أو أكثر على مركبة متحركة (على سبيل المثال ، بعض مشاهد تتبع الأجسام المتعددة (MOT)) وتريد إضافة تعليقات توضيحية إلى البيانات باستخدام أنواع متعددة من التعليقات التوضيحية. أنت تخطط لاستخدام هذه البيانات لتدريب خوارزمية ML للتحكم في السرعة والحفاظ على المسار. بالنظر إلى المهمة المطروحة ، من الضروري أن تستخدم ملصقات عالية الجودة لتدريب النموذج.
أولاً ، يجب تحديد أنواع التعليقات التوضيحية التي تريد إضافتها إلى إطارات الفيديو الخاصة بك. من بين أهم الأشياء التي يجب تسميتها لحالة الاستخدام هذه المركبات الأخرى الموجودة في الإطار وحدود الطريق والممرات. للقيام بذلك ، عليك تحديد ملف تصنيف التصنيف الهرمي، الذي يحدد نوع التسميات التي تريد إضافتها إلى كل فيديو ، والترتيب الذي تريد إضافة التسميات به. ال وظيفة وضع العلامات على تتبع فيديو الحقيقة الأرضية يدعم التعليقات التوضيحية لمربع الإحاطة ، والخطوط المتعددة ، والمضلع ، ونقطة المفاتيح. في حالة الاستخدام هذه ، يتم شرح المركبات باستخدام مربعات ثنائية الأبعاد ، أو مربعات تحيط، ويشار إلى حدود الطريق ومنحنياته بسلسلة من مقاطع الخطوط المرنة ، ويُشار إليها باسم الخطوط المتعددة.
ثانيًا ، تحتاج إلى إنشاء سير عمل لضمان جودة الملصق. للقيام بذلك ، يمكنك إنشاء سير عمل تدقيق للتحقق من أن الملصقات التي تم إنشاؤها بواسطة خط الأنابيب الخاص بك ذات جودة عالية بما يكفي لتكون مفيدة للتدريب على النموذج. في سير عمل التدقيق هذا ، يمكنك تحسين دقة الملصق بشكل كبير من خلال إنشاء خط أنابيب مراجعة متعدد الخطوات يسمح بتدقيق التعليقات التوضيحية ، وإذا لزم الأمر ، تعديلها بواسطة مراجع ثان قد يكون خبيرًا في الموضوع.
استنادًا إلى حجم مجموعة البيانات وكائنات البيانات ، يجب أيضًا مراعاة الوقت والموارد المطلوبة لإنشاء خط الأنابيب هذا وصيانته. من الناحية المثالية ، تريد أن تبدأ هذه السلسلة من وظائف وضع العلامات تلقائيًا ، وتتطلب فقط عملية بشرية لتحديد بيانات الإدخال وسير العمل.
الحل المستخدم في هذا المنشور يستخدم Ground Truth ، تكوين سحابة AWSو Step Functions و الأمازون DynamoDB لإنشاء سلسلة من وظائف التصنيف التي تعمل بطريقة متوازية وهرمية. يمكنك استخدام تصنيف تسمية هرمي لإنشاء وظائف وضع العلامات لأنماط مختلفة (خطوط متعددة ومربعات إحاطة) ، وتضيف خطوات مراجعة بشرية ثانوية لتحسين جودة التعليقات التوضيحية والنتائج النهائية.
بالنسبة إلى هذا المنشور ، نعرض الحل في سياق مساحة السيارات ، ولكن يمكنك بسهولة تطبيق خط الأنابيب العام هذا على خطوط الأنابيب التي تتضمن الصور ومقاطع الفيديو والنصوص والمزيد. بالإضافة إلى ذلك ، نعرض سير عمل قابل للتوسيع ، مما يسمح لك بتقليل العدد الإجمالي للإطارات التي تحتاج إلى مراجعة بشرية عن طريق إضافة فحوصات جودة آلية والحفاظ على جودة البيانات على نطاق واسع. في حالة الاستخدام هذه ، نستخدم هذه الفحوصات للعثور على الحالات الشاذة في بيانات السلاسل الزمنية MOT مثل التعليقات التوضيحية لتتبع كائن الفيديو.
نسير في حالة استخدام نقوم فيها بإنشاء أنواع متعددة من التعليقات التوضيحية لمشهد السيارات. على وجه التحديد ، نقوم بتشغيل أربع وظائف وضع العلامات لكل مقطع فيديو إدخال: وضع العلامات الأولية للمركبات ، ووضع العلامات الأولية للممرات ، ثم وظيفة التعديل لكل وظيفة أولية مع قوة عاملة منفصلة لضمان الجودة.
نوضح نقاط الامتداد المختلفة في سير عمل Step Function الذي يمكن أن يسمح لك بالتشغيل الفحوصات الآلية لضمان الجودة. يسمح هذا بتصفية القصاصات بين وبعد اكتمال الوظائف ، مما قد ينتج عنه تعليقات توضيحية عالية الجودة لجزء بسيط من التكلفة.
تستخدم خدمات AWS لتنفيذ هذا الحل
ينشئ هذا الحل ويدير وظائف وضع العلامات على Ground Truth لتسمية إطارات الفيديو باستخدام أنواع متعددة من التعليقات التوضيحية. تمتلك Ground Truth دعمًا أصليًا لمجموعات بيانات الفيديو من خلال إطار الفيديو الخاص بها نوع مهمة تتبع الكائن.
يسمح نوع المهمة هذا للعمال بإنشاء تعليقات توضيحية عبر سلسلة من إطارات الفيديو ، مما يوفر أدوات للتنبؤ بالموقع التالي لمربع إحاطة في الإطارات اللاحقة. كما أنها تدعم أنواعًا متعددة من التعليقات التوضيحية مثل المربعات المحيطة أو الخطوط المتعددة عبرها ملفات تكوين فئة التسمية المقدمة أثناء خلق فرص العمل. نستخدم هذه الأدوات في هذا البرنامج التعليمي ، حيث نقوم بتشغيل وظيفة للصناديق المحيطة بالمركبة ووظيفة لخطوط الحارة المتعددة.
نستخدم وظائف الخطوة لإدارة وظيفة وضع العلامات. يلخص هذا الحل وضع العلامات على إنشاء الوظائف بحيث تحدد سير العمل الإجمالي الذي تريد تشغيله باستخدام تصنيف تسمية هرمي ، ويتم التعامل مع جميع إدارة الوظائف بواسطة وظائف الخطوة.
يتم تنفيذ الحل باستخدام قوالب CloudFormation التي يمكنك نشرها في حساب AWS الخاص بك. واجهة الحل هي واجهة برمجة تطبيقات يديرها بوابة أمازون API، والذي يوفر القدرة على إرسال مهام التعليقات التوضيحية إلى الحل ، والتي يتم ترجمتها بعد ذلك إلى وظائف وضع العلامات على Ground Truth.
التكاليف المقدرة
من خلال نشر هذا الحل واستخدامه ، فإنك تتحمل تكلفة قصوى تبلغ 20 دولارًا تقريبًا بخلاف تكاليف وضع العلامات البشرية لأنه لا يستخدم إلا موارد الحوسبة المُدارة بالكامل عند الطلب. خدمة تخزين أمازون البسيطة (Amazon S3) ، AWS لامدا, الأمازون SageMakerبوابة API ، خدمة إعلام أمازون البسيطة (Amazon SNS) ، خدمة Amazon Simple Queue Service (Amazon SQS) ، غراء AWS، ووظائف الخطوة مدرجة في ملف طبقة AWS المجانية، مع رسوم للاستخدام الإضافي. لمزيد من المعلومات ، راجع صفحات التسعير التالية:
يعتمد تسعير Ground Truth على نوع القوة العاملة التي تستخدمها. إذا كنت مستخدمًا جديدًا لـ Ground Truth ، فنحن نقترح عليك استخدام قوة عاملة خاصة وتضمين نفسك كعامل لاختبار تكوين وظيفة التسمية الخاصة بك. لمزيد من المعلومات، راجع تسعير Amazon SageMaker Ground Truth.
حل نظرة عامة
في هذه السلسلة المكونة من جزأين ، نناقش نمطًا معماريًا يسمح لك ببناء خط أنابيب لتنظيم تدفقات عمل تسمية البيانات متعددة الخطوات التي تجعل العمال يضيفون أنواعًا مختلفة من التعليقات التوضيحية بالتوازي باستخدام Ground Truth. تتعلم أيضًا كيف يمكنك تحليل التعليقات التوضيحية لمجموعة البيانات التي ينتجها سير العمل بالإضافة إلى أداء العامل. يغطي المنشور الأول سير عمل Step Functions الذي يعمل على أتمتة تدفقات عمل تسمية بيانات ML المتقدمة باستخدام Ground Truth للتسلسل وتصنيفات الملصقات الهرمية. يصف المنشور الثاني كيفية إنشاء بحيرات البيانات على التعليقات التوضيحية لمجموعة البيانات من Ground Truth ومقاييس العمال واستخدام بحيرات البيانات هذه لاستخلاص رؤى أو تحليل أداء العاملين لديك وجودة التعليقات التوضيحية لمجموعة البيانات باستخدام التحليلات المتقدمة.
يصف الرسم التخطيطي التالي سير العمل الهرمي ، والذي يمكنك استخدامه لتشغيل مجموعات من مهام وضع العلامات في خطوات متسلسلة ، أو ومستوياتها، حيث تعمل كل وظيفة تصنيف في مستوى واحد بالتوازي.
يتكون الحل من جزأين رئيسيين:
- استخدم API لتشغيل سير عمل التزامن.
- قم بتشغيل الخطوات الفردية لسير العمل لتحقيق خط أنابيب وضع العلامات.
قم بتشغيل سير عمل التزامن باستخدام واجهة برمجة التطبيقات (API)
يستخدم قالب CloudFormation الذي تم إطلاقه في هذا الحل API Gateway لكشف نقطة نهاية لك لتشغيل وظائف وضع العلامات المجمعة. بعد إرسال طلب النشر إلى نقطة نهاية بوابة API ، يتم تشغيل وظيفة Lambda لتشغيل سير العمل.
يحتوي الجدول التالي على اثنين من واجهات برمجة التطبيقات (API) الرئيسية التي تواجه المستخدم والمرتبطة بتشغيل الدُفعة ، والتي تمثل وظائف وضع العلامات متعددة المستويات.
URL | نوع الطلب | الوصف |
{endpointUrl} / batch / create | سأعين | تعمل واجهة برمجة التطبيقات على تشغيل مجموعة جديدة من وظائف وضع العلامات |
{endpointUrl} / دفعة / عرض | للحصول على | تصف واجهات برمجة التطبيقات الحالة الحالية لتشغيل وظيفة المجموعة |
قم بتشغيل سير العمل
لتنسيق الخطوات ، نستخدم Step Functions كحل مُدار. عندما يتم تشغيل واجهة برمجة التطبيقات لإنشاء وظيفة الدُفعات ، تقوم وظيفة Lambda بتشغيل سير عمل Step Functions كما يلي. هذا يبدأ معالجة إدخال التعليق التوضيحي.
دعونا نناقش الخطوات بمزيد من التفصيل.
خطوة التحول
الخطوة الأولى هي المعالجة المسبقة للبيانات. يحول التنفيذ الحالي مدخلات دفتر الملاحظات إلى ملف نوع بيانات ملف البيان الداخلي مشتركة عبر خطوات متعددة. لا تؤدي هذه الخطوة حاليًا أي معالجة معقدة ، ولكن يمكنك تخصيص هذه الخطوة بشكل أكبر عن طريق إضافة منطق المعالجة المسبقة للبيانات المخصصة إلى هذه الوظيفة. على سبيل المثال ، إذا تم ترميز مجموعة البيانات الخاصة بك في مقاطع فيديو خام ، فيمكنك إجراء تقسيم الإطار وإنشاء البيان داخل التحويل بدلاً من دفتر ملاحظات منفصل. بدلاً من ذلك ، إذا كنت تستخدم هذا الحل لإنشاء خط أنابيب وضع العلامات السحابية ثلاثية الأبعاد ، فقد ترغب في إضافة منطق لاستخراج بيانات الوضع في نظام إحداثيات عالمي باستخدام مصفوفات LiDAR الخارجية.
عامل التشغيل
عند اكتمال المعالجة المسبقة للبيانات ، يتم تشغيل واجهة برمجة تطبيقات الحقيقة الأرضية CreateLabelingJob يستخدم لإطلاق وظائف وضع العلامات. وظائف وضع العلامات هذه مسؤولة عن إضافة تعليقات توضيحية لمجموعات البيانات المرتبطة بالمستوى الأول.
CheckForFirstLevelComplete
هذه الخطوة تنتظر FIRST_LEVEL
وظائف وضع العلامات على الحقيقة الأرضية التي تم تشغيلها من TriggerLabelingFirstStep
. عند اكتمال مشغل الوظيفة ، تنتظر هذه الخطوة حتى تكتمل جميع وظائف وضع العلامات التي تم إنشاؤها. تقوم وظيفة Lambda المستمع الخارجي بمراقبة حالة وظائف وضع العلامات ، وعندما تنتهي جميع وظائف وضع العلامات المعلقة ، فإنها تقوم بتشغيل sendTokenSucess
API للإشارة إلى هذه الحالة للمتابعة إلى الخطوة التالية. يتم التعامل مع حالات الفشل باستخدام فقرات الخطأ المناسبة والمهلة في تعريف الخطوة.
SendSecondLevelSNSAndCheckResponse
تقوم هذه الخطوة بإجراء معالجة لاحقة على إخراج مهمة المستوى الأول. على سبيل المثال ، إذا كانت متطلباتك هي إرسال 10٪ فقط من الإطارات إلى مهام الضبط ، فيمكنك تنفيذ هذا المنطق هنا عن طريق تصفية مجموعة المخرجات من المهمة الأولى.
المشغلLabelingSecondLevel
عند اكتمال المعالجة اللاحقة للبيانات من المستوى الأول ، CreateLabelingJobs
تُستخدم لإطلاق وظائف وضع العلامات لإكمال التعليقات التوضيحية في المستوى الثاني. في هذه المرحلة ، تقوم قوة عاملة خاصة بمراجعة جودة التعليقات التوضيحية لوظائف تصنيف المستوى الأول وتحديث التعليقات التوضيحية حسب الحاجة.
CheckForSecondLevelComplete
هذه الخطوة هي نفس خطوة الانتظار مثل CheckForFirstLevelComplete
, لكن هذه الخطوة تنتظر ببساطة الوظائف التي تم إنشاؤها من المستوى الثاني.
إرسالالمستوى الثالث
هذه الخطوة هي نفس خطوة ما بعد المعالجة مثل SendSecondLevelSNSAndCheckResponse
, لكن هذه الخطوة تقوم بالمعالجة اللاحقة لمخرجات المستوى الثاني والتغذية كمدخلات لوظيفة تصنيف المستوى الثالث.
المشغلالتسميةالمستوى الثالث
هذا هو نفس منطق TriggerLabelingSecondLevel
, ولكن يتم تشغيل وظائف وضع العلامات التي تم شرحها كمستوى ثالث. في هذه المرحلة ، تقوم القوى العاملة الخاصة بتحديث التعليقات التوضيحية لجودة وظيفة تصنيف المستوى الثاني.
تم إكمال CopyLogsAndSendBatch
تقوم وظيفة Lambda هذه بتسجيل رسائل SNS وإرسالها لإعلام المستخدمين بأن الدفعة قد اكتملت. إنه أيضًا عنصر نائب لأي منطق معالجة لاحقة قد ترغب في تشغيله. تتضمن المعالجة اللاحقة الشائعة تحويل البيانات المصنفة إلى تنسيق متوافق مع تنسيق بيانات خاص بالعميل.
المتطلبات الأساسية المسبقة
قبل البدء ، تأكد من توفر المتطلبات الأساسية التالية لديك:
- An حساب AWS.
- مفكرة إدارة الهوية والوصول AWS (IAM) مع الأذونات المطلوبة لإكمال هذه الإرشادات التفصيلية. يجب أن يحتوي دور IAM الخاص بك على الأذونات المطلوبة المرفقة. إذا كنت لا تحتاج إلى إذن دقيق ، فقم بإرفاق سياسات AWS التالية المُدارة:
AmazonS3FullAccess
AmazonAPIGatewayInvokeFullAccess
AmazonSageMakerFullAccess
- الإلمام بميزة Ground Truth و AWS CloudFormation ووظائف الخطوة.
- صانع حكيم القوى العاملة. في هذا المنشور ، نستخدم قوة عاملة خاصة. يمكنك إنشاء قوة عاملة على وحدة تحكم SageMaker. لاحظ ال أمازون كوجنيتو معرّف تجمع المستخدمين ومعرّف عميل التطبيق بعد إنشاء القوى العاملة. يمكنك استخدام هذه القيم لإخبار نشر مكدس CloudFormation أي القوى العاملة لإنشاء فرق العمل ، والتي تمثل مجموعة المصنفات. يمكنك العثور على هذه القيم في ملف ملخص القوى العاملة الخاصة قسم على وحدة التحكم بعد إنشاء القوى العاملة الخاصة بك ، أو عند الاتصال وصف فريق العمل.
يوضح GIF التالي كيفية إنشاء قوة عاملة خاصة. للحصول على إرشادات خطوة بخطوة ، انظر أنشئ Amazon Cognito Workforce باستخدام صفحة Labeling Work Force.
قم بتشغيل مكدس CloudFormation
الآن بعد أن رأينا بنية الحل ، نقوم بنشره في حسابنا حتى نتمكن من تشغيل مثال على سير العمل. تتم إدارة جميع خطوات النشر الخاصة بنا بواسطة AWS CloudFormation - فهي تنشئ موارد في Lambda و Step Functions و DynamoDB و API Gateway نيابة عنك.
يمكنك تشغيل الحزمة في منطقة AWS us-east-1
على وحدة تحكم CloudFormation عن طريق اختيار قم بتشغيل Stack:
في وحدة تحكم CloudFormation ، حدد المقبل، ثم قم بتعديل معلمات النموذج التالية لتخصيص الحل.
يمكنك تحديد موقع CognitoUserPoolClientId و CognitoUserPoolId في وحدة تحكم SageMaker.
- معرف CognitoUserPoolClient: معرف عميل التطبيق للقوى العاملة الخاصة بك.
- معرف مستخدم CognitoUserPool: معرّف تجمع المستخدمين المرتبط بالقوى العاملة الخاصة بك.
لتحديد هذه القيم في وحدة التحكم:
- افتح وحدة تحكم SageMaker في https://console.aws.amazon.com/sagemaker/
- أختار القوى العاملة وضع العلامات في جزء التنقل.
- اختيار خاص
- استخدم القيم الموجودة في ملف ملخص فريق العمل الخاص استخدم عميل التطبيق لـ CognitoUserPoolClientId والاستخدام تجمع مستخدمي Amazon Cognito ل معرف CognitoUserPool.
في هذا البرنامج التعليمي ، يمكنك استخدام القيم الافتراضية للمعلمات التالية.
- وظيفة الغراء تعبير Cron لاستخدامه عند جدولة إعداد التقارير عن مهمة AWS Glue cron. تُستخدم نتائج التعليقات التوضيحية التي تم إنشاؤها باستخدام SageMaker Ground Truth ومقاييس أداء العمال لإنشاء لوحة معلومات في Amazon QuickSight. سيتم شرح ذلك بالتفصيل كجزء من الجزء الثاني. تظهر مخرجات تعليقات SageMaker التوضيحية ومقاييس أداء العمال في استعلامات أثينا بعد معالجة البيانات باستخدام AWS Glue. بشكل افتراضي ، تعمل وظائف AWS Glue cron كل ساعة.
- إتمام المهمة عدد الثواني التي يجب انتظارها قبل معالجة وظيفة وضع العلامات على أنها فاشلة والانتقال إلى حالة BatchError.
- مستوى التسجيل: يتم استخدام هذا داخليًا ويمكن تجاهله. مستوى التسجيل لتغيير إسهاب السجلات. يقبل قيم DEBUG و PROD.
اختصار: بادئة يتم استخدامها عند تسمية الموارد المستخدمة لإنشاء وإدارة وظائف التصنيف ومقاييس العمال.
لبدء تشغيل الحزمة في منطقة AWS مختلفة ، استخدم الإرشادات الموجودة في ملف README الخاص بـ مستودع جيثب.
بعد نشر الحل ، يوجد فريقان عمل جديدان في القوة العاملة الخاصة التي أنشأتها سابقًا: smgt-workflow-first-level
و smgt-workflow-second-level
. هذه هي فرق العمل الافتراضية التي يستخدمها الحل إذا لم يتم تحديد تجاوزات ، و smgt-workflow-second-level
يتم استخدام فريق العمل لوصف وظائف المستوى الثاني والثالث. يجب أن تضيف نفسك إلى كل من فرق العمل لترى تصنيف المهام التي تم إنشاؤها بواسطة الحل. لمعرفة كيفية إضافة نفسك إلى فريق عمل خاص ، راجع إضافة أو إزالة العمال.
تحتاج أيضًا إلى الانتقال إلى وحدة تحكم API Gateway والبحث عن واجهة برمجة التطبيقات المنشورة مسبوقة بـ smgt-workflow
ولاحظ معرّفها. يحتاج دفتر الملاحظات إلى الرجوع إلى هذا المعرف حتى يتمكن من تحديد عنوان URL الخاص بواجهة برمجة التطبيقات (API) الذي سيتم الاتصال به.
قم بتشغيل الكمبيوتر الدفتري
بعد نشر الحل في حسابك ، تكون جاهزًا لتشغيل دفتر ملاحظات للتفاعل معه وبدء مهام سير عمل جديدة. في هذا القسم ، نتصفح الخطوات التالية:
- قم بإعداد مثيل دفتر الملاحظات والوصول إليه.
- احصل على مثال لمجموعة البيانات.
- قم بإعداد ملفات إدخال الحقيقة الأرضية.
قم بإعداد مثيل دفتر ملاحظات SageMaker
في مثال دفتر الملاحظات هذا ، ستتعلم كيفية تعيين تصنيف بسيط يتكون من فئة مركبة وفئة حارة إلى ملفات تكوين فئة تسمية الحقيقة الأرضية. يتم استخدام ملف تكوين فئة التسمية لتحديد الملصقات التي يستخدمها العمال للتعليق على صورك. بعد ذلك ، ستتعلم كيفية تشغيل الحل الذي يدير خط الأنابيب وتكوينه باستخدام قالب CloudFormation. يمكنك أيضًا تخصيص هذا الرمز بشكل أكبر ، على سبيل المثال عن طريق تخصيص استدعاء API لإنشاء الدُفعات لتشغيل وضع العلامات لمجموعة مختلفة من أنواع المهام.
لإنشاء مثيل دفتر ملاحظات والوصول إلى دفتر الملاحظات المستخدم في هذا المنشور ، أكمل الخطوات التالية:
- إنشاء نسخة دفتر ملاحظات بالمعلمات التالية:
- استخدم ml.t2.medium لبدء تشغيل مثيل دفتر الملاحظات.
- زيادة حجم تخزين ML إلى 10 جيجابايت على الأقل.
- حدد دور IAM في دفتر الملاحظات الموضح في المتطلبات الأساسية. يتيح هذا الدور للكمبيوتر الدفتري تحميل مجموعة البيانات الخاصة بك إلى Amazon S3 واستدعاء واجهات برمجة التطبيقات للحل.
- افتح Jupyter Lab أو Jupyter إلى الوصول إلى مثيلات دفتر الملاحظات الخاص بك.
- في Jupyter ، اختر ملف أمثلة على برنامج SageMaker في Jupyter Lab ، اختر أيقونة SageMaker.
- اختار وظائف وضع العلامات على الأرض ثم اختر الوظيفة sagemaker_ground_truth_workflows.ipynb.
- إذا كنت تستخدم Jupyter ، فاختر استعمل لنسخ دفتر الملاحظات إلى المثيل وتشغيله. إذا كنت في مختبر Jupyter ، فاختر إنشاء نسخة.
احصل على مثال لمجموعة البيانات
أكمل الخطوات التالية لإعداد مجموعة البيانات الخاصة بك:
- قم بتنزيل MOT17.zip باستخدام ملف تنزيل Dataset قسم من دفتر الملاحظات.
تبلغ مساحة هذا التنزيل 5 غيغابايت تقريبًا ويستغرق عدة دقائق.
- قم بفك ضغط MOT17.zip باستخدام الكمبيوتر المحمول قم بفك ضغط مجموعة البيانات
- تحت المبادرة من انسخ البيانات إلى S3 header ، قم بتشغيل الخلية لنسخ مجموعة واحدة من مجموعة بيانات إطارات الفيديو إلى Amazon S3.
قم بإعداد ملفات إدخال الحقيقة الأرضية
لاستخدام الحل ، نحتاج إلى إنشاء ملف بيان. يخبر هذا الملف Ground Truth بمكان مجموعة البيانات الخاصة بك. نحتاج أيضًا إلى ملفي تكوين فئة التسمية لوصف أسماء الملصقات الخاصة بنا ، وأداة وضع العلامات لاستخدامها لكل (مربع محيط أو متعدد الخطوط).
- قم بتشغيل الخلايا تحتها توليد البيان للحصول على قائمة الإطارات في مقطع فيديو من مجموعة البيانات. نأخذ 150 إطارًا بنصف معدل الإطارات للفيديو كمثال.
- تواصل تشغيل الخلايا تحت توليد البيان لإنشاء ملف تسلسل يصف إطارات الفيديو الخاصة بنا ، ثم إنشاء ملف بيان يشير إلى ملف التسلسل الخاص بنا.
- قم بتشغيل الخلية تحتها إنشاء ملفات تكوين فئة التسمية لإنشاء ملفين جديدين: ملف تكوين ملصق السيارة (الذي يستخدم أداة المربع المحيط) ، وملف تكوين تسمية الممر (الذي يستخدم أداة الخطوط المتعددة).
- انسخ ملف البيان وقم بتسمية ملفات تكوين الفئة إلى Amazon S3 عن طريق تشغيل ملف أرسل البيانات إلى S3
في هذه المرحلة ، تكون قد أعددت جميع المدخلات لوظائف وضع العلامات وأنت على استعداد لبدء تشغيل الحل.
لمعرفة المزيد حول وظائف وضع العلامات على إطار فيديو الحقيقة الأرضية وتسلسلها ، راجع المراجع التالية:
قم بتشغيل مثال على سير العمل
في هذا القسم ، نتصفح الخطوات لتشغيل مثال على سير العمل في مجموعة بيانات السيارات. نقوم بإنشاء سير عمل متعدد الوسائط ، ونقوم بعمل العلامات الأولية والتدقيق ، ثم نعرض التعليقات التوضيحية المكتملة.
قم بإنشاء دفعة سير عمل
ينظم هذا الحل سير عمل مهام وضع العلامات على Ground Truth لتشغيل وظائف الصندوق المحيط لتتبع كائن الفيديو والوظائف متعددة الخطوط ، بالإضافة إلى إنشاء وظائف الضبط تلقائيًا بعد وضع العلامات الأولية. يتم تكوين دفعة سير العمل هذه من خلال ملف batch_create
API متاح للحل.
قم بتشغيل الخلية تحتها عرض إنشاء الدُفعات في دفتر الملاحظات. يؤدي هذا إلى تمرير بيان الإدخال وتكوين فئة التسمية S3 URIs إلى دفعة سير عمل جديدة.
يجب أن تقوم الخلية بإخراج معرف مجموعة سير العمل المنشأة حديثًا ، على سبيل المثال:
أكمل الجولة الأولى من مهام وضع العلامات
لمحاكاة العمال الذين يكملون وضع العلامات ، نقوم بتسجيل الدخول كعامل في فريق عمل الحقيقة الأرضية من المستوى الأول وإكمال مهمة وضع العلامات.
- قم بتشغيل الخلية تحتها تسجيل الدخول إلى بوابة العامل للحصول على ارتباط لتسجيل الدخول إلى بوابة العمال.
يجب أن تكون الدعوة قد تم إرسالها بالفعل إلى عنوان بريدك الإلكتروني إذا قمت بدعوة نفسك إلى فرق العمل من المستوى الأول والمستوى الثاني التي تم إنشاؤها بواسطة الحل.
- قم بتسجيل الدخول وانتظر حتى تظهر المهام في بوابة العامل.
يجب أن تتوفر مهمتان ، واحدة تنتهي بـ vehicle
وواحد ينتهي بـ lane
، المقابلة للوظيفتين اللتين أنشأناهما أثناء إنشاء دفعة سير العمل.
- افتح كل مهمة وأضف بعض الملصقات الوهمية عن طريق الاختيار والسحب على إطارات الصور.
- اختار تسجيل في كل مهمة.
أكمل الجولة الثانية من مهام وضع العلامات
حدد سير العمل لدينا أننا أردنا إطلاق وظائف التعديل تلقائيًا لكل وظيفة من المستوى الأول. نكمل الآن الجولة الثانية من مهام وضع العلامات.
- لا تزال في بوابة العامل ، انتظر المهام مع
vehicle-audit
وlane-audit
لتظهر. - افتح كل مهمة في بوابة العامل ، مع ملاحظة أن تسميات المستوى السابق لا تزال مرئية.
يمكن تنفيذ مهام التعديل هذه من قبل مجموعة ضمان الجودة المدربة تدريباً عالياً في فريق عمل مختلف.
- قم بإجراء التعديلات حسب الرغبة واختر تجاوز or فشل في كل تعليق توضيحي.
- عندما تنتهي ، اختر تسجيل.
عرض التعليقات التوضيحية المكتملة
يمكننا عرض تفاصيل حول مجموعة سير العمل المكتملة عن طريق تشغيل عرض الدُفعات API.
- قم بتشغيل الخلية تحتها عرض الدُفعات التجريبي.
يستعلم هذا عن قاعدة بيانات الحل لجميع دفعات تشغيل سير العمل الكاملة ، ويجب إخراج معرف الدُفعة عند اكتمال الدُفعة.
- يمكننا الحصول على مزيد من التفاصيل المحددة حول الدُفعة عن طريق تشغيل الخلية أسفلها عرض تفصيلي للدُفعات.
يأخذ هذا معرف الدُفعة في النظام ويعيد معلومات الحالة ومواقع كافة بيانات الإدخال والإخراج لكل وظيفة تم إنشاؤها.
- انسخ وادخل الحقل
jobOutputS3Url
لأي من الوظائف وتحقق من تنزيل ملف البيان لهذه الوظيفة.
يحتوي هذا الملف على مرجع لتسلسل بيانات الإدخال بالإضافة إلى S3 URI للتعليقات التوضيحية للمخرجات لكل تسلسل.
النتائج النهائية
عند اكتمال جميع مهام وضع العلامات في خط الأنابيب ، يتم نشر رسالة SNS على موضوع SNS الوضع الافتراضي. أنت يمكن الاشتراك في مواضيع SNS باستخدام عنوان بريد إلكتروني للتحقق من وظائف الحل. تتضمن الرسالة معرف الدُفعة المستخدم أثناء إنشاء الدُفعة ، ورسالة حول إكمال الدُفعة ، ونفس المعلومات batch/show
يوفر API تحت أ batchInfo
مفتاح. يمكنك تحليل هذه الرسالة لاستخراج البيانات الوصفية حول وظائف وضع العلامات المكتملة في المستوى الثاني من خط الأنابيب.
داخل كل كتلة بيانات وصفية للوظيفة ، أ jobOutputS3Url
يحتوي الحقل على عنوان URL مُعد مسبقًا للوصول إلى بيان الإخراج لهذه الوظيفة المعينة. يحتوي بيان الإخراج على نتائج تسمية البيانات بتنسيق البيان المعزز ، والذي يمكنك تحليله لاسترداد التعليقات التوضيحية عن طريق فهرسة كائن JSON باستخدام <jobName>-ref
. يشير هذا الحقل إلى موقع S3 يحتوي على جميع التعليقات التوضيحية لمقطع الفيديو المحدد.
على سبيل المثال ، لوظائف الصندوق المحيط ، ملف SeqLabel.json
يحتوي الملف على التعليقات التوضيحية للمربع المحيط لكل إطار توضيحي (في هذه الحالة ، يتم التعليق على الإطار الأول فقط):
نظرًا لأن رسالة SNS الخاصة بإكمال الدُفعة تحتوي على جميع ملفات بيان الإخراج من المهام التي تم إطلاقها بالتوازي ، يمكنك إجراء أي معالجة لاحقة للتعليقات التوضيحية بناءً على هذه الرسالة. على سبيل المثال ، إذا كان لديك تنسيق تسلسل محدد لهذه التعليقات التوضيحية التي تجمع بين المربعات المحيطة بالمركبة والتعليقات التوضيحية للممر ، فيمكنك الحصول على بيان الإخراج الخاص بمهمة الممر بالإضافة إلى مهمة السيارة ، ثم الدمج بناءً على رقم الإطار والتحويل إلى ما تريده الشكل النهائي.
لمعرفة المزيد حول تنسيقات بيانات إخراج Ground Truth ، راجع بيانات الناتج.
تنظيف
لتجنب تكبد رسوم في المستقبل ، قم بتشغيل تنظيف قسم من دفتر الملاحظات لحذف جميع الموارد بما في ذلك عناصر S3 ومكدس CloudFormation. عند اكتمال الحذف ، تأكد من إيقاف وحذف مثيل دفتر الملاحظات الذي يستضيف البرنامج النصي الحالي لدفتر الملاحظات.
وفي الختام
توفر لك هذه السلسلة المكونة من جزأين بنية مرجعية لإنشاء سير عمل متقدم لتصنيف البيانات يتألف من خط أنابيب متعدد الخطوات لتصنيف البيانات ، ووظائف الضبط ، ومخازن البيانات للتعليقات التوضيحية لمجموعة البيانات المقابلة ومقاييس العمال بالإضافة إلى لوحات المعلومات المحدثة.
في هذا المنشور ، تعلمت كيفية أخذ بيانات إطار الفيديو وتشغيل سير عمل لتشغيل وظائف وضع العلامات الأرضية المتعددة ، وإنشاء نوعين مختلفين من التعليقات التوضيحية (المربعات المحيطة والخطوط المتعددة). لقد تعلمت أيضًا كيف يمكنك تمديد خط الأنابيب للتدقيق والتحقق من مجموعة البيانات المصنفة وكيفية استرداد النتائج التي تم تدقيقها. أخيرًا ، رأيت كيفية الرجوع إلى التقدم الحالي للوظائف المجمعة باستخدام BatchShow API.
لمزيد من المعلومات حول بحيرة البيانات لشروح مجموعة بيانات الحقيقة الأرضية ومقاييس العمال من الحقيقة الأرضية ، تحقق مرة أخرى إلى مدونة Ground Truth لمنشور المدونة الثاني في هذه السلسلة (قريبًا).
جرب مفكرة وقم بتخصيصه لمجموعات بيانات الإدخال الخاصة بك عن طريق إضافة وظائف إضافية أو خطوات تدقيق ، أو عن طريق تعديل طريقة بيانات الوظائف. مزيد من التخصيص حل يمكن أن تشمل ، على سبيل المثال لا الحصر ، ما يلي:
- إضافة أنواع إضافية من التعليقات التوضيحية مثل أقنعة التجزئة الدلالية أو نقاط المفاتيح
- إضافة ضمان الجودة التلقائي والتصفية إلى سير عمل Step Functions لإرسال التعليقات التوضيحية منخفضة الجودة فقط إلى المستوى التالي من المراجعة
- إضافة المستوى الثالث أو الرابع من مراجعة الجودة لأنواع المراجعات الإضافية الأكثر تخصصًا
تم تصميم هذا الحل باستخدام تقنيات بدون خادم بالإضافة إلى وظائف الخطوة ، مما يجعله قابلاً للتخصيص بدرجة عالية وقابل للتطبيق لمجموعة متنوعة من التطبيقات.
حول المؤلف
فيديا ساجار رافيباتي هو مهندس التعلم العميق في مختبر أمازون ML Solutions، حيث يستفيد من خبرته الواسعة في الأنظمة الموزعة واسعة النطاق وشغفه بالتعلم الآلي لمساعدة عملاء AWS عبر قطاعات الصناعة المختلفة على تسريع تبني الذكاء الاصطناعي والسحابة. في السابق ، كان مهندسًا للتعلم الآلي في خدمات الاتصال في أمازون الذي ساعد في بناء منصات للتخصيص والصيانة التنبؤية.
جيريمي فيلتراكو مهندس تطوير برمجيات في Amazon ML Solutions Lab في Amazon Web Services. يستخدم خلفيته في رؤية الكمبيوتر والروبوتات والتعلم الآلي لمساعدة عملاء AWS على تسريع تبنيهم للذكاء الاصطناعي.
جاي سونغ جانغ هو مهندس تطوير برمجيات. يكمن شغفه في أتمتة العمليات اليدوية باستخدام حلول الذكاء الاصطناعي وتقنيات التنظيم لضمان تنفيذ الأعمال.
تاليا شوبرا كاتب تقني في AWS متخصص في التعلم الآلي والذكاء الاصطناعي. تعمل مع فرق متعددة في AWS لإنشاء وثائق تقنية وبرامج تعليمية للعملاء الذين يستخدمون Amazon SageMaker و MxNet و AutoGluon.
- "
- 100
- 107
- 3d
- 7
- 98
- الوصول
- حسابي
- إضافي
- تبني
- AI
- اعتماد منظمة العفو الدولية
- خوارزمية
- الكل
- السماح
- أمازون
- الأمازون SageMaker
- الحقيقة الأمازون SageMaker الأرض
- أمازون ويب سيرفيسز
- تحليلات
- API
- واجهات برمجة التطبيقات
- التطبيق
- التطبيقات
- هندسة معمارية
- الذكاء الاصطناعي
- التدقيق
- الآلي
- السيارات
- AWS
- المدونة
- صندوق
- نساعدك في بناء
- ابني
- الأعمال
- دعوة
- الحالات
- تغيير
- اسعارنا محددة من قبل وزارة العمل
- الشيكات
- سحابة
- اعتماد السحابة
- الكود
- آت
- مشترك
- إحصاء
- رؤية الكمبيوتر
- الإتصال
- التكاليف
- خلق
- لرحلة بحرية
- حالياًّ
- الوضع الحالي
- العملاء
- لوحة أجهزة القياس
- البيانات
- بحيرة البيانات
- جودة البيانات
- قاعدة البيانات
- التعلم العميق
- الطلب
- التفاصيل
- التطوير التجاري
- البريد الإلكتروني
- نقطة النهاية
- مهندس
- فشل
- الأزياء
- الاسم الأول
- شكل
- مجانا
- وظيفة
- مستقبل
- العلاجات العامة
- GIF
- تجمع
- هنا
- مرتفع
- استضافة
- كيفية
- كيفية
- HTTPS
- IAM
- اي كون
- تحديد
- هوية
- صورة
- بما فيه
- العالمية
- معلومات
- رؤى
- رؤيتنا
- IT
- وظيفة
- المشــاريــع
- القفل
- وصفها
- ملصقات
- كبير
- إطلاق
- تعلم
- تعلم
- تعلم
- مستوى
- تعامل
- محدود
- LINK
- قائمة
- موقع
- آلة التعلم
- إدارة
- رسم خريطة
- ماسكات
- متوسط
- المقاييس
- ML
- نموذج
- أسماء
- قائمة الإختيارات
- إعلام
- تعمل
- طلب
- أخرى
- نمط
- أداء
- التخصيص
- بلاتفورم
- سياسات الخصوصية والبيع
- تجمع
- بوابة
- التسعير
- خاص
- أنتج
- جودة
- الخام
- تخفيض
- المتطلبات الأساسية
- الموارد
- النتائج
- عائدات
- مراجعة
- التعليقات
- الروبوتات
- يجري
- تشغيل
- sagemaker
- حجم
- ثانوي
- مسلسلات
- Serverless
- خدماتنا
- طقم
- شاركت
- الاشارات
- المقاس
- So
- تطبيقات الكمبيوتر
- تطوير البرمجيات
- الحلول
- الفضاء
- المسرح
- بداية
- بدأت
- الولايه او المحافظه
- المحافظة
- الحالة
- تخزين
- تحقيق النجاح
- الدعم
- الدعم
- نظام
- أنظمة
- تقني
- التكنولوجيا
- يروي
- تجربه بالعربي
- الوقت
- رمز
- تيشرت
- تتبع الشحنة
- قادة الإيمان
- تحول
- معالجة
- البرنامج التعليمي
- الدروس
- آخر التحديثات
- URI
- المستخدمين
- المثالية
- السيارات
- فيديو
- مقاطع فيديو
- المزيد
- رؤيتنا
- حجم
- انتظر
- الويب
- خدمات ويب
- من الذى
- في غضون
- للعمل
- العمال
- سير العمل
- القوى العاملة
- أعمال
- العالم
- كاتب