هذا منشور مشترك شارك في كتابته AWS و Voxel51. Voxel51 هي الشركة التي تقف وراء FiftyOne ، وهي مجموعة أدوات مفتوحة المصدر لبناء مجموعات بيانات عالية الجودة ونماذج رؤية حاسوبية.
تقوم شركة بيع بالتجزئة ببناء تطبيق جوال لمساعدة العملاء على شراء الملابس. لإنشاء هذا التطبيق ، يحتاجون إلى مجموعة بيانات عالية الجودة تحتوي على صور ملابس ، مصنفة بفئات مختلفة. في هذا المنشور ، نوضح كيفية إعادة توظيف مجموعة بيانات حالية من خلال تنظيف البيانات والمعالجة المسبقة ووضع العلامات مسبقًا باستخدام نموذج تصنيف بدون طلقة في واحد وخمسون، وضبط هذه التسميات باستخدام الحقيقة الأمازون SageMaker الأرض.
يمكنك استخدام Ground Truth و FiftyOne لتسريع مشروع وضع العلامات على البيانات. نوضح كيفية استخدام التطبيقين معًا بسلاسة لإنشاء مجموعات بيانات ذات تصنيف عالي الجودة. بالنسبة لحالة الاستخدام الخاصة بنا على سبيل المثال ، فإننا نعمل مع مجموعة بيانات Fashion200K، صدر في ICCV 2017.
حل نظرة عامة
Ground Truth هي خدمة وسم بيانات مُدارة وذاتية الخدمة بالكامل تُمكِّن علماء البيانات ومهندسي التعلم الآلي (ML) والباحثين من بناء مجموعات بيانات عالية الجودة. واحد وخمسون by فوكسل 51 عبارة عن مجموعة أدوات مفتوحة المصدر لتنسيق مجموعات بيانات رؤية الكمبيوتر وتصورها وتقييمها بحيث يمكنك تدريب النماذج الأفضل وتحليلها من خلال تسريع حالات الاستخدام الخاصة بك.
في الأقسام التالية ، نوضح كيفية القيام بما يلي:
- تصور مجموعة البيانات في FiftyOne
- قم بتنظيف مجموعة البيانات بالترشيح وإلغاء تكرار الصورة في FiftyOne
- قم بتسمية البيانات التي تم تنظيفها مسبقًا بتصنيف اللقطة الصفرية في FiftyOne
- قم بتسمية مجموعة البيانات الأصغر المنسقة باستخدام Ground Truth
- حقن النتائج المسمى من Ground Truth في FiftyOne ومراجعة النتائج المسمى في FiftyOne
نظرة عامة على حالة الاستخدام
لنفترض أنك تمتلك شركة بيع بالتجزئة وترغب في إنشاء تطبيق للهاتف المحمول لتقديم توصيات مخصصة لمساعدة المستخدمين على تحديد الملابس التي يرتدونها. يبحث المستخدمون المحتملون لديك عن تطبيق يخبرهم بمواد الملابس الموجودة في خزانة ملابسهم التي تعمل جيدًا معًا. ترى فرصة هنا: إذا كان بإمكانك تحديد ملابس جيدة ، يمكنك استخدام هذا للتوصية بمواد جديدة من الملابس تكمل الملابس التي يمتلكها العميل بالفعل.
تريد أن تجعل الأمور أسهل ما يمكن للمستخدم النهائي. من الناحية المثالية ، يحتاج أي شخص يستخدم التطبيق الخاص بك فقط إلى التقاط صور للملابس الموجودة في خزانة ملابسه ، وتعمل نماذج ML الخاصة بك بسحرها وراء الكواليس. يمكنك تدريب نموذج للأغراض العامة أو ضبط نموذج لأسلوب فريد لكل مستخدم مع بعض أشكال التعليقات.
أولاً ، تحتاج إلى تحديد نوع الملابس التي يلتقطها المستخدم. هل هو قميص؟ زوج من السراويل؟ أو أي شيء آخر؟ بعد كل شيء ، ربما لا ترغب في التوصية بزي به فساتين متعددة أو قبعات متعددة.
لمواجهة هذا التحدي الأولي ، تريد إنشاء مجموعة بيانات تدريبية تتكون من صور لمجموعة متنوعة من الملابس بأنماط وأنماط مختلفة. لإنشاء نموذج أولي بميزانية محدودة ، فأنت تريد التمهيد باستخدام مجموعة بيانات موجودة.
لتوضيح العملية وإرشادك خلال العملية الواردة في هذا المنشور ، نستخدم مجموعة بيانات Fashion200K التي تم إصدارها في ICCV 2017. إنها مجموعة بيانات راسخة ومُستشهد بها جيدًا ، ولكنها ليست مناسبة بشكل مباشر لحالة الاستخدام الخاصة بك.
على الرغم من تصنيف سلع الملابس بالفئات (والفئات الفرعية) وتحتوي على مجموعة متنوعة من العلامات المفيدة المستخرجة من أوصاف المنتج الأصلي ، لا يتم تصنيف البيانات بشكل منهجي بمعلومات النمط أو النمط. هدفك هو تحويل مجموعة البيانات الحالية هذه إلى مجموعة بيانات تدريب قوية لنماذج تصنيف الملابس الخاصة بك. تحتاج إلى تنظيف البيانات ، وزيادة مخطط وضع العلامات باستخدام تسميات النمط. وتريد القيام بذلك بسرعة وبأقل قدر ممكن من الإنفاق.
قم بتنزيل البيانات محليًا
أولاً ، قم بتنزيل ملف women.tar المضغوط ومجلد الملصقات (بجميع مجلداته الفرعية) باتباع الإرشادات الواردة في مستودع GitHub لمجموعة بيانات Fashion200K. بعد فك ضغطهما ، أنشئ دليلًا رئيسيًا fashion200k ، وانقل التسميات ومجلدات النساء إلى هذا. لحسن الحظ ، تم اقتصاص هذه الصور بالفعل في المربعات المحيطة باكتشاف الكائن ، لذلك يمكننا التركيز على التصنيف ، بدلاً من القلق بشأن اكتشاف الكائنات.
على الرغم من وجود "200K" في لقبه ، فإن دليل النساء الذي استخرجناه يحتوي على 338,339 صورة. لإنشاء مجموعة بيانات Fashion200K الرسمية ، قام مؤلفو مجموعة البيانات بالزحف إلى أكثر من 300,000 منتج عبر الإنترنت ، وفقط المنتجات التي تحتوي على أوصاف تحتوي على أكثر من أربع كلمات هي التي تم قطعها. لأغراضنا ، حيث لا يكون وصف المنتج ضروريًا ، يمكننا استخدام جميع الصور التي تم الزحف إليها.
لنلقِ نظرة على كيفية تنظيم هذه البيانات: داخل مجلد النساء ، يتم ترتيب الصور حسب نوع مقالة المستوى الأعلى (التنانير والقمصان والسراويل والسترات والفساتين) ، والفئة الفرعية لنوع المقالة (البلوزات والقمصان والأكمام الطويلة قمم).
ضمن أدلة الفئات الفرعية ، يوجد دليل فرعي لكل قائمة منتجات. كل من هذه تحتوي على عدد متغير من الصور. تحتوي الفئة الفرعية cropped_pants ، على سبيل المثال ، على قوائم المنتجات التالية والصور المرتبطة بها.
يحتوي مجلد الملصقات على ملف نصي لكل نوع مقال من المستوى الأعلى ، لكل من تقسيمي التدريب والاختبار. يوجد داخل كل من هذه الملفات النصية سطر منفصل لكل صورة ، يحدد مسار الملف النسبي والنتيجة والعلامات من وصف المنتج.
نظرًا لأننا نعيد استخدام مجموعة البيانات لأغراض أخرى ، فإننا نجمع كل صور القطار والاختبار. نستخدمها لإنشاء مجموعة بيانات عالية الجودة خاصة بالتطبيقات. بعد أن نكمل هذه العملية ، يمكننا تقسيم مجموعة البيانات الناتجة عشوائيًا إلى قطارات جديدة وتقسيم اختبار.
قم بإدخال مجموعة بيانات وعرضها وتنظيمها في FiftyOne
إذا لم تكن قد قمت بذلك بالفعل ، فقم بتثبيت FiftyOne مفتوح المصدر باستخدام نقطة:
من أفضل الممارسات القيام بذلك في بيئة افتراضية جديدة (venv أو conda). ثم قم باستيراد الوحدات ذات الصلة. قم باستيراد المكتبة الأساسية ، وخمسين ، و FiftyOne Brain ، التي تحتوي على أساليب ML المضمنة ، و FiftyOne Zoo ، والتي سنقوم من خلالها بتحميل نموذج سيُنشئ لنا تسميات خالية من اللقطات ، و ViewField ، الذي يتيح لنا تصفية البيانات في مجموعة البيانات الخاصة بنا:
أنت أيضًا تريد استيراد وحدتي glob و os Python ، مما سيساعدنا في العمل مع المسارات وتطابق الأنماط على محتويات الدليل:
نحن الآن جاهزون لتحميل مجموعة البيانات في FiftyOne. أولاً ، قمنا بإنشاء مجموعة بيانات باسم fashion200k وجعلها ثابتة ، مما يسمح لنا بحفظ نتائج العمليات الحسابية المكثفة ، لذلك نحتاج فقط إلى حساب الكميات المذكورة مرة واحدة.
يمكننا الآن تكرار جميع أدلة الفئات الفرعية ، وإضافة جميع الصور الموجودة في أدلة المنتج. نضيف تصنيف FiftyOne لكل عينة مع اسم الحقل article_type ، مملوءًا بفئة مقالة المستوى الأعلى للصورة. نضيف أيضًا معلومات الفئة والفئة الفرعية كعلامات:
في هذه المرحلة ، يمكننا تصور مجموعة البيانات الخاصة بنا في تطبيق FiftyOne من خلال إطلاق جلسة:
يمكننا أيضًا طباعة ملخص لمجموعة البيانات في Python عن طريق التشغيل print(dataset)
:
يمكننا أيضًا إضافة العلامات من ملف labels
دليل للعينات في مجموعة البيانات الخاصة بنا:
بالنظر إلى البيانات ، تتضح بعض الأشياء:
- بعض الصور محببة إلى حد ما وذات دقة منخفضة. هذا على الأرجح لأن هذه الصور تم إنشاؤها عن طريق اقتصاص الصور الأولية في المربعات المحيطة باكتشاف الكائن.
- بعض الملابس يرتديها شخص ، وبعضها يتم تصويره بمفرده. يتم تغليف هذه التفاصيل بواسطة
viewpoint
خاصية. - الكثير من الصور لنفس المنتج متشابهة جدًا ، لذلك على الأقل في البداية ، قد لا يضيف تضمين أكثر من صورة واحدة لكل منتج قوة تنبؤية كبيرة. بالنسبة للجزء الأكبر ، فإن الصورة الأولى لكل منتج (تنتهي بـ
_0.jpeg
) هو الأنظف.
في البداية ، قد نرغب في تدريب نموذج تصنيف نمط الملابس لدينا على مجموعة فرعية يتم التحكم فيها من هذه الصور. ولهذه الغاية ، نستخدم صورًا عالية الدقة لمنتجاتنا ، ونقتصر رؤيتنا على عينة تمثيلية واحدة لكل منتج.
أولاً ، نقوم بتصفية الصور منخفضة الدقة. نحن نستخدم ال compute_metadata()
طريقة لحساب وتخزين عرض الصورة وارتفاعها بالبكسل لكل صورة في مجموعة البيانات. ثم نقوم بتوظيف FiftyOne ViewField
لتصفية الصور بناءً على قيم العرض والارتفاع الدنيا المسموح بها. انظر الكود التالي:
تحتوي هذه المجموعة الفرعية عالية الدقة على أقل من 200,000 عينة.
من وجهة النظر هذه ، يمكننا إنشاء طريقة عرض جديدة في مجموعة البيانات الخاصة بنا تحتوي على عينة تمثيلية واحدة فقط (على الأكثر) لكل منتج. نحن نستخدم ال ViewField
مرة أخرى ، مطابقة النمط لمسارات الملفات التي تنتهي بـ _0.jpeg
:
دعونا نعرض الترتيب العشوائي للصور في هذه المجموعة الفرعية:
قم بإزالة الصور الزائدة عن الحاجة في مجموعة البيانات
يحتوي هذا العرض على 66,297 صورة ، أو ما يزيد قليلاً عن 19٪ من مجموعة البيانات الأصلية. ومع ذلك ، عندما ننظر إلى العرض ، نرى أن هناك العديد من المنتجات المتشابهة جدًا. من المحتمل أن يؤدي الاحتفاظ بكل هذه النسخ فقط إلى إضافة تكلفة إلى تدريبنا على وضع العلامات والنماذج ، دون تحسين الأداء بشكل ملحوظ. بدلاً من ذلك ، دعنا نتخلص من التكرارات القريبة لإنشاء مجموعة بيانات أصغر لا تزال تحزم نفس اللكمة.
نظرًا لأن هذه الصور ليست مكررة تمامًا ، لا يمكننا التحقق من المساواة في البكسل. لحسن الحظ ، يمكننا استخدام FiftyOne Brain لمساعدتنا في تنظيف مجموعة البيانات الخاصة بنا. على وجه الخصوص ، سنقوم بحساب التضمين لكل صورة - متجه منخفض الأبعاد يمثل الصورة - ثم نبحث عن الصور التي تكون متجهات التضمين بها قريبة من بعضها البعض. كلما اقتربت النواقل ، كلما كانت الصور متشابهة.
نستخدم نموذج CLIP لإنشاء متجه دمج 512 بعدًا لكل صورة ، ونخزن هذه الزخارف في حفلات الزفاف الميدانية على العينات في مجموعة البيانات الخاصة بنا:
ثم نحسب القرب بين الزيجات باستخدام تشابه جيب التمام، وتأكيد أن أي متجهين يكون التشابه بينهما أكبر من حد معين من المحتمل أن يكونا قريبين من التكرارات. تقع درجات تشابه جيب التمام في النطاق [0 ، 1] ، وبالنظر إلى البيانات ، يبدو أن درجة العتبة التي تبلغ 0.5 = XNUMX صحيحة تقريبًا. مرة أخرى ، لا يجب أن يكون هذا مثاليًا. من غير المحتمل أن تدمر بعض الصور شبه المكررة قوتنا التنبؤية ، ولا يؤثر التخلص من بعض الصور غير المكررة على أداء النموذج ماديًا.
يمكننا عرض التكرارات المزعومة للتحقق من أنها زائدة عن الحاجة بالفعل:
عندما نكون سعداء بالنتيجة ونعتقد أن هذه الصور قريبة بالفعل من التكرارات ، يمكننا اختيار عينة واحدة من كل مجموعة من العينات المتشابهة للاحتفاظ بها ، وتجاهل الآخرين:
الآن هذا المنظر به 3,729 صورة. من خلال تنظيف البيانات وتحديد مجموعة فرعية عالية الجودة من مجموعة بيانات Fashion200K ، يتيح لنا FiftyOne تقييد تركيزنا من أكثر من 300,000 صورة إلى أقل بقليل من 4,000 ، مما يمثل انخفاضًا بنسبة 98٪. أدى استخدام عمليات التضمين لإزالة الصور شبه المكررة وحدها إلى خفض إجمالي عدد الصور قيد الدراسة بأكثر من 90٪ ، مع تأثير ضئيل إن وجد على أي نماذج يتم تدريبها على هذه البيانات.
قبل وضع العلامات المسبقة لهذه المجموعة الفرعية ، يمكننا فهم البيانات بشكل أفضل من خلال تصور الزخارف التي قمنا بحسابها بالفعل. يمكننا استخدام جهاز FiftyOne Brain المدمج compute_visualization(
) ، التي تستخدم تقنية التقريب المتشعب المنتظم (UMAP) لعرض متجهات التضمين 512 بعدًا في مساحة ثنائية الأبعاد حتى نتمكن من تصورها:
نفتح ملف لوحة العرائس في تطبيق FiftyOne والتلوين حسب نوع المقالة ، ويمكننا أن نرى أن هذه الزخارف ترمز تقريبًا إلى فكرة نوع المقالة (من بين أشياء أخرى!).
نحن الآن جاهزون لتسمية هذه البيانات مسبقًا.
عند فحص هذه الصور الفريدة عالية الدقة ، يمكننا إنشاء قائمة أولية مناسبة من الأنماط لاستخدامها كفئة في تصنيفنا المسبق لتصنيف اللقطة الصفرية. إن هدفنا في وضع العلامات المسبقة على هذه الصور ليس بالضرورة تسمية كل صورة بشكل صحيح. بدلاً من ذلك ، يتمثل هدفنا في توفير نقطة انطلاق جيدة للمضيفين من البشر حتى نتمكن من تقليل وقت وضع العلامات والتكلفة.
يمكننا بعد ذلك إنشاء نموذج تصنيف بدون طلقة لهذا التطبيق. نستخدم نموذج CLIP ، وهو نموذج للأغراض العامة يتم تدريبه على كل من الصور واللغة الطبيعية. نقوم بإنشاء مثيل لنموذج CLIP باستخدام موجه النص "الملابس في النمط" ، بحيث يُخرج النموذج الفئة التي تناسبها "الملابس في النمط [class]" عند إعطاء صورة. لم يتم تدريب CLIP على بيانات البيع بالتجزئة أو البيانات الخاصة بالموضة ، لذلك لن يكون هذا مثاليًا ، ولكن يمكن أن يوفر عليك تكاليف وضع العلامات والتعليقات التوضيحية.
ثم نطبق هذا النموذج على مجموعتنا الفرعية المختصرة ونخزن النتائج في ملف article_style
حقل:
عند إطلاق تطبيق FiftyOne مرة أخرى ، يمكننا تصور الصور باستخدام تسميات الأنماط المتوقعة هذه. نقوم بالفرز حسب ثقة التنبؤ حتى نعرض تنبؤات النمط الأكثر ثقة أولاً:
يمكننا أن نرى أن أعلى توقعات الثقة تبدو لأنماط "القميص" و "الطباعة الحيوانية" و "البولكا دوت" و "الحروف". هذا منطقي ، لأن هذه الأنماط متميزة نسبيًا. يبدو أيضًا ، بالنسبة للجزء الأكبر ، أن تسميات الأنماط المتوقعة دقيقة.
يمكننا أيضًا إلقاء نظرة على تنبؤات النمط الأقل ثقة:
بالنسبة لبعض هذه الصور ، توجد فئة النمط المناسب في القائمة المقدمة ، ويتم تصنيف مقالة الملابس بشكل غير صحيح. يجب أن تكون الصورة الأولى في الشبكة ، على سبيل المثال ، "تمويه" وليست "شيفرون". ومع ذلك ، في حالات أخرى ، لا تتناسب المنتجات بدقة مع فئات الأنماط. الفستان الموجود في الصورة الثانية في الصف الثاني ، على سبيل المثال ، ليس "مخططًا" تمامًا ، ولكن نظرًا لنفس خيارات التسمية ، قد يكون هناك تعارض مع المعلق البشري. أثناء قيامنا ببناء مجموعة البيانات الخاصة بنا ، نحتاج إلى تحديد ما إذا كنا سنزيل حالات الحافة مثل هذه ، أو إضافة فئات نمط جديدة ، أو زيادة مجموعة البيانات.
تصدير مجموعة البيانات النهائية من FiftyOne
قم بتصدير مجموعة البيانات النهائية بالرمز التالي:
يمكننا تصدير مجموعة بيانات أصغر ، على سبيل المثال ، 16 صورة ، إلى المجلد 200kFashionDatasetExportResult-16Images
. نقوم بإنشاء وظيفة تعديل Ground Truth باستخدامه:
قم بتحميل مجموعة البيانات المنقحة ، وقم بتحويل تنسيق الملصق إلى Ground Truth ، وتحميله إلى Amazon S3 ، وإنشاء ملف بيان لوظيفة الضبط
يمكننا تحويل التسميات في مجموعة البيانات لمطابقة مخطط بيان الإخراج لمهمة الصندوق المحيط بالحقيقة الأرضية ، وقم بتحميل الصور إلى ملف خدمة تخزين أمازون البسيطة (Amazon S3) لبدء تشغيل ملف وظيفة تعديل الحقيقة الأرضية:
قم بتحميل ملف البيان إلى Amazon S3 بالرمز التالي:
قم بإنشاء ملصقات مصححة ذات نمط باستخدام Ground Truth
لإضافة تعليق توضيحي لبياناتك باستخدام تسميات الأنماط باستخدام Ground Truth ، أكمل الخطوات الضرورية لبدء وظيفة تسمية المربع المحيط باتباع الإجراء الموضح في الشروع في العمل مع الحقيقة الأرضية توجيه مع مجموعة البيانات في نفس دلو S3.
- في وحدة تحكم SageMaker ، قم بإنشاء وظيفة تسمية الحقيقة الأرضية.
- تعيين موقع مجموعة بيانات الإدخال ليكون البيان الذي أنشأناه في الخطوات السابقة.
- حدد مسار S3 لـ موقع مجموعة بيانات الإخراج.
- في حالة دور IAM، اختر أدخل دور IAM مخصصًا الحمض النووي الريبي، ثم أدخل الدور ARN.
- في حالة فئة المهمة، اختر صورة وحدد الصندوق المحيط.
- اختار التالى.
- في مجلة العمال ، اختر نوع القوى العاملة التي ترغب في استخدامها.
يمكنك اختيار قوة عاملة من خلال الأمازون ميكانيكي تركأو البائعين الخارجيين أو القوى العاملة الخاصة بك. لمزيد من التفاصيل حول خيارات القوى العاملة لديك ، راجع إنشاء وإدارة القوى العاملة. - وسع خيارات عرض التسميات الحالية وحدد أريد عرض التسميات الموجودة من مجموعة البيانات لهذه الوظيفة.
- في حالة سمة التسمية name ، اختر الاسم من البيان الذي يتوافق مع التصنيفات التي تريد عرضها للتعديل.
سترى فقط أسماء سمات التسمية للتسميات التي تطابق نوع المهمة الذي حددته في الخطوات السابقة. - أدخل تسميات يدويًا لـ أداة وسم الصندوق المحيط.
يجب أن تحتوي التسميات على نفس التسميات المستخدمة في مجموعة البيانات العامة. يمكنك إضافة تسميات جديدة. توضح لقطة الشاشة التالية كيف يمكنك اختيار العمال وتكوين الأداة لوظيفة التصنيف الخاصة بك. - اختار أرسال لمعاينة الصورة والتعليقات التوضيحية الأصلية.
لقد أنشأنا الآن وظيفة تصنيف في Ground Truth. بعد اكتمال مهمتنا ، يمكننا تحميل البيانات ذات العلامات التي تم إنشاؤها حديثًا في FiftyOne. ينتج عن Ground Truth بيانات الإخراج في بيان إخراج Ground Truth. لمزيد من التفاصيل حول ملف بيان الإخراج ، راجع مخرجات مهمة الصندوق المحيط. يُظهر الكود التالي مثالاً على تنسيق بيان الإخراج هذا:
راجع النتائج المصنفة من Ground Truth في FiftyOne
بعد اكتمال المهمة ، قم بتنزيل بيان الإخراج لوظيفة وضع العلامات من Amazon S3.
اقرأ ملف بيان الإخراج:
أنشئ مجموعة بيانات FiftyOne وقم بتحويل أسطر البيان إلى عينات في مجموعة البيانات:
يمكنك الآن رؤية بيانات ذات تصنيف عالي الجودة من Ground Truth في FiftyOne.
وفي الختام
في هذا المنشور ، أوضحنا كيفية إنشاء مجموعات بيانات عالية الجودة من خلال الجمع بين قوة واحد وخمسون by فوكسل 51، عبارة عن مجموعة أدوات مفتوحة المصدر تتيح لك إدارة مجموعة البيانات الخاصة بك وتتبعها وتصورها وتنظيمها ، و Ground Truth ، وهي خدمة تسمية بيانات تتيح لك تصنيف مجموعات البيانات المطلوبة بكفاءة ودقة لتدريب أنظمة تعلم الآلة من خلال توفير الوصول إلى العديد من التطبيقات المبنية - في قوالب المهام والوصول إلى قوة عاملة متنوعة من خلال MECHANICAL TUR أو البائعين الخارجيين أو القوى العاملة الخاصة بك.
نحن نشجعك على تجربة هذه الوظيفة الجديدة عن طريق تثبيت نسخة FiftyOne واستخدام وحدة التحكم في Ground Truth للبدء. لمعرفة المزيد حول الحقيقة الأرضية ، يرجى الرجوع إلى بيانات التسمية, الأسئلة الشائعة حول تسمية بيانات Amazon SageMaker، و AWS مدونة التعلم الآلي.
تواصل مع مجتمع التعلم الآلي والذكاء الاصطناعي إذا كان لديك أي أسئلة أو تعليقات!
انضم إلى مجتمع FiftyOne!
انضم إلى آلاف المهندسين وعلماء البيانات الذين يستخدمون FiftyOne بالفعل لحل بعض أكثر المشكلات صعوبة في رؤية الكمبيوتر اليوم!
حول المؤلف
شالندرا شبرا يشغل حاليًا منصب رئيس إدارة المنتجات لخدمات Amazon SageMaker Human-in-the-Loop (HIL). في السابق ، احتضنت شالندرا وقادت ذكاء اللغة والمحادثة لاجتماعات Microsoft Teams ، وكان EIR في Amazon Alexa Techstars Startup Accelerator ، ونائب رئيس المنتج والتسويق في مناقشة. io، رئيس المنتجات والتسويق في Clipboard (حصل عليها Salesforce) ، ومدير المنتج الرئيسي في Swype (حصل عليها Nuance). إجمالاً ، ساعد شالندرا في بناء وشحن وتسويق المنتجات التي لمست أكثر من مليار شخص.
يعقوب ماركس هو مهندس تعلم آلي ومطور مبشر في Voxel51 ، حيث يساعد في تحقيق الشفافية والوضوح لبيانات العالم. قبل انضمامه إلى Voxel51 ، أسس جاكوب شركة ناشئة لمساعدة الموسيقيين الناشئين على التواصل ومشاركة المحتوى الإبداعي مع المعجبين. قبل ذلك ، عمل في Google X و Samsung Research و Wolfram Research. في حياته الماضية ، كان جاكوب فيزيائيًا نظريًا ، أكمل درجة الدكتوراه في جامعة ستانفورد ، حيث درس المراحل الكمومية للمادة. في أوقات فراغه ، يستمتع جاكوب بالتسلق والجري وقراءة روايات الخيال العلمي.
جايسون كورسو هو المؤسس المشارك والرئيس التنفيذي لشركة Voxel51 ، حيث يوجه الإستراتيجية للمساعدة في تحقيق الشفافية والوضوح لبيانات العالم من خلال أحدث البرامج المرنة. وهو أيضًا أستاذ الروبوتات والهندسة الكهربائية وعلوم الكمبيوتر في جامعة ميشيغان ، حيث يركز على أحدث المشكلات عند تقاطع رؤية الكمبيوتر واللغة الطبيعية والمنصات المادية. في أوقات فراغه ، يستمتع Jason بقضاء الوقت مع عائلته ، والقراءة ، والتواجد في الطبيعة ، ولعب ألعاب الطاولة ، وجميع أنواع الأنشطة الإبداعية.
بريان مور هو المؤسس المشارك والمدير التقني لشركة Voxel51 ، حيث يقود الإستراتيجية الفنية والرؤية. وهو حاصل على درجة الدكتوراه في الهندسة الكهربائية من جامعة ميشيغان ، حيث تركزت أبحاثه على الخوارزميات الفعالة لمشاكل التعلم الآلي على نطاق واسع ، مع التركيز بشكل خاص على تطبيقات الرؤية الحاسوبية. في أوقات فراغه ، يستمتع بلعبة الريشة والجولف والمشي لمسافات طويلة واللعب مع توأمه يوركشاير تيريرز.
زولينغ باي هو مهندس تطوير برمجيات في Amazon Web Services. تعمل على تطوير أنظمة موزعة على نطاق واسع لحل مشاكل التعلم الآلي.
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- أفلاطونايستريم. ذكاء بيانات Web3. تضخيم المعرفة. الوصول هنا.
- سك المستقبل مع أدرين أشلي. الوصول هنا.
- شراء وبيع الأسهم في شركات ما قبل الاكتتاب مع PREIPO®. الوصول هنا.
- المصدر https://aws.amazon.com/blogs/machine-learning/create-high-quality-datasets-with-amazon-sagemaker-ground-truth-and-fiftyone/
- :لديها
- :يكون
- :ليس
- :أين
- $ UP
- 000
- 1
- 10
- 11
- 110
- 13
- 14
- 20
- 200
- 2017
- 23
- 24
- 250
- 28
- 30
- 500
- 66
- 7
- 8
- 9
- a
- من نحن
- تسريع
- تسريع
- مسرع
- الوصول
- دقيق
- بدقة
- المكتسبة
- أنشطة
- تضيف
- مضيفا
- العنوان
- تعديل
- تعديل
- بعد
- مرة أخرى
- AI
- اليكسا
- خوارزميات
- الكل
- يسمح
- وحده
- سابقا
- أيضا
- أمازون
- الأمازون اليكسا
- الأمازون SageMaker
- الحقيقة الأمازون SageMaker الأرض
- أمازون ويب سيرفيسز
- من بين
- an
- تحليل
- و
- حيوان
- أي وقت
- التطبيق
- تطبيق
- التطبيقات
- التقديم
- مناسب
- هي
- ترتيبها
- البند
- مقالات
- AS
- أسوشيتد
- At
- الكتاب
- بعيدا
- AWS
- قاعدة
- على أساس
- BE
- لان
- أصبح
- كان
- قبل
- وراء
- خلف الكواليس
- يجري
- اعتقد
- أفضل
- أفضل
- ما بين
- مليار
- مجلس
- العاب طاولة
- عظم
- التمهيد
- على حد سواء
- صندوق
- مربعات
- دماغ
- استراحة
- جلب
- جلبت
- ميزانية
- نساعدك في بناء
- ابني
- مدمج
- لكن
- يشترى
- by
- CAN
- اسر
- حقيبة
- الحالات
- الفئات
- الفئة
- الرئيس التنفيذي
- تحدى
- تحدي
- التحقق
- اختار
- وضوح
- فئة
- فصول
- تصنيف
- سوائل التنظيف
- واضح
- بوضوح
- زبون
- التسلق
- اغلاق
- أقرب
- ملابس
- ملابس
- المؤسس المشارك
- الكود
- دمج
- الجمع بين
- حول الشركة
- تكملة
- إكمال
- الانتهاء
- إحصاء
- الكمبيوتر
- علوم الكمبيوتر
- رؤية الكمبيوتر
- تطبيقات الرؤية الحاسوبية
- الثقة
- واثق
- التواصل
- نظر
- تتكون
- كنسولات
- يحتوي
- محتوى
- محتويات
- ذو شاهد
- تحادثي
- تحول
- نسخ
- جوهر
- تصحيح
- يتوافق
- التكلفة
- التكاليف
- خلق
- خلق
- الإبداع
- أوراق اعتماد
- CTO
- من تنسيق
- القيمين
- حاليا
- على
- زبون
- العملاء
- قطع
- المتطور والحديث
- البيانات
- قواعد البيانات
- تقرر
- شرح
- الجينز
- عمق
- وصف
- تفاصيل
- كشف
- المطور
- تطوير
- التطوير التجاري
- مختلف
- مباشرة
- الدلائل
- العرض
- خامد
- وزعت
- الانظمة الموزعة
- عدة
- do
- لا
- كلب
- فعل
- فعل
- لا
- DOT
- إلى أسفل
- بإمكانك تحميله
- التكرارات
- e
- كل
- سهل
- حافة
- تأثير
- فعال
- بكفاءة
- الهندسة الكهربائية
- تضمين
- الناشئة
- تشديد
- توظف
- إمباورز
- مغلفة
- شجع
- النهاية
- مهندس
- الهندسة
- المهندسين
- أدخل
- البيئة
- مساواة
- أساسي
- أنشئ
- الأثير (ETH)
- تقييم
- مبشر
- بالضبط
- مثال
- القائمة
- تصدير
- بإنصاف
- للعائلات
- المشجعين
- ردود الفعل
- قليل
- خيال
- حقل
- مجال
- قم بتقديم
- ملفات
- تصفية
- تصفية
- نهائي
- الاسم الأول
- تناسب
- مرن
- تركز
- ركز
- ويركز
- متابعيك
- في حالة
- النموذج المرفق
- شكل
- لحسن الحظ
- تاسست
- أربعة
- مجانًا
- تبدأ من
- تماما
- وظيفة
- ألعاب
- هدف عام
- توليد
- ولدت
- دولار فقط واحصل على خصم XNUMX% على جميع
- GitHub جيثب:
- منح
- معطى
- هدف
- الغولف
- خير
- شراء مراجعات جوجل
- أكبر
- شبكة
- أرض
- تجمع
- توجيه
- سعيد
- يملك
- he
- رئيس
- ارتفاع
- مساعدة
- ساعد
- مفيد
- يساعد
- هنا
- عالي الجودة
- عالية الدقة
- أعلى
- جدا
- المشي لمسافات طويلة
- له
- يحمل
- كيفية
- كيفية
- لكن
- HTML
- HTTP
- HTTPS
- الانسان
- i
- IAM
- ID
- تحديد
- تحديد
- IDS
- if
- صورة
- صور
- التأثير
- استيراد
- تحسين
- in
- في أخرى
- بما فيه
- غير صحيح
- محتضن
- معلومات
- في البداية
- في البداية
- تثبيت
- تركيب
- مثل
- بدلًا من ذلك
- تعليمات
- رؤيتنا
- تقاطع طرق
- إلى
- IT
- انها
- جيرسي دبل سترتش
- وظيفة
- انضمام
- مشترك
- جسون
- م
- احتفظ
- حفظ
- تُشير
- وصفها
- ملصقات
- لغة
- على نطاق واسع
- إطلاق
- إطلاق
- قيادة
- يؤدي
- تعلم
- تعلم
- الأقل
- ليد
- اليسار
- يتيح
- المكتبة
- الحياة
- مثل
- على الأرجح
- مما سيحدث
- محدود
- خط
- خطوط
- قائمة
- قائمة
- مصانع
- القليل
- حياة
- تحميل
- بحث
- أبحث
- الكثير
- منخفض
- آلة
- آلة التعلم
- صنع
- سحر
- جعل
- يصنع
- إدارة
- تمكن
- إدارة
- مدير
- كثير
- رسم خريطة
- تجارة
- التسويق
- مباراة
- مطابقة
- ماديا
- أمر
- مايو..
- ميكانيكي
- الوسائط
- اجتماعات
- مييتااا
- البيانات الوصفية
- طريقة
- طرق
- ميشيغان
- مایکروسافت
- فرق مايكروسوفت
- ربما
- الحد الأدنى
- ML
- الجوال
- تطبيقات الجوال
- نموذج
- عارضات ازياء
- الوحدات
- الأكثر من ذلك
- أكثر
- خطوة
- كثيرا
- متعدد
- الموسيقيين
- يجب
- الاسم
- عين
- أسماء
- طبيعي
- اللغة الطبيعية
- الطبيعة
- قرب
- بالضرورة
- ضروري
- حاجة
- إحتياجات
- جديد
- بشكل ملحوظ
- Notion
- الآن
- الظل
- عدد
- موضوع
- كشف الكائن
- الأجسام
- of
- رسمي
- on
- مرة
- ONE
- online
- فقط
- جاكيت
- المصدر المفتوح
- عمليات
- الفرصة
- مزيد من الخيارات
- or
- منظم
- أصلي
- OS
- أخرى
- أخرى
- لنا
- خارج
- أوجز
- الناتج
- على مدى
- الخاصة
- تملك
- حزم
- يقترن
- جزء
- خاص
- الماضي
- مسار
- نمط
- أنماط
- أداء
- شخص
- مخصصه
- مراحل المادة
- مادي
- اختيار
- لوحات حائط
- البلايد
- عادي
- منصات التداول
- أفلاطون
- الذكاء افلاطون البيانات
- أفلاطون داتا
- لعب
- البوينت
- مأهول
- ممكن
- منشور
- قوة
- ممارسة
- وتوقع
- تنبؤ
- تنبؤات
- أرسال
- سابق
- سابقا
- طباعة
- قبل
- خاص
- المحتمل
- مشاكل
- عملية المعالجة
- منتج
- ادارة المنتج
- مدير المنتج
- المنتجات
- البروفيسور
- تنفيذ المشاريع
- الملكية
- محتمل
- النموذج
- تزود
- المقدمة
- توفير
- جمهور
- لكمة
- أغراض
- بايثون
- كمية
- الأسئلة المتكررة
- بسرعة
- نطاق
- بدلا
- نادي القراءة
- استعداد
- نوصي
- ساندي خ. ميليك
- تخفيض
- عقار مخفض
- تخفيض
- نسبيا
- صدر
- ذات الصلة
- إزالة
- ممثل
- تمثل
- مطلوب
- بحث
- الباحثين
- دقة الشاشة
- بتقييد
- نتيجة
- مما أدى
- النتائج
- بيع بالتجزئة
- عائد أعلى
- مراجعة
- تخلص من
- الروبوتات
- قوي
- النوع
- تقريبا
- صف
- خراب
- تشغيل
- sagemaker
- قال
- SALESFORCE
- نفسه
- سامسونج
- حفظ
- مشاهد
- علوم
- القصص الخيالي
- العلماء
- أحرز هدفاً
- بسلاسة
- الثاني
- القسم
- أقسام
- انظر تعريف
- بدا
- يبدو
- مختار
- إحساس
- مستقل
- الخدمة
- خدمات
- الجلسة
- طقم
- مشاركة
- هي
- ينبغي
- إظهار
- يظهر
- الشريحة
- مماثل
- الاشارات
- الأصغر
- So
- تطبيقات الكمبيوتر
- تطوير البرمجيات
- حل
- بعض
- شخص ما
- شيء
- الفضاء
- أنفق
- الإنفاق
- انقسم
- الإنشقاقات
- ستانفورد
- بداية
- بدأت
- ابتداء
- بدء التشغيل
- بدء التشغيل مسرع
- دولة من بين الفن
- خطوات
- لا يزال
- تخزين
- متجر
- الإستراتيجيات
- نمط
- أنماط
- ملخص
- مدعومة
- أنظمة
- أخذ
- مهمة
- فريق
- تقني
- TechStars
- يروي
- النماذج
- تجربه بالعربي
- من
- أن
- •
- من مشاركة
- منهم
- then
- نظري
- هناك.
- تشبه
- هم
- الأشياء
- اعتقد
- طرف ثالث
- الآلاف
- عتبة
- عبر
- رمي
- الوقت
- إلى
- سويا
- أداة
- أدوات
- تيشرت
- افضل مستوى
- التوب
- الإجمالي
- لمست
- مسار
- قطار
- متدرب
- قادة الإيمان
- تحول
- الشفافية
- صحيح
- حقيقة
- منعطف أو دور
- اثنان
- نوع
- أنواع
- مع
- فهم
- فريد من نوعه
- جامعة
- جامعة ميشيغان
- تحديث
- us
- تستخدم
- حالة الاستخدام
- مستعمل
- مستخدم
- المستخدمين
- استخدام
- القيم
- تشكيلة
- مختلف
- الباعة
- تحقق من
- جدا
- بواسطة
- المزيد
- افتراضي
- رؤيتنا
- تريد
- وكان
- we
- الويب
- خدمات ويب
- حسن
- كان
- ابحث عن
- متى
- سواء
- التي
- ويكيبيديا
- سوف
- مع
- في غضون
- بدون
- نسائي
- كلمات
- للعمل
- عمل
- العمال
- القوى العاملة
- أعمال
- العالم
- قلق
- سوف
- اكتب
- X
- لصحتك!
- حل متجر العقارات الشامل الخاص بك في جورجيا
- زفيرنت
- الرمز البريدي
- ZOO