أنشئ تطبيق ويب للتفاعل مع التسميات التوضيحية للصور التي تم إنشاؤها بواسطة التعلم الآلي

عقدة المصدر: 1849327

نبذة عامة

مقدمة من IBM Model Asset eXchange (MAX) الذي يتم استضافته على تبادل التعلم الآلي منح مطوري التطبيقات الذين ليس لديهم خبرة في علوم البيانات وصولاً سهلاً إلى نماذج التعلم الآلي المنشأة مسبقًا. يوضح نمط الرمز هذا مدى سهولة إنشاء تطبيق ويب يستخدم نموذج MAX. يستخدم تطبيق الويب Image Caption Generator من MAX ويقوم بإنشاء واجهة مستخدم ويب بسيطة تتيح لك تصفية الصور بناءً على الأوصاف التي يقدمها النموذج.

الوصف

يتم إنشاء 2.5 كوينتيليون بايت من البيانات يوميًا ، بناءً على دراسة أجرتها شركة IBM. الكثير من هذه البيانات عبارة عن بيانات غير منظمة ، مثل النصوص الكبيرة والتسجيلات الصوتية والصور. للقيام بشيء مفيد مع البيانات ، يجب عليك أولاً تحويلها إلى بيانات منظمة.

يستخدم نمط الكود هذا أحد النماذج من نموذج Asset Exchange ، وهو تبادل حيث يمكن للمطورين العثور على نماذج التعلم العميق مفتوحة المصدر وتجربتها. على وجه التحديد ، فإنه يستخدم مولد التسمية التوضيحية للصورة لإنشاء تطبيق ويب يعلق على الصور ويتيح لك التصفية من خلال محتوى الصور المستند إلى الصور. يوفر تطبيق الويب واجهة مستخدم تفاعلية مدعومة بخادم Python خفيف الوزن باستخدام Tornado. يأخذ الخادم الصور من خلال واجهة المستخدم ، ويرسلها إلى نقطة نهاية REST للنموذج ، ويعرض التعليقات التي تم إنشاؤها على واجهة المستخدم. تم إعداد نقطة نهاية REST الخاصة بالنموذج باستخدام صورة Docker المتوفرة في MAX. تعرض واجهة مستخدم الويب التسميات التوضيحية التي تم إنشاؤها لكل صورة بالإضافة إلى سحابة كلمات تفاعلية لتصفية الصور بناءً على تسميتها.

عندما تكمل نموذج الشفرة هذا ، تفهم كيفية:

  • نشر نموذج التعلم العميق مع نقطة نهاية REST
  • أنشئ تعليقات لصورة باستخدام واجهة برمجة تطبيقات REST الخاصة بطراز MAX
  • قم بتشغيل تطبيق ويب يستخدم REST API للنموذج

التدفق

تدفق

  1. يرسل الخادم الصور الافتراضية إلى Model API ويتلقى بيانات التسمية التوضيحية.
  2. يتفاعل المستخدم مع واجهة مستخدم الويب التي تحتوي على المحتوى الافتراضي وتحميل الصور.
  3. تطلب واجهة مستخدم الويب بيانات التسمية التوضيحية للصور من الخادم وتقوم بتحديث المحتوى عند إرجاع البيانات.
  4. يرسل الخادم الصور إلى Model API ويتلقى بيانات التسمية التوضيحية للعودة إلى واجهة مستخدم الويب.

تعليمات

هل أنت على استعداد لوضع نمط الرمز هذا للاستخدام؟ تفاصيل كاملة عن كيفية البدء في تشغيل واستخدام هذا التطبيق في README.

المصدر: https://developer.ibm.com/patterns/create-a-web-app-to-interact-with-machine-learning-generated-image-captions/

الطابع الزمني:

اكثر من IBM Developer