ایجاد یک برنامه وب برای تعامل با شرح تصاویر تولید شده توسط یادگیری ماشینی

بازنشر افلاطون

دنبال: 0

خلاصه

معرفی مدل IBM Asset EXchange (MAX) که در میزبانی می شود تبادل یادگیری ماشینی به توسعه دهندگان برنامه بدون تجربه علم داده دسترسی آسان به مدل های یادگیری ماشینی از پیش ساخته شده را داده است. این الگوی کد نشان می دهد که ایجاد یک برنامه وب که از مدل MAX استفاده می کند چقدر ساده است. برنامه وب از Image Caption Generator از MAX استفاده می کند و یک رابط کاربری وب ساده ایجاد می کند که به شما امکان می دهد تصاویر را بر اساس توضیحات ارائه شده توسط مدل فیلتر کنید.

توضیحات:

بر اساس مطالعه IBM، هر روز 2.5 کوئینتیلیون بایت داده ایجاد می شود. بسیاری از این داده ها داده های بدون ساختار هستند، مانند متون بزرگ، ضبط های صوتی و تصاویر. برای انجام کاری مفید با داده ها، ابتدا باید آن را به داده های ساخت یافته تبدیل کنید.

این الگوی کد از یکی از مدل‌های Model Asset Exchange استفاده می‌کند، صرافی که در آن توسعه‌دهندگان می‌توانند مدل‌های یادگیری عمیق منبع باز را بیابند و آزمایش کنند. به طور خاص، از آن استفاده می کند تولید کننده عنوان تصویر برای ایجاد یک برنامه وب که تصاویر را شرح می دهد و به شما امکان می دهد محتوای تصویر مبتنی بر تصاویر را فیلتر کنید. برنامه وب یک رابط کاربری تعاملی ارائه می دهد که توسط یک سرور پایتون سبک وزن با استفاده از Tornado پشتیبانی می شود. سرور تصاویر را از طریق UI می گیرد، آنها را به نقطه پایانی REST برای مدل می فرستد و زیرنویس های ایجاد شده را در UI نمایش می دهد. نقطه پایانی REST مدل با استفاده از تصویر Docker ارائه شده در MAX تنظیم می شود. رابط کاربری وب زیرنویس‌های تولید شده را برای هر تصویر و همچنین یک ابر کلمه تعاملی برای فیلتر کردن تصاویر بر اساس عنوان آنها نمایش می‌دهد.

هنگامی که این الگوی کد را تکمیل کردید، می فهمید که چگونه:

یک مدل یادگیری عمیق را با نقطه پایانی REST اجرا کنید
با استفاده از MAX Model’s REST API برای یک تصویر زیرنویس ایجاد کنید
یک برنامه وب را اجرا کنید که از REST API مدل استفاده می کند

جریان

سرور تصاویر پیش فرض را به مدل API ارسال می کند و داده های عنوان را دریافت می کند.
کاربر با رابط کاربری وب که حاوی محتوای پیش‌فرض است تعامل می‌کند و تصاویر را آپلود می‌کند.
رابط کاربری وب داده‌های شرح تصاویر را از سرور درخواست می‌کند و هنگام بازگرداندن داده‌ها، محتوا را به‌روزرسانی می‌کند.
سرور تصاویر را به مدل API می فرستد و داده های عنوان را برای بازگشت به رابط کاربری وب دریافت می کند.

دستورالعمل ها

برای استفاده از این الگوی کد آماده هستید؟ جزئیات کامل در مورد نحوه شروع اجرا و استفاده از این برنامه در این قسمت موجود است README.

منبع: https://developer.ibm.com/patterns/create-a-web-app-to-interact-with-machine-learning-generated-image-captions/

تمبر زمان: مارس 27، 2019

تمبر زمان: ژوئیه 9، 2020

یک برنامه وب ایجاد کنید تا با زیرنویس‌های تصویری ایجاد شده از یادگیری ماشین تعامل داشته باشید

بازنشر افلاطون

خلاصه

توضیحات:

جریان

دستورالعمل ها

بیشتر از توسعه دهنده IBM

اعتبارسنجی مدل های یادگیری عمیق بینایی کامپیوتری

با استفاده از Watson Machine Learning یک اپلیکیشن تشخیص شی بلادرنگ ایجاد کنید

استخراج بینش از ویدیوها

توسعه داشبوردهای تحلیلی برای پروژه های هوش مصنوعی با IBM Maximo Visual Inspection

استخراج صدا از ویدئو

داده های آپاچی کافکا را دریافت کنید

یک نوت بوک پایتون برای مدل های خط لوله با استفاده از AutoAI ایجاد کنید

صدا را در زمان واقعی یا از یک فایل صوتی رونویسی کنید

نتایج استنتاج IBM Maximo Visual Inspection را در داشبورد بارگذاری کنید

پیاده سازی سیستم کنترل امنیتی خودکار فرودگاه

یک مدل سفارشی گفتار به نوشتار با قابلیت‌های دیاریشن بلندگو بسازید

صدای انسان مانند را از متن تولید کنید

درباره‌ ما

جستجوی عمودی و هوش مصنوعی

سکو

همیشه در ارتباط ماندن

حساب