آیا هوش مصنوعی مولد می تواند بازارهای تلفن را شارژ کند؟ - نیمه ویکی

آیا هوش مصنوعی مولد می تواند بازارهای تلفن را شارژ کند؟ - نیم ویکی

گره منبع: 2926005

اجماع در بازارهای گوشی‌های هوشمند جایی بین کاهش جزئی و رشد خفیف است که نشان‌دهنده عدم وجود محرک‌های آشکار برای رشد قوی‌تر است. به عنوان یک فرصت تجاری، این وضعیت نامطلوب تا حدودی با حجم بسیار زیاد جبران می‌شود (طبق یک منبع، 500 میلیارد دلار در سال 2023)، اما ما در حال حاضر به اوج پذیرش خارج از چین نزدیک شده‌ایم، بنابراین سؤال واقعی برای سازندگان تلفن باید این باشد که "قاتل بعدی چیست؟" برنامه ای که می تواند سوزن را حرکت دهد؟

آیا هوش مصنوعی مولد می تواند بازارهای تلفن را شارژ کند

ما مصرف‌کنندگان افراد بی‌ثباتی هستیم و به نظر می‌رسد سرگرمی در فهرست موارد ضروری ما رتبه بالایی دارد. بازو است شرط بندی روی بازی های موبایل. امکان دیگر ممکن است هوش مصنوعی مولد برای ایجاد/دستکاری تصویر باشد. کوالکام قبلاً یک قابلیت مبتنی بر تلفن را نشان داده است در حالی که دیگران از جمله اپل هنوز بر روی برنامه های مدل زبان بزرگ متمرکز هستند. برای من ارزش این را دارد که به جنبه تصویری هوش مصنوعی مولد بیشتر نگاه کنم تا در صورت و زمانی که این هوش مصنوعی شروع به کار کرد، کمی آگاه تر باشم. برای سرگرمی، تصویر را با استفاده از Image Creator از Microsoft Bing در اینجا ایجاد کردم.

تولید مبتنی بر انتشار

من قصد دارم با مقایسه با یک LLM مفهوم را توضیح دهم. LLM ها بر روی دنباله های متنی، لزوما خطی آموزش می بینند. مقدار زیادی از آن. و آنها روی متن نشانه‌سازی شده کار می‌کنند و وقتی دنباله خاصی از نشانه‌ها را می‌بینند یاد می‌گیرند که معمولاً از آن دنباله پیروی می‌کنند. برای متن عالی است، اما نه تصاویری که دو بعدی هستند و عموماً قابل رمزگذاری نیستند، بنابراین رویکرد آموزشی باید متفاوت باشد. در آموزش مبتنی بر انتشار، اولین نویز به تدریج به تصاویر آموزشی اضافه می شود (نشر به جلو)، در حالی که شبکه با حذف نویز تصاویر تغییر یافته آموزش داده می شود تا هر تصویر اصلی را بازیابی کند (نشر معکوس). به نظر کثیف است اما ظاهراً روش حذف نویز (حل معادلات دیفرانسیل تصادفی) به خوبی تعریف شده و قوی است. مدل انتشار پایدار، به عنوان یک نمونه، در دسترس عموم است.

سپس امکان تولید تصاویر جدید از این شبکه آموزش دیده، با شروع یک تصویر نویز تصادفی وجود دارد. اکنون شما به روشی نیاز دارید تا راهنمایی کند که چه تصویری می خواهید ایجاد کنید. Dall.E-2، Midjourney و Stable Diffusion همگی می توانند پیام های متنی را دریافت کنند. اینها به آموزش گرفته شده از برچسب های متنی ارائه شده همراه با تصاویر آموزشی بستگی دارد. سپس استنتاج شامل اطلاعات سریع در فرآیند توجه در مسیر استنتاج تصویر نهایی می شود. این سیستم ها نیز مانند LLM ها از ترانسفورماتور استفاده می کنند که به این معنی است که پشتیبانی از این قابلیت به سخت افزار جدید نیاز دارد.

نسل به ایجاد تصاویر از ابتدا محدود نمی شود. تکنیکی به نام ورودی می توان برای بهبود یا جایگزینی بخش هایی از یک تصویر استفاده کرد. به این به عنوان یک نسخه مبتنی بر هوش مصنوعی از ویرایش تصویر در حال حاضر در تلفن های هوشمند رایج فکر کنید. نه فقط رنگ اصلی، تعادل نور، برش دادن بمب های عکس، و غیره، بلکه رفع مشکلات بسیار چالش برانگیزتر یا طراحی مجدد خود در لباس های کازپلی – هر چیزی. حالا که می بینم بسیار محبوب هستم.

آیا هوش مصنوعی مولد سوزن را حرکت می دهد؟

من هیچ نظری ندارم - نظر بالا را در مورد مصرف کنندگان بی ثبات ببینید. سپس دوباره، محرک های بصری، به ویژه در اطراف خودمان، و بازی تقریبا برای همه جذاب است. اگر می توانید این کار را روی گوشی خود انجام دهید، چرا که نه؟ هوش مصنوعی دامنه ای است که به سرعت در حال حرکت است که به نظر می رسد شرط بندی های بزرگ را تشویق می کند. من مطمئناً نمی خواهم علیه این احتمال شرط بندی کنم.

همچنین باید اشاره کنم که تصویربرداری مولد در حال حاضر کاربردهای جدی تری دارد، به ویژه در زمینه پزشکی که می توان از آن برای ترمیم یک اسکن CAT پر سر و صدا یا بازیابی جزئیات مسدود شده توسط ساختار استخوان استفاده کرد. من حتی می توانم تصور کنم که این فناوری راه خود را به جعبه ابزار پزشکی قانونی وارد کند. همه ما برنامه‌های تلویزیونی را دیده‌ایم - ابی یا آنجلا با برون‌یابی داده‌های آموزش‌دیده از آنچه که قابل مشاهده است، جزئیات گمشده را در یک عکس پر می‌کنند. تصویربرداری مولد می تواند آن را ممکن کند!

اشتراک گذاری این پست از طریق:

تمبر زمان:

بیشتر از نیمه ویکی