کیا جنریٹو AI ریچارج فون مارکیٹس کر سکتا ہے؟ - Semiwiki

کیا جنریٹو AI ریچارج فون مارکیٹس کر سکتا ہے؟ - سیمی ویکی

ماخذ نوڈ: 2926005

سمارٹ فون مارکیٹس پر اتفاق رائے معمولی کمی اور معمولی ترقی کے درمیان کہیں منڈلاتا ہے جو زیادہ مضبوط ترقی کے لیے واضح ڈرائیوروں کی کمی کو ظاہر کرتا ہے۔ کاروباری مواقع کے طور پر یہ غیر دلکش ریاست کسی حد تک سراسر حجم (ایک ذریعہ کے مطابق 500 میں $2023B) سے دور ہے لیکن ہم پہلے ہی چین سے باہر اپنانے کے عروج کے قریب ہیں لہذا فون بنانے والوں کے لیے اصل سوال یہ ہونا چاہیے کہ "اگلا قاتل کیا ہے؟ ایسی ایپ جو سوئی کو حرکت دے سکتی ہے؟

کیا جنریٹیو AI ریچارج فون مارکیٹس

ہم صارفین ایک بے چین ہیں اور ایسا لگتا ہے کہ تفریح ​​ہماری ضروری اشیاء کی فہرست میں اعلیٰ ہے۔ بازو ہے۔ موبائل گیمنگ پر شرط لگانا. ایک اور امکان تصویر کی تخلیق/ ہیرا پھیری کے لیے تخلیقی AI ہو سکتا ہے۔ Qualcomm پہلے ہی فون پر مبنی صلاحیت کا مظاہرہ کر چکا ہے۔ جبکہ ایپل سمیت دیگر اب بھی بڑی زبان کے ماڈل ایپس پر توجہ مرکوز کیے ہوئے ہیں۔ میرے لیے جنریٹو اے آئی کے تصویری پہلو کو قریب سے دیکھنے کے لیے صرف تھوڑا زیادہ جانکاری ہونا ضروری ہے کہ یہ کب اور کب شروع ہوتا ہے۔ تفریح ​​کے لیے میں نے مائیکروسافٹ بنگ سے امیج کریٹر کا استعمال کرتے ہوئے یہاں تصویر بنائی۔

بازی پر مبنی نسل

میں ایل ایل ایم کے ساتھ موازنہ کرکے تصور کی وضاحت کرنے کی کوشش کرنے جا رہا ہوں۔ LLMs متن کی ترتیب پر تربیت دیتے ہیں، ضروری طور پر لکیری۔ اس کے بہت سے. اور وہ ٹوکنائزڈ ٹیکسٹ پر کام کرتے ہیں، یہ سیکھتے ہیں کہ جب وہ ٹوکن کی ایک خاص ترتیب دیکھتے ہیں جو عام طور پر اس ترتیب کی پیروی کر سکتے ہیں۔ متن کے لیے بہت اچھا ہے لیکن تصاویر کے لیے نہیں جو 2D ہیں اور عام طور پر قابل نشانی نہیں ہیں، اس لیے تربیت کا طریقہ مختلف ہونا چاہیے۔ بازی پر مبنی تربیت میں، پہلے شور کو بتدریج تربیتی امیجز (فارورڈ ڈفیوژن) میں شامل کیا جاتا ہے، جب کہ نیٹ ورک کو ہر اصل امیج (ریورس ڈفیوژن) کو بازیافت کرنے کے لیے ترمیم شدہ امیجز امیجز کو مسترد کر کے تربیت دی جاتی ہے۔ گڑبڑ لگتا ہے لیکن بظاہر denoising طریقہ (اسٹوکاسٹک تفریق مساوات کو حل کرنا) اچھی طرح سے بیان کردہ اور مضبوط ہے۔ اسٹیبل ڈفیوژن ماڈل، ایک مثال کے طور پر، عوامی طور پر دستیاب ہے۔

اس کے بعد اس تربیت یافتہ نیٹ ورک سے نئی تصاویر بنانا ممکن ہے، بے ترتیب شور والی تصویر سے شروع ہو کر۔ اب آپ کو یہ بتانے کے لیے ایک طریقہ درکار ہے کہ آپ کون سی تصویر بنانا چاہتے ہیں۔ Dall.E-2، Midjourney، اور Stable Diffusion سبھی ٹیکسٹ پرامپٹس لے سکتے ہیں۔ یہ تربیت کی تصاویر کے ساتھ فراہم کردہ ٹیکسٹ لیبلز سے لی گئی تربیت پر منحصر ہے۔ نتیجہ اس کے بعد حتمی تصویر کا اندازہ لگانے کے راستے میں توجہ کے عمل میں فوری معلومات شامل کرتا ہے۔ ایل ایل ایم کی طرح یہ سسٹم بھی ٹرانسفارمرز استعمال کرتے ہیں جس کا مطلب ہے کہ اس صلاحیت کے لیے نئے ہارڈ ویئر کی ضرورت ہوتی ہے۔

نسل صرف شروع سے تصاویر بنانے تک محدود نہیں ہے۔ ایک تکنیک کہلاتی ہے۔ پینٹنگ تصویر کے کچھ حصوں کو بہتر بنانے یا تبدیل کرنے کے لیے استعمال کیا جا سکتا ہے۔ اس کو سمارٹ فونز پر پہلے سے مقبول امیج ایڈیٹنگ کا AI پر مبنی ورژن سمجھیں۔ نہ صرف بنیادی رنگ، روشنی کا توازن، فوٹو بومبس وغیرہ کو تراشنا، بلکہ بہت زیادہ مشکل مسائل کو حل کرنا یا خود کو cosplay کے لباس میں دوبارہ تیار کرنا - کچھ بھی۔ اب جب کہ میں بہت مقبول ہوتا دیکھ سکتا ہوں۔

کیا جنریٹو اے آئی سوئی کو حرکت دے گا؟

مجھے کوئی اندازہ نہیں ہے - پریشان کن صارفین پر اوپر تبصرہ دیکھیں۔ پھر ایک بار پھر، بصری محرک، خاص طور پر اپنے ارد گرد، اور تقریباً ہر ایک کو اپیل کرتا ہے۔ اگر آپ اپنے فون پر ایسا کر سکتے ہیں تو کیوں نہیں؟ AI ایک تیز رفتار ڈومین ہے جو بڑے دائو کی حوصلہ افزائی کرتا ہے۔ میں یقینی طور پر اس امکان کے خلاف شرط نہیں لگانا چاہوں گا۔

مجھے یہ بھی بتانا چاہئے کہ جنریٹو امیجنگ میں پہلے سے ہی زیادہ سنجیدہ ایپلی کیشنز ہیں، خاص طور پر طبی میدان میں جہاں اسے شور مچانے والے CAT اسکین کی مرمت یا ہڈیوں کے ڈھانچے سے ممکنہ طور پر مسدود تفصیلات کی بازیافت کے لیے استعمال کیا جا سکتا ہے۔ میں تصور بھی کر سکتا ہوں کہ یہ ٹیکنالوجی فرانزک ٹول کٹ میں کام کر رہی ہے۔ ہم سب نے ٹی وی شوز دیکھے ہیں - ابی یا انجیلا جو دکھائی دے رہا ہے اس سے تربیت یافتہ ڈیٹا کے ذریعے ایک تصویر میں گمشدہ تفصیلات کو بھرتے ہیں۔ تخلیقی امیجنگ یہ ممکن بنا سکتی ہے!

اس پوسٹ کو بذریعہ شیئر کریں:

ٹائم اسٹیمپ:

سے زیادہ سیمی ویکی