ٹیک کے اندر ایک بلاگ سیریز ہے جو ہمارے ساتھ ہے۔ ٹیک ٹاکس پوڈ کاسٹ. پوڈ کاسٹ کی 19ویں قسط میں، بین الاقوامی سطح پر, Roblox کے CEO David Baszucki نے پروڈکٹ کے سینئر ڈائریکٹر Zhen Fang کے ساتھ Roblox کی بین الاقوامی حکمت عملی اور تکنیکی چیلنجوں کے بارے میں بات کی جن کو ہم دنیا بھر کے لاکھوں لوگوں کے لیے مقامی تجربہ کو یقینی بنانے کے لیے حل کر رہے ہیں۔ Inside the Tech کے اس ایڈیشن میں، ہم نے ان تکنیکی چیلنجوں میں سے ایک، کثیر لسانی اور معنوی تلاش کے بارے میں مزید جاننے کے لیے انجینئرنگ مینیجر راوالی کندور سے بات کی، اور کس طرح گروتھ ٹیم کا کام دنیا بھر میں روبلوکس کے صارفین کو تلاش کرنے میں مدد کر رہا ہے۔ جو کچھ وہ ہمارے پلیٹ فارم پر چاہتے ہیں۔
آپ کی ٹیم کون سا سب سے بڑا تکنیکی چیلنج لے رہی ہے؟
تقریباً ایک سال پہلے تک، روبلوکس سرچ نے صارفین کی تلاش کے نتائج کو ملانے کے لیے ایک لغوی نظام کا استعمال کیا، یعنی اس کی توجہ صرف متن کے ملاپ پر تھی۔ لیکن تلاش کے رویے تیزی سے بدل رہے ہیں اور یہ نقطہ نظر اب صارفین کو متعلقہ مواد دینے کے لیے کافی نہیں ہے۔ اسی وقت، کچھ روبلوکس صارفین اپنے سوالات میں غلط املا استعمال کر سکتے ہیں۔ لہٰذا، ہمیں ایسے نتائج تجویز کرنے کے قابل ہونا چاہیے جو ان کی تلاش کے مطابق ہوں، جس کا مطلب ہے کہ ان کے ارادے کو سمجھنا۔
تلاش میں ایک اور بڑا مسئلہ تمام زبانوں میں تربیتی ڈیٹا کی کمی ہے۔ سیمنٹک تلاش سے پہلے، ہمارا پہلا قدم روبلوکس سسٹم کے اندر مشینی ترجمہ کا فائدہ اٹھانا تھا۔ ہم نے ترجمے کو ترتیب دیا اور پھر متن کا میچ کیا۔ لیکن یہ صارفین کو ہمیشہ متعلقہ مواد دکھانے کے لیے کافی نہیں ہے۔ لہذا، ہم نے ایک جدید ترین ML تکنیک کو اپنایا ہے جسے طالب علم-استاد ماڈل کہا جاتا ہے: استاد کسی بھی مخصوص منظر نامے کے لیے ہمارے سب سے بڑے سیاق و سباق سے سیکھتا ہے۔
Roblox پر انگریزی سب سے زیادہ استعمال ہونے والی زبان ہے، یہی وجہ ہے کہ ہم انگریزی میں زیادہ سے زیادہ معنوی رشتے سیکھتے ہیں — ٹیچر ماڈل — اور پھر ہم اسے دوسری زبانوں تک بڑھا کر طالب علم کے ماڈل میں ڈسٹل کرتے ہیں۔ اس سے ہمیں اس مسئلے کو حل کرنے میں مدد ملتی ہے حالانکہ ہمارے پاس مخصوص زبانوں میں بہت زیادہ ڈیٹا نہیں ہے۔ اس کی وجہ سے جاپان میں تلاش سے شروع ہونے والے ڈراموں میں 15% اضافہ ہوا ہے۔
ہم حال ہی میں "đua xe (racing)" جیسے کیٹلاگ کے سوالات کی بہتر مدد کرنے کے لیے کام کر رہے ہیں۔ لیکن صارفین زیادہ کثرت سے طویل، آزادانہ سوالات جمع کر رہے ہیں، جیسے، "ارے، مجھے ایک گیم کھیلنا یاد ہے جہاں ایک ڈریگن اور ایک لڑکی اس سے لڑ رہی تھی۔ کیا آپ اسے ڈھونڈنے میں میری مدد کر سکتے ہیں؟" یہ مزید تکنیکی چیلنجز پیش کرتا ہے اور ہم ان خطوط پر اپنے نظام کو بہتر بنانے کے لیے جاری رکھے ہوئے ہیں۔
مزید سیاق و سباق اور زیادہ معنوی تلاش کو شامل کرنے کے لیے کچھ اختراعی طریقے کیا ہیں؟
ہم نے ایک ہائبرڈ سرچ سسٹم بنایا ہے جو لغوی تلاش لیتا ہے اور اسے ML تکنیکوں اور ماڈلز کے ساتھ جوڑتا ہے جس میں سیمنٹک تلاش اور استفسار کے ارادے کی سمجھ کا استعمال ہوتا ہے۔ ہم سیاق و سباق کو سمجھنے، پیچیدہ سوالات کو سنبھالنے، اور متعلقہ مواد واپس کرنے کے لیے اپنے سسٹمز کو مسلسل تیار کر رہے ہیں۔
سیمنٹک سرچ کا جادو سرایت کرنے میں ہے، جو مختلف قسم کے سگنلز کی بھرپور نمائندگی کرتے ہیں جو ہمیں پورے روبلوکس سے ملتے ہیں۔ مثال کے طور پر، ہم سگنلز کو شامل کر رہے ہیں جیسے صارف کی آبادیات، صارف کا استفسار، یہ کتنا طویل ہے، یا اس کے منفرد پہلو کیا ہیں۔
ہم مواد کے اشاروں کو بھی دیکھ رہے ہیں، جیسے تجربات، اوتار کے آئٹمز، اور مشغولیت— یہ گیم کتنی بار کھیلی گئی یا اس کے کتنے صارفین تھے، اور کتنے ممالک سے؟ منیٹائزیشن اور برقرار رکھنے جیسی چیزیں بھی ہیں، نیز میٹا ڈیٹا جیسے تجربے کا عنوان، تفصیل، یا تخلیق کار۔ ہم ان سب کو BERT پر مبنی، ٹرانسفارمر پر مبنی فن تعمیر کے ذریعے ڈالتے ہیں اور ہم استعمال کرتے ہیں ملٹیلیئر پرسیپٹرن آخر میں سرایت پیدا کرنے کے لیے، جو ہماری سچائی کا ذریعہ بنتے ہیں۔
ایک اور اختراع ہمارا اندرون خانہ مماثلت کی تلاش کا نظام ہے۔ جب کوئی تلاش کا استفسار کرتا ہے، تو ہم قریب سے متعلقہ ایمبیڈنگز کو بازیافت کرتے ہیں، اور اس بات کا یقین کرنے کے لیے ان کی درجہ بندی کرتے ہیں کہ وہ صارف کی تلاش سے متعلق ہیں۔ اور پھر ہم نتائج صارفین کو واپس کرتے ہیں۔
کچھ اہم چیزیں کیا ہیں جو آپ نے اس تکنیکی کام سے سیکھی ہیں؟
ہر زبان اپنا منفرد چیلنج پیش کرتی ہے۔ اور خاص طور پر تلاش کے ساتھ، ہمیں یہ سمجھنے کی ضرورت ہے کہ دنیا کے مختلف حصوں میں صارفین کیا تلاش کر رہے ہیں تاکہ ہم انہیں انتہائی متعلقہ نتائج دکھا سکیں۔ ہمیں زبان کے مختلف عناصر کو سمجھنا ہوگا۔ مثال کے طور پر، پہلے سے تربیت یافتہ ٹرانسفارمر جاپانیوں کی متعدد بولیوں کو سمجھنے کے لیے ضروری رہے ہیں۔
دوم، تلاش کے استفسار کے نمونے کافی حد تک بدل رہے ہیں اور ہمیں برقرار رکھنے کے لیے اپنی ٹیکنالوجی کے اسٹیک کو مسلسل تیار کرنا ہوگا۔ ایک ہی وقت میں، ہمیں اپنے صارفین کو اس بارے میں مطلع کرنے کی ضرورت ہے کہ ہمارے پلیٹ فارم پر کیا ممکن ہے، کیونکہ ہو سکتا ہے وہ اس کا احساس نہ کریں۔ مثال کے طور پر، ہم اپنے صارفین کو بتا سکتے ہیں کہ تلاش فری اسٹائل سوالات (جیسے ریسنگ گیمز یا فوڈ گیمز) جیسی چیزوں کو سپورٹ کر سکتی ہے اور یہ سمجھتی ہے کہ لوگ کیا تلاش کر رہے ہیں اور مناسب نتائج واپس کر سکتے ہیں۔
آپ کی ٹیم کس روبلوکس قدر کے ساتھ سب سے زیادہ موافق ہے؟
لمبا نظارہ لینا ہماری ٹیم کے لیے بنیادی ہے اور یہی ایک وجہ ہے کہ مجھے روبلوکس میں کام کرنا پسند ہے۔
میری ٹیم کی ایک مثال ہمارا ٹیک اسٹیک ہے، جو ہمارے ML- اور NLP پر مبنی سرچ سسٹمز پر مشتمل ہے — پہلے سے تربیت یافتہ بڑے ماڈلز کا استعمال کرتے ہوئے سیمینٹک تلاش، خودکار تکمیل اور املا کی اصلاح۔
ہم نے اسے اپنے دسیوں لاکھوں یومیہ فعال صارفین کے ذریعے کی جانے والی مختلف قسم کی تلاشوں میں دوبارہ استعمال کے قابل بناتے ہوئے بنایا ہے۔ اس کا مطلب ہے کہ ہم مختلف قسم کے ڈیٹا کو پلگ ان کر سکتے ہیں (مثال کے طور پر تجربات کے بجائے اوتار آئٹمز)، اور اسے بہت کم تبدیلیوں کے ساتھ کام کرنا چاہیے۔
ہم نے تجربات کے لیے معنوی تلاش کو شامل کیا ہے، اور ہم نے اسے مارکیٹ پلیس جیسے دیگر عمودی حصوں کے ساتھ شیئر کیا ہے، اور وہ صرف موجودہ فن تعمیر پر چھلانگ لگانے میں کامیاب رہے ہیں۔ یہ بالکل پلگ اینڈ پلے نہیں ہے، لیکن کچھ ٹھیک ٹیوننگ کے ساتھ، ہم اسے مختلف استعمال کے معاملات میں ڈھال سکتے ہیں۔
روبلوکس اور آپ کی ٹیم کہاں جا رہی ہے اس کے بارے میں آپ کو سب سے زیادہ پرجوش کیا ہے؟
تلاش واحد سطح ہے جہاں صارف اپنے واضح ارادے کا اظہار کرتے ہیں۔ اور اس کا مطلب ہے کہ یہ ضروری ہے کہ ہم سمجھیں کہ وہ کیا چاہتے ہیں اور انہیں انتہائی متعلقہ نتائج دیں۔ اس لیے میرے لیے اس ارادے کو سمجھنے اور اپنے صارفین کو اس کے بارے میں تعلیم دینے کے لیے کام کرنا واقعی پرجوش ہے کہ کیا ممکن ہے، بعض اوقات اس سے پہلے کہ صارف کو اس کا احساس ہو جائے۔
کسی بھی ملک میں صارف کچھ پوچھ سکتا ہے اور ہم انہیں وہی دے سکتے ہیں جو وہ چاہتے ہیں اور یہ ان کے لیے سب سے زیادہ متعلقہ ہے۔ یہ اعتماد پیدا کرتا ہے جس کے نتیجے میں، برقرار رکھنے میں بہتری آتی ہے۔ اس اعتماد کو بڑھانے کے لیے تلاش کو بہتر بنانے کے چیلنج کو قبول کرنا اور ایک ارب صارفین رکھنے کے اپنے ہدف کو حاصل کرنے میں Roblox کی مدد کرنا میرے لیے بہت پرجوش ہے۔
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
- پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- پلیٹو ای ایس جی۔ کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
- پلیٹو ہیلتھ۔ بائیوٹیک اینڈ کلینیکل ٹرائلز انٹیلی جنس۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://blog.roblox.com/2023/11/inside-the-tech-solving-for-multilingual-semantic-search/
- : ہے
- : ہے
- : نہیں
- :کہاں
- $UP
- 15٪
- 19
- a
- قابلیت
- ہمارے بارے میں
- حاصل
- کے پار
- فعال
- اپنانے
- اپنایا
- پہلے
- سیدھ کریں
- تمام
- ساتھ
- بھی
- ہمیشہ
- an
- اور
- کوئی بھی
- نقطہ نظر
- نقطہ نظر
- مناسب
- فن تعمیر
- کیا
- ارد گرد
- AS
- پوچھنا
- پہلوؤں
- At
- خود مختار
- اوتار
- BE
- بن
- رہا
- اس سے پہلے
- بہتر
- سب سے بڑا
- ارب
- بٹ
- بلاگ
- تعمیر
- بناتا ہے
- تعمیر
- لیکن
- by
- کہا جاتا ہے
- کر سکتے ہیں
- مقدمات
- کیٹلوگ
- سی ای او
- کچھ
- چیلنج
- چیلنجوں
- تبدیلیاں
- تبدیل کرنے
- یکجا
- پیچیدہ
- مشتمل
- مواد
- سیاق و سباق
- جاری
- مسلسل
- کور
- سکتا ہے
- ممالک
- ملک
- خالق
- روزانہ
- اعداد و شمار
- ڈیوڈ
- آبادی
- تفصیل
- DID
- مختلف
- ڈائریکٹر
- کرتا
- کر
- نہیں
- ڈریگن
- ایڈیشن
- کی تعلیم
- عناصر
- آخر
- انجنیئرنگ
- کو یقینی بنانے کے
- پرکرن
- خاص طور پر
- ضروری
- بھی
- تیار
- تیار ہوتا ہے
- بالکل
- مثال کے طور پر
- پرجوش
- دلچسپ
- موجودہ
- تجربہ
- تجربات
- ایکسپریس
- توسیع
- لڑ
- مل
- پہلا
- توجہ مرکوز
- کھانا
- کے لئے
- اکثر
- سے
- کھیل ہی کھیل میں
- کھیل
- پیدا
- حاصل
- شادی سے پہلے
- دے دو
- دنیا
- مقصد
- ترقی
- ہینڈل
- ہے
- ہونے
- قیادت
- مدد
- مدد
- مدد کرتا ہے
- کس طرح
- HTTPS
- ہائبرڈ
- i
- کو بہتر بنانے کے
- بہتر ہے
- کو بہتر بنانے کے
- in
- شامل
- شامل کرنا
- اضافہ
- انڈیکس شدہ
- مطلع
- جدت طرازی
- جدید
- کے اندر
- کے بجائے
- ارادے
- بین الاقوامی سطح پر
- IT
- اشیاء
- میں
- جاپان
- جاپانی
- کودنے
- صرف
- رکھیں
- کلیدی
- نہیں
- زبان
- زبانیں
- بڑے
- جانیں
- سیکھا ہے
- قیادت
- لیوریج
- کی طرح
- لائنوں
- لانگ
- اب
- تلاش
- بہت
- محبت
- مشین
- بنا
- ماجک
- اہم
- بناتا ہے
- مینیجر
- بہت سے
- بازار
- میچ
- کے ملاپ
- مئی..
- me
- مطلب
- کا مطلب ہے کہ
- میٹا ڈیٹا
- لاکھوں
- برا
- کم سے کم
- ML
- ایم ایل تکنیک
- ماڈل
- ماڈل
- منیٹائزیشن
- زیادہ
- سب سے زیادہ
- ایک سے زیادہ
- my
- ضرورت ہے
- نہیں
- of
- اکثر
- on
- ایک
- صرف
- or
- شروع کرنا
- دیگر
- ہمارے
- خود
- حصے
- پیٹرن
- لوگ
- بالکل
- پلیٹ فارم
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- کھیلا
- کھیل
- ادا کرتا ہے
- پلگ
- podcast
- مقبول
- ممکن
- تحفہ
- مسئلہ
- مصنوعات
- ڈال
- سوالات
- جلدی سے
- بہت
- لوگ دوڑ میں مقابلہ
- درجہ بندی
- احساس
- واقعی
- وجوہات
- حال ہی میں
- تعلقات
- متعلقہ
- یاد
- نتائج کی نمائش
- برقراری
- واپسی
- امیر
- Roblox
- اسی
- منظر نامے
- تلاش کریں
- تلاش
- سینئر
- سیریز
- مشترکہ
- ہونا چاہئے
- دکھائیں
- ظاہر
- سگنل
- So
- مکمل طور پر
- حل
- حل کرنا۔
- کچھ
- کسی
- کچھ
- کبھی کبھی
- ماخذ
- مخصوص
- املا
- ڈھیر لگانا
- ریاستی آرٹ
- مرحلہ
- حکمت عملی
- طالب علم
- اس طرح
- کافی
- مشورہ
- حمایت
- اس بات کا یقین
- سطح
- کے نظام
- سسٹمز
- لے لو
- لیتا ہے
- لینے
- مذاکرات
- استاد
- ٹیم
- ٹیک
- ٹیکنیکل
- تکنیک
- تکنیک
- ٹیکنالوجی
- بتا
- دہلی
- متن
- کہ
- ۔
- دنیا
- ان
- ان
- تو
- وہاں.
- یہ
- وہ
- چیزیں
- اس
- ان
- اگرچہ؟
- کے ذریعے
- وقت
- عنوان
- کرنے کے لئے
- ٹریننگ
- ٹرانسفارمرز
- ترجمہ
- بھروسہ رکھو
- حقیقت
- ٹرن
- قسم
- اقسام
- سمجھ
- افہام و تفہیم
- سمجھتا ہے۔
- منفرد
- us
- استعمال کی شرائط
- استعمال کیا جاتا ہے
- رکن کا
- صارفین
- کا استعمال کرتے ہوئے
- استعمال کرنا۔
- قیمت
- مختلف اقسام کے
- عمودی
- بہت
- لنک
- چاہتے ہیں
- تھا
- we
- اچھا ہے
- کیا
- کیا ہے
- جب
- جس
- کیوں
- وکیپیڈیا
- ساتھ
- کے اندر
- کام
- کام کر
- دنیا
- سال
- آپ
- اور
- زیفیرنیٹ