इनसाइड द टेक एक ब्लॉग श्रृंखला है जो हमारे साथ है टेक टॉक्स पॉडकास्ट. पॉडकास्ट के एपिसोड 19 में, अंतरराष्ट्रीय स्तर पर, रोबॉक्स के सीईओ डेविड बासज़ुकी ने उत्पाद के वरिष्ठ निदेशक जेन फैंग से रोबॉक्स की अंतर्राष्ट्रीय रणनीति और दुनिया भर के लाखों लोगों के लिए स्थानीय अनुभव सुनिश्चित करने के लिए हम जिन तकनीकी चुनौतियों का समाधान कर रहे हैं, उनके बारे में बात की। इनसाइड द टेक के इस संस्करण में, हमने उन तकनीकी चुनौतियों में से एक, बहुभाषी और अर्थ संबंधी खोज के बारे में और अधिक जानने के लिए इंजीनियरिंग मैनेजर रावली कंदुर से बात की, और ग्रोथ टीम का काम दुनिया भर में रोबॉक्स उपयोगकर्ताओं को खोजने और जल्दी से ढूंढने में कैसे मदद कर रहा है। वे हमारे मंच पर जो कुछ भी चाहते हैं।
आपकी टीम किस सबसे बड़ी तकनीकी चुनौती का सामना कर रही है?
लगभग एक साल पहले तक, Roblox खोज उपयोगकर्ताओं की खोजों के परिणामों से मिलान करने के लिए एक शाब्दिक प्रणाली का उपयोग करती थी, जिसका अर्थ है कि यह पूरी तरह से पाठ मिलान पर केंद्रित था। लेकिन खोज व्यवहार तेजी से बदल रहा है और वह दृष्टिकोण अब उपयोगकर्ताओं को प्रासंगिक सामग्री देने के लिए पर्याप्त नहीं है। वहीं, कुछ Roblox उपयोगकर्ता अपने प्रश्नों में गलत वर्तनी का उपयोग कर सकते हैं। इसलिए, हमें ऐसे परिणाम सुझाने में सक्षम होना होगा जो वे जो खोज रहे हैं उससे मेल खाते हों, जिसका अर्थ है उनके इरादे को समझना।
खोज में एक और बड़ी समस्या सभी भाषाओं में प्रशिक्षण डेटा की कमी है। सिमेंटिक खोज से पहले, हमारा पहला कदम रोबॉक्स प्रणाली के भीतर मशीनी अनुवाद का लाभ उठाना था। हमने अनुवादों को अनुक्रमित किया और फिर पाठ मिलान किया। लेकिन यह उपयोगकर्ताओं को हमेशा प्रासंगिक सामग्री दिखाने के लिए पर्याप्त नहीं है। इसलिए, हमने एक अधिक अत्याधुनिक एमएल तकनीक को अपनाया है जिसे छात्र-शिक्षक मॉडल कहा जाता है: शिक्षक किसी भी विशिष्ट परिदृश्य के लिए संदर्भ के हमारे सबसे बड़े स्रोत से सीखता है।
Roblox पर अंग्रेजी सबसे अधिक उपयोग की जाने वाली भाषा है, यही कारण है कि हम अंग्रेजी-शिक्षक मॉडल-में जितना संभव हो उतने अर्थपूर्ण संबंध सीखते हैं और फिर हम इसे अन्य भाषाओं में विस्तारित करके छात्र मॉडल तक सीमित कर देते हैं। इससे हमें उस समस्या को हल करने में मदद मिलती है, भले ही हमारे पास कुछ भाषाओं में बहुत अधिक डेटा न हो। इससे जापान में खोज से उत्पन्न होने वाले नाटकों में 15% की वृद्धि हुई है।
हम हाल ही में "đua xe (रेसिंग)" जैसे कैटलॉग प्रश्नों का बेहतर समर्थन करने के लिए काम कर रहे हैं। लेकिन उपयोगकर्ता अधिक बार लंबी, फ्रीफ़ॉर्म क्वेरी सबमिट कर रहे हैं, जैसे, "अरे, मुझे एक गेम खेलना याद है जहां एक ड्रैगन और एक लड़की उससे लड़ रही थी। क्या आप उसे ढूंढने में मेरी मदद कर सकते हैं?” यह अधिक तकनीकी चुनौतियाँ प्रस्तुत करता है और हम इसी तर्ज पर अपने सिस्टम में सुधार करना जारी रख रहे हैं।
अधिक संदर्भ और अधिक अर्थपूर्ण खोज को शामिल करने के लिए कुछ नवीन दृष्टिकोण क्या हैं?
हमने एक हाइब्रिड खोज प्रणाली बनाई है जो शाब्दिक खोज लेती है और इसे सिमेंटिक खोज और क्वेरी के इरादे की समझ का उपयोग करके एमएल तकनीकों और मॉडलों के साथ जोड़ती है। हम संदर्भ की समझ बनाने, जटिल प्रश्नों को संभालने और प्रासंगिक सामग्री वापस करने के लिए अपने सिस्टम को लगातार विकसित कर रहे हैं।
सिमेंटिक खोज का जादू एम्बेडिंग में है, जो रोब्लॉक्स से हमें मिलने वाले विभिन्न प्रकार के संकेतों का समृद्ध प्रतिनिधित्व है। उदाहरण के लिए, हम उपयोगकर्ता जनसांख्यिकी, उपयोगकर्ता की क्वेरी, यह कितना लंबा है, या इसके अद्वितीय पहलू क्या हैं जैसे संकेतों को शामिल कर रहे हैं।
हम अनुभव, अवतार आइटम और जुड़ाव जैसे सामग्री संकेतों को भी देख रहे हैं - यह गेम कितनी बार खेला गया या इसके कितने उपयोगकर्ता थे, और कितने देशों से थे? मुद्रीकरण और प्रतिधारण जैसी चीज़ें भी हैं, साथ ही किसी अनुभव का शीर्षक, विवरण या निर्माता जैसे मेटाडेटा भी हैं। हम इन सभी को BERT-आधारित, ट्रांसफार्मर-आधारित आर्किटेक्चर के माध्यम से रखते हैं और हम इसका उपयोग करते हैं मल्टीलेयर परसेप्ट्रॉन अंत में एम्बेडिंग उत्पन्न करने के लिए, जो हमारे सत्य का स्रोत बन जाता है।
एक और नवाचार हमारी इन-हाउस समानता खोज प्रणाली है। जब कोई खोज क्वेरी बनाता है, तो हम बारीकी से संबंधित एम्बेडिंग को पुनः प्राप्त करते हैं, और यह सुनिश्चित करने के लिए उन्हें रैंक करते हैं कि वे उपयोगकर्ता जो खोज रहे हैं उसके लिए प्रासंगिक हैं। और फिर हम उपयोगकर्ताओं को परिणाम लौटाते हैं।
इस तकनीकी कार्य को करने से आपने कौन सी प्रमुख बातें सीखी हैं?
प्रत्येक भाषा अपनी अनूठी चुनौती प्रस्तुत करती है। और विशेष रूप से खोज के साथ, हमें यह समझने की आवश्यकता है कि दुनिया के विभिन्न हिस्सों में उपयोगकर्ता क्या खोज रहे हैं ताकि हम उन्हें सबसे प्रासंगिक परिणाम दिखा सकें। हमें विभिन्न भाषा तत्वों को समझना होगा। उदाहरण के लिए, जापानी की कई बोलियों को समझने के लिए पूर्व-प्रशिक्षित ट्रांसफार्मर आवश्यक रहे हैं।
दूसरे, खोज क्वेरी पैटर्न काफी बदल रहा है और इसे बनाए रखने के लिए हमें अपनी प्रौद्योगिकी स्टैक को लगातार विकसित करना होगा। साथ ही, हमें अपने उपयोगकर्ताओं को यह सूचित करने की आवश्यकता है कि हमारे प्लेटफ़ॉर्म पर क्या संभव है, क्योंकि उन्हें इसका एहसास नहीं हो सकता है। उदाहरण के लिए, हम अपने उपयोगकर्ताओं को बता सकते हैं कि खोज फ्रीस्टाइल क्वेरीज़ (जैसे रेसिंग गेम या लोकप्रिय खाद्य गेम) जैसी चीज़ों का समर्थन कर सकती है और यह समझती है कि लोग क्या खोज रहे हैं और उचित परिणाम दे सकते हैं।
आपकी टीम किस Roblox मान के साथ सबसे अधिक मेल खाती है?
दीर्घकालिक दृष्टिकोण रखना हमारी टीम का मूल है और यही एक कारण है कि मुझे रोबॉक्स में काम करना पसंद है।
मेरी टीम का एक उदाहरण हमारा तकनीकी स्टैक है, जिसमें हमारे एमएल- और एनएलपी-आधारित खोज सिस्टम शामिल हैं - पूर्व-प्रशिक्षित बड़े मॉडल का उपयोग करके सिमेंटिक खोज, स्वत: पूर्ण और वर्तनी सुधार।
हमने इसे हमारे लाखों दैनिक सक्रिय उपयोगकर्ताओं द्वारा की गई विभिन्न प्रकार की खोजों को ध्यान में रखते हुए पुन: प्रयोज्यता के साथ बनाया है। इसका मतलब है कि हम एक अलग प्रकार के डेटा को प्लग इन कर सकते हैं (उदाहरण के लिए, अनुभवों के बजाय अवतार आइटम), और इसे बहुत कम बदलावों के साथ काम करना चाहिए।
हमने अनुभवों के लिए सिमेंटिक खोज को शामिल किया है, और हमने इसे मार्केटप्लेस जैसे अन्य वर्टिकल के साथ साझा किया है, और वे मौजूदा आर्किटेक्चर पर कूदने में सक्षम हैं। यह पूरी तरह से प्लग-एंड-प्ले नहीं है, लेकिन कुछ बढ़िया ट्यूनिंग के साथ, हम इसे विभिन्न उपयोग के मामलों में अनुकूलित कर सकते हैं।
रोबॉक्स और आपकी टीम किस दिशा में जा रही है, इस बारे में आपको सबसे अधिक उत्साहित करने वाली बात क्या है?
खोज ही एकमात्र सतह है जहां उपयोगकर्ता अपने स्पष्ट इरादे व्यक्त करते हैं। और इसका मतलब है कि यह आवश्यक है कि हम समझें कि वे क्या चाहते हैं और उन्हें सबसे प्रासंगिक परिणाम दें। इसलिए उस इरादे को समझने और अपने उपयोगकर्ताओं को जो संभव है उसके बारे में शिक्षित करना मेरे लिए वास्तव में रोमांचक है, कभी-कभी उपयोगकर्ता को इसका एहसास होने से पहले भी।
किसी भी देश में कोई उपयोगकर्ता कुछ पूछ सकता है और हम उन्हें वही दे सकते हैं जो वे चाहते हैं और यह उनके लिए सबसे अधिक प्रासंगिक है। इससे विश्वास बनता है, जो बदले में प्रतिधारण में सुधार करता है। उस विश्वास को बनाने के लिए खोज को बेहतर बनाने की चुनौती स्वीकार करना और रोबॉक्स को एक अरब उपयोगकर्ता बनाने के हमारे लक्ष्य को हासिल करने में मदद करना मेरे लिए रोमांचक है।
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- प्लेटोईएसजी. कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
- प्लेटोहेल्थ। बायोटेक और क्लिनिकल परीक्षण इंटेलिजेंस। यहां पहुंचें।
- स्रोत: https://blog.roblox.com/2023/11/inside-the-tech-solving-for-multilingual-semantic-search/
- :हैस
- :है
- :नहीं
- :कहाँ
- $यूपी
- 15% तक
- 19
- a
- योग्य
- About
- पाना
- के पार
- सक्रिय
- अनुकूलन
- दत्तक
- पूर्व
- संरेखित करें
- सब
- साथ में
- भी
- हमेशा
- an
- और
- कोई
- दृष्टिकोण
- दृष्टिकोण
- उपयुक्त
- स्थापत्य
- हैं
- चारों ओर
- AS
- पूछना
- पहलुओं
- At
- स्वत: पूर्ण
- अवतार
- BE
- बन
- किया गया
- से पहले
- बेहतर
- सबसे बड़ा
- बिलियन
- बिट
- ब्लॉग
- निर्माण
- बनाता है
- बनाया गया
- लेकिन
- by
- बुलाया
- कर सकते हैं
- मामलों
- सूची
- मुख्य कार्यपालक अधिकारी
- कुछ
- चुनौती
- चुनौतियों
- परिवर्तन
- बदलना
- जोड़ती
- जटिल
- होते हैं
- सामग्री
- प्रसंग
- जारी रखने के लिए
- लगातार
- मूल
- सका
- देशों
- देश
- निर्माता
- दैनिक
- तिथि
- डेविड
- जनसांख्यिकी
- विवरण
- डीआईडी
- विभिन्न
- निदेशक
- कर देता है
- कर
- dont
- अजगर
- संस्करण
- शिक्षित
- तत्व
- समाप्त
- अभियांत्रिकी
- सुनिश्चित
- प्रकरण
- विशेष रूप से
- आवश्यक
- और भी
- विकसित करना
- उद्विकासी
- ठीक ठीक
- उदाहरण
- उत्तेजित
- उत्तेजक
- मौजूदा
- अनुभव
- अनुभव
- व्यक्त
- का विस्तार
- मार पिटाई
- खोज
- प्रथम
- ध्यान केंद्रित
- भोजन
- के लिए
- अक्सर
- से
- खेल
- Games
- उत्पन्न
- मिल
- लड़की
- देना
- ग्लोब
- लक्ष्य
- विकास
- संभालना
- है
- होने
- अध्यक्षता
- मदद
- मदद
- मदद करता है
- कैसे
- HTTPS
- संकर
- i
- में सुधार
- सुधार
- में सुधार लाने
- in
- निगमित
- शामिल
- बढ़ना
- अनुक्रमित
- सूचित करना
- नवोन्मेष
- अभिनव
- अंदर
- बजाय
- इरादा
- अंतरराष्ट्रीय स्तर पर
- IT
- आइटम
- आईटी इस
- जापान
- जापानी
- छलांग
- केवल
- रखना
- कुंजी
- रंग
- भाषा
- भाषाऐं
- बड़ा
- जानें
- सीखा
- नेतृत्व
- लीवरेज
- पसंद
- पंक्तियां
- लंबा
- लंबे समय तक
- देख
- लॉट
- मोहब्बत
- मशीन
- बनाया गया
- जादू
- प्रमुख
- बनाता है
- प्रबंधक
- बहुत
- बाजार
- मैच
- मिलान
- मई..
- me
- अर्थ
- साधन
- मेटाडाटा
- लाखों
- मन
- कम से कम
- ML
- एमएल तकनीक
- आदर्श
- मॉडल
- मुद्रीकरण
- अधिक
- अधिकांश
- विभिन्न
- my
- आवश्यकता
- नहीं
- of
- अक्सर
- on
- ONE
- केवल
- or
- मूल
- अन्य
- हमारी
- अपना
- भागों
- पैटर्न उपयोग करें
- स्टाफ़
- पूरी तरह से
- मंच
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- खेला
- खेल
- निभाता
- प्लग
- पॉडकास्ट
- लोकप्रिय
- संभव
- प्रस्तुत
- मुसीबत
- एस्ट्रो मॉल
- रखना
- प्रश्नों
- जल्दी से
- बिल्कुल
- रेसिंग
- रैंक
- महसूस करना
- वास्तव में
- कारण
- हाल ही में
- रिश्ते
- प्रासंगिक
- याद
- परिणाम
- प्रतिधारण
- वापसी
- धनी
- Roblox
- वही
- परिदृश्य
- Search
- खोजें
- वरिष्ठ
- कई
- साझा
- चाहिए
- दिखाना
- दिखा
- संकेत
- So
- केवल
- हल
- सुलझाने
- कुछ
- कोई
- कुछ
- कभी कभी
- स्रोत
- विशिष्ट
- वर्तनी
- धुआँरा
- राज्य के-the-कला
- कदम
- स्ट्रेटेजी
- छात्र
- ऐसा
- पर्याप्त
- सुझाव
- समर्थन
- निश्चित
- सतह
- प्रणाली
- सिस्टम
- लेना
- लेता है
- ले जा
- बाते
- शिक्षक
- टीम
- तकनीक
- तकनीकी
- तकनीक
- तकनीक
- टेक्नोलॉजी
- कहना
- है
- टेक्स्ट
- कि
- RSI
- दुनिया
- लेकिन हाल ही
- उन
- फिर
- वहाँ।
- इन
- वे
- चीज़ें
- इसका
- उन
- हालांकि?
- यहाँ
- पहर
- शीर्षक
- सेवा मेरे
- प्रशिक्षण
- ट्रान्सफ़ॉर्मर
- का अंग्रेज़ी संस्करण
- ट्रस्ट
- सच
- मोड़
- टाइप
- प्रकार
- समझना
- समझ
- समझता है
- अद्वितीय
- us
- उपयोग
- प्रयुक्त
- उपयोगकर्ता
- उपयोगकर्ताओं
- का उपयोग
- उपयोग
- मूल्य
- विविधता
- कार्यक्षेत्र
- बहुत
- देखें
- करना चाहते हैं
- था
- we
- कुंआ
- क्या
- एचएमबी क्या है?
- कब
- कौन कौन से
- क्यों
- विकिपीडिया
- साथ में
- अंदर
- काम
- काम कर रहे
- विश्व
- वर्ष
- इसलिए आप
- आपका
- जेफिरनेट