Inside the Tech היא סדרת בלוגים שמלווה את שלנו פודקאסט Tech Talks. בפרק 19 של הפודקאסט, ברמה בינלאומית, מנכ"ל Roblox, David Baszucki, שוחח עם מנהל המוצר הבכיר Zhen Fang על האסטרטגיה הבינלאומית של Roblox, ועל האתגרים הטכניים שאנו פותרים כדי להבטיח חוויה מקומית לעשרות מיליוני אנשים ברחבי העולם. במהדורה זו של Inside the Tech, שוחחנו עם מנהל ההנדסה רבאלי קנדור כדי ללמוד עוד על אחד מאותם אתגרים טכניים, חיפוש רב לשוני וסמנטי, וכיצד עבודת צוות הצמיחה עוזרת למשתמשי רובלוקס ברחבי העולם לחפש - ולמצוא במהירות - כל מה שהם רוצים בפלטפורמה שלנו.
מהו האתגר הטכני הגדול ביותר שהצוות שלך לוקח על עצמו?
עד לפני כשנה, חיפוש Roblox השתמש במערכת מילונית כדי להתאים תוצאות לחיפושים של משתמשים, כלומר התמקד אך ורק בהתאמת טקסט. אבל התנהגויות החיפוש משתנות במהירות והגישה הזו כבר לא מספיקה כדי לתת למשתמשים תוכן רלוונטי. יחד עם זאת, חלק ממשתמשי Roblox עשויים להשתמש באיות שגוי בשאילתותיהם. לכן, עלינו להיות מסוגלים להציע תוצאות שתואמות למה שהם מחפשים, כלומר להבין את כוונתן.
בעיה מרכזית נוספת בחיפוש היא מחסור בנתוני אימון בשפות שונות. לפני החיפוש הסמנטי, הצעד הראשון שלנו היה למנף תרגומי מכונה בתוך מערכת רובלוקס. אינדקסנו את התרגומים ואז עשינו התאמה של טקסט. אבל זה לא מספיק כדי להציג תמיד תוכן רלוונטי למשתמשים. לכן, אימצנו טכניקת ML מתקדמת יותר הנקראת מודל תלמיד-מורה: המורה לומד ממקור ההקשר הגדול ביותר שלנו עבור כל תרחיש ספציפי.
אנגלית היא השפה הנפוצה ביותר ב-Roblox, וזו הסיבה שאנו לומדים כמה שיותר קשרים סמנטיים באנגלית - מודל המורה - ואז אנו מזקקים אותה למודל התלמיד על ידי הרחבת זה לשפות אחרות. זה עוזר לנו לפתור את הבעיה למרות שאין לנו הרבה נתונים בשפות מסוימות. זה הוביל לעלייה של 15% בהצגות שמקורן בחיפוש ביפן.
לאחרונה עבדנו כדי לתמוך טוב יותר בשאילתות הקטלוג כמו "đua xe (מירוץ)." אבל משתמשים מגישים בתדירות גבוהה יותר שאילתות ארוכות, בצורה חופשית, כמו, "היי, אני זוכר ששיחקתי משחק שבו היה דרקון ובחורה שנלחמו איתו. אתה יכול לעזור לי למצוא את זה?" זה מציג אתגרים טכניים יותר ואנחנו ממשיכים לשפר את המערכות שלנו בכיוון זה.
מהן כמה מהגישות החדשניות לשילוב יותר הקשר וחיפוש סמנטי יותר?
בנינו מערכת חיפוש היברידית שלוקחת חיפוש מילוני ומשלבת אותו עם טכניקות ומודלים של ML תוך שימוש בחיפוש סמנטי והבנת כוונת השאילתה. אנו מפתחים ללא הרף את המערכות שלנו כדי לבנות הבנת הקשר, לטפל בשאילתות מורכבות ולהחזיר תוכן רלוונטי.
הקסם של החיפוש הסמנטי הוא בהטמעות, שהן ייצוגים עשירים של מגוון אותות שאנו מקבלים מכל רחבי רובלוקס. לדוגמה, אנו משלבים אותות כמו נתונים דמוגרפיים של משתמשים, שאילתה של משתמש, משך הזמן או מה ההיבטים הייחודיים שלה.
אנחנו גם בוחנים אותות תוכן, כמו חוויות, פריטי אווטאר ומעורבות - באיזו תדירות שיחקו במשחק הזה או כמה משתמשים היו לו, ומכמה מדינות? יש גם דברים כמו מונטיזציה ושימור, כמו גם מטא נתונים כמו כותרת, תיאור או יוצר של חוויה. אנחנו מעבירים את כל אלה דרך ארכיטקטורה מבוססת BERT, מבוססת שנאים ואנחנו משתמשים ב- פרספטרון רב-שכבתי בסוף ליצור הטבעות, שהופכות למקור האמת שלנו.
חידוש נוסף הוא מערכת חיפוש הדמיון הפנימית שלנו. כאשר מישהו מבצע שאילתת חיפוש, אנו מאחזרים את ההטמעות הקשורות, ומדרגים אותן כדי לוודא שהן רלוונטיות למה שהמשתמש מחפש. ואז נחזיר את התוצאות למשתמשים.
מהם כמה מהדברים המרכזיים שלמדת מביצוע העבודה הטכנית הזו?
כל שפה מציגה אתגר ייחודי משלה. ובמיוחד בחיפוש, עלינו להבין מה מחפשים משתמשים במקומות שונים בעולם כדי שנוכל להראות להם את התוצאות הרלוונטיות ביותר. עלינו להבין מרכיבי שפה שונים. לדוגמה, שנאים מאומנים מראש היו חיוניים להבנת הניבים המרובים של היפנית.
שנית, דפוסי שאילתות החיפוש השתנו לא מעט ועלינו לפתח ללא הרף את ערימת הטכנולוגיה שלנו כדי לעמוד בקצב. יחד עם זאת, עלינו ליידע את המשתמשים שלנו על מה שאפשר בפלטפורמה שלנו, מכיוון שהם עלולים לא להבין זאת. לדוגמה, נוכל לומר למשתמשים שלנו שחיפוש יכול לתמוך בדברים כמו שאילתות בסגנון חופשי (כגון משחקי מרוצים או משחקי אוכל פופולריים) ושהוא מבין מה אנשים מחפשים ויכול להחזיר תוצאות מתאימות.
לאיזה ערך רובלוקס הצוות שלך הכי מיישר קו?
ראייה ארוכת טווח היא הליבה של הצוות שלנו וזו אחת הסיבות לכך שאני אוהב לעבוד ב-Roblox.
דוגמה אחת מהצוות שלי היא מחסנית הטכנולוגיה שלנו, המורכבת ממערכות החיפוש שלנו מבוססות ML ו-NLP - חיפוש סמנטי, השלמה אוטומטית ותיקון איות באמצעות מודלים גדולים מאומנים מראש.
בנינו זאת מתוך מחשבה על שימוש חוזר בסוגים שונים של חיפושים שבוצעו על ידי עשרות מיליוני המשתמשים הפעילים שלנו מדי יום. זה אומר שאנחנו יכולים לחבר סוג אחר של נתונים (לדוגמה, פריטי אווטאר במקום חוויות), וזה אמור לעבוד עם שינויים מינימליים מאוד.
שילבנו חיפוש סמנטי אחר חוויות, וחלקנו אותו עם אנכיים אחרים כמו Marketplace, והם הצליחו פשוט לקפוץ על הארכיטקטורה הקיימת. זה לא חיבור מושלם, אבל עם קצת כוונון עדין, אנחנו יכולים להתאים אותו למקרי שימוש שונים.
מה הכי מרגש אותך לאן מועדות פניהם של רובלוקס והצוות שלך?
החיפוש הוא המשטח היחיד שבו משתמשים מביעים את כוונתם המפורשת. וזה אומר שחיוני שנבין מה הם רוצים וניתן להם את התוצאות הרלוונטיות ביותר. אז זה באמת מרגש אותי לעבוד על הבנת הכוונה הזו וחינוך המשתמשים שלנו לגבי מה שאפשר, לפעמים אפילו לפני שהמשתמש מבין זאת.
משתמש בכל מדינה יכול לשאול משהו ואנחנו יכולים לתת לו בדיוק את מה שהוא רוצה וזה הכי רלוונטי עבורו. זה בונה אמון אשר בתורו משפר את השמירה. זה מרגש אותי לקחת על עצמי את האתגר של שיפור החיפוש כדי לבנות את האמון הזה ולעזור ל-Roblox להשיג את המטרה שלנו של מיליארד משתמשים.
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- PlatoData.Network Vertical Generative Ai. העצים את עצמך. גישה כאן.
- PlatoAiStream. Web3 Intelligence. הידע מוגבר. גישה כאן.
- PlatoESG. פחמן, קלינטק, אנרגיה, סביבה, שמש, ניהול פסולת. גישה כאן.
- PlatoHealth. מודיעין ביוטכנולוגיה וניסויים קליניים. גישה כאן.
- מקור: https://blog.roblox.com/2023/11/inside-the-tech-solving-for-multilingual-semantic-search/
- :יש ל
- :הוא
- :לֹא
- :איפה
- $ למעלה
- 15%
- 19
- a
- יכול
- אודות
- להשיג
- לרוחב
- פעיל
- להסתגל
- מאומץ
- לִפנֵי
- ליישר
- תעשיות
- לאורך
- גם
- תמיד
- an
- ו
- כל
- גישה
- גישות
- מתאים
- ארכיטקטורה
- ARE
- סביב
- AS
- לשאול
- היבטים
- At
- השלמה אוטומטית
- גִלגוּל
- BE
- להיות
- היה
- לפני
- מוטב
- הגדול ביותר
- B
- קצת
- בלוג
- לִבנוֹת
- בונה
- נבנה
- אבל
- by
- נקרא
- CAN
- מקרים
- קטלוג
- מנכ"ל
- מסוים
- לאתגר
- האתגרים
- שינויים
- משתנה
- משלב
- מורכב
- מורכב
- תוכן
- הקשר
- ממשיך
- ברציפות
- ליבה
- יכול
- מדינות
- מדינה
- יוצר
- יומי
- נתונים
- דוד
- דמוגרפיה
- תיאור
- DID
- אחר
- מְנַהֵל
- עושה
- עושה
- לא
- דְרָקוֹן
- מהדורה
- לחנך
- אלמנטים
- סוף
- הנדסה
- לְהַבטִיחַ
- אפיזודה
- במיוחד
- חיוני
- אֲפִילוּ
- להתפתח
- מתפתח
- בדיוק
- דוגמה
- מתרגש
- מרגש
- קיימים
- ניסיון
- חוויות
- אקספרס
- מאריך
- לְחִימָה
- ראשון
- מרוכז
- מזון
- בעד
- בתדירות גבוהה
- החל מ-
- מִשְׂחָק
- משחקים
- ליצור
- לקבל
- ילדה
- לתת
- כדור הארץ
- מטרה
- צמיחה
- לטפל
- יש
- יש
- בראשותו
- לעזור
- עזרה
- עוזר
- איך
- HTTPS
- היברידי
- i
- לשפר
- משפר
- שיפור
- in
- התאגדה
- שילוב
- להגדיל
- -
- לְהוֹדִיעַ
- חדשנות
- חדשני
- בתוך
- במקום
- כוונה
- ברמה בינלאומית
- IT
- פריטים
- שֶׁלָה
- יפן
- יפני
- לקפוץ
- רק
- שמור
- מפתח
- חוסר
- שפה
- שפות
- גָדוֹל
- לִלמוֹד
- למד
- הוביל
- תנופה
- כמו
- קווים
- ארוך
- עוד
- הסתכלות
- מגרש
- אהבה
- מכונה
- עשוי
- קסם
- גדול
- עושה
- מנהל
- רב
- שוק
- להתאים
- תואם
- מאי..
- me
- משמעות
- אומר
- מידע נוסף
- מיליונים
- אכפת לי
- מינימלי
- ML
- טכניקות ML
- מודל
- מודלים
- מונטיזציה
- יותר
- רוב
- מספר
- my
- צורך
- לא
- of
- לעתים קרובות
- on
- ONE
- רק
- or
- מקורו
- אחר
- שלנו
- שֶׁלוֹ
- חלקים
- דפוסי
- אֲנָשִׁים
- בצורה מושלמת
- פלטפורמה
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- שיחק
- משחק
- משחק
- תקע
- פודקאסט
- פופולרי
- אפשרי
- מתנות
- בעיה
- המוצר
- גם
- שאילתות
- מהירות
- דַי
- מירוץ
- לדרג
- להבין
- בֶּאֱמֶת
- סיבות
- לאחרונה
- מערכות יחסים
- רלוונטי
- לזכור
- תוצאות
- שייר
- לַחֲזוֹר
- עשיר
- רובלוקס
- אותו
- תרחיש
- חיפוש
- חיפושים
- לחצני מצוקה לפנסיונרים
- סדרה
- משותף
- צריך
- לְהַצִיג
- הצגה
- אותות
- So
- אך ורק
- לפתור
- פותר
- כמה
- מישהו
- משהו
- לפעמים
- מָקוֹר
- ספציפי
- איות
- לערום
- מדינה-of-the-art
- שלב
- אִסטרָטֶגִיָה
- סטודנט
- כזה
- מספיק
- להציע
- תמיכה
- בטוח
- משטח
- מערכת
- מערכות
- לקחת
- לוקח
- נטילת
- שיחות
- מורה
- נבחרת
- טק
- טכני
- טכניקה
- טכניקות
- טכנולוגיה
- לספר
- עשרות
- טֶקסט
- זֶה
- השמיים
- העולם
- שֶׁלָהֶם
- אותם
- אז
- שם.
- אלה
- הֵם
- דברים
- זֶה
- אלה
- אם כי?
- דרך
- זמן
- כותרת
- ל
- הדרכה
- רוֹבּוֹטרִיקִים
- תרגומים
- סומך
- אמת
- תור
- סוג
- סוגים
- להבין
- הבנה
- מבין
- ייחודי
- us
- להשתמש
- מְשׁוּמָשׁ
- משתמש
- משתמשים
- באמצעות
- ניצול
- ערך
- מגוון
- אנכיות
- מאוד
- לצפיה
- רוצה
- היה
- we
- טוֹב
- מה
- מה
- מתי
- אשר
- למה
- ויקיפדיה
- עם
- בתוך
- תיק עבודות
- עובד
- עוֹלָם
- שנה
- אתה
- זפירנט