מהפכה ביצירה ב-Roblox עם AI Generative - Roblox Blog

מהפכה ביצירה ב-Roblox עם AI Generative - Roblox Blog

צומת המקור: 2874293

מוקדם יותר השנה, חלקנו את שלנו חזון לבינה מלאכותית גנרטיבית (AI) ב-Roblox והכלים החדשים האינטואיטיביים שיאפשרו לכל משתמש להפוך ליוצר. מכיוון שהכלים הללו מתפתחים במהירות ברחבי התעשייה, רציתי לספק כמה עדכונים על ההתקדמות שעשינו, הדרך שעדיין לפניה לדמוקרטיזציה של יצירת בינה מלאכותית גנרית, ולמה אנחנו חושבים שבינה מלאכותית גנרית היא מרכיב קריטי לאן רובלוקס הולך. 

התקדמות ב-AI גנרטיבי ומודלים של שפות גדולות (LLMs) מציגות הזדמנות מדהימה לפתוח את העתיד של חוויות סוחפות על ידי יצירת יצירה קלה ומהירה יותר תוך שמירה על בטיחות וללא צורך במשאבי מחשוב מסיביים. יתרה מכך, התקדמות במודלים של AI שהם מולטי-מודאליים, כלומר הם מאומנים עם סוגים רבים של תוכן - כגון תמונות, קוד, טקסט, מודלים תלת-ממדיים ואודיו - פותחות את הדלת להתקדמות חדשה בכלי יצירה. אותם מודלים מתחילים לייצר גם פלטים מולטי-מודאליים, כמו מודל שיכול ליצור פלט טקסט, כמו גם כמה ויזואליים המשלימים את הטקסט. אנו רואים בפריצות הדרך של AI אלה הזדמנות עצומה להגדיל בו זמנית את היעילות עבור יוצרים מנוסים יותר ולאפשר אפילו ליותר אנשים להביא רעיונות נהדרים לחיים ב-Roblox. אצל השנה Roblox Developers Conference (RDC), הכרזנו על מספר כלים חדשים שיביאו AI גנרטיבי לתוך Roblox Studio ומעבר לכך כדי לעזור לכל מי שנמצא בקנה מידה של Roblox להגדיל מהר יותר, לחזור על המידה מהר יותר ולהגביר את כישוריו כדי ליצור תוכן טוב עוד יותר. 

עוזר רובלוקס

רובלוקס תמיד סיפקה ליוצרים את הכלים, שירותינו, ו תמיכה הם צריכים לבנות חוויות תלת מימד סוחפות. יחד עם זאת, ראינו את היוצרים שלנו מתחילים להשתמש בבינה מלאכותית של צד שלישי ושיחות כדי לעזור להם ליצור. למרות שהם שימושיים כדי לעזור להפחית את עומס העבודה של היוצר, גרסאות מדף אלה לא תוכננו עבור זרימות עבודה של Roblox מקצה לקצה או אומנו על קוד Roblox, סלנג ושפה. המשמעות היא שיוצרים עומדים בפני עבודה נוספת משמעותית כדי להשתמש בגרסאות אלה כדי ליצור תוכן עבור Roblox. עבדנו על דרכים להביא את הערך של הכלים האלה לתוך Roblox Studio, וב-RDC חלקנו דוגמה מוקדמת של Assistant.

Assistant היא הבינה המלאכותית שלנו לשיחות שמאפשרת ליוצרים בכל רמות המיומנות להשקיע פחות זמן משמעותית במשימות החוזרות ונשנות הכרוכות ביצירה ויותר זמן בפעילויות בעלות ערך גבוה, כמו נרטיב, משחק ועיצוב חוויה. רובלוקס ממוקמת באופן ייחודי לבנות את מודל הבינה המלאכותית השיחתית הזה עבור עולמות תלת מימד סוחפים, הודות לגישה שלנו לקבוצה גדולה של מודלים תלת מימדיים ציבוריים להתאמן עליהם, היכולת שלנו לשלב מודל עם ממשקי ה-API של הפלטפורמה שלנו, והחבילה ההולכת וגדלה של פתרונות AI חדשניים. . יוצרים יוכלו להשתמש בהודעות טקסט בשפה טבעית כדי ליצור סצנות, לערוך מודלים תלת מימדיים ולהחיל התנהגויות אינטראקטיביות על אובייקטים. Assistant יתמוך בשלושת שלבי היצירה: למידה, קידוד ובנייה:

  • לְמִידָה: בין אם יוצר חדש לגמרי בפיתוח על Roblox או ותיק ותיק, Roblox Assistant יעזור לענות על שאלות על פני מגוון רחב של משטחים באמצעות שפה טבעית. 
  • קידוד: Assistant ירחיב את המידע האחרון שלנו Code Assist כְּלִי. לדוגמה, מפתחים יכולים לבקש מ-Assistant לשפר את הקוד שלהם, להסביר קטע קוד או לעזור בניפוי באגים ולהציע תיקונים לקוד שאינו פועל כראוי.
  • בניין: Assistant יעזור ליוצרים במהירות אבטיפוס של רעיונות חדשים. לדוגמה, יוצר חדש יכול ליצור סצנות שלמות ולנסות גרסאות שונות פשוט על ידי הקלדת הנחיה כמו "הוסף כמה פנסי רחוב לאורך הכביש הזה" או "צור יער עם סוגים שונים של עצים. עכשיו הוסף כמה שיחים ופרחים."

העבודה עם Assistant תהיה שיתופית, אינטראקטיבית ואיטרטיבית, מה שיאפשר ליוצרים לספק משוב ולאפשר ל-Assistant לעבוד כדי לספק את הפתרון הנכון. זה יהיה כמו שיש לך יוצר מומחה כשותף שאתה יכול להקפיץ ממנו רעיונות ולנסות רעיונות עד שתצליח.

frameborder=”0″ allow=”accelerometer; הפעלה אוטומטית; לוח-כתיבה; מדיה מוצפנת; ג'ִירוֹסקוֹפּ; תמונה בתמונה; שיתוף אינטרנט" allowfullscreen>

כדי להפוך את Assistant לשותף הטוב ביותר שיכול להיות, פרסמנו הודעה נוספת ב-RDC: הזמנו מפתחים לעשות זאת לבחור ב לתרום את נתוני התסריט האנונימיים של Luau שלהם. נתוני הסקריפט האלה יעזרו להפוך את כלי הבינה המלאכותית שלנו, כמו Code Assist ו-Assistant, לטובים משמעותית בהצעת ויצירת קוד יעיל יותר, תוך מתן חזרה למפתחי Roblox שמשתמשים בהם. יתרה מכך, אם מפתחים יבחרו לשתף מעבר ל-Roblox, נתוני הסקריפט שלהם יתווספו למערך נתונים שזמינים לצדדים שלישיים כדי להכשיר את כלי הצ'אט של AI שלהם להיות טובים יותר בהצעת קוד Luau, ויחזירו למפתחי Luau בכל מקום.

כדי להיות ברור, באמצעות מחקר מקיף של משתמשים ושיחות שקופות עם מפתחים מובילים, תכננו את זה כדי להצטרף ויעזור להבטיח שכל המשתתפים יבינו והסכימו למה שהתוכנית כוללת. כתודה לאלה שבוחרים להשתתף בשיתוף נתוני סקריפט עם Roblox, נעניק גישה לגרסאות החזקות יותר של Assistant ו-Code Assist המופעלות על ידי מודל זה שהוכשר לקהילה. מי שלא הצטרף ימשיך לקבל גישה לגרסה הקיימת שלנו של Assistant ו-Code Assist.

יצירת אווטאר קלה יותר 

בסופו של דבר, אנחנו רוצים שלכל אחד מ-65.5 מיליון המשתמשים היומיים שלנו יהיה אווטאר שמייצג אותם באמת ומבטא את מי שהם. לאחרונה שחררנו את היכולת לחברי תוכנית UGC שלנו לעשות זאת ליצור ולמכור גם גופי אווטאר וגם ראשים עצמאיים. כיום, תהליך זה דורש גישה ל-Studio או לתוכנית ה-UGC שלנו, רמת מיומנות גבוהה למדי, ומספר ימים של עבודה כדי לאפשר הבעת פנים, תנועת גוף, חיפוי תלת מימד וכו'. תאריך, הגביל את מספר האפשרויות הזמינות. אנחנו רוצים ללכת אפילו רחוק יותר.

כדי לאפשר לכל אחד ב-Roblox לקבל אווטאר מותאם אישית ואקספרסיבי, עלינו להפוך אווטרים לקלים מאוד להפקה ולהתאים אישית. ב-RDC הכרזנו על כלי חדש שאנו משחררים ב-2024 שיאפשר יצירה קלה של אווטאר מותאם אישית מתמונה או ממספר תמונות. עם הכלי הזה, כל יוצר עם גישה ל-Studio או לתוכנית UGC שלנו יוכל להעלות תמונה, ליצור עבורו אווטאר ולאחר מכן לשנות אותו כרצונו. לטווח ארוך יותר, אנו מתכוונים גם להפוך את זה זמין ישירות בתוך חוויות ב-Roblox.

כדי לאפשר זאת, אנו מאמנים מודלים של AI על סכימת האווטאר של Roblox ומערכת מודלים תלת-ממדיים בבעלות רובלוקס. גישה אחת ממנפת מחקר ליצירת אווטרים מסוגננים בתלת-ממד מתמונות דו-ממדיות. אנו בוחנים גם שימוש במודלים של דיפוזיה של טקסט לתמונה שהוכשרו מראש כדי להגדיל נתוני אימון תלת-ממד מוגבלים עם טכניקות יצירת דו-ממדיות, ושימוש ברשת ייצור תלת-ממדית מבוססת רשת יריביים (GAN) לצורך אימון. לבסוף, אנו עובדים על השימוש ControlNet לשכב בתנוחות מוגדרות מראש כדי להנחות את התמונות המתקבלות מרובות תצוגה של האווטרים. 

תהליך זה מייצר רשת תלת מימדית עבור האווטאר. לאחר מכן, אנו ממנפים תלת מימד מחקר פילוח סמנטי, מאומן על תנוחות אווטאר תלת-ממדיות, לקחת את הרשת התלת-ממדית הזו ולהתאים אותה כדי להוסיף תווי פנים מתאימות, כלוב, חיפוי ומרקמים, בעצם, מה שהופך את הרשת התלת-ממדית הסטטית לאוואטר של רובלוקס. לבסוף, כלי לעריכת רשת מאפשר למשתמשים לשנות ולהתאים את המודל כדי לגרום לו להיראות יותר כמו הגרסה שהם מדמיינים. וכל זה קורה מהר - תוך דקות - יוצר אווטאר חדש שניתן לייבא לתוך רובלוקס ולהשתמש בו בחוויה.

frameborder=”0″ allow=”accelerometer; הפעלה אוטומטית; לוח-כתיבה; מדיה מוצפנת; ג'ִירוֹסקוֹפּ; תמונה בתמונה; שיתוף אינטרנט" allowfullscreen>

מנחה תקשורת קולית

בינה מלאכותית עבורנו היא לא רק יצירה, היא גם מערכת הרבה יותר יעילה להבטחת קהילה מגוונת, בטוחה ואזרחית, בקנה מידה. כאשר אנו מתחילים להשיק תכונות קוליות חדשות, כולל צ'אט קולי ו-Roblox Connect, השיחות החדשות כתכונת האווטאר שלך וממשקי API שהוכרזו ב-RDC, אנו עומדים בפני אתגר חדש - ניהול שפת דיבור בזמן אמת. התקן הנוכחי בתעשייה עבור זה הוא תהליך המכונה זיהוי דיבור אוטומטי (ASR), אשר בעצם לוקח קובץ אודיו, מתמלל אותו כדי להמיר אותו לטקסט, ואז מנתח את הטקסט כדי לחפש שפה לא הולמת, מילות מפתח וכו'. 

זה עובד היטב עבור חברות המשתמשות בו בקנה מידה קטן יותר, אבל כשבדקנו את השימוש באותו תהליך ASR למתן תקשורת קולית, הבנו מהר מאוד שזה קשה ולא יעיל בקנה מידה שלנו. גישה זו גם מאבדת מידע בעל ערך להפליא שמקודד בעוצמת הקול ובטון הדיבור של הדובר, כמו גם בהקשר הרחב יותר של השיחה. מתוך מיליוני דקות השיחה שנצטרך לתמלל כל יום, בשפות שונות, רק אחוז קטן מאוד יישמע אולי כמו משהו לא הולם. וככל שנמשיך להגדיל את קנה המידה, המערכת הזו תדרוש יותר ויותר כוח מחשוב כדי לעמוד בקצב. אז בדקנו מקרוב כיצד נוכל לעשות זאת בצורה יעילה יותר, על ידי בניית צינור העובר ישירות מהשמע החי לתיוג תוכן כדי לציין אם הוא מפר את המדיניות שלנו או לא.

בסופו של דבר, הצלחנו לבנות מערכת זיהוי קול מותאמת אישית על ידי שימוש ב-ASR כדי לסווג את מערכי הנתונים הקוליים שלנו, ולאחר מכן להשתמש בנתונים הקוליים המסווגים האלה כדי לאמן את המערכת. ליתר דיוק, כדי להכשיר את המערכת החדשה הזו, אנו מתחילים עם אודיו ויוצרים תמליל. לאחר מכן אנו מריצים את התמליל דרך מערכת סינון הטקסט של Roblox כדי לסווג את האודיו. מערכת סינון טקסט זו מצוינת בזיהוי שפה מפרה מדיניות ב-Roblox, מאחר שביצענו אופטימיזציה של אותה מערכת סינון במשך שנים בסלנג, קיצורים ובלינגו ספציפיים ל-Roblox. בתום שכבות ההדרכה הללו, יש לנו מודל שמסוגל לזהות הפרות מדיניות ישירות מאודיו בזמן אמת.

למרות שלמערכת זו יש את היכולת לזהות מילות מפתח ספציפיות כגון ניבול פה, הפרות מדיניות הן רק לעתים רחוקות רק מילה אחת. מילה אחת יכולה להיראות לעתים קרובות בעייתית בהקשר אחד ובדיוק בסדר בהקשר אחר. בעיקרו של דבר, הפרות מסוג זה כרוכות במה שאתה אומר, איך אתה אומר זאת ובהקשר שבו ההצהרות נאמרות.

כדי להשתפר בהבנת הקשר, אנו ממנפים את הכוח המקורי של ארכיטקטורה מבוססת שנאים, שהיא טובה מאוד בסיכום רצפים. זה יכול לקחת רצף של נתונים, כמו זרם שמע, ולסכם אותו עבורך. ארכיטקטורה זו מאפשרת לנו לשמור על רצף שמע ארוך יותר כך שנוכל לזהות לא רק מילים אלא גם הקשר ואינטונציות. ברגע שכל המרכיבים הללו מתאחדים, יש לנו מערכת סופית שבה הקלט הוא אודיו והפלט הוא סיווג - מפרה מדיניות או לא. מערכת זו יכולה לזהות מילות מפתח וביטויים המפרים מדיניות, אך גם טון, רגשות והקשר אחר שחשוב כדי לקבוע את הכוונה. המערכת החדשה הזו, שמזהה דיבור מפר מדיניות ישירות מאודיו, יעילה יותר במחשוב ממערכת ASR מסורתית, מה שתקל בהרבה על קנה המידה ככל שאנו ממשיכים לדמיין מחדש כיצד אנשים מתאחדים.

היינו צריכים גם דרך חדשה להזהיר את מי שנמצאים בכלי התקשורת הקולית שלנו מההשלכות הפוטנציאליות של שפה מסוג זה. עם מערכת זיהוי חדשנית זו שעומדת לרשותנו, אנו מתנסים כעת בדרכים להשפיע על התנהגות מקוונת כדי לשמור על סביבה בטוחה. אנו יודעים שאנשים מפרים לפעמים את המדיניות שלנו שלא במתכוון ואנו רוצים להבין אם תזכורת מדי פעם עשויה לסייע במניעת עבירות נוספות. כדי לעזור בכך, אנו מתנסים במשוב משתמשים בזמן אמת באמצעות התראות. אם המערכת תזהה שאמרת משהו שמפר את המדיניות שלנו מספר פעמים, נציג הודעה קופצת על המסך המודיעה לך שהשפה שלך מפרה את המדיניות שלנו ומפנה אותך למדיניות שלנו לקבלת מידע נוסף.

עם זאת, הודעות זרימת קול הן רק מרכיב אחד של מערכת הניהול. אנחנו גם בוחנים דפוסי התנהגות בפלטפורמה, כמו גם תלונות של אחרים ב-Roblox, כדי להניע את החלטות המתינות הכוללות שלנו. צבירת האותות הללו עלולה לגרום להשלכות חזקות יותר, כולל ביטול גישה לתכונות אודיו, או בגין הפרות חמורות יותר, איסור מוחלט מהפלטפורמה. שמירה על בטוחה ואזרחית של הקהילה שלנו היא קריטית שכן ההתקדמות הללו במודלים של AI רב-מודאלי, בינה מלאכותית ו-LLM מתאחדות כדי לאפשר כלים ויכולות חדשות מדהימות ליוצרים. 

אנו מאמינים כי מתן הכלים הללו ליוצרים גם יוריד את מחסום הכניסה ליוצרים פחות מנוסים וגם ישחרר יוצרים מנוסים יותר מהמשימות היותר מייגעות של התהליך הזה. זה יאפשר להם להשקיע יותר זמן בהיבטים ההמצאתיים של כוונון עדין ורעיונות. המטרה שלנו עם כל זה היא לאפשר לכולם, בכל מקום, להביא את הרעיונות שלהם לחיים ולהגדיל באופן ניכר את מגוון האווטרים, הפריטים והחוויות הזמינים ב-Roblox. אנחנו גם שיתוף מידע וכלים כדי לסייע בהגנה על יצירות חדשות

אנחנו כבר מדמיינים אפשרויות מדהימות: נניח שמישהו מסוגל ליצור דופלגנגר אווטאר ישירות מתמונה, ואז הוא יוכל להתאים אישית את הדמות שלו כדי להגדיל אותו או לעבד אותו בסגנון אנימה. או שהם יכולים לבנות חוויה על ידי בקשת Assistant להוסיף מכוניות, בניינים ונוף, להגדיר תנאי תאורה או רוח, או לשנות את השטח. משם, הם יכלו לחזור ולחדד דברים רק על ידי הקלדה קדימה ואחורה עם Assistant. אנחנו יודעים שהמציאות של מה שאנשים יוצרים עם הכלים האלה, כשהם הופכים לזמינים, תהיה הרבה מעבר למה שאנחנו יכולים אפילו לדמיין.

בול זמן:

עוד מ רובלוקס