Revolutsiooniline loomine Robloxis generatiivse tehisintellektiga – Robloxi ajaveeb

Taasavaldanud Platon

järgijaid: 0

Selle aasta alguses jagasime oma nägemus Robloxi generatiivse tehisintellekti (AI) ja intuitiivsete uute tööriistade jaoks, mis võimaldavad igal kasutajal saada loojaks. Kuna need tööriistad arenevad kogu tööstuses kiiresti, tahtsin anda värskendusi meie tehtud edusammude kohta, tee kohta, mis on veel ees generatiivse tehisintellekti loomise demokratiseerimiseks, ja miks me arvame, et generatiivne AI on Robloxi suundumuste jaoks kriitiline element.

Generatiivsete tehisintellekti ja suurte keelemudelite (LLM) edusammud pakuvad uskumatut võimalust avada kaasahaarava kogemuse tulevik, võimaldades lihtsamat ja kiiremat loomist, säilitades samas turvalisuse ja ilma tohutuid arvutusressursse nõudmata. Lisaks avavad edusammud multimodaalsete tehisintellektimudelite osas, mis tähendab, et neid õpetatakse kasutama mitut tüüpi sisu (nt pildid, kood, tekst, 3D-mudelid ja heli), loomistööriistade uutele edusammudele. Need samad mudelid hakkavad tootma ka multimodaalseid väljundeid, näiteks mudeleid, mis võivad luua tekstiväljundi, ja mõningaid visuaale, mis teksti täiendavad. Näeme neid tehisintellekti läbimurdeid tohutu võimalusena suurendada kogenumate loojate tõhusust ja võimaldada veelgi rohkematel inimestel suurepäraseid ideid Robloxis ellu viia. Sellel aastal Roblox Developers Conference (RDC), teatasime mitmest uuest tööriistast, mis toovad Roblox Studiosse ja mujale generatiivse tehisintellekti, et aidata kõigil Robloxi mastaabis kiiremini, itereerida kiiremini ja täiendada nende oskusi veelgi parema sisu loomiseks.

Robloxi assistent

Roblox on alati loojatele tööriistu varustanud, teenusedja toetama nad peavad looma kaasahaarava 3D-kogemuse. Samal ajal oleme näinud, kuidas meie loojad on hakanud kasutama loomiseks kolmanda osapoole generatiivset ja vestluslikku AI-d. Kuigi need on kasulikud, et aidata vähendada looja töökoormust, ei olnud need valmisversioonid mõeldud Robloxi täielikuks töövoogudeks ega koolitatud Robloxi koodi, slängi ja lingo alal. See tähendab, et loojad seisavad silmitsi märkimisväärse lisatööga, et kasutada neid versioone Robloxi jaoks sisu loomiseks. Oleme töötanud selle kallal, kuidas tuua nende tööriistade väärtus Roblox Studiosse, ja RDC-s jagasime assistendi varajast näidet.

Assistent on meie vestluspõhine tehisintellekt, mis võimaldab kõikidel oskustasemetel loojatel kulutada oluliselt vähem aega igapäevastele, korduvatele loomisega seotud ülesannetele ja rohkem aega väärtuslikele tegevustele, nagu narratiiv, mängumäng ja kogemuste kujundamine. Tänu meie juurdepääsule suurele hulgale avalikele 3D-mudelitele, mille kallal treenida, meie võimele integreerida mudel meie platvormi API-dega ja meie kasvavale uuenduslike tehisintellekti lahenduste komplektile, on Robloxil ainulaadne positsioon selle vestluspõhise AI-mudeli loomiseks ümbritsevate 3D-maailmade jaoks. . Loojad saavad kasutada loomuliku keele tekstiviipasid, et luua stseene, redigeerida 3D-mudeleid ja rakendada objektidele interaktiivset käitumist. Assistent toetab kolme loomise etappi: õppimine, kodeerimine ja ehitamine:

Õppimine: Olenemata sellest, kas looja on Robloxis arenduses täiesti uus või kogenud veteran, aitab Roblox Assistant vastata küsimustele paljudel pindadel, kasutades loomulikku keelt.
Kodeerimine: Assistent laiendab meie hiljutisi Koodiabi tööriist. Näiteks võivad arendajad paluda assistendil oma koodi täiustada, koodiosa lahti seletada või aidata siluda ja soovitada parandusi koodile, mis korralikult ei tööta.
Hoone: Assistent aitab loojatel uusi ideid kiiresti prototüüpida. Näiteks võib uus looja luua terveid stseene ja proovida erinevaid versioone, sisestades lihtsalt viipa, nagu „Lisage sellele teele mõned tänavavalgustid” või „Tee eri tüüpi puudega mets. Nüüd lisage mõned põõsad ja lilled.

Assistendiga töötamine on koostööpõhine, interaktiivne ja iteratiivne, võimaldades sisuloojatel anda tagasisidet ja lasta assistendil õige lahenduse pakkumiseks töötada. See on nagu asjatundliku looja partner, kellelt saate ideid põrgatada ja ideid proovida, kuni saate need õigeks.

frameborder=”0″ enable=”kiirendusmõõtur; Autoplay; lõikelaud-kirjutamine; krüpteeritud meedia; güroskoop; pilt-pildis; veebijagamine” enablefullscreen>

Assistendi parimaks partneriks muutmiseks tegime RDC-s veel ühe teadaande: kutsusime arendajaid valima oma anonüümseks muudetud Luau skriptiandmete lisamiseks. Need skriptiandmed aitavad muuta meie tehisintellekti tööriistad, nagu Code Assist ja Assistant, oluliselt paremini soovitada ja luua tõhusamat koodi, andes tagasi Robloxi arendajatele, kes neid kasutavad. Lisaks, kui arendajad otsustavad jagada Robloxist kaugemale, lisatakse nende skriptiandmed kolmandatele osapooltele kättesaadavaks tehtud andmekogumisse, et koolitada nende AI-vestlustööriistu Luau koodi paremaks soovitamiseks, mis annab Luau arendajatele kõikjal tagasi.

Selguse huvides võib öelda, et põhjaliku kasutajauuringu ja tipparendajatega peetud läbipaistvate vestluste kaudu oleme kavandanud selle nii, et see oleks lubatav ja aitame tagada, et kõik osalejad mõistavad programmi sisu ja nõustuvad sellega. Tänutäheks neile, kes otsustavad Robloxiga skriptiandmete jagamises osaleda, anname juurdepääsu Assistendi ja Code Assisti võimsamatele versioonidele, mida toetab see kogukonna koolitatud mudel. Need, kes pole seda lubanud, saavad jätkuvalt juurdepääsu meie olemasolevale Assistendi ja Code Assisti versioonile.

Lihtsam avatari loomine

Lõppkokkuvõttes tahame, et igal meie 65.5 miljonil igapäevasel kasutajal oleks avatar, mis neid tõeliselt esindab ja väljendab, kes nad on. Hiljuti avaldasime meie UGC programmi liikmetele võimaluse seda teha luua ja müüa nii avatari kehasid kui ka eraldiseisvaid päid. Tänapäeval nõuab see protsess juurdepääsu Studiole või meie UGC programmile, üsna kõrget oskuste taset ja mitmepäevast tööd, et võimaldada näoilmet, keha liikumist, 3D-taglastamist jne. See muudab avataride loomise aeganõudvaks ja nõuab kuupäev, piiratud arv saadaolevaid valikuid. Tahame minna veelgi kaugemale.

Et võimaldada kõigil Robloxi kasutajatel isikupärastatud ja väljendusrikas avatar, peame tegema avataride loomise ja kohandamise väga lihtsaks. RDC-s teatasime uuest tööriistast, mille anname välja 2024. aastal ja mis võimaldab hõlpsalt luua pildist või mitmest pildist kohandatud avatari. Selle tööriista abil saavad kõik Studiole või meie UGC-programmile juurdepääsu omavad loojad pildi üles laadida, lasta endale luua avatari ja seejärel seda vastavalt oma soovile muuta. Pikemas perspektiivis kavatseme teha selle kättesaadavaks ka otse Robloxi kogemuste raames.

Selle võimaldamiseks koolitame AI-mudeleid Robloxi avatari skeemi ja Robloxile kuuluvate 3D-avatarimudelite komplekti. Üks lähenemine võimendab teadustöö 3D-piltidest stiliseeritud 2D-avatarite loomiseks. Samuti uurime eelkoolitatud teksti-pildiks difusioonimudelite kasutamist, et täiendada piiratud 3D-treeningandmeid 2D generatiivsete tehnikatega, ning kasutada koolituseks generatiivse võistlejavõrgu (GAN) põhinevat 3D genereerimisvõrku. Lõpuks töötame selle kasutamise kallal ControlNet kihiti eelmääratletud poosides, et juhtida avataride mitmevaatelisi pilte.

See protsess loob avatari jaoks 3D-võrgu. Järgmisena võimendame 3D-d semantilise segmenteerimise uurimine3D-avataripoosides treenitud, et võtta see 3D-võrk ja kohandada seda sobivate näojoonte, puuri, taglase ja tekstuuride lisamiseks, muutes sisuliselt staatilise 3D-võrgu Robloxi avatariks. Lõpuks võimaldab võrgusilma redigeerimise tööriist kasutajatel mudelit muuta ja kohandada, et see näeks välja sarnasem versioon, mida nad ette kujutavad. Ja kõik see toimub kiiresti – mõne minutiga – luues uue avatari, mida saab Robloxi importida ja kogemuses kasutada.

frameborder=”0″ enable=”kiirendusmõõtur; Autoplay; lõikelaud-kirjutamine; krüpteeritud meedia; güroskoop; pilt-pildis; veebijagamine” enablefullscreen>

Häälside modereerimine

Meie jaoks ei tähenda tehisintellekt ainult loomist, see on ka palju tõhusam süsteem mitmekesise, turvalise ja kodanikuühiskonna mastaabis tagamiseks. Kui hakkame kasutusele võtma uusi häälfunktsioone, sealhulgas häälvestlust ja Roblox Connecti, mis on teie avatari funktsiooniks uus helistamine, ja RDC-s välja kuulutatud API-sid, seisame silmitsi uue väljakutsega – kõnekeele modereerimine reaalajas. Praegune tööstusstandard selle jaoks on protsess, mida nimetatakse automaatseks kõnetuvastuseks (ASR), mis sisuliselt võtab helifaili, transkribeerib selle tekstiks teisendamiseks, seejärel analüüsib teksti, et otsida sobimatut keelt, märksõnu jne.

See toimib hästi ettevõtetele, kes kasutavad seda väiksemas mahus, kuid kui uurisime sama ASR-protsessi kasutamist kõneside modereerimiseks, mõistsime kiiresti, et see on meie mastaabis keeruline ja ebatõhus. See lähenemine kaotab ka uskumatult väärtuslikku teavet, mis on kodeeritud kõneleja helitugevusse ja hääletooni, samuti vestluse laiemas kontekstis. Miljonitest vestlusminutitest, mida me peaksime iga päev erinevates keeltes transkribeerima, kõlaks vaid väga väike osa midagi sobimatut. Ja kui me jätkame skaleerimist, vajaks see süsteem sammu pidamiseks üha rohkem arvutusvõimsust. Seetõttu uurisime lähemalt, kuidas saaksime seda tõhusamalt teha, luues torujuhtme, mis läheb otse reaalajas helist sisu sildistamiseni, et näidata, kas see rikub meie eeskirju või mitte.

Lõppkokkuvõttes suutsime luua ettevõttesisese kohandatud hääletuvastussüsteemi, kasutades ASR-i, et klassifitseerida meie ettevõttesisesed kõneandmed, ja seejärel kasutada neid salastatud kõneandmeid süsteemi koolitamiseks. Täpsemalt, selle uue süsteemi koolitamiseks alustame heliga ja loome ärakirja. Seejärel käivitame heli klassifitseerimiseks ärakirja meie Robloxi tekstifiltrisüsteemi kaudu. See tekstifiltrisüsteem on suurepärane poliitikat rikkuva keele tuvastamiseks Robloxis, kuna oleme seda sama filtrisüsteemi aastaid optimeerinud Robloxi-spetsiifiliste slängi, lühendite ja keelepruugi jaoks. Nende koolituskihtide lõpus on meil mudel, mis suudab tuvastada eeskirjade rikkumisi otse helist reaalajas.

Kuigi see süsteem suudab tuvastada konkreetseid märksõnu, nagu roppused, on eeskirjade rikkumine harva vaid üks sõna. Üks sõna võib sageli tunduda probleemne ühes kontekstis ja lihtsalt hea teises kontekstis. Põhimõtteliselt hõlmavad seda tüüpi rikkumised seda, mida te ütlete, kuidas te seda ütlete ja konteksti, milles avaldused tehakse.

Konteksti paremaks mõistmiseks kasutame trafopõhise arhitektuuri loomulikku jõudu, mis on järjestuste kokkuvõtte tegemisel väga hea. See võib võtta andmejada, näiteks helivoo, ja teha selle teie jaoks kokkuvõtte. See arhitektuur võimaldab meil säilitada pikemat helijada, et saaksime tuvastada mitte ainult sõnu, vaid ka konteksti ja intonatsioone. Kui kõik need elemendid kokku saavad, on meil lõplik süsteem, kus sisendiks on heli ja väljundiks on klassifikatsioon – rikub eeskirju või mitte. See süsteem suudab tuvastada märksõnu ja eeskirju rikkuvaid fraase, aga ka tooni, meeleolu ja muud konteksti, mis on kavatsuse kindlakstegemiseks oluline. See uus süsteem, mis tuvastab eeskirju rikkuva kõne otse helist, on oluliselt tõhusam kui traditsiooniline ASR-süsteem, mis muudab selle skaleerimise palju lihtsamaks, kuna jätkame inimeste kokkutuleku ümberkujundamist.

Vajasime ka uut viisi, kuidas hoiatada meie kõnesidevahendite kasutajaid seda tüüpi keele võimalike tagajärgede eest. Selle uuendusliku tuvastamissüsteemiga, mis on meie käsutuses, katsetame nüüd viise, kuidas mõjutada võrgukäitumist turvalise keskkonna säilitamiseks. Teame, et inimesed rikuvad mõnikord meie eeskirju tahtmatult, ja tahame mõista, kas aeg-ajalt meeldetuletus võib aidata vältida edasisi rikkumisi. Selle abistamiseks katsetame kasutajate reaalajas tagasisidet märguannete kaudu. Kui süsteem tuvastab, et olete mitu korda öelnud midagi, mis rikub meie eeskirju, kuvame teie ekraanil hüpikteatise, mis teavitab teid, et teie keel rikub meie eeskirju, ja suuname teid lisateabe saamiseks meie eeskirjade juurde.

Häälvoo märguanded on siiski vaid üks modereerimissüsteemi element. Vaatame ka platvormi käitumismustreid ja teiste Robloxi kasutajate kaebusi, et juhtida meie üldiste modereerimisotsuste langetamist. Nende signaalide koondamine võib põhjustada tugevamaid tagajärgi, sealhulgas juurdepääsu helifunktsioonidele tühistada või tõsisemate rikkumiste korral platvormilt täielikult keelata. Meie kogukonna turvaline ja kodanikuühiskonna hoidmine on ülioluline, kuna need edusammud multimodaalsete tehisintellekti mudelite, generatiivse tehisintellekti ja LLM-ide vallas annavad loojatele uskumatuid uusi tööriistu ja võimalusi.

Usume, et sisuloojatele nende tööriistade pakkumine vähendab vähem kogenud sisuloojate sisenemisbarjääri ja vabastab kogenumad sisuloojad selle protsessi tüütumatest ülesannetest. See võimaldab neil kulutada rohkem aega peenhäälestuse ja ideede leidmisele. Meie eesmärk on kõige selle juures võimaldada kõigil kõikjal oma ideid ellu viia ning Robloxis saadaolevate avatarite, esemete ja kogemuste mitmekesisust oluliselt suurendada. Meie oleme ka teabe ja tööriistade jagamine, mis aitab kaitsta uut loomingut.

Kujutame juba ette hämmastavaid võimalusi: oletame, et keegi suudab otse fotost luua avatari, mis on kahekordne. Seejärel saab ta oma avatari kohandada, et muuta see pikemaks või renderdada seda animestiilis. Või saavad nad luua kogemuse, paludes assistendil lisada autosid, hooneid ja maastikke, määrata valgustus- või tuuletingimusi või muuta maastikku. Sealt said nad asju täpsustada lihtsalt assistendiga edasi-tagasi tippides. Teame, et tegelikkus, mida inimesed nende tööriistadega loovad, läheb nende kättesaadavaks saamisel palju kaugemale sellest, mida me isegi ette kujutame.