Mullistava luominen Robloxissa generatiivisen tekoälyn avulla - Roblox-blogi

Mullistava luominen Robloxissa generatiivisen tekoälyn avulla – Roblox-blogi

Lähdesolmu: 2874293

Aiemmin tänä vuonna jaoimme omamme visio luova tekoäly (AI) Robloxissa ja intuitiiviset uudet työkalut, joiden avulla jokaisesta käyttäjästä voi tulla luoja. Koska nämä työkalut kehittyvät nopeasti eri puolilla alaa, halusin tarjota päivityksiä edistymisestämme, tiestä, joka on vielä edessäpäin generatiivisen tekoälyn luomisen demokratisoimiseksi, ja siitä, miksi uskomme, että generatiivinen tekoäly on ratkaiseva tekijä Robloxin kehityksessä. 

Generatiivisten tekoälymallien ja suurten kielimallien (LLM) edistysaskeleet tarjoavat uskomattoman mahdollisuuden avata mukaansatempaavien kokemusten tulevaisuus mahdollistamalla helpomman ja nopeamman luomisen turvallisuuden säilyttäen ja ilman valtavia laskentaresursseja. Lisäksi edistyneet tekoälymallit, jotka ovat multimodaalisia, mikä tarkoittaa, että niitä on koulutettu useiden erityyppisten sisältöjen, kuten kuvien, koodin, tekstin, 3D-mallien ja äänen kanssa, avaa oven luontityökalujen uusille edistyksille. Nämä samat mallit alkavat tuottaa myös multimodaalisia tuloksia, kuten mallia, joka voi luoda tekstitulosteen, sekä joitain tekstiä täydentäviä visuaaleja. Näemme nämä tekoälyn läpimurrot valtavana tilaisuutena samanaikaisesti lisätä tehokkuutta kokeneemmille sisällöntuottajille ja antaa entistä useammalle mahdollisuuden toteuttaa mahtavia ideoita Robloxissa. Tänä vuonna Roblox Developers Conference (RDC), julkistimme useita uusia työkaluja, jotka tuovat luovan tekoälyn Roblox Studioon ja sen ulkopuolelle auttamaan kaikkia Roblox-mittakaavassa olevia nopeammin, iteroimaan nopeammin ja kehittämään heidän taitojaan entistä paremman sisällön luomiseksi. 

Roblox Assistant

Roblox on aina tarjonnut tekijöille työkalut, palvelutja tuki heidän täytyy rakentaa mukaansatempaavia 3D-kokemuksia. Samaan aikaan olemme nähneet, että sisällöntuottajat alkavat käyttää kolmannen osapuolen luovaa ja keskustelullista tekoälyä auttaakseen heitä luomisessa. Vaikka ne ovat hyödyllisiä luojan työtaakan vähentämisessä, näitä valmiita versioita ei ole suunniteltu Roblox-työnkulkuja varten eikä niitä ole koulutettu Roblox-koodin, slangin ja kielen käyttöön. Tämä tarkoittaa, että sisällöntuottajien on tehtävä paljon lisätyötä näiden versioiden avulla luodakseen sisältöä Robloxille. Olemme työstäneet tapoja tuoda näiden työkalujen arvo Roblox Studioon, ja RDC:ssä jaoimme varhaisen esimerkin Assistantista.

Assistant on keskustelupohjainen tekoälymme, jonka avulla kaikentasoiset luojat voivat viettää huomattavasti vähemmän aikaa luomiseen liittyviin arkipäiväisiin, toistuviin tehtäviin ja enemmän aikaa arvokkaisiin toimintoihin, kuten narratiiviin, peliin ja kokemusten suunnitteluun. Roblox on ainutlaatuisessa asemassa rakentamaan tätä keskustelua herättävää tekoälymallia mukaansatempaaviin 3D-maailmoihin, koska meillä on pääsy laajaan joukkoon julkisia 3D-malleja harjoittelua varten, kykymme integroida malli alustan sovellusliittymiemme kanssa ja kasvava valikoima innovatiivisia tekoälyratkaisujamme. . Tekijät voivat käyttää luonnollisen kielen tekstikehotteita luodakseen kohtauksia, muokatakseen 3D-malleja ja soveltaakseen interaktiivisia käyttäytymismalleja objekteihin. Assistant tukee kolmea luomisvaihetta: oppimista, koodausta ja rakentamista:

  • Learning: Olipa sisällöntuottaja uusi Roblox-kehityksessä tai kokenut veteraani, Roblox Assistant auttaa vastaamaan kysymyksiin monilla erilaisilla pinnoilla käyttämällä luonnollista kieltä. 
  • Coding: Assistant laajentaa viimeisimpiä Koodiapu työkalu. Kehittäjät voivat esimerkiksi pyytää Assistantia parantamaan koodiaan, selittämään koodin osan tai auttamaan virheenkorjauksessa ja ehdottamaan korjauksia koodiin, joka ei toimi oikein.
  • Building: Assistant auttaa sisällöntuottajia luomaan nopeasti uusia ideoita. Uusi tekijä voi esimerkiksi luoda kokonaisia ​​kohtauksia ja kokeilla eri versioita yksinkertaisesti kirjoittamalla kehotteen, kuten "Lisää katuvaloja tälle tielle" tai "Tee metsä erilaisista puista. Lisää nyt pensaita ja kukkia."

Työskentely Assistantin kanssa on yhteistyökykyistä, interaktiivista ja iteratiivista, jolloin sisällöntuottajat voivat antaa palautetta ja Assistantin työskennellä oikean ratkaisun löytämiseksi. Se on kuin kumppanina olisi asiantunteva luoja, josta voit poimia ideoita ja kokeilla ideoita, kunnes saat sen oikein.

frameborder=”0″ allow=”kiihtyvyysmittari; automaattinen toisto; leikepöydälle kirjoitus; salattu media; gyroskooppi; kuva kuvassa; web-share” allowfullscreen>

Tehdäksemme Assistantista parhaan mahdollisen kumppanin, teimme RDC:ssä toisen ilmoituksen: Kutsuimme kehittäjiä opt in antaakseen anonymisoituja Luau-käsikirjoitustietojaan. Nämä komentosarjatiedot auttavat tekemään tekoälytyökaluistamme, kuten Code Assistin ja Assistantin, huomattavasti parempia ehdottamaan ja luomaan tehokkaampaa koodia, mikä antaa takaisin niitä käyttäville Roblox-kehittäjille. Lisäksi, jos kehittäjät päättävät jakaa Robloxin ulkopuolella, heidän skriptitietonsa lisätään tietojoukkoon, joka on kolmansien osapuolten saatavilla, jotta he voivat kouluttaa heidän AI-chat-työkalujaan ehdottamaan paremmin Luau-koodia ja palauttamaan Luau-kehittäjille kaikkialla.

Selvyyden vuoksi voimme todeta, että kattavan käyttäjätutkimuksen ja huippukehittäjien kanssa käytyjen läpinäkyvien keskustelujen avulla olemme suunnitelleet tämän osallistumisen ja autamme varmistamaan, että kaikki osallistujat ymmärtävät ja hyväksyvät sen, mitä ohjelma sisältää. Kiitoksena niille, jotka päättävät osallistua käsikirjoitusdatan jakamiseen Robloxin kanssa, annamme pääsyn tehokkaampiin Assistantin ja Code Assistin versioihin, jotka toimivat tämän yhteisön kouluttaman mallin avulla. Ne, jotka eivät ole ilmoittautuneet, voivat edelleen käyttää nykyistä Assistant- ja Code Assist -versiota.

Helpompi avatarin luominen 

Viime kädessä haluamme jokaisella 65.5 miljoonalla päivittäisestä käyttäjästämme avatarin, joka todella edustaa heitä ja ilmaisee, keitä he ovat. Julkaisimme äskettäin UGC-ohjelman jäsenille mahdollisuuden luoda ja myydä sekä avatarkehoja että itsenäisiä päitä. Nykyään tämä prosessi vaatii pääsyn Studioon tai UGC-ohjelmaamme, melko korkeaa taitoa ja useiden päivien työtä kasvojen ilmeen, kehon liikkeen, 3D-takilauksen jne. mahdollistamiseksi. Tämä tekee avatarien luomisesta aikaa vievää ja vaatii päivämäärä, rajoitettu määrä vaihtoehtoja. Haluamme mennä vielä pidemmälle.

Jotta jokaisella Robloxilla olisi henkilökohtainen, ilmeikäs avatar, meidän on tehtävä avatarista erittäin helppo luoda ja muokata. RDC:ssä julkistimme uuden työkalun, jonka julkaisemme vuonna 2024 ja jonka avulla voit helposti luoda mukautetun avatarin kuvasta tai useista kuvista. Tämän työkalun avulla jokainen tekijä, jolla on pääsy Studioon tai UGC-ohjelmaamme, voi ladata kuvan, luoda hänelle avatarin ja muokata sitä haluamallaan tavalla. Pidemmällä aikavälillä aiomme tarjota tämän myös suoraan Robloxin kokemuksissa.

Jotta tämä olisi mahdollista, koulutamme tekoälymalleja Robloxin avatar-skeemalla ja joukolla Robloxin omistamia 3D-avatarmalleja. Yksi lähestymistapa hyödyntää tutkimus 3D-tyyliteltyjen avatarien luomiseen 2D-kuvista. Tarkastelemme myös valmiiksi koulutettuja tekstistä kuvaksi diffuusiomalleja täydentämään rajoitettua 3D-harjoitteludataa 2D-generatiivisilla tekniikoilla ja käyttämään generatiiviseen kilpailevaan verkkoon (GAN) perustuvaa 3D-sukupolviverkkoa koulutukseen. Lopuksi käytämme käyttöä ControlNet kerrostella ennalta määrätyissä asennoissa ohjaamaan tuloksena olevia avatar-kuvia. 

Tämä prosessi tuottaa avatarille 3D-verkon. Seuraavaksi hyödynnämme 3D:tä semanttinen segmentointitutkimus, joka on koulutettu 3D-avatar-asennoille, ottamaan tuon 3D-verkon ja säätämään sitä lisäämään asianmukaisia ​​kasvonpiirteitä, häkkiä, takilaa ja tekstuureja, mikä tekee staattisesta 3D-verkosta Roblox-avatarin. Lopuksi mesh-editointityökalun avulla käyttäjät voivat muokata ja säätää mallia niin, että se näyttää enemmän kuvittelemansa versiolta. Ja kaikki tämä tapahtuu nopeasti – muutamassa minuutissa – luoden uuden avatarin, joka voidaan tuoda Robloxiin ja käyttää kokemuksessa.

frameborder=”0″ allow=”kiihtyvyysmittari; automaattinen toisto; leikepöydälle kirjoitus; salattu media; gyroskooppi; kuva kuvassa; web-share” allowfullscreen>

Moderoidaan puheviestintää

Meille tekoäly ei ole vain luomista, vaan se on myös paljon tehokkaampi järjestelmä monipuolisen, turvallisen ja kansalaisyhteiskunnan takaamiseksi laajassa mittakaavassa. Kun alamme ottaa käyttöön uusia ääniominaisuuksia, mukaan lukien äänikeskustelu ja Roblox Connect, uusi kutsuminen avatar-ominaisuuteen, sekä RDC:ssä julkistetut API:t, kohtaamme uuden haasteen – puhutun kielen valvomisen reaaliajassa. Nykyinen alan standardi tähän on prosessi, joka tunnetaan nimellä Automatic Speech Recognition (ASR), joka pohjimmiltaan ottaa äänitiedoston, litteroi sen muuntaakseen sen tekstiksi ja analysoi sitten tekstin löytääkseen sopimatonta kieltä, avainsanoja jne. 

Tämä toimii hyvin yrityksissä, jotka käyttävät sitä pienemmässä mittakaavassa, mutta kun tutkimme saman ASR-prosessin käyttöä puheviestinnän hillitsemiseen, huomasimme nopeasti, että se on vaikeaa ja tehotonta meidän mittakaavassamme. Tämä lähestymistapa menettää myös uskomattoman arvokasta tietoa, joka on koodattu puhujan äänenvoimakkuuteen ja äänensävyyn sekä keskustelun laajempaan kontekstiin. Niistä miljoonista keskusteluminuuteista, jotka meidän olisi litteroitava joka päivä eri kielillä, vain hyvin pieni prosenttiosuus kuulostaisi mahdollisesti sopimattomalta. Ja kun jatkamme skaalausta, järjestelmä vaatisi yhä enemmän laskentatehoa pysyäkseen mukana. Tarkastelimme siis tarkemmin, kuinka voisimme tehdä tämän tehokkaammin rakentamalla putkilinjan, joka kulkee suoraan live-äänestä sisällön merkitsemiseen sen osoittamiseksi, rikkooko se käytäntöjämme vai ei.

Lopulta pystyimme rakentamaan talon sisäisen mukautetun äänentunnistusjärjestelmän luokittelemalla talon sisäisiä äänidatajoukkojamme ASR:n avulla ja käyttämällä sitten luokiteltua äänidataa järjestelmän kouluttamiseen. Tarkemmin sanottuna tämän uuden järjestelmän kouluttamiseksi aloitamme äänellä ja luomme transkription. Suoritamme sitten transkription Roblox-tekstisuodatinjärjestelmämme läpi äänen luokittelemiseksi. Tämä tekstisuodatinjärjestelmä on loistava havaitsemaan käytäntöjä rikkovan kielen Robloxissa, koska olemme optimoineet tätä samaa suodatinjärjestelmää vuosia Roblox-kohtaisille slangille, lyhenteille ja kielelle. Näiden koulutuskerrosten lopussa meillä on malli, joka pystyy havaitsemaan käytäntörikkomukset suoraan äänestä reaaliajassa.

Vaikka tämä järjestelmä pystyy havaitsemaan tietyt avainsanat, kuten kirosanat, käytäntörikkomukset ovat harvoin vain yksi sana. Yksi sana voi usein tuntua ongelmalliselta yhdessä kontekstissa ja hienolta eri kontekstissa. Pohjimmiltaan tämäntyyppiset rikkomukset liittyvät siihen, mitä sanot, miten sanot sen ja kontekstin, jossa lausunnot esitetään.

Ymmärtääksemme kontekstia paremmin, hyödynnämme muuntajapohjaisen arkkitehtuurin natiivitehoa, joka on erittäin hyvä sekvenssien yhteenvedossa. Se voi ottaa datasarjan, kuten äänivirran, ja tehdä siitä yhteenvedon puolestasi. Tämä arkkitehtuuri mahdollistaa pidemmän äänisekvenssin säilyttämisen, jotta voimme havaita sanojen lisäksi myös kontekstin ja intonaation. Kun kaikki nämä elementit yhdistyvät, meillä on lopullinen järjestelmä, jossa tulo on ääni ja lähtö on luokitus – rikkoo käytäntöä tai ei. Tämä järjestelmä voi havaita avainsanoja ja käytäntöjä rikkovia lauseita, mutta myös sävyn, tunteen ja muun kontekstin, joka on tärkeä tarkoitus määrittää. Tämä uusi järjestelmä, joka havaitsee käytäntöjä rikkovan puheen suoraan äänestä, on huomattavasti tehokkaampi laskenta kuin perinteinen ASR-järjestelmä, mikä tekee siitä paljon helpompaa skaalata, kun jatkamme ihmisten yhdistämistä.

Tarvitsimme myös uuden tavan varoittaa puheviestintävälineidemme käyttäjiä tämän tyyppisen kielen mahdollisista seurauksista. Tämän innovatiivisen tunnistusjärjestelmän avulla kokeilemme nyt tapoja vaikuttaa verkkokäyttäytymiseen turvallisen ympäristön ylläpitämiseksi. Tiedämme, että ihmiset rikkovat joskus käytäntöjämme tahattomasti, ja haluamme ymmärtää, voisiko satunnainen muistutus auttaa estämään uusia rikoksia. Tämän helpottamiseksi kokeilemme reaaliaikaista käyttäjäpalautetta ilmoitusten kautta. Jos järjestelmä havaitsee, että olet sanonut jotain, joka rikkoo käytäntöjämme useita kertoja, näytämme näytölläsi ponnahdusikkunan, jossa kerromme, että käyttämäsi kielesi rikkoo käytäntöjämme, ja ohjaa sinut käytäntöihimme saadaksesi lisätietoja.

Äänistream-ilmoitukset ovat kuitenkin vain yksi osa moderointijärjestelmää. Tarkastelemme myös käyttäytymismalleja alustalla sekä muiden Roblox-käyttäjien valituksia ohjataksemme yleisiä maltillisia päätöksiämme. Näiden signaalien yhdistäminen voi johtaa voimakkaampiin seurauksiin, mukaan lukien ääniominaisuuksien käyttöoikeuden peruuttaminen tai vakavampien rikkomusten poistaminen alustalta kokonaan. Yhteisömme pitäminen turvallisena ja sivistyneenä on erittäin tärkeää, sillä nämä multimodaalisten tekoälymallien, generatiivisten tekoälyjen ja LLM:ien edistysaskeleet yhdistävät tekijöille uskomattomia uusia työkaluja ja ominaisuuksia. 

Uskomme, että näiden työkalujen tarjoaminen sisällöntuottajille alentaa vähemmän kokeneiden sisällöntuottajien markkinoille pääsyn esteitä ja vapauttaa kokeneemmat sisällöntuottajat tämän prosessin työläämmistä tehtävistä. Tämä antaa heille mahdollisuuden viettää enemmän aikaa hienosäädön ja ideoinnin kekseliäisiin puoliin. Kaiken tämän tavoitteemme on antaa kaikille, kaikkialla, saada ideansa eloon ja lisätä huomattavasti Robloxissa saatavilla olevien avatarien, esineiden ja kokemusten monipuolisuutta. Olemme myös tietojen ja työkalujen jakaminen uusien luomusten suojaamiseksi

Kuvittelemme jo uskomattomia mahdollisuuksia: Oletetaan, että joku pystyy luomaan avatar-doppelgangerin suoraan valokuvasta, hän voi sitten muokata avatariaan pitemmäksi tai renderöidä ne anime-tyyliin. Tai he voivat rakentaa kokemuksen pyytämällä Assistantia lisäämään autoja, rakennuksia ja maisemia, asettamaan valaistus- tai tuuliolosuhteet tai muuttamaan maastoa. Sieltä he pystyivät hiomaan asioita vain kirjoittamalla edestakaisin Assistantilla. Tiedämme, että todellisuus siitä, mitä ihmiset luovat näillä työkaluilla, ylittää niiden tullessa saataville paljon enemmän kuin voimme edes kuvitella.

Aikaleima:

Lisää aiheesta Roblox