Merevolusi Kreasi di Roblox dengan AI Generatif - Blog Roblox

Merevolusi Kreasi di Roblox dengan AI Generatif – Blog Roblox

Node Sumber: 2874293

Awal tahun ini, kami berbagi penglihatan untuk kecerdasan buatan (AI) generatif di Roblox dan alat baru intuitif yang memungkinkan setiap pengguna menjadi pencipta. Seiring dengan berkembangnya alat-alat ini dengan pesat di seluruh industri, saya ingin memberikan beberapa pembaruan mengenai kemajuan yang telah kami capai, jalan yang masih harus ditempuh untuk mendemokratisasi penciptaan AI generatif, dan mengapa menurut kami AI generatif adalah elemen penting dalam arah tujuan Roblox. 

Kemajuan dalam AI generatif dan model bahasa besar (LLM) menghadirkan peluang luar biasa untuk membuka masa depan pengalaman imersif dengan memungkinkan kreasi yang lebih mudah dan cepat dengan tetap menjaga keselamatan dan tanpa memerlukan sumber daya komputasi yang besar. Lebih jauh lagi, kemajuan dalam model AI yang bersifat multimodal, artinya mereka dilatih dengan berbagai jenis konten—seperti gambar, kode, teks, model 3D, dan audio—membuka pintu bagi kemajuan baru dalam alat kreasi. Model yang sama ini juga mulai menghasilkan keluaran multimodal, seperti model yang dapat membuat keluaran teks, serta beberapa visual yang melengkapi teks. Kami melihat terobosan AI ini sebagai peluang besar untuk secara bersamaan meningkatkan efisiensi bagi pembuat konten yang lebih berpengalaman dan memungkinkan lebih banyak orang mewujudkan ide-ide hebat di Roblox. Pada tahun ini Konferensi Pengembang Roblox (RDC), kami mengumumkan beberapa alat baru yang akan menghadirkan AI generatif ke Roblox Studio dan seterusnya untuk membantu siapa pun di Roblox menskalakan lebih cepat, melakukan iterasi lebih cepat, dan meningkatkan keterampilan mereka untuk membuat konten yang lebih baik lagi. 

Asisten Roblox

Roblox selalu menyediakan alat bagi pembuatnya, layanan, dan mendukung mereka perlu membangun pengalaman 3D yang mendalam. Pada saat yang sama, kami telah melihat para pembuat konten kami mulai menggunakan AI generatif dan percakapan pihak ketiga untuk membantu mereka berkreasi. Meskipun berguna untuk membantu mengurangi beban kerja pembuat, versi siap pakai ini tidak dirancang untuk alur kerja Roblox end-to-end atau dilatih tentang kode, bahasa gaul, dan istilah Roblox. Itu berarti pembuat konten menghadapi pekerjaan tambahan yang signifikan untuk menggunakan versi ini guna membuat konten untuk Roblox. Kami telah berupaya mencari cara untuk menghadirkan nilai alat ini ke Roblox Studio, dan di RDC kami membagikan contoh awal Asisten.

Asisten adalah AI percakapan kami yang memungkinkan pembuat konten dengan semua tingkat keahlian menghabiskan lebih sedikit waktu untuk tugas-tugas sehari-hari dan berulang-ulang dalam berkreasi, dan lebih banyak waktu untuk aktivitas bernilai tinggi, seperti narasi, permainan, dan desain pengalaman. Roblox diposisikan secara unik untuk membangun model AI percakapan ini untuk dunia 3D yang imersif, berkat akses kami ke sejumlah besar model 3D publik untuk dilatih, kemampuan kami untuk mengintegrasikan model dengan API platform kami, dan rangkaian solusi AI inovatif kami yang terus berkembang . Pembuat konten akan dapat menggunakan perintah teks bahasa alami untuk membuat adegan, mengedit model 3D, dan menerapkan perilaku interaktif pada objek. Asisten akan mendukung tiga fase pembuatan: pembelajaran, pengkodean, dan pembuatan:

  • belajar: Baik kreator masih baru dalam mengembangkan Roblox atau sudah berpengalaman, Asisten Roblox akan membantu menjawab pertanyaan di berbagai platform menggunakan bahasa alami. 
  • Pengodean: Asisten akan memperluas informasi terbaru kami Bantuan Kode alat. Misalnya, developer dapat meminta Asisten untuk menyempurnakan kodenya, menjelaskan bagian kode, atau membantu melakukan debug dan menyarankan perbaikan untuk kode yang tidak berfungsi dengan benar.
  • Bangunan: Asisten akan membantu pembuat konten dengan cepat membuat prototipe ide-ide baru. Misalnya, pembuat konten baru dapat membuat seluruh adegan dan mencoba versi yang berbeda hanya dengan mengetik perintah seperti “Tambahkan beberapa lampu jalan di sepanjang jalan ini” atau “Buat hutan dengan berbagai jenis pepohonan. Sekarang tambahkan beberapa semak dan bunga.”

Bekerja dengan Asisten akan bersifat kolaboratif, interaktif, dan berulang, sehingga memungkinkan pembuat konten memberikan masukan dan membuat Asisten bekerja untuk memberikan solusi yang tepat. Ini seperti memiliki pencipta yang ahli sebagai mitra di mana Anda dapat melontarkan ide dan mencoba ide hingga Anda dapat melakukannya dengan benar.

frameborder=”0″ izinkan=”akselerometer; putar otomatis; clipboard-tulis; media terenkripsi; giroskop; gambar di dalam gambar; web-share” memungkinkan layar penuh>

Untuk menjadikan Asisten sebagai mitra terbaik, kami membuat pengumuman lain di RDC: Kami mengundang pengembang untuk melakukannya memilih di untuk menyumbangkan data skrip Luau yang dianonimkan. Data skrip ini akan membantu membuat alat AI kami, seperti Code Assist dan Assistant, jauh lebih baik dalam menyarankan dan membuat kode lebih efisien, sehingga memberikan manfaat kepada pengembang Roblox yang menggunakannya. Selanjutnya, jika pengembang memilih untuk berbagi di luar Roblox, data skrip mereka akan ditambahkan ke kumpulan data yang disediakan bagi pihak ketiga untuk melatih alat obrolan AI mereka agar lebih baik dalam menyarankan kode Luau, sehingga memberikan manfaat kepada pengembang Luau di mana pun.

Untuk lebih jelasnya, melalui riset pengguna yang komprehensif dan percakapan transparan dengan pengembang terkemuka, kami telah merancang hal ini agar dapat diikutsertakan dan akan membantu memastikan bahwa semua peserta memahami dan menyetujui apa yang tercakup dalam program ini. Sebagai ucapan terima kasih kepada mereka yang memilih untuk berpartisipasi dalam berbagi data skrip dengan Roblox, kami akan memberikan akses ke versi Asisten dan Code Assist yang lebih canggih yang didukung oleh model yang dilatih komunitas ini. Mereka yang belum ikut serta akan terus memiliki akses ke versi Asisten dan Bantuan Kode kami yang sudah ada.

Pembuatan Avatar Lebih Mudah 

Pada akhirnya, kami ingin setiap dari 65.5 juta pengguna harian kami memiliki avatar yang benar-benar mewakili dan mengekspresikan siapa mereka. Kami baru-baru ini merilis kemampuan untuk anggota Program UGC kami membuat dan menjual tubuh avatar dan kepala mandiri. Saat ini, proses tersebut memerlukan akses ke Studio atau Program UGC kami, tingkat keterampilan yang cukup tinggi, dan kerja beberapa hari untuk mengaktifkan ekspresi wajah, gerakan tubuh, pemasangan 3D, dll. Hal ini membuat avatar memakan waktu lama untuk dibuat dan harus, untuk tanggal, membatasi jumlah opsi yang tersedia. Kami ingin melangkah lebih jauh.

Agar semua orang di Roblox memiliki avatar yang dipersonalisasi dan ekspresif, kita perlu membuat avatar menjadi sangat mudah untuk dibuat dan disesuaikan. Di RDC, kami mengumumkan alat baru yang kami rilis pada tahun 2024 yang memungkinkan pembuatan avatar khusus dengan mudah dari sebuah gambar atau dari beberapa gambar. Dengan alat ini, setiap pembuat konten yang memiliki akses ke Studio atau program UGC kami akan dapat mengunggah gambar, membuat avatar untuk mereka, dan kemudian memodifikasinya sesuai keinginan mereka. Dalam jangka panjang, kami juga bermaksud untuk menyediakannya secara langsung dalam pengalaman di Roblox.

Untuk mewujudkan hal ini, kami melatih model AI pada skema avatar Roblox dan serangkaian model avatar 3D milik Roblox. Satu pendekatan memanfaatkan penelitian untuk menghasilkan avatar bergaya 3D dari gambar 2D. Kami juga mempertimbangkan untuk menggunakan model difusi teks-ke-gambar yang telah dilatih sebelumnya untuk menambah data pelatihan 3D terbatas dengan teknik generatif 2D, dan menggunakan jaringan generasi 3D berbasis generative adversarial network (GAN) untuk pelatihan. Akhirnya, kami sedang berupaya menggunakan KontrolNet untuk melapisi pose yang telah ditentukan sebelumnya untuk memandu gambar multi-tampilan avatar yang dihasilkan. 

Proses ini menghasilkan jaring 3D untuk avatar. Selanjutnya, kami memanfaatkan 3D penelitian segmentasi semantik, dilatih dalam pose avatar 3D, untuk mengambil jaring 3D tersebut dan menyesuaikannya untuk menambahkan fitur wajah, sangkar, tali-temali, dan tekstur yang sesuai, pada dasarnya, membuat jaring 3D statis menjadi avatar Roblox. Terakhir, alat pengeditan mesh memungkinkan pengguna untuk mengubah dan menyesuaikan model agar terlihat lebih seperti versi yang mereka bayangkan. Dan semua ini terjadi dengan cepat—dalam hitungan menit—menghasilkan avatar baru yang dapat diimpor ke Roblox dan digunakan dalam sebuah pengalaman.

frameborder=”0″ izinkan=”akselerometer; putar otomatis; clipboard-tulis; media terenkripsi; giroskop; gambar di dalam gambar; web-share” memungkinkan layar penuh>

Memoderasi Komunikasi Suara

Bagi kami, AI bukan hanya tentang penciptaan, namun juga merupakan sistem yang jauh lebih efisien untuk memastikan komunitas yang beragam, aman, dan beradab dalam skala besar. Saat kami mulai meluncurkan fitur suara baru, termasuk obrolan suara dan Roblox Connect, fitur panggilan baru sebagai avatar Anda, dan API yang diumumkan di RDC, kami menghadapi tantangan baru—memoderasi bahasa lisan secara real-time. Standar industri saat ini untuk hal ini adalah proses yang dikenal sebagai Pengenalan Ucapan Otomatis (ASR), yang pada dasarnya mengambil file audio, mentranskripsikannya untuk mengubahnya menjadi teks, kemudian menganalisis teks untuk mencari bahasa, kata kunci, dll yang tidak pantas. 

Hal ini berfungsi dengan baik bagi perusahaan yang menggunakan teknologi ini dalam skala yang lebih kecil, namun saat kami mempelajari penggunaan proses ASR yang sama untuk memoderasi komunikasi suara, kami segera menyadari bahwa hal ini sulit dan tidak efisien pada skala kami. Pendekatan ini juga menghilangkan informasi yang sangat berharga yang terkandung dalam volume dan nada suara pembicara, serta konteks percakapan yang lebih luas. Dari jutaan menit percakapan yang harus kami transkripsikan setiap hari, dalam berbagai bahasa, hanya sebagian kecil yang mungkin terdengar tidak pantas. Dan seiring dengan peningkatan skala yang kami lakukan, sistem tersebut akan memerlukan lebih banyak daya komputasi untuk mengimbanginya. Jadi kami melihat lebih dekat bagaimana kami dapat melakukan hal ini secara lebih efisien, dengan membangun saluran yang langsung mulai dari audio langsung hingga memberi label pada konten untuk menunjukkan apakah konten tersebut melanggar kebijakan kami atau tidak.

Pada akhirnya, kami dapat membangun sistem deteksi suara khusus internal dengan menggunakan ASR untuk mengklasifikasikan kumpulan data suara internal, kemudian menggunakan data suara rahasia tersebut untuk melatih sistem. Lebih khusus lagi, untuk melatih sistem baru ini, kami memulai dengan audio dan membuat transkrip. Kami kemudian menjalankan transkrip melalui sistem filter teks Roblox untuk mengklasifikasikan audio. Sistem filter teks ini sangat bagus dalam mendeteksi bahasa yang melanggar kebijakan di Roblox karena kami telah mengoptimalkan sistem filter yang sama ini selama bertahun-tahun pada bahasa gaul, singkatan, dan istilah khusus Roblox. Di akhir pelatihan berlapis ini, kami memiliki model yang mampu mendeteksi pelanggaran kebijakan langsung dari audio secara real-time.

Meskipun sistem ini memiliki kemampuan untuk mendeteksi kata kunci spesifik seperti kata-kata kotor, pelanggaran kebijakan jarang hanya berupa satu kata. Satu kata sering kali tampak bermasalah dalam satu konteks dan baik-baik saja dalam konteks yang berbeda. Pada dasarnya, jenis pelanggaran ini melibatkan apa yang Anda katakan, cara Anda mengatakannya, dan konteks di mana pernyataan tersebut dibuat.

Untuk memahami konteks dengan lebih baik, kami memanfaatkan kekuatan asli arsitektur berbasis transformator, yang sangat baik dalam peringkasan urutan. Ini dapat mengambil urutan data, seperti aliran audio, dan meringkasnya untuk Anda. Arsitektur ini memungkinkan kami mempertahankan rangkaian audio yang lebih panjang sehingga kami tidak hanya dapat mendeteksi kata tetapi juga konteks dan intonasi. Setelah semua elemen ini bersatu, kita memiliki sistem akhir yang masukannya berupa audio dan keluarannya berupa klasifikasi—melanggar kebijakan atau tidak. Sistem ini tidak hanya dapat mendeteksi kata kunci dan frasa yang melanggar kebijakan, tetapi juga nada, sentimen, dan konteks lain yang penting untuk menentukan niatnya. Sistem baru ini, yang mendeteksi ucapan yang melanggar kebijakan langsung dari audio, secara signifikan lebih efisien dalam hal komputasi dibandingkan sistem ASR tradisional, sehingga akan lebih mudah untuk melakukan penskalaan seiring kami terus memikirkan kembali cara orang berkumpul.

Kami juga memerlukan cara baru untuk memperingatkan orang-orang yang menggunakan alat komunikasi suara kami tentang potensi konsekuensi dari jenis bahasa ini. Dengan sistem deteksi inovatif yang kami miliki, kami kini bereksperimen dengan cara memengaruhi perilaku online untuk menjaga lingkungan yang aman. Kami memahami bahwa terkadang ada orang yang melanggar kebijakan kami secara tidak sengaja dan kami ingin memahami apakah pengingat sesekali dapat membantu mencegah pelanggaran lebih lanjut. Untuk membantu hal ini, kami bereksperimen dengan masukan pengguna secara real-time melalui notifikasi. Jika sistem mendeteksi bahwa Anda telah mengatakan sesuatu yang melanggar kebijakan kami beberapa kali, kami akan menampilkan pemberitahuan pop-up di layar Anda yang memberitahukan bahwa bahasa Anda melanggar kebijakan kami dan mengarahkan Anda ke kebijakan kami untuk informasi lebih lanjut.

Namun, notifikasi aliran suara hanyalah salah satu elemen dari sistem moderasi. Kami juga melihat pola perilaku di platform, serta keluhan dari orang lain di Roblox, untuk mendorong keputusan moderasi kami secara keseluruhan. Gabungan dari sinyal-sinyal ini dapat mengakibatkan konsekuensi yang lebih kuat, termasuk pencabutan akses ke fitur audio, atau pelanggaran yang lebih serius, pemblokiran sepenuhnya dari platform. Menjaga komunitas kita tetap aman dan beradab sangatlah penting karena kemajuan dalam model AI multimodal, AI generatif, dan LLM bersatu untuk memungkinkan alat dan kemampuan baru yang luar biasa bagi para pembuat konten. 

Kami percaya bahwa menyediakan alat-alat ini kepada kreator akan menurunkan hambatan masuk bagi kreator yang kurang berpengalaman dan membebaskan kreator yang lebih berpengalaman dari tugas-tugas yang lebih membosankan dalam proses ini. Hal ini akan memungkinkan mereka menghabiskan lebih banyak waktu pada aspek inventif dalam menyempurnakan dan membuat ide. Tujuan kami dengan semua ini adalah untuk memungkinkan semua orang, di mana pun, mewujudkan ide mereka dan meningkatkan keragaman avatar, item, dan pengalaman yang tersedia di Roblox. Kita juga berbagi informasi dan alat untuk membantu melindungi ciptaan baru

Kami sudah membayangkan kemungkinan yang luar biasa: Katakanlah seseorang dapat membuat avatar doppelganger langsung dari sebuah foto, mereka kemudian dapat menyesuaikan avatarnya untuk membuatnya lebih tinggi atau menjadikannya dalam gaya anime. Atau mereka dapat membangun pengalaman dengan meminta Asisten menambahkan mobil, bangunan, dan pemandangan, menyetel kondisi pencahayaan atau angin, atau mengubah medan. Dari sana, mereka dapat mengulangi untuk menyempurnakan berbagai hal hanya dengan mengetik bolak-balik menggunakan Asisten. Kami tahu kenyataan bahwa apa yang diciptakan orang-orang dengan alat-alat ini, ketika sudah tersedia, akan melampaui apa yang dapat kita bayangkan.

Stempel Waktu:

Lebih dari roblox