제너레이티브 AI로 Roblox 창작에 혁명을 일으키다 - Roblox 블로그

생성적 AI를 통한 Roblox의 창조 혁신 – Roblox 블로그

소스 노드 : 2874293

올해 초 우리는 시력 Roblox의 생성적 인공지능(AI)과 모든 사용자가 창작자가 될 수 있는 직관적인 새 도구를 제공합니다. 이러한 도구가 업계 전반에 걸쳐 빠르게 발전함에 따라 저는 우리가 이룩한 진전, 생성적 AI 생성을 민주화하기 위해 앞으로 나아갈 길, 생성적 AI가 Roblox가 나아가는 방향에 있어 중요한 요소라고 생각하는 이유에 대한 몇 가지 업데이트를 제공하고 싶었습니다. 

생성적 AI와 대규모 언어 모델(LLM)의 발전은 대규모 컴퓨팅 리소스 없이 안전을 유지하면서 더 쉽고 빠른 생성을 가능하게 함으로써 몰입형 경험의 미래를 열 수 있는 놀라운 기회를 제공합니다. 또한, 다중 모드인 AI 모델의 발전, 즉 이미지, 코드, 텍스트, 3D 모델, 오디오 등 다양한 유형의 콘텐츠로 훈련됨을 의미하는 AI 모델은 제작 도구의 새로운 발전을 위한 문을 열어줍니다. 이러한 동일한 모델은 텍스트 출력을 생성할 수 있는 모델뿐만 아니라 텍스트를 보완하는 일부 시각적 개체와 같은 다중 모드 출력도 생성하기 시작했습니다. 우리는 이러한 AI 혁신을 숙련된 제작자의 효율성을 동시에 높이고 더 많은 사람들이 Roblox에서 멋진 아이디어를 생생하게 구현할 수 있는 엄청난 기회라고 생각합니다. 올해에는 Roblox 개발자 회의(RDC), 우리는 Roblox의 모든 사람이 더 빠르게 확장하고, 더 빠르게 반복하고, 기술을 강화하여 더 나은 콘텐츠를 만들 수 있도록 생성적 AI를 Roblox Studio 및 그 이상에 도입할 몇 가지 새로운 도구를 발표했습니다. 

Roblox 어시스턴트

Roblox는 항상 창작자에게 도구를 제공해 왔습니다. 서비스SUPPORT 몰입형 3D 경험을 구축해야 합니다. 동시에, 우리는 창작자들이 창작을 돕기 위해 제XNUMX자 생성 및 대화형 AI를 사용하기 시작하는 것을 보았습니다. 제작자의 작업량을 줄이는 데는 유용하지만, 이러한 기성 버전은 Roblox 전체 워크플로를 위해 설계되거나 Roblox 코드, 속어 및 용어에 대해 교육되지 않았습니다. 즉, 제작자는 이러한 버전을 사용하여 Roblox용 콘텐츠를 제작하려면 상당한 추가 작업에 직면해야 합니다. 우리는 이러한 도구의 가치를 Roblox Studio에 도입하는 방법을 연구해 왔으며 RDC에서 Assistant의 초기 사례를 공유했습니다.

Assistant는 모든 기술 수준의 제작자가 제작과 관련된 평범하고 반복적인 작업에 훨씬 적은 시간을 소비하고 내러티브, 게임 플레이, 경험 디자인과 같은 고부가가치 활동에 더 많은 시간을 할애할 수 있도록 하는 대화형 AI입니다. Roblox는 학습할 수 있는 대규모 공개 3D 모델 세트에 대한 액세스, 모델을 플랫폼 API와 통합하는 기능, 점점 늘어나는 혁신적인 AI 솔루션 제품군 덕분에 몰입형 3D 세계를 위한 대화형 AI 모델을 구축할 수 있는 독보적인 위치에 있습니다. . 제작자는 자연어 텍스트 프롬프트를 사용하여 장면을 만들고, 3D 모델을 편집하고, 개체에 대화형 동작을 적용할 수 있습니다. 어시스턴트는 학습, 코딩, 구축이라는 창작의 세 단계를 지원합니다.

  • 학습 : Roblox 개발이 처음인 제작자이든 노련한 베테랑이든 관계없이 Roblox Assistant는 자연어를 사용하여 다양한 표면에서 질문에 답하는 데 도움을 줍니다. 
  • 코딩 : 어시스턴트가 최근에 확장할 예정입니다. 코드 어시스트 도구. 예를 들어 개발자는 어시스턴트에게 코드 개선, 코드 섹션 설명, 디버깅 지원, 제대로 작동하지 않는 코드 수정 제안 등을 요청할 수 있습니다.
  • 건물: 어시스턴트는 제작자가 새로운 아이디어의 프로토타입을 빠르게 제작할 수 있도록 도와줍니다. 예를 들어, 새로운 제작자는 "이 도로를 따라 가로등을 추가해 주세요" 또는 "다양한 종류의 나무로 숲을 만들어 보세요"와 같은 프롬프트를 입력하여 전체 장면을 생성하고 다양한 버전을 시험해 볼 수 있습니다. 이제 덤불과 꽃을 추가하세요.”

어시스턴트와의 작업은 협업적이고 상호작용적이며 반복적이므로 제작자가 피드백을 제공하고 어시스턴트가 올바른 솔루션을 제공하도록 할 수 있습니다. 마치 전문 창작자를 파트너로 삼아 아이디어를 구체화하고 올바른 결과를 얻을 때까지 시험해 볼 수 있는 것과 같습니다.

frameborder=”0″ allow=”가속도계; 자동 재생; 클립보드 쓰기; 암호화된 미디어; 자이로스코프; 픽처 인 픽처; 웹 공유” allowfullscreen>

Assistant를 최고의 파트너로 만들기 위해 우리는 RDC에서 또 다른 발표를 했습니다. 옵트 익명화된 Luau 스크립트 데이터를 제공합니다. 이 스크립트 데이터는 Code Assist 및 Assistant와 같은 AI 도구를 더욱 효율적으로 제안하고 생성하여 이를 사용하는 Roblox 개발자에게 돌려주는 데 도움이 됩니다. 또한 개발자가 Roblox 외부에서 공유하기로 선택한 경우 스크립트 데이터는 제XNUMX자가 사용할 수 있는 데이터 세트에 추가되어 AI 채팅 도구가 Luau 코드를 더 잘 제안하도록 교육하여 모든 곳의 Luau 개발자에게 돌려줍니다.

명확히 하자면, 포괄적인 사용자 조사와 최고 개발자와의 투명한 대화를 통해 우리는 이를 선택적으로 설계했으며 모든 참가자가 프로그램에 수반되는 내용을 이해하고 동의하도록 도울 것입니다. Roblox와 스크립트 데이터 공유에 참여하기로 선택한 분들께 감사의 뜻으로 이 커뮤니티 교육 모델을 기반으로 하는 더욱 강력한 버전의 Assistant 및 Code Assist에 대한 액세스 권한을 부여합니다. 선택하지 않은 사용자는 기존 버전의 Assistant 및 Code Assist에 계속 액세스할 수 있습니다.

더욱 쉬워진 아바타 생성 

궁극적으로 우리는 매일 65.5만 명의 사용자가 자신을 진정으로 대표하고 자신이 누구인지 표현하는 아바타를 갖기를 원합니다. 우리는 최근 UGC 프로그램 회원이 다음을 수행할 수 있는 기능을 출시했습니다. 아바타 본체와 독립형 헤드를 모두 제작 및 판매. 오늘날 해당 프로세스에는 Studio 또는 UGC 프로그램에 대한 액세스, 상당히 높은 수준의 기술, 얼굴 표정, 신체 움직임, 3D 리깅 등을 가능하게 하는 며칠간의 작업이 필요합니다. 이로 인해 아바타를 만드는 데 시간이 많이 걸리고 날짜에 따라 사용 가능한 옵션 수가 제한됩니다. 우리는 더욱 더 나아가고 싶습니다.

Roblox의 모든 사람이 개인화되고 표현력이 풍부한 아바타를 가질 수 있도록 하려면 아바타를 매우 쉽게 생성하고 맞춤 설정할 수 있어야 합니다. RDC에서 우리는 이미지 또는 여러 이미지에서 맞춤형 아바타를 쉽게 생성할 수 있는 새로운 도구를 2024년에 출시할 예정이라고 발표했습니다. 이 도구를 사용하면 Studio 또는 UGC 프로그램에 액세스할 수 있는 모든 제작자가 이미지를 업로드하고 아바타를 만든 다음 원하는 대로 수정할 수 있습니다. 장기적으로는 Roblox 환경 내에서 직접 이 기능을 사용할 수 있도록 할 계획입니다.

이를 가능하게 하기 위해 우리는 Roblox의 아바타 스키마와 Roblox가 소유한 3D 아바타 모델 세트를 기반으로 AI 모델을 훈련하고 있습니다. 한 가지 접근 방식은 다음을 활용합니다. 연구 3D 이미지에서 2D 스타일화된 아바타를 생성하기 위한 것입니다. 또한 사전 훈련된 텍스트-이미지 확산 모델을 사용하여 제한된 3D 훈련 데이터를 2D 생성 기술로 강화하고, 훈련을 위해 GAN(Generative Adversarial Network) 기반 3D 생성 네트워크를 사용하는 방법도 검토하고 있습니다. 마지막으로 우리는 다음을 사용하여 작업하고 있습니다. 컨트롤넷 미리 정의된 포즈를 레이어링하여 아바타의 다중 뷰 이미지 결과를 안내합니다. 

이 프로세스는 아바타용 3D 메시를 생성합니다. 다음으로 3D를 활용합니다. 의미론적 분할 연구, 3D 아바타 포즈에 대해 교육을 받은 3D 메시를 가져와 조정하여 적절한 얼굴 특징, 케이지, 리깅 및 텍스처를 추가합니다. 본질적으로 정적 3D 메시를 Roblox 아바타로 만듭니다. 마지막으로 메시 편집 도구를 사용하면 사용자가 모델을 변형하고 조정하여 상상하는 버전과 더 비슷하게 만들 수 있습니다. 그리고 이 모든 작업은 몇 분 안에 빠르게 이루어지며 Roblox로 가져와서 경험에 사용할 수 있는 새로운 아바타를 생성합니다.

frameborder=”0″ allow=”가속도계; 자동 재생; 클립보드 쓰기; 암호화된 미디어; 자이로스코프; 픽처 인 픽처; 웹 공유” allowfullscreen>

음성 커뮤니케이션 조정

우리에게 AI는 단지 창조에 관한 것이 아니라 다양하고 안전한 시민 커뮤니티를 대규모로 보장하기 위한 훨씬 더 효율적인 시스템이기도 합니다. 음성 채팅, Roblox Connect, 아바타 기능으로서의 새로운 호출, RDC에서 발표된 API 등 새로운 음성 기능을 출시하기 시작하면서 우리는 실시간으로 음성 언어를 조정해야 하는 새로운 과제에 직면하게 되었습니다. 이에 대한 현재 업계 표준은 자동 음성 인식(ASR)으로 알려진 프로세스로, 기본적으로 오디오 파일을 가져와 이를 텍스트로 변환한 다음 텍스트를 분석하여 부적절한 언어, 키워드 등을 찾습니다. 

이는 소규모로 회사에서 사용하는 경우에 적합하지만 동일한 ASR 프로세스를 사용하여 음성 통신을 조절하는 방법을 살펴보면서 우리 규모에서는 이것이 어렵고 비효율적이라는 것을 금방 깨달았습니다. 또한 이 접근 방식은 화자의 음량과 목소리 톤은 물론 대화의 더 넓은 맥락에 인코딩된 매우 귀중한 정보도 손실합니다. 우리가 매일 다양한 언어로 복사해야 하는 수백만 분의 대화 중에서 부적절한 내용처럼 들리는 경우는 극히 일부에 불과합니다. 그리고 우리가 계속 확장함에 따라 해당 시스템을 유지하려면 점점 더 많은 컴퓨팅 성능이 필요합니다. 그래서 우리는 라이브 오디오에서 콘텐츠에 라벨을 지정하여 정책 위반 여부를 표시하는 파이프라인을 구축함으로써 이를 더욱 효율적으로 수행할 수 있는 방법을 자세히 살펴보았습니다.

궁극적으로 우리는 ASR을 사용하여 사내 음성 데이터 세트를 분류한 다음 분류된 음성 데이터를 사용하여 시스템을 교육함으로써 사내 맞춤형 음성 감지 시스템을 구축할 수 있었습니다. 보다 구체적으로 말하면, 이 새로운 시스템을 교육하기 위해 오디오로 시작하고 스크립트를 작성합니다. 그런 다음 Roblox 텍스트 필터 시스템을 통해 스크립트를 실행하여 오디오를 분류합니다. 이 텍스트 필터 시스템은 Roblox 관련 속어, 약어 및 용어에 대해 수년 동안 동일한 필터 시스템을 최적화해 왔기 때문에 Roblox에서 정책 위반 언어를 탐지하는 데 탁월합니다. 이러한 학습 단계가 끝나면 오디오에서 직접 정책 위반을 실시간으로 감지할 수 있는 모델이 완성됩니다.

이 시스템에는 욕설과 같은 특정 키워드를 탐지하는 기능이 있지만 정책 위반이 단 한 단어로 끝나는 경우는 거의 없습니다. 한 단어는 어떤 상황에서는 문제가 있는 것처럼 보일 수 있지만 다른 상황에서는 문제가 없어 보일 수 있습니다. 기본적으로 이러한 유형의 위반에는 귀하가 말하는 내용, 말하는 방법 및 진술이 이루어지는 맥락이 포함됩니다.

컨텍스트를 더 잘 이해하기 위해 시퀀스 요약에 매우 뛰어난 변환기 기반 아키텍처의 기본 기능을 활용합니다. 오디오 스트림과 같은 일련의 데이터를 가져와 요약할 수 있습니다. 이 아키텍처를 사용하면 더 긴 오디오 시퀀스를 보존할 수 있으므로 단어뿐만 아니라 문맥과 억양도 감지할 수 있습니다. 이러한 요소가 모두 결합되면 입력은 오디오이고 출력은 분류(정책 위반 여부)인 최종 시스템이 완성됩니다. 이 시스템은 키워드와 정책 위반 문구를 감지할 수 있을 뿐만 아니라 의도를 판단하는 데 중요한 어조, 정서 및 기타 맥락도 감지할 수 있습니다. 정책을 위반하는 음성을 오디오에서 직접 감지하는 이 새로운 시스템은 기존 ASR 시스템보다 컴퓨팅 효율성이 훨씬 높기 때문에 사람들이 함께 모이는 방식을 계속 재구상하면서 확장이 훨씬 더 쉬워질 것입니다.

또한 이러한 유형의 언어로 인해 발생할 수 있는 잠재적인 결과에 대해 음성 통신 도구를 사용하는 사람들에게 경고할 수 있는 새로운 방법도 필요했습니다. 우리는 이 혁신적인 탐지 시스템을 활용하여 안전한 환경을 유지하기 위해 온라인 행동에 영향을 미치는 방법을 실험하고 있습니다. 우리는 사람들이 의도치 않게 정책을 위반하는 경우가 있다는 것을 알고 있으며, 가끔씩 상기시켜 주면 추가 위반을 방지하는 데 도움이 될 수 있는지 알고 싶습니다. 이를 돕기 위해 우리는 알림을 통한 실시간 사용자 피드백을 실험하고 있습니다. 귀하가 당사의 정책을 여러 차례 위반한 내용을 시스템에서 감지한 경우 당사는 귀하의 언어가 당사의 정책을 위반했음을 알리는 팝업 알림을 귀하의 화면에 표시하고 자세한 내용을 확인할 수 있는 당사의 정책으로 안내합니다.

그러나 음성 스트림 알림은 조정 시스템의 한 요소일 뿐입니다. 또한 플랫폼의 행동 패턴과 Roblox의 다른 사람들의 불만 사항을 검토하여 전반적인 검토 결정을 내립니다. 이러한 신호가 종합되면 오디오 기능에 대한 액세스가 취소되거나 더 심각한 위반의 경우 플랫폼에서 완전히 금지되는 등 더 강력한 결과가 발생할 수 있습니다. 멀티모달 AI 모델, 생성 AI 및 LLM의 이러한 발전이 함께 모여 제작자를 위한 놀라운 새 도구와 기능을 제공하므로 커뮤니티를 안전하고 정중하게 유지하는 것이 중요합니다. 

우리는 크리에이터에게 이러한 도구를 제공하면 경험이 부족한 크리에이터의 진입 장벽을 낮추고 경험이 많은 크리에이터는 이 프로세스의 더 지루한 작업에서 벗어날 수 있다고 믿습니다. 이를 통해 학생들은 미세 조정 및 아이디어 창출의 창의적인 측면에 더 많은 시간을 할애할 수 있습니다. 이 모든 것에 대한 우리의 목표는 모든 사람이 어디서나 자신의 아이디어를 실현할 수 있도록 하고 Roblox에서 사용할 수 있는 아바타, 아이템 및 경험의 다양성을 크게 늘리는 것입니다. 우리는 또한 새로운 창작물을 보호하는 데 도움이 되는 정보와 도구 공유

우리는 이미 놀라운 가능성을 상상하고 있습니다. 누군가가 사진에서 직접 도플갱어 아바타를 만들 수 있고, 아바타를 맞춤 설정하여 키를 더 크게 만들거나 애니메이션 스타일로 렌더링할 수 있다고 가정해 보겠습니다. 또는 어시스턴트에게 자동차, 건물, 풍경을 추가하고 조명이나 바람 조건을 설정하거나 지형을 변경하도록 요청하여 환경을 구축할 수도 있습니다. 그런 다음 어시스턴트와 앞뒤로 입력하는 것만으로 반복하여 개선할 수 있었습니다. 우리는 사람들이 이러한 도구를 사용하여 만드는 현실이 우리가 상상하는 것 이상으로 발전할 것임을 알고 있습니다.

타임 스탬프 :

더보기 Roblox