Inside the Tech - Giải quyết các bản dịch tự động trên Roblox - Blog Roblox

Inside the Tech – Giải quyết các bản dịch tự động trên Roblox – Blog Roblox

Nút nguồn: 2964647

Inside the Tech là một chuỗi blog gắn liền với Podcast nói chuyện công nghệ. Trong tập 19, International, Giám đốc điều hành Roblox David Baszucki đã nói chuyện với Zhen Fang, Giám đốc quốc tế, về việc giải quyết vấn đề dịch tự động và tìm kiếm đa ngôn ngữ. Trong ấn bản Inside the Tech này, chúng tôi đã trò chuyện với Giám đốc kỹ thuật Kyle Spence về một số thách thức kỹ thuật chính của nhóm Người sáng tạo: tự động dịch nội dung Roblox sang 15 ngôn ngữ mà chúng tôi hỗ trợ. Khi làm như vậy, chúng tôi đang giúp người dùng hiểu nội dung cả trên nền tảng và trải nghiệm, bất kể nội dung đó bằng ngôn ngữ nào. Khi làm như vậy, chúng tôi đảm bảo trải nghiệm được bản địa hóa cho hàng chục triệu người trên toàn cầu.

Hãy cho chúng tôi biết về những thách thức kỹ thuật lớn mà nhóm của bạn đang cố gắng giải quyết?

Roblox là một nền tảng để giao tiếp và kết nối thông qua trải nghiệm 3D. Người sáng tạo có thể tạo và chia sẻ bất cứ thứ gì họ muốn trên Roblox. Và nền tảng của chúng tôi cho phép họ chia sẻ những sáng tạo của mình với mọi người từ khắp nơi trên thế giới. Tuy nhiên, mặc dù cộng đồng toàn cầu của chúng tôi rất lớn nhưng nhiều người sáng tạo chỉ nói một ngôn ngữ. Điều này có thể khiến mọi người khó giao tiếp với nhau trên nền tảng của chúng tôi. 

Chúng tôi muốn mọi người thưởng thức nội dung của bất kỳ người sáng tạo nào cũng như tương tác và kết bạn, bất kể họ sống ở đâu và nói ngôn ngữ gì. Vì vậy, để vượt qua rào cản ngôn ngữ, chúng tôi cần có khả năng bản địa hóa những gì mọi người nhìn và nghe trong thời gian thực bằng 15 ngôn ngữ. 

Chúng tôi có các biên dịch viên nội bộ, những người có thể dễ dàng xử lý những việc đã được thiết lập lâu dài hơn như điều hướng và hướng dẫn trên trang web của chúng tôi. Nhưng đó là một thách thức lớn hơn nhiều khi chúng tôi không biết người sáng tạo đang làm gì và vì vậy ban đầu chúng tôi tập trung vào việc cố gắng cung cấp bản dịch tự động cho trải nghiệm của người sáng tạo. Thử thách kỹ thuật lớn tiếp theo của chúng tôi sẽ là thực hiện dịch tự động trên tất cả các loại nội dung, từ văn bản đến hình ảnh, lưới 3D, vật phẩm hình đại diện, sản phẩm trò chơi, thẻ trò chơi, huy hiệu, v.v. 

Cuối cùng, chúng tôi hy vọng hầu hết mọi người sẽ có thể sử dụng Roblox và thậm chí không nhận ra bất cứ điều gì được dịch vì mọi thứ đều bằng ngôn ngữ tự nhiên của họ. 

Một số giải pháp đổi mới mà chúng tôi đang xây dựng để giải quyết những thách thức kỹ thuật này là gì?

Khi nói đến dịch văn bản, giọng nói và hình ảnh, chúng tôi bắt đầu sử dụng xử lý ngôn ngữ tự nhiên (NLP), kết hợp một số khả năng thành thạo ML mà chúng tôi có tại Roblox. Việc triển khai NLP yêu cầu xây dựng các mô hình dịch thuật của riêng chúng tôi, mô hình này hiệu quả hơn đáng kể. Theo thời gian, chúng tôi sẽ tiếp tục cải thiện về chất lượng và yếu tố chi phí. Trên thực tế, chúng tôi đã giảm hơn 70% chi phí cho các mô hình dịch thuật trải nghiệm của mình trong năm nay. 

Một điều nữa là dịch thành công tất cả các loại nội dung, bao gồm cả hình ảnh, giống như một ký hiệu viết tay. Đó là một ví dụ về việc chúng tôi đang xem xét cách dịch ngoài văn bản đã nhập.

Và chúng tôi cũng bắt đầu thấy được sự tiến bộ trong công việc nghiên cứu về dịch trò chuyện thoại. Vì vậy, hãy tưởng tượng một người nói tiếng Đức đang trò chuyện trên Roblox với một người nói tiếng Anh. Mỗi người sẽ nghe những gì người kia nói—đặc điểm giọng nói, nhịp điệu, cảm xúc—ở độ trễ thấp nhưng bằng ngôn ngữ của chính họ.

Chúng tôi muốn độ trễ thấp, điều này khó thực hiện với nhiều ngôn ngữ do cấu trúc câu khác nhau. Nhưng Roblox có một số lợi ích thú vị khi xây dựng mô hình dịch thuật. Nội dung của chúng tôi có nhiều khả năng dự đoán được trong cách mọi người nói chuyện, bất kể ngôn ngữ của họ và điều đó thực sự hữu ích cho việc đào tạo người mẫu của chúng tôi. Vì vậy, khi ai đó nói điều gì đó trên Roblox, có thể sẽ có một âm thanh cụ thể sẽ theo sau. Điều đó có thể thu hẹp khá nhiều không gian ngôn ngữ.

Những bài học quan trọng khi thực hiện công việc kỹ thuật này là gì?

Một là người dịch bên thứ ba không hiểu các ngữ cảnh cụ thể của Roblox, chẳng hạn như một chướng ngại vật (hoặc chướng ngại vật), vì vậy họ không thể dịch những thứ như vậy sang nhiều ngôn ngữ. Nhưng việc cung cấp một số hiểu biết sẽ giúp người chơi có thời gian vui vẻ hơn. 

Vì vậy, chúng tôi đào tạo các mô hình của mình về nội dung Roblox, điều đó có nghĩa là chúng có thể cung cấp các bản dịch chất lượng cao hơn. Sau đó, chúng ta có thể quyết định mức chất lượng mà chúng ta mong muốn và điều chỉnh theo những thay đổi trong ngôn ngữ theo thời gian. Ví dụ, tiếng lóng của 10 năm trước không phải là tiếng lóng ngày nay. Vì vậy chúng tôi luôn cập nhật những mẫu này. Hệ thống của chúng tôi mang lại cho chúng tôi cảm nhận khá hợp lý về cách chúng tôi phản ứng với nội dung mà chúng tôi chưa thấy và cách đào tạo các mô hình để cải thiện chúng.

Chúng tôi cũng phải thích ứng với quy mô khổng lồ của mình. Khi người sáng tạo xây dựng nhiều trải nghiệm hơn và khi có nhiều người giao tiếp trên nền tảng của chúng tôi hơn, chúng tôi cần phát triển những cách thông minh để sử dụng mô hình, chiến lược bộ nhớ đệm và chiến lược lưu trữ trong mọi trường hợp sử dụng. 

Vì vậy, nhà phát triển có thể làm cho trải nghiệm ở Hoa Kỳ trở nên phổ biến ở Nhật Bản, mặc dù họ không nói tiếng Nhật và không quảng bá trải nghiệm đó ở đó. Nhưng bây giờ họ có thể có một Cơ sở người dùng Nhật Bản một phần là do dịch tự động. Và người chơi có thể tạo kết nối thực sự trên Roblox với mọi người từ khắp nơi trên thế giới có nền tảng văn hóa khác nhau. Điều đó thật thú vị vì mục tiêu chung của nhóm chúng tôi là kết nối mọi người và mở rộng phạm vi tiếp cận nội dung của người sáng tạo.

Giá trị Roblox nào phù hợp nhất với công việc của nhóm bạn?

Chúng tôi thực sự tập trung vào sự đổi mới và hướng tới những vụ đặt cược điên rồ này phù hợp với tầm nhìn của chúng tôi đối với nền tảng. Chúng tôi không ngừng thực hiện chúng mặc dù chúng tôi có thể thất bại. Chúng tôi nghiền nát nó và làm cho nó hoạt động, ngay cả khi chưa có tiền lệ nào để tuân theo.

Đó là một trong những điều chính mà tôi yêu thích ở Roblox—đưa ra những ý tưởng điên rồ và được lãnh đạo nói: “Hãy xem liệu chúng ta có thể làm cho nó thành công hay không”. Miễn là chúng ta học được từ nó thì điều đó đáng để mạo hiểm.

Điều gì khiến bạn phấn khích nhất về vị trí mà nhóm của bạn và Roblox nói chung đang hướng tới?

Làm việc trên các dự án đầy thử thách, thú vị, sáng tạo, trong đó thành công có nghĩa là tác động lớn đến xã hội, làm cho thế giới nhỏ hơn và kết nối mọi người lại với nhau. Một phần quan trọng là tâm lý ưu tiên kỹ thuật của chúng tôi: lãnh đạo có những ý tưởng cấp cao nhưng tin tưởng những người trong nhóm sẽ quyết định cách chúng tôi đạt được điều đó. Có được sự hỗ trợ từ cấp trên thực sự quan trọng.

Và trong các nhóm, chúng tôi thực sự hợp tác. Chúng tôi nhìn vào mã của người khác mà không có cái tôi. Bạn có thể thách thức các ý tưởng nếu chúng ta nảy ra được điều gì đó thực sự mạnh mẽ.

Dấu thời gian:

Thêm từ ROBLOX