Inside the Tech は、当社のレポートに付随するブログ シリーズです。 テックトークポッドキャスト。 ポッドキャストのエピソード 19 では、 世界全体, Roblox の CEO、David Baszucki 氏がプロダクト シニア ディレクターの Zhen Fang 氏と、Roblox の国際戦略と、世界中の何千万人もの人々にローカライズされたエクスペリエンスを提供するために当社が解決している技術的課題について話しました。 Inside the Tech の今回の号では、エンジニアリング マネージャーの Ravali Kandur と対談し、それらの技術的課題の XNUMX つである多言語およびセマンティック検索について、そして Growth チームの取り組みが世界中の Roblox ユーザーの検索と迅速な発見にどのように役立っているかについて詳しく学びました。私たちのプラットフォームで彼らが望むものは何でも。
あなたのチームが取り組んでいる最大の技術的課題は何ですか?
約 XNUMX 年前まで、Roblox 検索は結果とユーザーの検索を照合するために語彙システムを使用していました。つまり、テキストの照合のみに焦点を当てていました。 しかし、検索行動は急速に変化しており、そのアプローチではユーザーに関連性の高いコンテンツを提供するにはもはや十分ではありません。 同時に、一部の Roblox ユーザーはクエリで間違ったスペルを使用する可能性があります。 したがって、彼らが求めているものに一致する結果を提案できる必要があります。これは、彼らの意図を理解することを意味します。
検索におけるもう XNUMX つの大きな問題は、複数の言語にわたるトレーニング データが不足していることです。 セマンティック検索の前に、最初のステップは Roblox システム内で機械翻訳を活用することでした。 翻訳にインデックスを付けてから、テキストの照合を行いました。 しかし、ユーザーに関連性のあるコンテンツを常に表示するにはそれだけでは十分ではありません。 そこで、私たちは生徒-教師モデルと呼ばれる、より最先端の ML 手法を採用しました。教師は、特定のシナリオに関するコンテキストの最大のソースから学習します。
英語は Roblox で最も使用されている言語です。そのため、私たちは英語でできる限り多くの意味関係 (教師モデル) を学習し、それを他の言語に拡張することで学生モデルに抽出します。 これは、特定の言語のデータがあまりない場合でも、その問題を解決するのに役立ちます。 これにより、日本での検索からの再生が 15% 増加しました。
私たちは最近、「đua xe (レーシング)」のようなカタログ クエリのサポートを改善することに取り組んでいます。 しかし、ユーザーは、次のような長い自由形式のクエリをより頻繁に送信するようになりました。「ドラゴンと女の子がそれと戦っているゲームをプレイしたことを覚えています。 それを見つけるのを手伝ってくれませんか?」 これにはさらに技術的な課題が伴いますが、私たちはこれらの方向に沿ってシステムを改善し続けています。
より多くのコンテキストとよりセマンティックな検索を組み込むための革新的なアプローチにはどのようなものがありますか?
私たちは、語彙検索を利用し、セマンティック検索とクエリの意図の理解を利用する ML 技術およびモデルと組み合わせたハイブリッド検索システムを構築しました。 私たちは、コンテキストの理解を構築し、複雑なクエリを処理し、関連するコンテンツを返すためにシステムを継続的に進化させています。
セマンティック検索の魔法は埋め込みにあります。埋め込みは、Roblox 全体から取得するさまざまなシグナルを豊富に表現したものです。 たとえば、ユーザー人口統計、ユーザーのクエリ、長さ、そのユニークな側面などのシグナルを組み込んでいます。
また、エクスペリエンス、アバター アイテム、エンゲージメントなどのコンテンツ シグナルにも注目しています。このゲームがどのくらいの頻度でプレイされたか、何人のユーザーが何カ国から参加したかなどです。 収益化や保持、エクスペリエンスのタイトル、説明、作成者などのメタデータもあります。 これらすべてを BERT ベースのトランスフォーマー ベースのアーキテクチャに通し、 多層パーセプトロン 最後に、真実のソースとなる埋め込みを生成します。
もう XNUMX つのイノベーションは、社内の類似性検索システムです。 ユーザーが検索クエリを作成すると、密接に関連するエンベディングを取得し、ランク付けして、ユーザーが探しているものと関連していることを確認します。 そして結果をユーザーに返します。
この技術的な作業を通じて学んだ重要なことは何ですか?
どの言語にも独自の課題があります。 特に検索では、最も関連性の高い結果を表示できるように、世界のさまざまな地域のユーザーが何を探しているのかを理解する必要があります。 私たちはさまざまな言語要素を理解する必要があります。 たとえば、事前トレーニングされたトランスフォーマーは、日本語の複数の方言を理解するために不可欠です。
次に、検索クエリのパターンはかなり変化しており、それに追いつくためにテクノロジー スタックを継続的に進化させる必要があります。 同時に、ユーザーが気づいていない可能性があるため、私たちのプラットフォームで何ができるかをユーザーに知らせる必要があります。 たとえば、検索がフリースタイル クエリ (レース ゲームや人気の食べ物ゲームなど) のようなものをサポートしていること、検索が人々が探しているものを理解し、適切な結果を返すことができることをユーザーに伝えることができます。
あなたのチームが最も共感するRobloxの価値はどれですか?
長期的な視点を持つことが私たちのチームの中核であり、それが私がRobloxで働くのが大好きな理由のXNUMXつです。
私のチームの一例は、ML および NLP ベースの検索システム (事前トレーニング済みの大規模モデルを使用したセマンティック検索、オートコンプリート、スペル修正) で構成される技術スタックです。
私たちは、毎日数千万人のアクティブ ユーザーが行うさまざまな種類の検索における再利用性を念頭に置いてこれを構築しました。 つまり、異なるタイプのデータ (たとえば、エクスペリエンスではなくアバター アイテム) を接続でき、最小限の変更で機能するはずです。
私たちはエクスペリエンスのセマンティック検索を組み込み、それをマーケットプレイスなどの他の業種と共有し、既存のアーキテクチャにそのまま飛びつくことができました。 完全にプラグアンドプレイではありませんが、微調整を行うことで、さまざまなユースケースに適応させることができます。
Roblox とあなたのチームがどこに向かっているのかについて、最も興奮していることは何ですか?
検索は、ユーザーが明示的な意図を表現する唯一の表面です。 つまり、彼らが何を望んでいるのかを理解し、最も適切な結果を提供することが不可欠であるということです。 したがって、私にとって、その意図を理解し、何が可能なのかをユーザーに教育することに取り組むのは、時にはユーザーが気付く前にさえ、本当にエキサイティングです。
どの国のユーザーも何かを尋ねることができ、私たちは彼らが望むもの、そして彼らにとって最も関連性のあるものを正確に提供することができます。 これにより信頼が構築され、定着率が向上します。 その信頼を築き、Roblox が XNUMX 億人のユーザーを持つという目標を達成できるよう、検索の改善に挑戦することに私は興奮しています。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://blog.roblox.com/2023/11/inside-the-tech-solving-for-multilingual-semantic-search/
- :持っている
- :は
- :not
- :どこ
- $UP
- 視聴者の38%が
- 19
- a
- できる
- 私たちについて
- 達成する
- 越えて
- アクティブ
- 適応する
- 採択
- 前
- 整列する
- すべて
- 沿って
- また
- 常に
- an
- および
- どれか
- アプローチ
- アプローチ
- 適切な
- 建築
- です
- 周りに
- AS
- 頼む
- 側面
- At
- オートコンプリート
- アバター
- BE
- になる
- き
- より良いです
- 最大の
- 10億
- ビット
- ブログ
- ビルド
- 構築します
- 内蔵
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- 呼ばれます
- 缶
- 例
- カタログ
- 最高経営責任者(CEO)
- 一定
- 挑戦する
- 課題
- 変更
- 変化
- 組み合わせ
- 複雑な
- からなる
- コンテンツ
- コンテキスト
- 連続
- 連続的に
- 基本
- 可能性
- 国
- 国
- クリエイター
- daily
- データ
- デイビッド
- 人口動態
- 説明
- DID
- 異なります
- 取締役
- ありません
- すること
- ドント
- Dragon
- エディション
- 教育する
- 要素は
- end
- エンジニアリング
- 確保
- エピソード
- 特に
- 本質的な
- さらに
- 進化
- 進化
- 正確に
- 例
- 興奮させる
- エキサイティング
- 既存の
- 体験
- エクスペリエンス
- 表現します
- 延伸
- 戦闘
- もう完成させ、ワークスペースに掲示しましたか?
- 名
- 焦点を当て
- フード
- 頻繁に
- から
- ゲーム
- Games
- 生成する
- 取得する
- 女の子
- 与える
- 世界
- 目標
- 成長性
- ハンドル
- 持ってる
- 持って
- 向かって
- 助けます
- 助け
- ことができます
- 認定条件
- HTTPS
- ハイブリッド
- i
- 改善します
- 向上させる
- 改善
- in
- Incorporated
- 組み込む
- 増える
- 索引付けされた
- 知らせます
- 革新的手法
- 革新的な
- 内部
- を取得する必要がある者
- 意図
- 世界全体
- IT
- リーディングシート
- ITS
- 日本
- 日本語
- ジャンプ
- ただ
- キープ
- キー
- 欠如
- 言語
- ESL, ビジネスESL <br> 中国語/フランス語、その他
- 大
- LEARN
- 学んだ
- ツェッペリン
- 活用します
- ような
- ライン
- 長い
- より長いです
- 探して
- たくさん
- 愛
- 機械
- 製
- マジック
- 主要な
- 作る
- マネージャー
- 多くの
- 市場
- 一致
- マッチング
- 五月..
- me
- 意味
- 手段
- 何百万
- マインド
- 最小限の
- ML
- MLテクニック
- モデル
- 収益化
- 他には?
- 最も
- の試合に
- my
- 必要
- いいえ
- of
- 頻繁に
- on
- ONE
- の
- or
- 元来の
- その他
- 私たちの
- 自分の
- 部品
- パターン
- のワークプ
- 完璧に
- プラットフォーム
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- 演奏
- 再生
- 演劇
- プラグ
- ポッドキャスト
- 人気
- 可能
- プレゼント
- 問題
- プロダクト
- 置きます
- クエリ
- すぐに
- 非常に
- レーシング
- ランク
- 実現する
- 本当に
- 理由は
- 最近
- の関係
- 関連した
- 覚えています
- 結果
- 保持
- return
- 富裕層
- ROBLOX
- 同じ
- シナリオ
- を検索
- 検索
- シニア
- シリーズ
- shared
- すべき
- 表示する
- 表示
- 信号
- So
- もっぱら
- 解決する
- 解決
- 一部
- 誰か
- 何か
- 時々
- ソース
- 特定の
- 綴り
- スタック
- 最先端の
- 手順
- 戦略
- 学生
- そのような
- 十分な
- 示唆する
- サポート
- 確か
- 表面
- システム
- 取る
- 取り
- 取得
- トーク
- 教師
- チーム
- テク
- 技術的
- 技術
- テクニック
- テクノロジー
- 言う
- 十
- 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다.
- それ
- 世界
- アプリ環境に合わせて
- それら
- その後
- そこ。
- ボーマン
- 彼ら
- 物事
- この
- それらの
- しかし?
- 介して
- 時間
- 役職
- 〜へ
- トレーニング
- トランスフォーマー
- 翻訳
- 信頼
- 真実
- 順番
- type
- わかる
- 理解する
- 理解する
- ユニーク
- us
- つかいます
- 中古
- ユーザー
- users
- 活用
- 値
- 多様
- 垂直
- 非常に
- 詳しく見る
- 欲しいです
- ました
- we
- WELL
- この試験は
- 何ですか
- いつ
- which
- なぜ
- Wikipedia
- 以内
- 仕事
- ワーキング
- 世界
- 年
- 貴社
- あなたの
- ゼファーネット