Inside the Tech ist eine Blogserie, die unsere begleitet Tech Talks-Podcast. In Folge 19 des Podcasts InternationalDavid Baszucki, CEO von Roblox, sprach mit Product Senior Director Zhen Fang über die internationale Strategie von Roblox und die technischen Herausforderungen, die wir lösen, um ein lokalisiertes Erlebnis für zig Millionen Menschen auf der ganzen Welt zu gewährleisten. In dieser Ausgabe von Inside the Tech haben wir mit Engineering Manager Ravali Kandur gesprochen, um mehr über eine dieser technischen Herausforderungen, die mehrsprachige und semantische Suche, zu erfahren und darüber, wie die Arbeit des Growth-Teams Roblox-Benutzern auf der ganzen Welt hilft, nach – und schnell zu finden – alles, was sie wollen, auf unserer Plattform.
Was ist die größte technische Herausforderung, der sich Ihr Team stellt?
Bis vor etwa einem Jahr verwendete die Roblox-Suche ein lexikalisches System, um Ergebnisse mit den Suchanfragen der Benutzer abzugleichen, was bedeutete, dass sie sich ausschließlich auf den Textabgleich konzentrierte. Doch das Suchverhalten ändert sich schnell und dieser Ansatz reicht nicht mehr aus, um Benutzern relevante Inhalte bereitzustellen. Gleichzeitig verwenden einige Roblox-Benutzer in ihren Abfragen möglicherweise eine falsche Schreibweise. Wir müssen also in der Lage sein, Ergebnisse vorzuschlagen, die ihren Wünschen entsprechen, was bedeutet, dass wir ihre Absicht verstehen.
Ein weiteres großes Problem bei der Suche ist der Mangel an sprachübergreifenden Trainingsdaten. Vor der semantischen Suche bestand unser erster Schritt darin, maschinelle Übersetzungen innerhalb des Roblox-Systems zu nutzen. Wir haben die Übersetzungen indiziert und dann einen Textabgleich durchgeführt. Dies reicht jedoch nicht aus, um den Benutzern immer relevante Inhalte anzuzeigen. Deshalb haben wir eine modernere ML-Technik namens Schüler-Lehrer-Modell übernommen: Der Lehrer lernt aus unserer größten Kontextquelle für ein bestimmtes Szenario.
Englisch ist die am häufigsten verwendete Sprache auf Roblox, weshalb wir so viele semantische Beziehungen wie möglich im Englischen lernen – dem Lehrermodell – und es dann zum Schülermodell destillieren, indem wir es auf andere Sprachen erweitern. Dies hilft uns, dieses Problem zu lösen, auch wenn wir in bestimmten Sprachen nicht über viele Daten verfügen. Dies hat in Japan zu einer 15-prozentigen Steigerung der aus der Suche stammenden Spiele geführt.
Wir haben in letzter Zeit daran gearbeitet, unsere Kataloganfragen wie „đua xe (Rennen)“ besser zu unterstützen. Aber Benutzer senden häufiger lange, frei formulierte Anfragen wie: „Hey, ich erinnere mich, dass ich ein Spiel gespielt habe, bei dem ein Drache und ein Mädchen damit kämpften.“ Können Sie mir helfen, das zu finden?“ Dies bringt weitere technische Herausforderungen mit sich und wir verbessern unsere Systeme in diesem Sinne weiter.
Welche innovativen Ansätze gibt es, um mehr Kontext und mehr semantische Suche zu integrieren?
Wir haben ein hybrides Suchsystem entwickelt, das die lexikalische Suche mit ML-Techniken und -Modellen kombiniert und dabei die semantische Suche und das Verständnis der Absicht einer Abfrage nutzt. Wir entwickeln unsere Systeme kontinuierlich weiter, um Kontextverständnis aufzubauen, komplexe Abfragen zu bearbeiten und relevante Inhalte zurückzugeben.
Die Magie der semantischen Suche liegt in den Einbettungen, bei denen es sich um reichhaltige Darstellungen einer Vielzahl von Signalen handelt, die wir von überall in Roblox erhalten. Wir integrieren beispielsweise Signale wie Benutzerdemografie, die Anfrage eines Benutzers, wie lange es dauert oder was seine einzigartigen Aspekte sind.
Wir betrachten auch Inhaltssignale wie Erfahrungen, Avatar-Elemente und Engagement – wie oft wurde dieses Spiel gespielt oder wie viele Benutzer hatte es und aus wie vielen Ländern? Es gibt auch Dinge wie Monetarisierung und Aufbewahrung sowie Metadaten wie den Titel, die Beschreibung oder den Ersteller einer Erfahrung. Wir haben all dies einer BERT-basierten, transformatorbasierten Architektur unterzogen und verwenden a Mehrschichtiges Perzeptron am Ende, um Einbettungen zu generieren, die unsere Quelle der Wahrheit werden.
Eine weitere Neuerung ist unser hauseigenes Ähnlichkeitssuchsystem. Wenn jemand eine Suchanfrage stellt, rufen wir die eng verwandten Einbettungen ab und ordnen sie, um sicherzustellen, dass sie für das, was der Benutzer sucht, relevant sind. Und dann geben wir die Ergebnisse an die Benutzer zurück.
Was sind einige der wichtigsten Dinge, die Sie bei dieser technischen Arbeit gelernt haben?
Jede Sprache stellt ihre eigene, einzigartige Herausforderung dar. Und insbesondere bei der Suche müssen wir verstehen, wonach Benutzer in verschiedenen Teilen der Welt suchen, damit wir ihnen die relevantesten Ergebnisse anzeigen können. Wir müssen verschiedene Sprachelemente verstehen. Beispielsweise waren vorab trainierte Transformatoren für das Verständnis der verschiedenen japanischen Dialekte unerlässlich.
Zweitens haben sich die Suchmuster stark verändert und wir müssen unseren Technologie-Stack kontinuierlich weiterentwickeln, um mithalten zu können. Gleichzeitig müssen wir unsere Nutzer darüber informieren, was auf unserer Plattform möglich ist, da sie sich dessen möglicherweise nicht bewusst sind. Wir könnten unseren Benutzern beispielsweise mitteilen, dass die Suche Dinge wie Freestyle-Suchanfragen unterstützen kann (z. B. Rennspiele oder beliebte Essensspiele) und dass sie versteht, wonach die Leute suchen, und entsprechende Ergebnisse liefern kann.
Welchem Roblox-Wert entspricht Ihr Team am meisten?
Der Weitblick ist für unser Team von zentraler Bedeutung und einer der Gründe, warum ich die Arbeit bei Roblox liebe.
Ein Beispiel aus meinem Team ist unser Tech-Stack, der aus unseren ML- und NLP-basierten Suchsystemen besteht – semantische Suche, automatische Vervollständigung und Rechtschreibkorrektur mithilfe vorab trainierter großer Modelle.
Wir haben dies im Hinblick auf die Wiederverwendbarkeit für verschiedene Suchtypen unserer zig Millionen täglich aktiven Benutzer entwickelt. Das bedeutet, dass wir eine andere Art von Daten einbinden können (z. B. Avatar-Elemente anstelle von Erfahrungen), und es sollte mit sehr minimalen Änderungen funktionieren.
Wir haben die semantische Suche nach Erlebnissen integriert und diese mit anderen Branchen wie Marketplace geteilt, sodass sie einfach auf die bestehende Architektur zurückgreifen konnten. Es ist nicht perfekt Plug-and-Play, aber mit etwas Feinabstimmung können wir es an verschiedene Anwendungsfälle anpassen.
Was begeistert Sie am meisten an der Entwicklung von Roblox und Ihrem Team?
Die Suche ist die einzige Oberfläche, auf der Benutzer ihre ausdrückliche Absicht zum Ausdruck bringen. Und das bedeutet, dass es wichtig ist, dass wir verstehen, was sie wollen, und ihnen die relevantesten Ergebnisse liefern. Daher ist es für mich wirklich spannend, daran zu arbeiten, diese Absicht zu verstehen und unsere Benutzer darüber aufzuklären, was möglich ist, manchmal sogar bevor der Benutzer es erkennt.
Ein Benutzer in jedem Land kann etwas fragen und wir können ihm genau das geben, was er möchte und das für ihn am relevantesten ist. Dadurch wird Vertrauen aufgebaut, was wiederum die Kundenbindung verbessert. Für mich ist es spannend, die Herausforderung anzunehmen, die Suche zu verbessern, um dieses Vertrauen aufzubauen und Roblox dabei zu helfen, unser Ziel zu erreichen, eine Milliarde Nutzer zu haben.
- SEO-gestützte Content- und PR-Distribution. Holen Sie sich noch heute Verstärkung.
- PlatoData.Network Vertikale generative KI. Motiviere dich selbst. Hier zugreifen.
- PlatoAiStream. Web3-Intelligenz. Wissen verstärkt. Hier zugreifen.
- PlatoESG. Kohlenstoff, CleanTech, Energie, Umwelt, Solar, Abfallwirtschaft. Hier zugreifen.
- PlatoHealth. Informationen zu Biotechnologie und klinischen Studien. Hier zugreifen.
- Quelle: https://blog.roblox.com/2023/11/inside-the-tech-solving-for-multilingual-semantic-search/
- :hast
- :Ist
- :nicht
- :Wo
- $UP
- 15%
- 19
- a
- Fähig
- Über Uns
- Erreichen
- über
- aktiv
- automatisch
- angenommen
- vor
- ausrichten
- Alle
- entlang
- ebenfalls
- immer
- an
- und
- jedem
- Ansatz
- Ansätze
- angemessen
- Architektur
- SIND
- um
- AS
- fragen
- Aspekte
- At
- Autovervollständigen
- Benutzerbild
- BE
- werden
- war
- Bevor
- Besser
- Größte
- Milliarde
- Bit
- Blog
- bauen
- baut
- erbaut
- aber
- by
- namens
- CAN
- Fälle
- Katalog
- CEO
- sicher
- challenges
- Herausforderungen
- Änderungen
- Ändern
- vereint
- Komplex
- besteht
- Inhalt
- Kontext
- fortgesetzt
- ständig
- Kernbereich
- könnte
- Ländern
- Land
- Schöpfer
- Unterricht
- technische Daten
- Christian
- Demographie
- Beschreibung
- DID
- anders
- Direktor
- die
- Dabei
- Nicht
- Drache
- Ausgabe
- Erziehung
- Elemente
- Ende
- Entwicklung
- gewährleisten
- Folge anschauen
- insbesondere
- essential
- Sogar
- entwickelt sich
- sich entwickelnden
- genau
- Beispiel
- erregt
- unterhaltsame Programmpunkte
- vorhandenen
- ERFAHRUNGEN
- Erfahrungen
- express
- Verlängerung
- Kampf
- Finden Sie
- Vorname
- konzentriert
- Nahrung,
- Aussichten für
- häufig
- für
- Spiel
- Games
- erzeugen
- bekommen
- Mädchen
- ABSICHT
- Globus
- Kundenziele
- Wachstum
- Griff
- Haben
- mit
- Leitung
- Hilfe
- Unternehmen
- hilft
- Ultraschall
- HTTPS
- Hybrid
- i
- zu unterstützen,
- verbessert
- Verbesserung
- in
- Incorporated
- einarbeiten
- Erhöhung
- indiziert
- informieren
- Innovation
- innovativ
- innerhalb
- beantragen müssen
- Absicht
- International
- IT
- Artikel
- SEINE
- Japan
- Japanisch
- springen
- nur
- Behalten
- Wesentliche
- Mangel
- Sprache
- Sprachen
- grosse
- LERNEN
- gelernt
- geführt
- Hebelwirkung
- Gefällt mir
- Linien
- Lang
- länger
- suchen
- Los
- ich liebe
- Maschine
- gemacht
- Magie
- Dur
- MACHT
- Manager
- viele
- Marktplatz
- Spiel
- Abstimmung
- Kann..
- me
- Bedeutung
- Mittel
- Metadaten
- Millionen
- Geist / Bewusstsein
- minimal
- ML
- ML-Techniken
- Modell
- für
- Monetisierung
- mehr
- vor allem warme
- mehrere
- my
- Need
- nicht
- of
- vorgenommen,
- on
- EINEM
- einzige
- or
- Ursprung
- Andere
- UNSERE
- besitzen
- Teile
- Muster
- Personen
- perfekt
- Plattform
- Plato
- Datenintelligenz von Plato
- PlatoData
- gespielt
- spielend
- spielt
- Stecker
- Podcast
- Beliebt
- möglich
- Geschenke
- Aufgabenstellung:
- Produkt
- setzen
- Abfragen
- schnell
- ganz
- Renn-
- Rang
- realisieren
- wirklich
- Gründe
- kürzlich
- Beziehungen
- relevant
- merken
- Die Ergebnisse
- Beibehaltung
- Rückkehr
- Reiches
- Roblox
- gleich
- Szenario
- Suche
- Suchbegriffe
- Senior
- Modellreihe
- von Locals geführtes
- sollte
- erklären
- zeigt
- Signale
- So
- allein
- LÖSEN
- Auflösung
- einige
- Jemand,
- etwas
- manchmal
- Quelle
- spezifisch
- Rechtschreibung
- Stapel
- State-of-the-art
- Schritt
- Strategie
- Schüler und Studenten
- so
- ausreichend
- vorschlagen
- Support
- sicher
- Oberfläche
- System
- Systeme und Techniken
- Nehmen
- nimmt
- Einnahme
- Gespräche
- Lehrer
- Team
- Tech
- Technische
- Technik
- Techniken
- Technologie
- erzählen
- Zehn
- Text
- zur Verbesserung der Gesundheitsgerechtigkeit
- Das
- die Welt
- ihr
- Sie
- dann
- Dort.
- Diese
- vom Nutzer definierten
- fehlen uns die Worte.
- diejenigen
- obwohl?
- Durch
- Zeit
- Titel
- zu
- Ausbildung
- Transformer
- Übersetzungen
- Vertrauen
- Wahrheit
- WENDE
- tippe
- Typen
- verstehen
- Verständnis
- versteht
- einzigartiges
- us
- -
- benutzt
- Mitglied
- Nutzer
- Verwendung von
- Verwendung
- Wert
- Vielfalt
- Vertikalen
- sehr
- Anzeigen
- wollen
- wurde
- we
- GUT
- Was
- Was ist
- wann
- welche
- warum
- Wikipedia
- mit
- .
- Arbeiten
- arbeiten,
- weltweit wie ausgehandelt und gekauft ausgeführt wird.
- Jahr
- U
- Ihr
- Zephyrnet