Inside the Tech är en bloggserie som följer med vår Tech Talks Podcast. I avsnitt 19 av podden, Internationell, Roblox VD David Baszucki pratade med Product Senior Director Zhen Fang om Roblox internationella strategi och de tekniska utmaningar vi löser för att säkerställa en lokal upplevelse för tiotals miljoner människor runt om i världen. I den här utgåvan av Inside the Tech pratade vi med teknikchefen Ravali Kandur för att lära oss mer om en av dessa tekniska utmaningar, flerspråkig och semantisk sökning, och hur Growth-teamets arbete hjälper Roblox-användare över hela världen att söka efter – och snabbt hitta – allt de vill ha på vår plattform.
Vilken är den största tekniska utmaningen som ditt team antar?
Fram till för ungefär ett år sedan använde Roblox Search ett lexikalt system för att matcha resultat till användarnas sökningar, vilket innebär att det enbart fokuserade på textmatchning. Men sökbeteenden förändras snabbt och det tillvägagångssättet räcker inte längre för att ge användarna relevant innehåll. Samtidigt kan vissa Roblox-användare använda felaktig stavning i sina frågor. Så vi måste kunna föreslå resultat som matchar det de letar efter, vilket innebär att förstå deras avsikt.
Ett annat stort problem vid sökning är bristen på träningsdata över språk. Innan semantisk sökning var vårt första steg att utnyttja maskinöversättningar inom Roblox-systemet. Vi indexerade översättningarna och gjorde sedan en textmatchning. Men det är inte tillräckligt för att alltid visa användarnas relevant innehåll. Så vi har antagit en mer toppmodern ML-teknik som kallas en elev-lärarmodell: läraren lär sig från vår största källa till sammanhang för ett specifikt scenario.
Engelska är det mest använda språket på Roblox, vilket är anledningen till att vi lär oss så många semantiska relationer som vi kan på engelska – lärarmodellen – och sedan destillerar vi det till elevmodellen genom att utöka det till andra språk. Detta hjälper oss att lösa det problemet även om vi inte har mycket data på vissa språk. Detta har lett till en ökning med 15 % av pjäser som kommer från sök i Japan.
Vi har nyligen arbetat för att bättre stödja våra katalogfrågor som "đua xe (racing)." Men användare skickar oftare in långa frågor i fritt format, som "Hej, jag minns att jag spelade ett spel där det fanns en drake och en tjej som slogs med den. Kan du hjälpa mig att hitta det?” Detta innebär fler tekniska utmaningar och vi fortsätter att förbättra våra system i denna linje.
Vilka är några av de innovativa metoderna för att införliva mer sammanhang och mer semantiskt sökning?
Vi har byggt ett hybridsöksystem som tar lexikal sökning och kombinerar den med ML-tekniker och modeller som använder semantisk sökning och förståelsen av en frågas avsikt. Vi utvecklar kontinuerligt våra system för att bygga upp sammanhangsförståelse, hantera komplexa frågor och returnera relevant innehåll.
Det magiska med semantisk sökning ligger i inbäddningarna, som är rika representationer av en mängd olika signaler vi får från hela Roblox. Till exempel införlivar vi signaler som användardemografi, en användares fråga, hur lång den är eller vilka dess unika aspekter är.
Vi tittar också på innehållssignaler, som upplevelser, avatarobjekt och engagemang – hur ofta spelades det här spelet eller hur många användare hade det, och från hur många länder? Det finns också saker som intäktsgenerering och lagring, såväl som metadata som en upplevelses titel, beskrivning eller skapare. Vi lägger alla dessa genom en BERT-baserad, transformatorbaserad arkitektur och vi använder en Flerskiktsperceptron i slutet för att generera inbäddningar, som blir vår källa till sanning.
En annan innovation är vårt interna system för likhetssökning. När någon gör en sökfråga hämtar vi de närbesläktade inbäddningarna och rangordnar dem för att vara säker på att de är relevanta för det användaren letar efter. Och sedan returnerar vi resultaten till användarna.
Vilka är några av de viktigaste sakerna som du har lärt dig av det här tekniska arbetet?
Varje språk presenterar sin egen unika utmaning. Och speciellt med sökning måste vi förstå vad användare i olika delar av världen letar efter så att vi kan visa dem de mest relevanta resultaten. Vi måste förstå olika språkelement. Till exempel har förutbildade transformatorer varit avgörande för att förstå de många japanska dialekterna.
För det andra har sökfrågemönster förändrats ganska mycket och vi måste kontinuerligt utveckla vår teknikstapel för att hänga med. Samtidigt måste vi informera våra användare om vad som är möjligt på vår plattform, eftersom de kanske inte inser det. Vi kan till exempel berätta för våra användare att sökning kan stödja saker som freestyle-frågor (som racingspel eller populära matspel) och att den förstår vad folk letar efter och kan ge lämpliga resultat.
Vilket Roblox-värde följer ditt team mest?
Att se på lång sikt är kärnan i vårt team och det är en av anledningarna till att jag älskar att jobba på Roblox.
Ett exempel från mitt team är vår tekniska stack, som består av våra ML- och NLP-baserade söksystem – semantisk sökning, autokomplettering och stavningskorrigering med förtränade stora modeller.
Vi har byggt detta med återanvändbarhet i åtanke över olika typer av sökningar som görs av våra tiotals miljoner dagliga aktiva användare. Det betyder att vi kan koppla in en annan typ av data (till exempel avatarobjekt istället för upplevelser), och det bör fungera med mycket minimala ändringar.
Vi har införlivat semantiskt sökande efter upplevelser, och vi har delat det med andra vertikaler som Marketplace, och de har bara kunnat hoppa på den befintliga arkitekturen. Det är inte perfekt plug-and-play, men med lite finjustering kan vi anpassa det för olika användningsfall.
Vad upphetsar dig mest med vart Roblox och ditt team är på väg?
Sökning är den enda ytan där användare uttrycker sin uttryckliga avsikt. Och det betyder att det är viktigt att vi förstår vad de vill ha och ger dem de mest relevanta resultaten. Så det är verkligen spännande för mig att arbeta med att förstå denna avsikt och utbilda våra användare om vad som är möjligt, ibland till och med innan användaren inser det.
En användare i vilket land som helst kan fråga något och vi kan ge dem exakt vad de vill ha och det är mest relevant för dem. Detta skapar förtroende som i sin tur förbättrar retentionen. Det är spännande för mig att anta utmaningen att förbättra sökningen för att bygga upp det förtroendet och hjälpa Roblox att nå vårt mål att ha en miljard användare.
- SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
- PlatoData.Network Vertical Generative Ai. Styrka dig själv. Tillgång här.
- PlatoAiStream. Web3 Intelligence. Kunskap förstärkt. Tillgång här.
- Platoesg. Kol, CleanTech, Energi, Miljö, Sol, Avfallshantering. Tillgång här.
- PlatoHealth. Biotech och kliniska prövningar Intelligence. Tillgång här.
- Källa: https://blog.roblox.com/2023/11/inside-the-tech-solving-for-multilingual-semantic-search/
- : har
- :är
- :inte
- :var
- $UPP
- 15%
- 19
- a
- Able
- Om oss
- Uppnå
- tvärs
- aktiv
- anpassa
- antagen
- sedan
- rikta
- Alla
- längs
- också
- alltid
- an
- och
- vilken som helst
- tillvägagångssätt
- tillvägagångssätt
- lämpligt
- arkitektur
- ÄR
- runt
- AS
- be
- aspekter
- At
- automatisk komplettering
- Avatar
- BE
- blir
- varit
- innan
- Bättre
- störst
- Miljarder
- Bit
- Blogg
- SLUTRESULTAT
- bygger
- byggt
- men
- by
- kallas
- KAN
- fall
- katalog
- VD
- vissa
- utmanar
- utmaningar
- Förändringar
- byte
- kombinerar
- komplex
- består
- innehåll
- sammanhang
- fortsätter
- kontinuerligt
- Kärna
- kunde
- länder
- land
- skaparen
- dagligen
- datum
- David
- Demografi
- beskrivning
- DID
- olika
- Direktör
- gör
- gör
- inte
- drake
- edition
- utbilda
- element
- änden
- Teknik
- säkerställa
- episod
- speciellt
- väsentlig
- Även
- utvecklas
- utvecklas
- exakt
- exempel
- exciterade
- spännande
- befintliga
- erfarenhet
- Erfarenheter
- uttrycker
- sträcker
- bekämpa
- hitta
- Förnamn
- fokuserade
- livsmedelsproduktion
- För
- ofta
- från
- lek
- Games
- generera
- skaffa sig
- Flicka
- Ge
- globen
- Målet
- Tillväxt
- hantera
- Har
- har
- headed
- hjälpa
- hjälpa
- hjälper
- Hur ser din drömresa ut
- HTTPS
- Hybrid
- i
- förbättra
- förbättrar
- förbättra
- in
- Inkorporerad
- införlivande
- Öka
- indexeras
- underrätta
- Innovation
- innovativa
- inuti
- istället
- uppsåt
- Internationell
- IT
- artikel
- DESS
- Japan
- japanska
- hoppa
- bara
- Ha kvar
- Nyckel
- Brist
- språk
- Språk
- Large
- LÄRA SIG
- lärt
- Led
- Hävstång
- tycka om
- rader
- Lång
- längre
- du letar
- Lot
- älskar
- Maskinen
- gjord
- magi
- större
- GÖR
- chef
- många
- marknadsplats
- Match
- matchande
- Maj..
- me
- betyder
- betyder
- metadata
- miljoner
- emot
- minimum
- ML
- ML -tekniker
- modell
- modeller
- intäktsgenerering
- mer
- mest
- multipel
- my
- Behöver
- Nej
- of
- Ofta
- on
- ONE
- endast
- or
- ursprung
- Övriga
- vår
- egen
- reservdelar till din klassiker
- mönster
- Personer
- perfekt
- plattform
- plato
- Platon Data Intelligence
- PlatonData
- spelat
- i
- spelar
- kontakt
- podcast
- Populära
- möjlig
- presenterar
- Problem
- Produkt
- sätta
- sökfrågor
- snabbt
- ganska
- Racing
- rangordna
- inser
- verkligen
- skäl
- nyligen
- Förhållanden
- relevanta
- ihåg
- Resultat
- retentionstid
- avkastning
- Rik
- Roblox
- Samma
- scenario
- Sök
- sök
- senior
- Serier
- delas
- skall
- show
- visar
- signaler
- So
- enbart
- LÖSA
- Lösa
- några
- någon
- något
- ibland
- Källa
- specifik
- stavning
- stapel
- state-of-the-art
- Steg
- Strategi
- student
- sådana
- tillräcklig
- föreslå
- stödja
- säker
- yta
- system
- System
- Ta
- tar
- tar
- Talks
- lärare
- grupp
- tech
- Teknisk
- Tekniken
- tekniker
- Teknologi
- tala
- tiotals
- text
- den där
- Smakämnen
- världen
- deras
- Dem
- sedan
- Där.
- Dessa
- de
- saker
- detta
- de
- fastän?
- Genom
- tid
- Titel
- till
- Utbildning
- transformatorer
- Översättningar
- Litar
- sanningen
- SVÄNG
- Typ
- typer
- förstå
- förståelse
- förstår
- unika
- us
- användning
- Begagnade
- Användare
- användare
- med hjälp av
- Använda
- värde
- mängd
- vertikaler
- mycket
- utsikt
- vill
- var
- we
- VÄL
- Vad
- Vad är
- när
- som
- varför
- wikipedia
- med
- inom
- Arbete
- arbetssätt
- världen
- år
- dig
- Din
- zephyrnet