Az Inside the Tech egy blogsorozat, amely a mi oldalunkat kíséri Tech Talks podcast. A podcast 19. epizódjában Nemzetközi , David Baszucki, a Roblox vezérigazgatója Zhen Fang termékvezető igazgatóval beszélgetett a Roblox nemzetközi stratégiájáról és azokról a technikai kihívásokról, amelyeket megoldunk, hogy világszerte több tízmillió ember számára biztosítsuk a helyi élményt. Az Inside the Tech jelen kiadásában Ravali Kandur mérnöki menedzserrel beszélgettünk, hogy többet megtudjunk az egyik technikai kihívásról, a többnyelvű és szemantikai keresésről, valamint arról, hogy a Growth csapat munkája hogyan segíti a Roblox-felhasználókat szerte a világon keresni és gyorsan megtalálni bármit, amit akarnak a platformunkon.
Mi a csapatod legnagyobb technikai kihívása?
Körülbelül egy évvel ezelőttig a Roblox keresés egy lexikális rendszert használt, hogy az eredményeket a felhasználók kereséseivel párosítsa, vagyis kizárólag a szövegegyeztetésre összpontosított. A keresési szokások azonban gyorsan változnak, és ez a megközelítés már nem elegendő ahhoz, hogy releváns tartalmat biztosítson a felhasználóknak. Ugyanakkor egyes Roblox-felhasználók hibásan írják le a lekérdezéseket. Tehát olyan eredményeket kell tudnunk javasolni, amelyek megfelelnek annak, amit keresnek, ami azt jelenti, hogy meg kell értenünk a szándékukat.
A keresés másik nagy problémája a képzési adatok hiánya a nyelveken. A szemantikus keresés előtt az első lépésünk a gépi fordítások kihasználása volt a Roblox rendszeren belül. A fordításokat indexeltük, majd szövegegyeztetést készítettünk. Ez azonban nem elegendő ahhoz, hogy mindig releváns tartalmat jelenítsen meg a felhasználóknak. Tehát egy korszerűbb ML technikát alkalmaztunk, amelyet diák-tanár modellnek nevezünk: a tanár a mi kontextusunk legnagyobb forrásából tanul bármilyen konkrét forgatókönyv esetén.
Az angol a leggyakrabban használt nyelv a Robloxon, ezért tanulunk meg annyi szemantikai kapcsolatot, amennyit csak tudunk az angolban – a tanári modellben –, majd ezt más nyelvekre kiterjesztve a tanulói modellre desztilláljuk. Ez segít megoldani ezt a problémát, még akkor is, ha bizonyos nyelveken nincs sok adatunk. Ennek eredményeként Japánban 15%-kal nőtt a keresésből származó darabok száma.
A közelmúltban azon dolgoztunk, hogy jobban támogassuk katalóguskérdéseinket, például a „đua xe (versenyzés”). De a felhasználók gyakrabban küldenek be hosszú, szabad formájú lekérdezéseket, például: „Hé, emlékszem, hogy játszottam egy játékkal, ahol egy sárkány és egy lány harcolt vele. Segítenél megtalálni?" Ez további technikai kihívásokat jelent, és ezen a téren folytatjuk rendszereink fejlesztését.
Melyek azok az innovatív megközelítések, amelyek több kontextust és szemantikus keresést tartalmaznak?
Felépítettünk egy hibrid keresőrendszert, amely lexikális keresést alkalmaz, és kombinálja azt ML technikákkal és modellekkel, amelyek a szemantikus keresést és a lekérdezés szándékának megértését használják fel. Rendszereinket folyamatosan fejlesztjük a kontextus megértésének, az összetett lekérdezések kezelésének és a releváns tartalom visszaadásának érdekében.
A szemantikus keresés varázsa a beágyazásokban rejlik, amelyek gazdagon reprezentálják a Roblox minden részéből érkező jeleket. Például olyan jeleket építünk be, mint a felhasználói demográfia, a felhasználói lekérdezés, a hosszúság vagy az egyedi jellemzők.
A tartalmi jeleket is vizsgáljuk, például az élményeket, az avatarelemeket és az elköteleződést – milyen gyakran játszották ezt a játékot, vagy hány felhasználója volt, és hány országból? Vannak olyan dolgok is, mint a bevételszerzés és a megőrzés, valamint a metaadatok, például az élmény címe, leírása vagy alkotója. Mindezeket BERT alapú, transzformátor alapú architektúrán keresztül helyeztük át, és a Többrétegű Perceptron a végén beágyazásokat generálunk, amelyek az igazság forrásává válnak.
Egy másik újítás a házon belüli hasonlóságkereső rendszerünk. Amikor valaki keresési lekérdezést hajt végre, lekérjük a szorosan kapcsolódó beágyazásokat, és rangsoroljuk őket, hogy megbizonyosodjunk arról, hogy relevánsak a felhasználó által keresett dolgok szempontjából. Ezután visszaküldjük az eredményeket a felhasználóknak.
Melyek azok a kulcsfontosságú dolgok, amelyeket megtanultál e technikai munka során?
Minden nyelv megvan a maga egyedi kihívása. És különösen a keresésnél meg kell értenünk, mit keresnek a felhasználók a világ különböző részein, hogy a legrelevánsabb találatokat tudjuk megmutatni nekik. Meg kell értenünk a különböző nyelvi elemeket. Például az előre betanított transzformátorok elengedhetetlenek a japán nyelv többféle dialektusának megértéséhez.
Másodszor, a keresési lekérdezési minták meglehetősen sokat változtak, és folyamatosan fejlesztenünk kell technológiai csomagunkat, hogy lépést tudjunk tartani. Ugyanakkor tájékoztatnunk kell felhasználóinkat arról, hogy mi lehetséges a platformunkon, mert előfordulhat, hogy ezt nem veszik észre. Például elmondhatjuk felhasználóinknak, hogy a keresés támogathat olyan dolgokat, mint a freestyle lekérdezések (például versenyjátékok vagy népszerű étkezési játékok), és hogy megérti, mit keresnek az emberek, és megfelelő találatokat tud adni.
Melyik Roblox értékhez igazodik leginkább a csapata?
A hosszú távú szemlélet a csapatunk alapja, és ez az egyik oka annak, hogy szeretek a Robloxnál dolgozni.
A csapatom egyik példája a technológiai halmazunk, amely ML- és NLP-alapú keresőrendszereinkből áll – szemantikus keresés, automatikus kiegészítés és helyesírás-javítás előre betanított nagy modellek segítségével.
Ezt az újrafelhasználhatóság szem előtt tartásával hoztuk létre a napi több tízmillió aktív felhasználónk által végzett különböző típusú keresések során. Ez azt jelenti, hogy más típusú adatokat is csatlakoztathatunk (például avatarelemeket az élmények helyett), és nagyon minimális változtatásokkal kell működnie.
Beépítettük a szemantikus tapasztalatkeresést, és megosztottuk azt más ágazatokkal, például a Marketplace-szel, és képesek voltak ráugrani a meglévő architektúrára. Nem teljesen plug-and-play, de némi finomhangolással a különböző használati esetekhez igazíthatjuk.
Mi izgat a legjobban abban, hogy Roblox és csapata merre tart?
A keresés az egyetlen felület, ahol a felhasználók kifejezik kifejezett szándékukat. Ez pedig azt jelenti, hogy elengedhetetlen, hogy megértsük, mit akarnak, és a legrelevánsabb eredményeket adjuk nekik. Szóval nagyon izgalmas számomra, hogy ezen a szándékon dolgozhatok, és felvilágosíthatom a felhasználókat arról, hogy mi lehetséges, néha még azelőtt, hogy a felhasználó észrevenné.
Egy felhasználó bármely országban kérdezhet valamit, mi pedig pontosan azt adhatjuk neki, amit akar, és ez a leginkább releváns számára. Ez bizalmat épít, ami viszont javítja a megtartást. Izgalmas számomra, hogy vállalhatom a keresés fejlesztésének kihívását, hogy kiépítsem ezt a bizalmat, és segítsek a Robloxnak elérni azt a célt, hogy egymilliárd felhasználó legyen.
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
- PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
- PlatoESG. Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
- PlatoHealth. Biotechnológiai és klinikai vizsgálatok intelligencia. Hozzáférés itt.
- Forrás: https://blog.roblox.com/2023/11/inside-the-tech-solving-for-multilingual-semantic-search/
- :van
- :is
- :nem
- :ahol
- $ UP
- 15%
- 19
- a
- Képes
- Rólunk
- Elérése
- át
- aktív
- alkalmazkodni
- fogadott
- Augusztus
- összehangolása
- Minden termék
- mentén
- Is
- mindig
- an
- és a
- bármilyen
- megközelítés
- megközelít
- megfelelő
- építészet
- VANNAK
- körül
- AS
- kérdez
- szempontok
- At
- autocomplete
- avatar
- BE
- válik
- óta
- előtt
- Jobb
- Legnagyobb
- Billió
- Bit
- Blog
- épít
- épít
- épült
- de
- by
- hívott
- TUD
- esetek
- katalógus
- vezérigazgató
- bizonyos
- kihívás
- kihívások
- Változások
- változó
- kombájnok
- bonyolult
- áll
- tartalom
- kontextus
- folyamatos
- folyamatosan
- Mag
- tudott
- országok
- ország
- Teremtő
- napi
- dátum
- David
- Demográfiai
- leírás
- DID
- különböző
- Igazgató
- nem
- Ennek
- ne
- Sárkány
- kiadás
- nevelése
- elemek
- végén
- Mérnöki
- biztosítására
- epizód
- különösen
- alapvető
- Még
- fejlődik
- fejlődik
- pontosan
- példa
- izgatott
- izgalmas
- létező
- tapasztalat
- Tapasztalatok
- expressz
- kiterjedő
- harcoló
- Találjon
- vezetéknév
- összpontosított
- élelmiszer
- A
- gyakran
- ból ből
- játék
- Games
- generál
- kap
- Girl
- Ad
- földgolyó
- cél
- Növekedés
- fogantyú
- Legyen
- tekintettel
- fejes
- segít
- segít
- segít
- Hogyan
- HTTPS
- hibrid
- i
- javul
- javítja
- javuló
- in
- Bejegyzett
- amely magában foglalja
- Növelje
- indexelt
- tájékoztat
- Innováció
- újító
- belső
- helyette
- A szándék
- Nemzetközi
- IT
- tételek
- ITS
- Japán
- japán
- ugrás
- éppen
- Tart
- Kulcs
- hiány
- nyelv
- Nyelvek
- nagy
- TANUL
- tanult
- Led
- Tőkeáttétel
- mint
- vonalak
- Hosszú
- hosszabb
- keres
- Sok
- szerelem
- gép
- készült
- mágia
- fontos
- KÉSZÍT
- menedzser
- sok
- piactér
- Mérkőzés
- egyező
- Lehet..
- me
- jelenti
- eszközök
- Metaadatok
- Több millió
- bánja
- minimális
- ML
- ML technikák
- modell
- modellek
- bevételszerzési
- több
- a legtöbb
- többszörös
- my
- Szükség
- nem
- of
- gyakran
- on
- ONE
- csak
- or
- származó
- Más
- mi
- saját
- alkatrészek
- minták
- Emberek (People)
- tökéletesen
- emelvény
- Plató
- Platón adatintelligencia
- PlatoData
- játszott
- játék
- játszik
- dugó
- podcast
- Népszerű
- lehetséges
- ajándékot
- Probléma
- Termékek
- tesz
- lekérdezések
- gyorsan
- egészen
- verseny
- rangsorban
- észre
- tényleg
- miatt
- nemrég
- Kapcsolatok
- eszébe jut
- Eredmények
- visszatartás
- visszatérés
- Gazdag
- roblox
- azonos
- forgatókönyv
- Keresés
- keresések
- idősebb
- Series of
- megosztott
- kellene
- előadás
- mutató
- jelek
- So
- Kizárólag
- SOLVE
- Megoldása
- néhány
- Valaki
- valami
- néha
- forrás
- különleges
- helyesírás
- verem
- csúcs-
- Lépés
- Stratégia
- diák
- ilyen
- elegendő
- javasol
- támogatás
- biztos
- felületi
- rendszer
- Systems
- Vesz
- tart
- bevétel
- Talks
- tanár
- csapat
- tech
- Műszaki
- technika
- technikák
- Technológia
- mondd
- tíz
- szöveg
- hogy
- A
- a világ
- azok
- Őket
- akkor
- Ott.
- Ezek
- ők
- dolgok
- ezt
- azok
- bár?
- Keresztül
- idő
- Cím
- nak nek
- Képzések
- transzformerek
- Fordítása
- Bízzon
- igazság
- FORDULAT
- típus
- típusok
- megért
- megértés
- megérti
- egyedi
- us
- használ
- használt
- használó
- Felhasználók
- segítségével
- kihasználva
- érték
- fajta
- függőlegesek
- nagyon
- Megnézem
- akar
- volt
- we
- JÓL
- Mit
- Mi
- amikor
- ami
- miért
- Wikipedia
- val vel
- belül
- Munka
- dolgozó
- világ
- év
- te
- A te
- zephyrnet