Inside the Tech este o serie de bloguri care ne însoțește Podcast Tech Talks. În episodul 19 al podcastului, Internațional, CEO-ul Roblox, David Baszucki, a vorbit cu directorul senior de produs Zhen Fang despre strategia internațională a Roblox și despre provocările tehnice pe care le rezolvăm pentru a asigura o experiență localizată pentru zeci de milioane de oameni de pe tot globul. În această ediție a revistei Inside the Tech, am discutat cu managerul de inginerie Ravali Kandur pentru a afla mai multe despre una dintre aceste provocări tehnice, căutarea multilingvă și semantică și despre modul în care munca echipei Growth îi ajută pe utilizatorii Roblox din întreaga lume să caute și să găsească rapid... orice doresc pe platforma noastră.
Care este cea mai mare provocare tehnică pe care o asumă echipa ta?
Până acum aproximativ un an, căutarea Roblox folosea un sistem lexical pentru a potrivi rezultatele cu căutările utilizatorilor, ceea ce înseamnă că se concentra doar pe potrivirea textului. Dar comportamentele de căutare se schimbă rapid și această abordare nu mai este suficientă pentru a oferi utilizatorilor conținut relevant. În același timp, unii utilizatori Roblox pot folosi ortografie incorectă în interogările lor. Deci, trebuie să putem sugera rezultate care se potrivesc cu ceea ce caută, ceea ce înseamnă să le înțelegem intenția.
O altă problemă majoră în căutare este lipsa datelor de instruire în diferite limbi. Înainte de căutarea semantică, primul nostru pas a fost să folosim traducerile automate în sistemul Roblox. Am indexat traducerile și apoi am făcut o potrivire a textului. Dar acest lucru nu este suficient pentru a le afișa întotdeauna utilizatorilor conținut relevant. Așadar, am adoptat o tehnică ML mai de ultimă generație numită model student-profesor: profesorul învață din cea mai mare sursă de context pentru orice scenariu specific.
Engleza este cea mai folosită limbă pe Roblox, motiv pentru care învățăm cât mai multe relații semantice putem în engleză — modelul profesorului — și apoi o distilăm la modelul elevului, extinzându-l la alte limbi. Acest lucru ne ajută să rezolvăm această problemă, chiar dacă nu avem multe date în anumite limbi. Acest lucru a dus la o creștere cu 15% a jocurilor care provin din căutarea în Japonia.
Recent, am lucrat pentru a sprijini mai bine interogările din catalog precum „đua xe (curse).” Dar utilizatorii trimit mai des interogări lungi, libere, cum ar fi „Hei, îmi amintesc că am jucat un joc în care era un dragon și o fată se lupta cu el. Mă poți ajuta să găsesc asta?” Acest lucru prezintă mai multe provocări tehnice și continuăm să ne îmbunătățim sistemele în acest sens.
Care sunt unele dintre abordările inovatoare de a încorpora mai mult context și mai multă căutare semantică?
Am construit un sistem de căutare hibrid care preia căutarea lexicală și o combină cu tehnici și modele ML care utilizează căutarea semantică și înțelegerea intenției unei interogări. Ne evoluăm continuu sistemele pentru a construi înțelegerea contextului, a gestiona interogări complexe și a returna conținut relevant.
Magia căutării semantice se află în înglobări, care sunt reprezentări bogate ale unei varietăți de semnale pe care le primim de la Roblox. De exemplu, încorporăm semnale precum datele demografice ale utilizatorilor, interogarea unui utilizator, cât de lungă este sau care sunt aspectele sale unice.
De asemenea, ne uităm la semnalele de conținut, cum ar fi experiențele, elementele avatarului și implicarea — cât de des a fost jucat acest joc sau câți utilizatori a avut și din câte țări? Există, de asemenea, lucruri precum generarea de bani și păstrarea, precum și metadate precum titlul, descrierea sau creatorul unei experiențe. Toate acestea le punem printr-o arhitectură bazată pe BERT, bazată pe transformatoare și folosim a Perceptron multistrat la final, pentru a genera înglobări, care devin sursa noastră de adevăr.
O altă inovație este sistemul nostru intern de căutare a similitudinii. Când cineva face o interogare de căutare, recuperăm înglobările strâns legate și le clasificăm pentru a ne asigura că sunt relevante pentru ceea ce caută utilizatorul. Și apoi returnăm rezultatele utilizatorilor.
Care sunt câteva dintre lucrurile cheie pe care le-ați învățat din realizarea acestei lucrări tehnice?
Fiecare limbă prezintă propria provocare unică. Și mai ales cu căutarea, trebuie să înțelegem ce caută utilizatorii din diferite părți ale lumii, astfel încât să le putem arăta cele mai relevante rezultate. Trebuie să înțelegem diferite elemente ale limbajului. De exemplu, transformatoarele pre-antrenate au fost esențiale pentru înțelegerea multiplelor dialecte ale japonezei.
În al doilea rând, modelele de interogări de căutare s-au schimbat destul de mult și trebuie să evoluăm continuu tehnologia noastră pentru a ține pasul. În același timp, trebuie să ne informăm utilizatorii despre ceea ce este posibil pe platforma noastră, deoarece este posibil să nu-și dea seama. De exemplu, le-am putea spune utilizatorilor noștri că căutarea poate accepta lucruri precum interogări freestyle (cum ar fi jocuri de curse sau jocuri cu mâncare populare) și că înțelege ceea ce caută oamenii și poate returna rezultate adecvate.
Cu ce valoare Roblox se aliniază cel mai mult echipa ta?
Viziunea de lungă durată este esențiala echipei noastre și este unul dintre motivele pentru care îmi place să lucrez la Roblox.
Un exemplu de la echipa mea este stiva noastră de tehnologie, care constă în sistemele noastre de căutare bazate pe ML și NLP - căutare semantică, completare automată și corecție ortografică folosind modele mari pre-antrenate.
Am creat acest lucru ținând cont de reutilizarea în diferite tipuri de căutări efectuate de zecile de milioane de utilizatori activi zilnic. Asta înseamnă că putem conecta un alt tip de date (de exemplu, articole avatar în loc de experiențe) și ar trebui să funcționeze cu modificări minime.
Am încorporat căutarea semantică pentru experiențe și am împărtășit-o cu alte verticale, cum ar fi Marketplace, și au reușit să sară doar pe arhitectura existentă. Nu este perfect plug-and-play, dar cu unele reglaje fine, îl putem adapta în diferite cazuri de utilizare.
Ce te entuziasmează cel mai mult în legătură cu locul în care se îndreaptă Roblox și echipa ta?
Căutarea este singura suprafață în care utilizatorii își exprimă intenția explicită. Și asta înseamnă că este esențial să înțelegem ce vor ei și să le oferim cele mai relevante rezultate. Așa că este foarte interesant pentru mine să lucrez la înțelegerea acestei intenții și la educarea utilizatorilor noștri despre ceea ce este posibil, uneori chiar înainte ca utilizatorul să-și dea seama.
Un utilizator din orice țară poate cere ceva și noi îi putem oferi exact ceea ce își dorește și asta este cel mai relevant pentru el. Acest lucru creează încredere care, la rândul său, îmbunătățește reținerea. Este incitant pentru mine să accept provocarea de a îmbunătăți căutarea pentru a construi această încredere și pentru a ajuta Roblox să-și atingă obiectivul de a avea un miliard de utilizatori.
- Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
- PlatoData.Network Vertical Generative Ai. Împuterniciți-vă. Accesați Aici.
- PlatoAiStream. Web3 Intelligence. Cunoștințe amplificate. Accesați Aici.
- PlatoESG. carbon, CleanTech, Energie, Mediu inconjurator, Solar, Managementul deșeurilor. Accesați Aici.
- PlatoHealth. Biotehnologie și Inteligență pentru studii clinice. Accesați Aici.
- Sursa: https://blog.roblox.com/2023/11/inside-the-tech-solving-for-multilingual-semantic-search/
- :are
- :este
- :nu
- :Unde
- $UP
- 15%
- 19
- a
- Capabil
- Despre Noi
- Obține
- peste
- activ
- adapta
- adoptată
- în urmă
- alinia
- TOATE
- de-a lungul
- de asemenea
- mereu
- an
- și
- Orice
- abordare
- abordari
- adecvat
- arhitectură
- SUNT
- în jurul
- AS
- cere
- aspecte
- At
- Completare automată
- Avatar
- BE
- deveni
- fost
- înainte
- Mai bine
- Cea mai mare
- Miliard
- Pic
- Blog
- construi
- construiește
- construit
- dar
- by
- denumit
- CAN
- cazuri
- catalog
- CEO
- sigur
- contesta
- provocări
- Modificări
- schimbarea
- combină
- complex
- constă
- conţinut
- context
- continuarea
- continuu
- Nucleu
- ar putea
- țări
- ţară
- creator
- zilnic
- de date
- David
- Criterii demografice
- descriere
- FĂCUT
- diferit
- Director
- face
- face
- Dont
- balaur
- ediţie
- educarea
- element
- capăt
- Inginerie
- asigura
- episod
- mai ales
- esenţial
- Chiar
- evolua
- evoluție
- exact
- exemplu
- excitat
- captivant
- existent
- experienţă
- Experiențe
- expres
- extindere
- luptă
- Găsi
- First
- concentrat
- alimente
- Pentru
- frecvent
- din
- joc
- Jocuri
- genera
- obține
- Fată
- Da
- glob
- scop
- Creștere
- manipula
- Avea
- având în
- intitulat
- ajutor
- ajutor
- ajută
- Cum
- HTTPS
- Hibrid
- i
- îmbunătăţi
- îmbunătăţeşte
- îmbunătățirea
- in
- Incorporated
- care încorporează
- Crește
- indexate
- Informa
- Inovaţie
- inovatoare
- în interiorul
- in schimb
- scop
- Internațional
- IT
- articole
- ESTE
- Japonia
- Japonez
- a sari
- doar
- A pastra
- Cheie
- lipsă
- limbă
- Limbă
- mare
- AFLAȚI
- învățat
- Led
- Pârghie
- ca
- linii
- Lung
- mai lung
- cautati
- Lot
- dragoste
- maşină
- făcut
- magie
- major
- FACE
- manager
- multe
- piaţă
- Meci
- potrivire
- Mai..
- me
- sens
- mijloace
- Metadata
- milioane
- minte
- minim
- ML
- Tehnici ML
- model
- Modele
- generarea de bani
- mai mult
- cele mai multe
- multiplu
- my
- Nevoie
- Nu.
- of
- de multe ori
- on
- ONE
- afară
- or
- de origine
- Altele
- al nostru
- propriu
- piese
- modele
- oameni
- perfect
- platformă
- Plato
- Informații despre date Platon
- PlatoData
- a jucat
- joc
- joacă
- ștecher
- Podcast
- Popular
- posibil
- cadouri
- Problemă
- Produs
- pune
- interogări
- repede
- cu totul
- curse
- rank
- realiza
- într-adevăr
- motive
- recent
- Relaţii
- minte
- REZULTATE
- retenţie
- reveni
- Bogat
- Roblox
- acelaşi
- scenariu
- Caută
- Cautari
- senior
- serie
- comun
- să
- Arăta
- arătând
- semnalele
- So
- Numai
- REZOLVAREA
- Rezolvarea
- unele
- Cineva
- ceva
- uneori
- Sursă
- specific
- ortografie
- stivui
- de ultimă oră
- Pas
- Strategie
- student
- astfel de
- suficient
- sugera
- a sustine
- sigur
- Suprafață
- sistem
- sisteme
- Lua
- ia
- luare
- Tratative
- profesor
- echipă
- tech
- Tehnic
- tehnică
- tehnici de
- Tehnologia
- spune
- zeci
- a) Sport and Nutrition Awareness Day in Manasia Around XNUMX people from the rural commune Manasia have participated in a sports and healthy nutrition oriented activity in one of the community’s sports ready yards. This activity was meant to gather, mainly, middle-aged people from a Romanian rural community and teach them about the benefits that sports have on both their mental and physical health and on how sporting activities can be used to bring people from a community closer together. Three trainers were made available for this event, so that the participants would get the best possible experience physically and so that they could have the best access possible to correct information and good sports/nutrition practices. b) Sports Awareness Day in Poiana Țapului A group of young participants have taken part in sporting activities meant to teach them about sporting conduct, fairplay, and safe physical activities. The day culminated with a football match.
- acea
- lumea
- lor
- Lor
- apoi
- Acolo.
- Acestea
- ei
- lucruri
- acest
- aceste
- deşi?
- Prin
- timp
- Titlu
- la
- Pregătire
- transformatoare
- Traduceri
- Încredere
- Adevăr
- ÎNTORCĂ
- tip
- Tipuri
- înţelege
- înţelegere
- înțelege
- unic
- us
- utilizare
- utilizat
- Utilizator
- utilizatorii
- folosind
- Utilizand
- valoare
- varietate
- verticalele
- foarte
- Vizualizare
- vrea
- a fost
- we
- BINE
- Ce
- Ce este
- cand
- care
- de ce
- Wikipedia
- cu
- în
- Apartamente
- de lucru
- lume
- an
- tu
- Ta
- zephyrnet