Inside the Tech는 당사와 함께 제공되는 블로그 시리즈입니다. 기술 토크 팟캐스트. 팟캐스트 19화에서는 국제 노동자 동맹, Roblox CEO David Baszucki는 제품 수석 이사인 Zhen Fang과 함께 Roblox의 국제 전략과 전 세계 수천만 명의 사람들에게 현지화된 경험을 보장하기 위해 해결하고 있는 기술적 과제에 대해 이야기했습니다. 이번 Inside the Tech 에디션에서는 엔지니어링 관리자인 Ravali Kandur와 대화를 통해 이러한 기술적 과제 중 하나인 다국어 및 의미론적 검색에 대해 자세히 알아보고, Growth 팀의 작업이 전 세계 Roblox 사용자가 검색하고 빠르게 찾는 데 어떻게 도움이 되는지 알아보았습니다. 우리 플랫폼에서 그들이 원하는 모든 것.
당신의 팀이 겪고 있는 가장 큰 기술적 과제는 무엇입니까?
약 XNUMX년 전까지만 해도 Roblox 검색에서는 어휘 시스템을 사용하여 결과를 사용자의 검색어와 일치시켰습니다. 즉, 텍스트 일치에만 집중했습니다. 그러나 검색 행동은 빠르게 변화하고 있으며 이러한 접근 방식은 더 이상 사용자에게 관련 콘텐츠를 제공하기에 충분하지 않습니다. 동시에 일부 Roblox 사용자는 검색어에 잘못된 철자를 사용할 수 있습니다. 따라서 우리는 그들이 찾고 있는 것과 일치하는 결과를 제안할 수 있어야 하며, 이는 그들의 의도를 이해한다는 것을 의미합니다.
검색의 또 다른 주요 문제는 언어 전반에 걸친 훈련 데이터가 부족하다는 것입니다. 의미 검색 이전에 우리의 첫 번째 단계는 Roblox 시스템 내에서 기계 번역을 활용하는 것이었습니다. 우리는 번역을 색인화한 다음 텍스트 일치를 수행했습니다. 그러나 항상 사용자에게 관련 콘텐츠를 표시하는 것만으로는 충분하지 않습니다. 그래서 우리는 학생-교사 모델이라는 더욱 최첨단 ML 기술을 채택했습니다. 교사는 특정 시나리오에 대한 가장 큰 맥락 소스로부터 학습합니다.
영어는 Roblox에서 가장 많이 사용되는 언어입니다. 따라서 우리는 교사 모델인 영어에서 최대한 많은 의미 관계를 학습한 다음 이를 다른 언어로 확장하여 학생 모델로 정제합니다. 이는 특정 언어에 대한 데이터가 많지 않더라도 문제를 해결하는 데 도움이 됩니다. 이로 인해 일본에서는 검색을 통해 발생한 연극이 15% 증가했습니다.
우리는 최근 "đua xe(레이싱)"와 같은 카탈로그 검색어를 더 효과적으로 지원하기 위해 노력해 왔습니다. 하지만 사용자들은 다음과 같이 길고 자유로운 형식의 쿼리를 더 자주 제출하고 있습니다. "야, 용과 소녀가 그것으로 싸우는 게임을 했던 기억이 나네. 제가 그걸 찾는 것을 도와주실 수 있나요?” 이는 더 많은 기술적인 과제를 제시하며 우리는 이러한 방향으로 시스템을 지속적으로 개선하고 있습니다.
더 많은 컨텍스트와 의미론적 검색을 통합하기 위한 혁신적인 접근 방식에는 어떤 것이 있습니까?
우리는 어휘 검색을 의미론적 검색과 쿼리 의도 이해를 활용하는 ML 기술 및 모델과 결합하는 하이브리드 검색 시스템을 구축했습니다. 우리는 상황 이해를 구축하고, 복잡한 쿼리를 처리하고, 관련 콘텐츠를 반환하기 위해 시스템을 지속적으로 발전시키고 있습니다.
의미론적 검색의 마법은 Roblox 전반에서 얻은 다양한 신호를 풍부하게 표현하는 임베딩에 있습니다. 예를 들어, 사용자 인구통계, 사용자 쿼리, 기간, 고유한 측면과 같은 신호를 통합합니다.
또한 경험, 아바타 아이템, 참여도와 같은 콘텐츠 신호도 살펴봅니다. 즉, 이 게임을 얼마나 자주 플레이했는지, 사용자 수는 몇 명, 국가는 몇 개국에서 발생했는지 등을 살펴봅니다. 또한 수익 창출 및 유지와 같은 것뿐만 아니라 경험의 제목, 설명, 제작자와 같은 메타데이터도 있습니다. 우리는 이 모든 것을 BERT 기반, 변환기 기반 아키텍처에 적용하고 다층 퍼셉트론 결국 우리의 진실의 원천이 되는 임베딩을 생성합니다.
또 다른 혁신은 사내 유사성 검색 시스템입니다. 누군가 검색어를 입력하면 우리는 밀접하게 관련된 임베딩을 검색하고 순위를 매겨 사용자가 찾고 있는 것과 관련이 있는지 확인합니다. 그런 다음 결과를 사용자에게 반환합니다.
이 기술 작업을 수행하면서 배운 주요 내용은 무엇입니까?
모든 언어는 고유한 도전 과제를 제시합니다. 특히 검색의 경우, 가장 관련성이 높은 결과를 표시할 수 있도록 세계 각지의 사용자가 무엇을 찾고 있는지 이해해야 합니다. 우리는 다양한 언어 요소를 이해해야 합니다. 예를 들어, 사전 훈련된 변환기는 일본어의 다양한 방언을 이해하는 데 필수적이었습니다.
둘째, 검색어 패턴이 상당히 변화하고 있으며 이를 따라잡기 위해서는 기술 스택을 지속적으로 발전시켜야 합니다. 동시에, 우리는 사용자가 깨닫지 못할 수도 있으므로 플랫폼에서 무엇이 가능한지 알려주어야 합니다. 예를 들어, 검색은 자유형 쿼리(예: 레이싱 게임, 인기 있는 음식 게임)와 같은 항목을 지원할 수 있으며 사람들이 찾고 있는 것이 무엇인지 이해하고 적절한 결과를 반환할 수 있다는 점을 사용자에게 알릴 수 있습니다.
귀하의 팀은 어떤 Roblox 가치에 가장 부합합니까?
장기적 관점을 갖는 것이 우리 팀의 핵심이며 제가 Roblox에서 일하는 것을 좋아하는 이유 중 하나입니다.
우리 팀의 한 가지 예는 ML 및 NLP 기반 검색 시스템(의미 검색, 자동 완성, 사전 훈련된 대형 모델을 사용한 철자 수정)으로 구성된 기술 스택입니다.
우리는 매일 수천만 명의 활성 사용자가 수행하는 다양한 유형의 검색에 대한 재사용성을 염두에 두고 이를 구축했습니다. 즉, 다른 유형의 데이터(예: 경험 대신 아바타 아이템)를 연결할 수 있으며 최소한의 변경만으로 작동해야 합니다.
우리는 경험에 대한 의미론적 검색을 통합했고 이를 Marketplace와 같은 다른 업종과 공유했으며 그들은 기존 아키텍처를 바로 뛰어넘을 수 있었습니다. 완벽한 플러그 앤 플레이는 아니지만 약간의 미세 조정을 통해 다양한 사용 사례에 맞게 조정할 수 있습니다.
Roblox와 팀이 향하는 방향에서 가장 흥미로운 점은 무엇인가요?
검색은 사용자가 명시적인 의도를 표현하는 유일한 표면입니다. 즉, 고객이 원하는 것이 무엇인지 이해하고 가장 관련성이 높은 결과를 제공하는 것이 중요합니다. 그래서 그 의도를 이해하고 때로는 사용자가 깨닫기도 전에 가능한 것에 대해 사용자를 교육하는 작업을 하는 것이 나에게는 정말 흥미로운 일입니다.
어떤 국가의 사용자가 무엇이든 물어볼 수 있고 우리는 그들이 원하는 것과 가장 관련성이 높은 것을 정확하게 제공할 수 있습니다. 이는 신뢰를 구축하고 결과적으로 유지율을 향상시킵니다. 신뢰를 구축하고 Roblox가 XNUMX억 명의 사용자를 확보한다는 목표를 달성하는 데 도움이 되도록 검색을 개선하는 과제를 맡게 되어 기쁩니다.
- SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
- PlatoData.Network 수직 생성 Ai. 자신에게 권한을 부여하십시오. 여기에서 액세스하십시오.
- PlatoAiStream. 웹3 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
- 플라톤ESG. 탄소, 클린테크, 에너지, 환경, 태양광, 폐기물 관리. 여기에서 액세스하십시오.
- PlatoHealth. 생명 공학 및 임상 시험 인텔리전스. 여기에서 액세스하십시오.
- 출처: https://blog.roblox.com/2023/11/inside-the-tech-solving-for-multilingual-semantic-search/
- :있다
- :이다
- :아니
- :어디
- $UP
- 15%
- 19
- a
- 할 수 있는
- 소개
- 달성
- 가로질러
- 활동적인
- 각색하다
- 채택
- ...전에
- 일직선으로하다
- All
- 따라
- 또한
- 항상
- an
- 및
- 어떤
- 접근
- 구혼
- 적당한
- 아키텍처
- 있군요
- 약
- AS
- 문의
- 측면
- At
- 자동 완성
- 화신
- BE
- 가
- 된
- 전에
- 더 나은
- 가장 큰
- 억원
- 비트
- 블로그
- 빌드
- 빌드
- 내장
- 비자 면제 프로그램에 해당하는 국가의 시민권을 가지고 있지만
- by
- 라는
- CAN
- 가지 경우
- 목록
- 대표 이사
- 어떤
- 도전
- 과제
- 변경
- 변화
- 결합
- 복잡한
- 구성
- 함유량
- 문맥
- 지속
- 지속적으로
- 핵심
- 수
- 국가
- 국가
- 창조자
- 매일
- 데이터
- 데이비드
- 인구 통계
- 설명
- DID
- 다른
- 책임자
- 하지
- 하기
- 말라
- 용
- 판
- 교육
- 요소
- end
- 엔지니어링
- 확인
- 삽화
- 특히
- 필수
- 조차
- 진화시키다
- 진화하는
- 정확하게
- 예
- 흥분하다
- 흥미 진진한
- 현존하는
- 경험
- 체험
- 급행
- 연장
- 싸움
- Find
- 먼저,
- 집중
- 식품
- 럭셔리
- 자주
- 에
- 경기
- Games
- 생성
- 얻을
- 소녀
- 주기
- 공
- 골
- 성장
- 핸들
- 있다
- 데
- 가고
- 도움
- 도움이
- 도움이
- 방법
- HTTPS
- 잡종
- i
- 개선
- 향상
- 개선
- in
- Incorporated
- 통합
- 증가
- 색인
- 통보
- 혁신
- 혁신적인
- 내부
- 를 받아야 하는 미국 여행자
- 의지
- 국제 노동자 동맹
- IT
- 항목
- 그
- 일본
- 일본제
- 도약
- 다만
- 유지
- 키
- 결핍
- 언어
- 언어
- 넓은
- 배우다
- 배운
- 지도
- 이점
- 처럼
- 라인
- 긴
- 이상
- 찾고
- 롯
- 애정
- 기계
- 만든
- 마법
- 주요한
- 제작
- 매니저
- .
- 시장
- 경기
- 어울리는
- XNUMX월..
- me
- 의미
- 방법
- 메타 데이터
- 수백만
- 신경
- 최소의
- ML
- 머신러닝 기술
- 모델
- 모델
- 수익 창출
- 배우기
- 가장
- 여러
- my
- 필요
- 아니
- of
- 자주
- on
- ONE
- 만
- or
- 원산지
- 기타
- 우리의
- 자신의
- 부품
- 패턴
- 사람들
- 아주
- 플랫폼
- 플라톤
- 플라톤 데이터 인텔리전스
- 플라토데이터
- 경기
- 연주
- 재생
- 플러그
- 팟 캐스트
- 인기 문서
- 가능한
- 선물
- 문제
- 프로덕트
- 놓다
- 쿼리
- 빨리
- 아주
- 경마
- 순위
- 실현
- 정말
- 이유
- 최근에
- 관계
- 관련된
- 기억
- 결과
- 보유
- return
- 풍부한
- Roblox
- 같은
- 대본
- 검색
- 검색
- 연장자
- 연속
- 공유
- 영상을
- 표시
- 보여주는
- 신호
- So
- 혼자서
- 풀다
- 해결
- 일부
- 어떤 사람
- 무언가
- 때로는
- 출처
- 구체적인
- 철자
- 스택
- 최첨단
- 단계
- 전략
- 학생
- 이러한
- 충분한
- 제안
- SUPPORT
- 확인
- 표면
- 체계
- 시스템은
- 받아
- 소요
- 복용
- 회담
- 선생
- 팀
- 기술
- 테크니컬
- 기술
- 기법
- Technology
- 이야기
- 수십
- 본문
- 그
- XNUMXD덴탈의
- 세계
- 그들의
- 그들
- 그때
- 그곳에.
- Bowman의
- 그들
- 일
- 이
- 그
- 그래도?
- 을 통하여
- 시간
- Title
- 에
- 트레이닝
- 변압기
- 번역
- 믿어
- 진실
- 회전
- 유형
- 유형
- 이해
- 이해
- 이해한다
- 유일한
- us
- 사용
- 익숙한
- 사용자
- 사용자
- 사용
- 활용
- 가치
- 종류
- 업종
- 대단히
- 관측
- 필요
- 였다
- we
- 잘
- 뭐
- 언제
- 어느
- why
- 위키 백과
- 과
- 이내
- 작업
- 일하는
- 세계
- year
- 당신
- 너의
- 제퍼 넷