Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

SPARC: Soft Probabilistic Adaptive multi-interest Retrieval Model via Codebooks for recommender system

Created by
  • Haebom

저자

Jialiang Shi, Yaguang Dou, Tian Qi

개요

본 논문은 실제 추천 시스템(RS)에서 다중 관심사 모델링의 세 가지 주요 과제(1. 사전 정의된 외부 지식에서 추출된 불변의 관심사, 2. 기존 관심사 매칭에 치중한 과도한 활용 전략, 3. 새로운 관심사 발견 부족)를 해결하기 위해 새로운 검색 프레임워크인 SPARC(Soft Probabilistic Adaptive Retrieval Model via Codebooks)를 제안합니다. SPARC는 RQ-VAE(Residual Quantized Variational Autoencoder)를 사용하여 이산적인 관심사 공간을 구축하고, 이를 대규모 추천 모델과 함께 학습하여 사용자 피드백을 반영하고 동적으로 진화하는 행동 기반 관심사를 채굴합니다. 또한, 전체 동적 이산 관심사 공간에 대한 확률 분포를 예측하는 확률적 관심사 모듈을 통해 온라인 추론 중 효율적인 "소프트 검색" 전략을 가능하게 하여, 수동적 매칭에서 능동적 탐색으로 패러다임을 전환하고 관심사 발견을 효과적으로 촉진합니다. 수천만 명의 일일 활성 사용자를 보유한 산업 플랫폼에서의 A/B 테스트 결과, 사용자 시청 시간 +0.9%, 페이지뷰(PV) +0.4%, PV500(24시간 내 500 PV에 도달하는 새로운 콘텐츠) +22.7% 증가 등 상당한 성과를 거두었습니다. Amazon Product 데이터셋을 사용한 오프라인 평가에서도 Recall@K 및 NDCG@K 등의 지표가 일관되게 향상되었습니다.

시사점, 한계점

시사점:
RQ-VAE를 이용한 동적이고 이산적인 관심사 공간 구축 및 행동 기반 관심사 채굴을 통한 실시간 사용자 선호도 반영 가능성 제시.
확률적 관심사 모듈을 통한 "소프트 검색" 전략으로 능동적 관심사 탐색 및 발견 가능.
대규모 산업 플랫폼에서의 A/B 테스트를 통해 실제적인 효용성 검증. 사용자 시청 시간, 페이지뷰, 신규 콘텐츠 도달률 등 주요 지표의 상당한 개선.
오프라인 평가를 통해 알고리즘의 성능 향상을 추가적으로 검증.
한계점:
RQ-VAE를 이용한 관심사 공간 구축의 복잡성 및 계산 비용에 대한 논의 부족.
특정 산업 플랫폼에 대한 결과의 일반화 가능성에 대한 추가적인 연구 필요.
사용된 Amazon Product 데이터셋의 세부 정보 및 전처리 과정에 대한 명확한 설명 부족.
장기적인 사용자 행동 변화에 대한 모델의 적응력에 대한 추가적인 분석 필요.
👍