Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

SPARC: Soft Probabilistic Adaptive multi-interest Retrieval Model via Codebooks for recommender system

Created by
  • Haebom

저자

Jialiang Shi, Yaguang Dou, Tian Qi

개요

본 논문은 실세계 추천 시스템(RS)에서 다중 관심사 모델링의 핵심 문제점을 해결하기 위해 새로운 검색 프레임워크인 SPARC(Soft Probabilistic Adaptive Retrieval Model via Codebooks)를 제안합니다. 기존 방법의 한계점인 고정된 관심사와 수동적인 매칭 전략을 극복하기 위해, Residual Quantized Variational Autoencoder (RQ-VAE)를 활용하여 사용자 행동에 따라 동적으로 변화하는 이산적인 관심사 공간을 구축하고, 전체 관심사 공간에 대한 확률 분포를 예측하는 확률적 관심사 모듈을 도입합니다. 이를 통해 온라인 추론 시 "수동적 매칭"에서 "능동적 탐색"으로 패러다임을 전환하여 새로운 관심사 발견을 효과적으로 증진시킵니다. 수천만 명의 일일 활성 사용자를 보유한 산업 플랫폼에서의 A/B 테스트 결과, 사용자 시청 시간 +0.9%, 페이지뷰 +0.4%, PV500(24시간 내 500 PV 도달한 신규 콘텐츠) +22.7% 향상 등의 성과를 보였으며, Amazon Product 데이터셋을 이용한 오프라인 평가에서도 Recall@K 및 NDCG@K 지표가 향상되는 것을 확인했습니다.

시사점, 한계점

시사점:
사용자 행동에 따라 동적으로 변화하는 다중 관심사 모델링이 가능함을 보여줌.
기존의 수동적 매칭 방식에서 능동적 탐색 방식으로 전환하여 새로운 관심사 발견을 효과적으로 증진시킴.
산업 플랫폼 및 오픈소스 데이터셋에서의 실험을 통해 실효성과 실용성을 검증.
추천 시스템 성능 향상에 기여하는 측면을 실제 비즈니스 지표 향상으로 입증.
한계점:
RQ-VAE를 이용한 관심사 공간 구축 및 학습 과정의 복잡성.
특정 산업 플랫폼 및 데이터셋에 대한 결과이므로, 다른 도메인이나 데이터셋으로의 일반화 가능성에 대한 추가 연구 필요.
확률적 관심사 모듈의 성능에 대한 추가적인 분석 및 개선 여지 존재.
👍