Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

MoE-MLoRA for Multi-Domain CTR Prediction: Efficient Adaptation with Expert Specialization

Created by
  • Haebom

저자

Ken Yaggel, Eyal German, Aviel Ben Siman Tov

개요

본 논문은 다양한 도메인에 걸친 사용자 상호작용에 적응해야 하는 개인화 추천 시스템을 위한 MoE-MLoRA(Mixture-of-Experts MLoRA) 프레임워크를 제안합니다. MoE-MLoRA는 각 전문가가 도메인별로 독립적으로 훈련된 후 게이팅 네트워크가 각 전문가의 기여도를 동적으로 가중치 부여하는 혼합 전문가 프레임워크입니다. Movielens와 Taobao 데이터셋에서 8가지 CTR 모델에 대해 MoE-MLoRA를 평가한 결과, 대규모 동적 데이터셋에서는 성능 향상을 보였지만(Taobao-20에서 +1.45 Weighed-AUC), 도메인 다양성과 희소성이 낮은 구조화된 데이터셋에서는 제한적인 이점만 제공하는 것으로 나타났습니다. 도메인당 전문가 수 분석 결과, 전문가 수가 많다고 항상 성능이 향상되는 것은 아니며, 모델 인식 조정의 필요성을 보여줍니다. 본 연구는 전문가 기반 아키텍처가 복잡한 환경에서 예측 정확도를 향상시킬 수 있음을 보여줍니다. 구현 및 코드는 GitHub 저장소에서 확인할 수 있습니다.

시사점, 한계점

시사점:
대규모 동적 데이터셋에서의 개인화 추천 시스템 성능 향상 가능성 제시 (Taobao-20에서 +1.45 Weighed-AUC 향상).
도메인별 전문가 특화 및 적응형 게이팅을 통한 복잡한 환경에서의 예측 정확도 향상 가능성 확인.
전문가 기반 아키텍처의 잠재력을 강조.
한계점:
도메인 다양성과 희소성이 낮은 구조화된 데이터셋에서는 제한적인 성능 향상.
도메인당 전문가 수 증가가 항상 성능 향상으로 이어지지 않음. 모델 인식 조정의 필요성 제기.
최적의 전문가 수 결정을 위한 추가 연구 필요.
👍