Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Diffusion-based Multi-modal Synergy Interest Network for Click-through Rate Prediction

Created by
  • Haebom

저자

Xiaoxi Cui, Weihai Lu, Yu Tong, Yiheng Li, Zhejun Zhao

개요

본 논문은 기존 클릭률 예측(CTR) 방법들이 주로 ID 모달리티에 기반하여 사용자의 다양한 선호도를 포괄적으로 모델링하지 못하는 한계를 지적하며, 다모달 CTR 예측을 위한 새로운 프레임워크인 Diffusion-based Multi-modal Synergy Interest Network (Diff-MSIN)을 제안한다. Diff-MSIN은 Multi-modal Feature Enhancement (MFE) Module, Synergistic Relationship Capture (SRC) Module, 그리고 Feature Dynamic Adaptive Fusion (FDAF) Module의 세 가지 모듈로 구성되어 있으며, 각 모듈은 다양한 모달리티 간의 상승작용, 공통점, 특수성을 추출하고, 사용자 선호도를 포착하며 융합 노이즈를 줄이는 데 초점을 맞춘다. Rec-Tmall과 세 개의 Amazon 데이터셋을 사용한 실험 결과, Diff-MSIN은 기존 방법보다 최소 1.67% 향상된 성능을 보였다.

시사점, 한계점

시사점:
다모달 정보를 활용하여 사용자의 다양한 선호도를 더욱 정확하게 모델링할 수 있는 새로운 CTR 예측 프레임워크를 제시하였다.
기존 다모달 융합 방법들의 한계를 극복하고, 모달리티 간의 상승 효과를 효과적으로 모델링하는 새로운 방법을 제안하였다.
제안된 방법이 다양한 데이터셋에서 기존 방법보다 우수한 성능을 보임을 실험적으로 증명하였다.
공개된 코드를 통해 재현성을 확보하였다.
한계점:
제안된 방법의 성능 향상이 특정 데이터셋에 국한될 가능성이 있다.
더욱 다양하고 대규모의 데이터셋을 사용한 추가적인 실험이 필요하다.
제안된 프레임워크의 계산 복잡도 및 효율성에 대한 분석이 부족하다.
👍