Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Enhancing Live Broadcast Engagement: A Multi-modal Approach to Short Video Recommendations Using MMGCN and User Preferences

Created by
  • Haebom

저자

Saeid Aghasoleymani Najafabadi

개요

본 논문은 실시간 방송 참여도 향상을 위한 다중 모드 접근 방식을 탐구하여 사용자 선호도를 통합한 다중 모드 그래프 합성곱 신경망(MMGCN) 기반의 짧은 비디오 추천 시스템을 개발합니다. 개인의 관심사에 맞춘 개인화된 추천을 제공하기 위해 사용자 상호 작용 데이터, 비디오 콘텐츠 특징 및 맥락 정보를 고려합니다. 협업 필터링 및 콘텐츠 기반 필터링 기술을 결합한 하이브리드 접근 방식을 통해 사용자, 비디오 속성 및 참여 패턴 간의 미묘한 관계를 포착할 수 있습니다. Kwai, TikTok, MovieLens 세 가지 데이터 세트를 사용하여 시스템의 효과를 평가했습니다. DeepFM, Wide & Deep, LightGBM 및 XGBoost와 같은 기준 모델과 비교하여 제안된 MMGCN 기반 모델은 우수한 성능을 보였습니다. 특히 다양한 사용자 선호도를 포착하고 정확한 개인화된 추천을 수행하는 데 모든 기준 방법을 능가하여 Kwai F1 점수 0.574, TikTok F1 점수 0.506, MovieLens F1 점수 0.197을 달성했습니다. 다중 모드 통합과 사용자 중심 접근 방식이 추천 시스템 발전에 중요하며, 실시간 방송 플랫폼에서 콘텐츠 발견과 시청자 참여 향상에 기여한다는 점을 강조합니다.

시사점, 한계점

시사점:
다중 모달 그래프 합성곱 신경망(MMGCN)을 활용한 짧은 비디오 추천 시스템이 실시간 방송 참여도 향상에 효과적임을 보임.
사용자 상호작용 데이터, 비디오 콘텐츠 특징, 맥락 정보를 통합하여 개인화된 추천의 정확도를 높임.
협업 필터링과 콘텐츠 기반 필터링의 하이브리드 접근 방식을 통해 다양한 사용자 선호도를 효과적으로 포착.
기존 모델들(DeepFM, Wide & Deep, LightGBM, XGBoost) 대비 우수한 성능(Kwai F1 0.574, TikTok F1 0.506, MovieLens F1 0.197)을 달성.
다중 모달 통합과 사용자 중심 접근 방식의 중요성을 강조.
한계점:
특정 플랫폼(Kwai, TikTok, MovieLens) 데이터에 대한 평가 결과이므로 일반화 가능성에 대한 추가 연구 필요.
사용된 데이터셋의 특성에 따라 성능이 달라질 수 있음. MovieLens의 낮은 F1 점수는 데이터셋의 특성 차이를 반영할 수 있음.
추천 시스템의 실제 운영 환경에서의 성능 및 안정성에 대한 추가적인 검증 필요.
모델의 해석성에 대한 추가적인 연구가 필요할 수 있음.
👍