Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Graph Representation Learning via Causal Diffusion for Out-of-Distribution Recommendation

Created by
  • Haebom

저자

Chu Zhao, Enneng Yang, Yuliang Liang, Pengxiang Lan, Yuting Liu, Jianzhe Zhao, Guibing Guo, Xingwei Wang

개요

본 논문은 기존 그래프 신경망(GNN) 기반 추천 알고리즘이 독립적이고 동일하게 분포된(IID) 데이터를 가정하지만, 실제로는 분포 외(OOD) 데이터로 인해 성능 저하가 발생하는 문제를 다룬다. 연구진은 구조적 인과 모델(SCM)을 이용하여 환경적 교란 변수(예: COVID-19 팬데믹)가 GNN 기반 모델의 상관관계를 불안정하게 만들어 OOD 데이터에 대한 일반화 성능을 저하시킨다는 것을 밝혔다. 이를 해결하기 위해, 환경적 교란 요인을 제거하고 불변의 그래프 표현을 학습하는 새로운 방법인 CausalDiffRec을 제안한다. CausalDiffRec은 백도어 조정과 변분 추론을 사용하여 실제 환경 분포를 추론하고, 이를 사전 지식으로 활용하여 확산 과정의 역방향 단계에서 불변 표현 학습을 유도한다. 또한, CausalDiffRec의 목적 함수 최적화가 환경 불변 그래프 표현 학습을 유도하여 분포 변화 환경에서 추천의 일반화 성능을 향상시킨다는 것을 이론적으로 증명하였다. 실험 결과, CausalDiffRec은 OOD 데이터에 대한 일반화 성능을 향상시켰으며, Food, KuaiRec, Yelp2018, Douban 데이터셋에서 각각 최대 10.69%, 18.83%, 22.41%, 11.65%의 성능 향상을 보였다.

시사점, 한계점

시사점:
GNN 기반 추천 시스템의 OOD 일반화 문제에 대한 새로운 관점 제시 (인과적 관점)
환경적 교란 요인을 제거하여 OOD 데이터에 대한 성능 향상을 달성하는 CausalDiffRec 제안
이론적 분석을 통해 CausalDiffRec의 효과성 증명
다양한 데이터셋에서 실험을 통해 CausalDiffRec의 우수성 검증
한계점:
SCM의 가정과 모델링의 정확성에 대한 검토 필요
특정 환경적 교란 요인에 대한 의존성 존재 가능성
더욱 다양하고 복잡한 실제 환경에 대한 추가적인 실험 필요
CausalDiffRec의 계산 비용 및 복잡도에 대한 추가적인 분석 필요
👍