Sequential Recommenders는 사용자 상호 작용 시퀀스를 통해 동적 사용자 의도를 활용하지만, 적대적 공격에 취약하다. 본 논문은 실용성이 부족한 기존 데이터 포이즈닝 공격 대신, 부분적인 사용자 상호 작용을 미묘하게 오염시켜 의도된 오해석을 유도하는 Profile Pollution Attack (PPA)에 초점을 맞춘다. 기존 PPA의 한계점을 해결하기 위해, 본 논문은 adversarial 효과와 은밀성을 균형 있게 유지하기 위해 bi-level 최적화 프레임워크와 multi-reward 강화 학습을 결합한 CREAT (constrained reinforcement driven attack)를 제안한다. Pattern Inversion Rewards를 통해 중요한 패턴을 반전시키고, unbalanced co-optimal transport를 통해 감지 가능한 변화를 최소화하는 Pattern Balanced Rewarding Policy를 개발했다. 또한 dynamic barrier constraints와 group-shared experience replay를 통해 단계별 perturbation을 가능하게 하는 Constrained Group Relative Reinforcement Learning을 사용하여 감지 가능성을 최소화하면서 targeted pollution을 달성한다.
시사점, 한계점
•
시사점:
◦
Sequential Recommenders에 대한 실용적인 적대적 공격 기법 제시.
◦
PPA의 새로운 접근 방식인 CREAT 개발.
◦
패턴 반전과 분포 일관성을 고려한 Pattern Balanced Rewarding Policy 도입.
◦
Constrained Group Relative Reinforcement Learning을 통한 단계별 perturbation.
◦
효과적인 targeted pollution 달성.
•
한계점:
◦
CREAT의 일반화 가능성 및 다른 추천 시스템 아키텍처에 대한 적용 가능성 추가 연구 필요.