Quantifying the Robustness of Retrieval-Augmented Language Models Against Spurious Features in Grounding Data
Created by
Haebom
Category
Empty
저자
Shiping Yang, Jie Wu, Wenbiao Ding, Ning Wu, Shining Liang, Ming Gong, Hengyuan Zhang, Dongmei Zhang
개요
본 논문은 실세계 응용에서 RAG 시스템의 배포를 위해 강건성이 중요한 속성이 되었다는 점을 강조합니다. 기존 연구는 명시적인 노이즈(예: 문서 의미)에 대한 강건성에 초점을 맞추었지만, spurious features(암묵적인 노이즈)는 간과했습니다. 이전 연구는 LLMs에서 spurious features를 탐구했지만, 특정 기능(예: 형식)과 좁은 시나리오(예: ICL)로 제한되었습니다. 본 연구는 RAG 패러다임에서 spurious features의 존재를 통계적으로 확인하고, 이는 LLM의 의미와 무관한 기능에 대한 민감성으로 인한 강건성 문제임을 밝힙니다. 또한, spurious features의 포괄적인 분류를 제공하고, 통제된 실험을 통해 그 영향을 경험적으로 정량화합니다. 추가 분석을 통해 모든 spurious features가 해로운 것은 아니며 때로는 유익할 수도 있음을 밝힙니다. 여러 LLM에 대한 광범위한 평가 결과는 spurious features가 RAG 분야에서 널리 퍼져 있고 어려운 문제임을 시사합니다. 향후 연구를 용이하게 하기 위해 코드와 데이터 세트를 공개합니다. 모든 코드와 데이터는 https://github.com/maybenotime/RAG-SpuriousFeatures에서 공개됩니다.