Rescuing the Unpoisoned: Efficient Defense against Knowledge Corruption Attacks on RAG Systems
Created by
Haebom
Category
Empty
저자
Minseok Kim, Hankook Lee, Hyungjoon Koo
개요
본 논문은 대규모 언어 모델(LLM) 기반의 검색 증강 생성(RAG) 시스템에서 지식 오염 공격에 대한 방어 기법인 RAGDefender를 소개합니다. RAGDefender는 검색 후 단계에서 경량 머신러닝 기술을 사용하여 추가적인 모델 훈련이나 추론 없이 유해 콘텐츠를 감지하고 필터링합니다. 실험 결과, RAGDefender는 기존 방어 기법보다 우수한 성능을 보였습니다.