본 논문은 Retrieval-Augmented Generation (RAG) 시스템의 데이터 추출 공격에 대한 새로운 위협인 Implicit Knowledge Extraction Attack (IKEA)을 제시합니다. 기존의 공격 방식과 달리 IKEA는 악성 입력 없이 자연스러운 질문을 통해 RAG 시스템의 개인 정보를 추출합니다. 핵심 개념(anchor concepts)을 활용하여 질문을 생성하고, 과거 질문-응답 패턴을 기반으로 핵심 개념을 샘플링하는 Experience Reflection Sampling과 유사성 제약 조건 하에 핵심 개념을 반복적으로 변형하는 Trust Region Directed Mutation 메커니즘을 통해 RAG 시스템의 지식을 효과적으로 추출합니다. 실험 결과, IKEA는 기존 방식보다 추출 효율성과 공격 성공률이 훨씬 높으며, 추출된 정보를 활용한 RAG 시스템이 기존 방식보다 성능이 우수함을 보여줍니다. 이는 RAG 시스템의 심각한 개인 정보 유출 위험성을 시사합니다.
시사점, 한계점
•
시사점:
◦
악성 입력 없이 RAG 시스템의 개인 정보를 효과적으로 추출하는 새로운 공격 기법(IKEA) 제시.
◦
기존의 데이터 추출 공격 방식의 한계를 극복하고 높은 성공률과 효율성을 달성.
◦
IKEA를 통해 추출된 데이터로 구축한 RAG 시스템이 기존 방식보다 우수한 성능을 보임으로써 RAG 시스템의 심각한 취약성을 입증.
◦
RAG 시스템의 보안 강화 및 개인 정보 보호를 위한 새로운 방어 및 완화 전략 개발 필요성 제기.
•
한계점:
◦
IKEA의 효과성은 특정 RAG 시스템 및 데이터셋에 대한 실험 결과에 기반하므로, 다른 시스템 및 데이터셋에 대한 일반화 가능성 검증 필요.
◦
IKEA의 공격 성공률과 효율성은 특정 방어 기법에 대한 실험 결과에 기반하므로, 다양한 방어 기법에 대한 추가적인 실험 및 분석 필요.