본 논문은 검색 증강 생성(RAG) 시스템에서 벡터 데이터베이스에 대한 공격 및 방어에 대해 연구한다. 특히 사실적이지만 의미론적으로 편향된 구절을 지식 기반에 삽입하여 대규모 언어 모델(LLM)이 생성하는 답변의 이념적 프레이밍에 은밀하게 영향을 미치는 편향 주입 공격을 소개한다. 저자들은 이 공격이 기존의 검색 기반 방어 수단을 효과적으로 회피하고 LLM 답변을 공격자의 의도된 관점으로 유도할 수 있음을 입증한다. 또한, 저자들은 사후 검색 필터링 방어 기법인 BiasDef를 개발하고, 이를 포괄적인 벤치마크를 통해 평가하여 그 효과를 입증했다.