대규모 언어 모델(LLM) 기반 정보 검색 시스템에 대한 새로운 공격 표면, 특히 적대적 순위 조작에 대한 취약성을 다룬 논문입니다. 본 논문에서는 텍스트의 유창성과 은밀성을 유지하면서 LLM 기반 순위 시스템을 조작하는 새로운 적대적 공격 방법인 StealthRank를 제시합니다. 기존 방법들이 감지 가능한 이상 현상을 유발하는 것과 달리, StealthRank는 에너지 기반 최적화 프레임워크와 Langevin 역학을 결합하여 StealthRank Prompts(SRPs)를 생성합니다. SRPs는 항목 또는 문서 설명에 포함된 미묘하지만 효과적으로 LLM 순위 메커니즘에 영향을 미치는 적대적 텍스트 시퀀스입니다. 여러 LLM에 걸쳐 StealthRank를 평가하여, 명시적인 조작 흔적을 남기지 않고 목표 항목의 순위를 은밀하게 높일 수 있음을 보여줍니다. 실험 결과, StealthRank는 효과성과 은밀성 측면에서 최첨단 적대적 순위 기준 모델을 꾸준히 능가하며 LLM 기반 순위 시스템의 심각한 취약성을 강조합니다. 코드는 공개적으로 제공됩니다.