본 논문은 대규모 언어 모델(LLM)의 추론 비용 공격에 대한 새로운 유형의 공격 기법인 '비트 플립 추론 비용 공격'을 제시한다. 기존의 공격 방식이 공격자가 직접 비용을 부담하는 자기 대상 공격이라는 점을 지적하며, 'BitHydra'라는 새로운 방법을 제안한다. BitHydra는 모델 파라미터의 중요 비트를 뒤집어 토큰 확률을 억제함으로써 최대 길이의 출력을 생성하게 만든다. 11개의 LLM을 대상으로 한 실험 결과, 소량의 비트 플립만으로도 다양한 LLM에서 최대 길이의 출력을 생성하는 높은 효율성과 전이성을 보였다.