Chain-of-Thought (CoT) 프롬프팅을 사용하는 LLM의 추론 능력 향상에도 불구하고, 계산 효율성이 새로운 공격 표면으로 부상했습니다. 본 논문은 CoT가 활성화된 LLM에 "과잉 사고" 행동을 의도적으로 유발하도록 설계된 최초의 백도어 공격인 BadThink를 제안합니다. BadThink는 신중하게 제작된 트리거 프롬프트에 의해 활성화되어 모델이 최종 출력의 일관성을 유지하면서 불필요하게 중복된 사고 과정을 생성하도록 조작합니다. 이러한 공격은 은밀하게 성능 저하를 유발하여 계산 비용과 추론 시간을 크게 증가시킵니다. BadThink는 정교한 포이즈닝 기반 미세 조정 전략을 통해 구현되며, LLM 기반 반복적 최적화 프로세스를 사용하여 자연스러운 포이즌 데이터를 생성함으로써 공격을 내재화합니다. 실험 결과, BadThink는 여러 최첨단 모델 및 추론 작업에서 추론 추적 길이를 일관되게 증가시켰으며 (MATH-500 데이터 세트에서 17배 이상 증가), 은밀하고 견고한 특성을 보였습니다. 이 연구는 추론 효율성을 은밀하게 조작할 수 있는 새로운 취약점을 공개하며, CoT 기반 시스템에 대한 새로운 종류의 정교한 공격을 제시합니다.