본 논문은 언어 모델의 행동을 명시적으로 제어하기 위한 경량 방식인 캐시 조향(cache steering)을 제안합니다. GPT-4를 이용해 생성된 추론 과정을 활용하여, 미세 조정이나 프롬프트 수정 없이도 모델의 행동을 더 명시적이고 다단계적인 추론으로 유도하는 조향 벡터를 구성합니다. 소규모 언어 모델에서 사고 연쇄 추론을 유도하는 데 이 기법을 적용하여, 다양한 추론 벤치마크에 대한 실험 평가를 통해 모델 추론의 질적 구조와 양적 과제 수행 능력 모두 향상됨을 보여줍니다. 기존의 활성화 조향 기법과 비교하여, 일회성 캐시 조향은 초매개변수 안정성, 추론 시간 효율성, 통합 용이성 측면에서 상당한 이점을 제공하여 더욱 강력하고 실용적인 솔루션임을 제시합니다.