Angular Steering은 대규모 언어 모델의 특정 동작을 제어하면서 일반적인 능력을 유지하는 새로운 방법입니다. 이 방법은 활성화를 고정된 2차원 공간 내에서 회전시키는 방식으로 동작하며, 거부 및 준수와 같은 동작을 정밀하게 제어할 수 있습니다. 기하학적 회전을 통해 파라미터 선택을 단순화하고 모델 안정성을 유지하며, 기존의 추가 및 직교화 기술을 통합합니다. Adaptive Angular Steering은 대상 특징에 정렬된 활성화만 선택적으로 회전시켜 안정성과 일관성을 더욱 향상시킵니다. 다양한 모델에서 실험한 결과, Angular Steering은 일반적인 언어 모델링 성능을 유지하면서 강력한 동작 제어를 달성했습니다.