본 논문은 대규모 언어 모델(LLM)을 제어하는 데 효과적인 선형 개념 벡터를 다룹니다. 기존의 선형 탐색 및 평균 차이 방법은 LLM의 은닉 표현에서 이러한 벡터를 도출하지만, 다양한 데이터는 노이즈(즉, 무관한 특징)를 도입하여 제어의 견고성에 문제를 야기합니다. 이를 해결하기 위해, 본 논문에서는 희소 자동 인코더를 사용하여 은닉 표현에서 노이즈 특징을 제거하는 희소 자동 인코더-탈잡음 개념 벡터(SDCV)를 제안합니다. 선형 탐색 및 평균 차이 방법에 적용했을 때, 제안된 방법은 제어 성공률을 향상시킵니다. 반실험 및 특징 시각화를 통해 노이즈 가설을 검증합니다.