본 논문은 추천 시스템에서 사용자 및 아이템 임베딩으로부터 일관되고 해석 가능한 개념에 부합하는 단일 의미 뉴런을 추출하는 방법을 제시합니다. 희소 오토인코더(SAE)를 활용하여 사전 훈련된 표현 내에서 의미 구조를 드러냅니다. 언어 모델 연구와 달리, 추천 시스템의 단일 의미는 사용자 및 아이템 임베딩 간의 상호 작용을 보존해야 합니다. 이를 위해, 고정된 추천 시스템을 통해 역전파하고 학습된 잠재 구조를 모델의 사용자-아이템 선호도 예측에 맞추는 예측 인식 훈련 목표를 도입했습니다. 결과적으로, 장르, 인기, 시간적 트렌드와 같은 속성을 포착하는 뉴런을 생성하며, 기본 모델을 수정하지 않고도 타겟 필터링 및 콘텐츠 프로모션과 같은 사후 제어 작업을 지원합니다.