본 논문은 표상 공학(RepE)을 시각-언어 모델(VLMs)에 확장 적용하여, 다중 모달 표상의 보존 및 변환 과정을 분석한 연구입니다. VLMs에서 시각 정보가 언어적 지식을 압도하여 현실과 모순되는 환각 응답이 발생하는 문제를 해결하기 위해, RepE를 통해 고차원 표상에 초점을 맞춰 해석성과 제어성을 향상시키는 방법을 제시합니다. 주요층에서의 신경 활동 안정성을 주성분 벡터를 이용하여 설명하는 이론적 틀을 개발하고, 실험적으로 검증하여 RepE를 기술적 도구에서 구조화된 이론적 틀로 발전시켰습니다. 이를 통해 AI의 강건성, 공정성, 투명성 향상을 위한 새로운 방향을 제시합니다.