本文重点研究了转向,这是一种在不修改大规模语言模型 (LLM) 参数的情况下控制其参数的有前景的方法。现有的转向方法依赖于大型数据集来学习清晰的动作信息,但从小型数据集中学习到的转向向量通常包含与任务无关的噪声特征,导致效率低下。为了解决这个问题,本文提出了 SAE-RSV(通过稀疏自编码器优化转向向量),它使用稀疏自编码器 (SAE) 对转向向量进行语义去噪和增强。SAE 根据与已识别的相关特征的语义相似性,从小型数据集中去除与任务无关的特征并增强缺失的任务相关特征。实验结果表明,所提出的 SAE-RSV 优于所有基准方法,包括基于监督学习的微调。我们证明,通过 SAE 优化原始转向向量可以从有限的训练数据中构建有效的转向向量。