每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

通过基于稀疏自动编码器的向量细化增强 LLM 控制

Created by
  • Haebom

作者

王安仪、吴宣胜、舒东、马云普、刘宁浩

SAE-RSV:使用稀疏自动编码器进行转向矢量细化

大纲

本文重点研究了转向,这是一种在不修改大规模语言模型 (LLM) 参数的情况下控制其参数的有前景的方法。现有的转向方法依赖于大型数据集来学习清晰的动作信息,但从小型数据集中学习到的转向向量通常包含与任务无关的噪声特征,导致效率低下。为了解决这个问题,本文提出了 SAE-RSV(通过稀疏自编码器优化转向向量),它使用稀疏自编码器 (SAE) 对转向向量进行语义去噪和增强。SAE 根据与已识别的相关特征的语义相似性,从小型数据集中去除与任务无关的特征并增强缺失的任务相关特征。实验结果表明,所提出的 SAE-RSV 优于所有基准方法,包括基于监督学习的微调。我们证明,通过 SAE 优化原始转向向量可以从有限的训练数据中构建有效的转向向量。

Takeaways, Limitations

Takeaways:
提出了一种新方法,即使使用小型数据集也能实现有效的 LLM 控制。
使用 SAE 消除噪声并增强转向矢量
与现有方法相比表现出更优异的性能
Limitations:
缺乏有关特定 SAE 结构和超参数的信息。
需要进一步研究来确定所提出方法的普遍性。
缺乏对基于 SAE 的精炼过程的计算成本的考虑。
👍