每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

幻觉排毒:用于大型语言模型训练的灵敏度下降(SenD)

Created by
  • Haebom

作者

Shahrad Mohammadzadeh、胡安·大卫·格拉、Marco Bonizzato、Reihaneh Rabbany、Golnoosh Farnadi

大纲

鉴于人们对大规模语言模型 (LLM) 可靠性日益担忧,尤其是幻觉现象(指事实不准确或输出不相关),本研究探讨了训练动态的不确定性与幻觉发生之间的关系。我们使用 Pythia 模型并结合多种幻觉检测指标,分析了训练过程中幻觉的趋势,并识别出显著的方差。为了解决这个问题,我们提出了灵敏度下降 (SenD),这是一种新颖的训练协议,可以确定性地移除高度波动的嵌入索引,以减少训练过程中的幻觉方差。此外,我们开发了高效特征值 (EES),这是一种无监督幻觉检测指标,其性能接近传统特征值两倍。该指标已集成到 SenD 中,从而能够以计算效率降低幻觉方差。 SenD 在测试期间将 Pythia 和 Meta 的 Llama 模型的可靠性提高了 17%,并提高了维基百科、医学、法律和编码领域的事实准确性,而不会影响下游任务的性能。

Takeaways, Limitations

Takeaways:
调查不确定性与法学硕士培训期间幻觉发生之间的关联。
提出了一种减少幻觉差异的新型训练协议SenD。
开发 EES,一种计算效率高的无监督幻觉检测指数。
提高了 Pythia 和 Llama 模型的可靠性和准确性。
Limitations:
特定模型(Pythia、Llama)的实验结果。
需要对SenD的普遍性进行进一步研究。
有必要评估 EES 的准确性及其在各种数据集上的性能。
👍