鉴于人们对大规模语言模型 (LLM) 可靠性日益担忧,尤其是幻觉现象(指事实不准确或输出不相关),本研究探讨了训练动态的不确定性与幻觉发生之间的关系。我们使用 Pythia 模型并结合多种幻觉检测指标,分析了训练过程中幻觉的趋势,并识别出显著的方差。为了解决这个问题,我们提出了灵敏度下降 (SenD),这是一种新颖的训练协议,可以确定性地移除高度波动的嵌入索引,以减少训练过程中的幻觉方差。此外,我们开发了高效特征值 (EES),这是一种无监督幻觉检测指标,其性能接近传统特征值两倍。该指标已集成到 SenD 中,从而能够以计算效率降低幻觉方差。 SenD 在测试期间将 Pythia 和 Meta 的 Llama 模型的可靠性提高了 17%,并提高了维基百科、医学、法律和编码领域的事实准确性,而不会影响下游任务的性能。