每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

接地无根:用于量化多模态法学硕士 (LLM) 中的幻觉的谱图框架

Created by
  • Haebom

作者

最高政府,斯瓦加塔姆·达斯

大纲

本文旨在解决大规模语言模型 (LLM) 中的幻觉现象,这是开发可靠人工智能的一项基本挑战,尤其是在医学、法律和金融等高风险多模态领域。我们提出了一个严格的信息几何框架来量化多模态 LLM (MLLM) 中的幻觉现象,克服了现有依赖定性基准测试或临时缓解措施的评估技术的局限性。本研究将 MLLM 的输出表示为基于多模态图拉普拉斯算子的谱嵌入,并将真值与不一致性之间的流形差距表征为语义扭曲。这建立了一个窄瑞利-里兹边界,该边界是多模态幻觉能量随时间变化的温度分布函数。利用重放核希尔伯特空间 (RKHS) 嵌入中的特征模态分解,我们提供了一个模态感知且理论可解释的指标,可以捕捉幻觉随时间和输入提示的演变。

Takeaways, Limitations

Takeaways:
提出了第一个用于量化多模态 LLM 中的幻觉现象的信息几何框架。
为幻觉现象的数学分析和理解奠定基础。
提供指标来跟踪幻觉随时间的变化以及通过温度退火输入提示的变化。
将幻觉从定性风险转变为可分析的现象。
Limitations:
缺乏有关论文中提出的框架的实际实施和应用的具体信息。
需要验证所提出的度量的普遍性及其对各种 MLLM 架构的适用性。
缺乏缓解和消除幻觉的切实可行的解决方案。
👍