每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

超越分块:面向长文档问答的语篇感知分层检索

Created by
  • Haebom

作者

陈辉耀、杨易、李英辉、张美山、张敏

大纲

本文提出了一个基于修辞结构理论 (RST) 的语篇感知层级框架,以克服现有方法的局限性,这些方法无法捕捉长文档问答系统中易于人类理解的语篇结构。该框架将语篇树转换为句子级表示,并使用 LLM 增强的节点表示连接结构和语义信息。其核心创新包括三个关键要素:针对长文档的语篇解析、基于 LLM 的语篇关系节点增强以及基于结构的层级检索。在 QASPER、Quality 和 NarrativeQA 数据集上的实验表明,与现有方法相比,该方法的性能持续提升,表明语篇结构集成显著提升了各种文档类型的问答性能。

Takeaways, Limitations

Takeaways:
提出了一种在长文档问答中利用话语结构的新方法。
将LLM与语篇结构相结合以提高绩效。
证明了跨不同数据集的一致性能改进。
进行消除研究来证明话语结构的重要性。
Limitations:
论文中没有明确提及具体的 Limitations。
使用 LLM 相关的计算成本和潜在资源消耗。
依赖于基于 RST 的话语分析的准确性和稳健性。
仅限于特定的话语结构(RST)。应考虑将其扩展到其他话语理论。
👍