每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

DiCoRe:通过发散-收敛法学硕士推理增强零样本事件检测

Created by
  • Haebom

作者

Tanmay Parekh、Kartik Mehta、Ninareh Mehrabi、张凯伟、彭南云

大纲

本文提出了一个全新的框架 DiCoRe,旨在解决零样本事件检测 (ED) 问题,该问题在专业领域文档理解中是一个关键问题。DiCoRe 采用发散-收敛推理方法,利用 Dreamer 和 Grounder 两个模块来克服事件本体的复杂性、特定领域触发词提取和结构化等挑战。Dreamer 通过开放式事件发现来促进发散推理,从而扩展事件范围;而 Grounder 则通过使用基于有限状态机的约束解码,将自由形式的预测与特定的任务指令对齐,从而进行收敛推理。最后,LLM-Judge 验证最终输出的准确性。在六个数据集、五个领域和九个 LLM 上进行的大量实验表明,DiCoRe 的表现优于现有的零样本、迁移学习和基于推理的方法,与同类最佳模型相比,其平均 F1 分数提高了 4-7%。

Takeaways, Limitations

Takeaways:
我们提出了一个新颖的框架 DiCoRe,其在零样本事件检测方面优于现有方法。
我们证明,通过发散-收敛推理可以提高事件覆盖率和准确性。
通过在各个领域和 LLM 上进行实验来验证 DiCoRe 的泛化性能。
Limitations:
有些部分依赖于 LLM-Judge 的性能,因此 LLM-Judge 的性能下降可能会影响整个系统的性能。
我们已经在多个领域进行了实验,但在某些领域可能会出现性能下降。可能需要针对特定​​领域进行额外的分析。
需要进一步分析所提出的框架的计算成本和效率。
👍