每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

思考者:学习快速思考和缓慢思考

Created by
  • Haebom

作者

钟星驰、杜文宇、付杰

大纲

本文基于心理学的双过程理论,提出了一种新颖的问答 (QA) 任务,旨在提升大规模语言模型 (LLM) 的推理能力。该任务旨在兼顾直觉推理和深思熟虑推理,涵盖四个阶段:快速思考、验证、慢速思考和总结。该任务将 Qwen2.5-1.5B 模型的平均准确率从 25.6% 提升至 27.3%,将 DeepSeek-R1-Qwen-1.5B 模型的平均准确率从 45.9% 提升至 51.0%,展现出显著的推理效率,尤其是在快速思考阶段。训练好的模型和源代码已公开发布。

Takeaways, Limitations

Takeaways:
提出了一种将直觉思维和深思熟虑的推理相结合的新方法,以提高法学硕士学生的推理能力。
所提出的方法在 Qwen2.5-1.5B 和 DeepSeek-R1-Qwen-1.5B 模型上均显示出更高的准确率。
在快速思考阶段,我们通过即使使用少量标记也能实现显著的准确性来展示推理效率。
通过开放模型和源代码来提高研究的可重复性和可用性。
Limitations:
需要进一步研究来确定所提出的方法对于其他 LLM 模型或复杂的 QA 任务是否同样有效。
缺乏对四步工作流程中每一步的贡献和交互的深入分析。
它与理论基础双重加工理论的关系有待进一步深入思考。
👍