每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

CTTS:集体测试时间缩放

Created by
  • Haebom

作者

宋振德、唐胜基、叶鹏、范嘉媛、白雷、陈涛、欧阳万里

大纲

本文提出了集体测试时间扩展 (CTTS) 来克服测试时间扩展 (TTS) 的局限性,TTS 是一种无需训练即可提升大规模语言模型 (LLM) 性能的方法。CTTS 旨在通过与多个智能体和多个奖励模型协作来提升性能,超越传统的单一测试时间扩展 (STTS) 范式。为此,我们系统地研究了三种交互范式——SA-MR、MA-SR 和 MA-MR,并论证了 MA-MR 范式的优越性。之后,我们提出了一个全新的框架 CTTS-MM,该框架通过用于智能体协作的智能体协作搜索 (ACS) 和用于奖励模型协作的混合奖励模型 (MoR) 来最大化 LLM 的性能。CTTS-MM 在各种基准测试中均优于现有的 STTS 方法和最先进的 LLM(例如 GPT-4.1)。

Takeaways,Limitations

Takeaways:
集体测试时间缩放 (CTTS) 提出了一种提高 LLM 性能的新方法,并且特别有用,因为它可以在没有训练的情况下提高性能。
通过与多智能体和多奖励模型协作,我们克服了现有 STTS 方法的局限性,并取得了超越最先进 LLM 性能的结果。
代理协作搜索(ACS)和混合奖励模型(MoR)策略是 CTTS-MM 的核心技术贡献,增加了其实际适用性。
通过开源代码披露支持研究的可重复性和可扩展性。
Limitations:
尽管论文中没有直接提到具体的 Limitations,但可能需要进一步研究 CTTS-MM 的计算成本、ACS 和 MoR 策略的优化以及在各种 LLM 和基准环境中的通用性。
论文中给出的具体参数设置和实验环境可能存在不足,需要在其他环境下进行性能验证。
👍