Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

SE-Agent: Self-Evolution Trajectory Optimization in Multi-Step Reasoning with LLM-Based Agents

Created by
  • Haebom

作者

Jiaye Lin, Yifu Guo, Yuzhen Han, Sen Hu, Ziyi Ni, Licheng Wang, Mingguang Chen, Daxin Jiang, Binxing Jiao, Chen Hu, Huacan Wang

概要

本稿では、大規模言語モデル(LLM)ベースのエージェントのトラブルシューティングプロセス(相互作用経路)を最適化する新しいフレームワークであるSE-Agentを提案します。既存のMCTSのような方法は、相互依存性とさまざまなナビゲーションスペースの不足のために非効率的な側面があることを指摘しています。これにより、さまざまな解決パスを探索し、効率の悪いパスの影響を軽減してパフォーマンスを向上させます。 SWE-bench Verifiedを用いた実験の結果、5つの強力なLLMで最大55%の性能向上を示し、最先端の性能を達成しました。

Takeaways、Limitations

Takeaways:
LLMベースのエージェントのトラブルシューティングプロセスの最適化に対する新しいアプローチの提示
自己進化型フレームワークによるナビゲーション空間の拡張とパフォーマンスの向上
既存経路のリサイクルによる効率的な学習
実際のGitHub問題解決による実用性検証と優れた性能達成(最大55%の性能向上)
オープンソース公開によるアクセシビリティの向上
Limitations:
提案されたフレームワークの一般化の可能性に関するさらなる研究が必要
特定ドメイン(GitHub問題)の評価結果であるため、他のドメインへのスケーラビリティ検証が必要
計算コストの増加の可能性(自己進化プロセスの反復演算)
SWE-bench Verifiedデータセットへの依存性
👍