[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Agentic Reasoning: A Streamlined Framework for Enhancing LLM Reasoning with Agentic Tools

Created by
  • Haebom

作者

Junde Wu, Jiayuan Zhu, Yuyuan Liu, Min Xu, Yueming Jin

概要

この論文では、外部ツール使用エージェントを統合して大規模言語モデル(LLM)の推論能力を向上させるためのエージェント推論フレームワークを紹介します。 Web検索、コード実行、構造化メモリを動的に活用して、深い研究を必要とする複雑な問題を解決します。コアイノベーションは、推論の文脈を保存し、論理的な関係を追跡し、幅広いツールの使用による長期的な推論の過程で一貫性を維持するMind-Mapエージェントです。さらに、Web検索エージェントの包括的なナビゲーションを通じて既存のアプローチを上回る高効率な検索メカニズムを開発しました。 DeepSeek-R1に適用されたこの方法は、パブリックモデルの最先端(SOTA)性能を達成し、この分野のリーディング独占モデルであるOpenAI Deep Researchと同様の性能を示しました。広範な除去研究は、エージェントツールの最適な選択を検証し、マインドマップとWeb検索エージェントの効果を確認しました。コードはhttps://github.com/theworldofagents/Agentic-Reasoningで確認できます。

Takeaways、Limitations

Takeaways:
LLMの推論能力を向上させる新しいフレームワークであるエージェント推論を提示します。
マインドマップエージェントによる長期推論プロセスの一貫性の確保
既存の手法を上回る高効率なWeb検索メカニズムの開発
パブリックモデルの中で最先端のパフォーマンスを達成し、OpenAI Deep Researchに似たパフォーマンスを実現。
エージェントツールの最適選択とエージェントの有効性検証
Limitations:
本論文で提示されたアプローチの一般化の可能性に関するさらなる研究の必要性
さまざまな種類の問題のパフォーマンス評価がさらに必要です。
エージェント推論フレームワークのスケーラビリティと効率性の追加分析が必要です。
独占モデルであるOpenAI Deep Researchとの直接的な比較ではなく、パフォーマンス比較という点。
👍