[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Agent KB: Leveraging Cross-Domain Experience for Agentic Problem Solving

Created by
  • Haebom

作者

Xiangru Tang, Tianrui Qin, Tianhao Peng, Ziyang Zhou, Daniel Shao, Tingting Du, Xinming Wei, Peng Xia, Fang Wu, He Zhu, Ge Zhang, Jiaheng Liu, Xingyao Wang, Sirui Hong, Chenglin Wu, Hao Cheng, Chi Wang, Wang

概要

本論文は、相互問題解決経験から効果的に学習したり、過去の成功経験を活用したり、新しい課題で自己反射や誤り訂正を行うことができない現AIエージェントの限界を指摘している。これを解決するために、高次元問題解決戦略と詳細な実行経験の両方を捉える共有知識ベースのAgent KBを提案する。 Agent KBは、学習エージェントが戦略的ガイダンスのためにワークフローレベルのパターンを検索し、教師エージェントが詳細な実行レベルパターンを改善するために識別する新しい教師 - 学生デュアルステップ検索メカニズムを実装します。この階層的アプローチにより、エージェントは外部ソースのさまざまな戦略を統合し、限定的な推論経路から逸脱することができます。 GAIAベンチマークとSWE-benchコード回復課題の評価結果、Agent KBはpass@1ベースで成功率を最大6.06%向上させ、SWE-benchではo3-miniの場合pass@1ベースで8.67%向上(23%から31.67%)を達成した。

Takeaways、Limitations

Takeaways:
AIエージェント間の知識転移のための効果的なメカニズムであるAgent KBの提示。
階層的な教師 - 学生の学習によるトラブルシューティング戦略と実行の改善。
GAIAおよびSWEベンチベンチマークでパフォーマンスの向上を実証的に実証
様々なトラブルシューティング戦略を組み込んでエージェントの推論能力を向上
Limitations:
Agent KBの拡張性と一般化能力に関するさらなる研究が必要
さまざまなドメインおよびタスクに対するAgent KBの適用可能性検証が必要です。
特定のベンチマークの評価結果であるため、一般化されたパフォーマンスを保証するのは困難です。
教師エージェントの信頼性とスクリーニング基準の明確な説明の欠如。
👍