Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

HyperAgent: Generalist Software Engineering Agents to Solve Coding Tasks at Scale

Created by
  • Haebom

作者

Huy Nhat Phan, Tien N. Nguyen, Phong X. Nguyen、Nghi DQ Bui

概要

この論文では、さまざまなプログラミング言語で幅広いソフトウェアエンジニアリング(SE)タスクを実行するように設計された、革新的な一般的なマルチエージェントシステムであるHyperAgentを紹介します。 HyperAgentは、人間開発者のワークフローを模倣し、計画、ナビゲーション、コード編集、実行など、SEタスクのライフサイクル全体を処理できる4つの専門エージェント(Planner、Navigator、Code Editor、Executor)を特徴としています。 SWE-Benchベンチマークを使用したGitHub問題の解決、RepoExecを使用したスト​​レージレベルのコード生成、Defects4Jを使用した障害の特定、プログラムのリカバリなど、さまざまなSE操作で既存の最高のパフォーマンスを上回る結果を示しています。

Takeaways、Limitations

Takeaways:
LLMベースのマルチエージェントシステムは、人間の開発者のワークフローを効果的に模倣し、さまざまなSE作業を自動化できることを示しています。
HyperAgentは、従来の特定の機能に限定されたシステムとは異なり、一般的なSE操作に適用可能な汎用システムであることを証明しました。
さまざまなベンチマークで既存の最高性能を超える結果を達成し、システムの卓越性を実証。
Limitations:
論文では、HyperAgentの具体的な実装方法や各エージェントの動作メカニズムの詳細な説明が不足している。
さまざまなSEタスクの一般化されたパフォーマンスを示していますが、特定の種類のタスクまたはプログラミング言語のパフォーマンスが低下する可能性があります。
実際の商業環境での適用性と安定性の検証がさらに必要です。
👍