本論文は,最新の大規模言語モデル(LLM)の推論能力を活用して,ドメイン特化アプリケーションに適用するためのマルチエージェントシステムの探索的研究結果を提示する。特に、複数の特殊化されたLLMを介して推論技術、コード生成、およびソフトウェア実行を組み合わせる方法に焦点を当てます。 LLM、推論技術、およびアプリケーションを個別に評価する従来の研究とは異なり、この論文はマルチエージェントLLMシステムの明確な仕様を定義し、エージェントスキーマ言語を導入してマルチエージェントシステムアーキテクチャとプロトタイプを介して仕様を実行および評価する方法を提供します。サイバーセキュリティタスクを含むテストケースを使用してアーキテクチャと評価アプローチの実現可能性を示し、OpenAIとDeepSeekのLLMを使用した質問応答、サーバーセキュリティ、およびネットワークセキュリティタスクの正常な完了を通じて評価結果を提示します。