本論文は、AIベースのソフトウェア開発プラットフォームの普及によって引き起こされるWebアプリケーションセキュリティ監査のスケーラビリティ危機を解決するために、マルチエージェントシステムであるMAPTAを提示します。 MAPTAは、大規模な言語モデルとツールベースの実行、およびエンドツーエンドの悪用検証を組み合わせて、自律的なWebアプリケーションセキュリティ評価を実行します。 XBOWベンチマーク(104課題)で優れた性能を示し、特にSSRF、誤った設定エラーなどでは完璧な性能を記録した。コスト分析の結果、成功した試みは平均0.073ドル、失敗は0.357ドルであり、成功と資源効率の間の高い相関関係を確認しました。実際のGitHubリポジトリ(8K-70K stars)の評価で、RCE、命令挿入、秘密公開、ランダムファイル書き込みなどの重大な脆弱性が発見され、10件の発見はCVEレビュー中です。