Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

VolleyBots: A Testbed for Multi-Drone Volleyball Game Combining Motion Control and Strategic Play

Created by
  • Haebom

作者

Zelai Xu, Ruize Zhang, Chao Yu, Huining Yuan, Xiangmin Yi, Shilong Ji, Chuqi Wang, Wenhao Tang, Feng Gao, Wenbo Ding, Xinlei Chen, Yu Wang

概要

この論文では、多くのドローンがバレーボールの試合で協力し競争するロボットスポーツテストベッドであるVoleyBotsを紹介します。 VolleyBotsは、競争と協力のゲームプレイ、ターンベースのインタラクション構造、アジャイルな3D起動という3つの特徴を統合したプラットフォームです。ドローンはチームメイトと調整し、相手チームの戦術を予想し、対応しなければならない課題を抱えています。ターンベースのインタラクションは正確なタイミング、正確な状態予測、長期的な時間依存性管理を必要とし、機敏な3D起動は、クワッドロータの不足駆動にもかかわらず、高速加速、急激な回転、正確な3D位置決めを必要とします。論文では、シングルドローンの練習からマルチドローンのコラボレーションと競争の課題に至るまでの包括的な課題セットと、代表的なマルチエージェント強化学習(MARL)とゲーム理論アルゴリズムの基準評価を提供します。シミュレーション結果は、オンポリシー強化学習(RL)法が単一のエージェント課題ではオフポリシー法よりも優れていますが、運動制御と戦略的プレイを組み合わせる複雑な課題では、両方の方法が困難になることを示しています。また、階層的ポリシーを設計し、3対3の課題で最も強力な基準より69.5%の勝率を達成し、低レベルの制御と高レベルの戦略との複雑な相互作用を解決するための効果的なソリューションとしての可能性を強調します。

Takeaways、Limitations

Takeaways:
ロボットスポーツを通じて実現された知能を評価できる新しいテストベッドであるVoleyBotsを提示。
運動制御と戦略的プレイを組み合わせた複雑な問題に対する効果的な解決策として,階層的政策の可能性を示した。
オンポリシRL法は,単一エージェント課題においてより良い性能を示した。
Limitations:
オンポリシーとオフポリシーのRL方法はどちらも、運動制御と戦略的プレイが組み合わされた複雑な課題で困難になります。
実際の環境ではなくシミュレーション環境での結果の提示
提示された階層的政策がすべての複雑な状況に効果的であるかどうかをさらに検討する必要があります。
👍