Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks

Created by
  • Haebom

作者

Lingyi Wang, Rashed Shelim, Walid Saad, Naren Ramakrishnan

概要

本稿では、無線ネットワークにおける既存の強化学習(RL)ベースの学習アプローチのデータ効率の低下と短期的なポリシー決定の問題を解決するために、世界モデルベースの学習フレームワークを提案します。特に、高いモビリティ、頻繁な信号遮断、非常に短いコヒーレンス時間を特徴とするmmWave V2X通信ネットワークでのパケット完成度認識情報エージング(CAoI)の最小化に焦点を当てています。提案されたフレームワークはmmWave V2X環境の動的モデルを学習し、それを使用してリンクスケジューリングを実行する方法を学習するために軌跡を予測します。実際の環境インタラクションではなく、微分可能な想像された軌跡で長期的なポリシーを学習し、時間とともに変化する無線データを予測し、実際の無線およびV2Xネットワークでリンクスケジューリングを最適化します。 Sionnaベースの現実的なシミュレータを使用して幅広い実験を行いました。提案された世界モデルは、既存のMBRLおよびMFRL法と比較してCAoIをそれぞれ26%、16%改善することを示しています。

Takeaways、Limitations

Takeaways:
世界モデルベースの強化学習により、ワイヤレスネットワーク、特にMmWave V2X環境でデータ効率を大幅に向上させることができます。
CAoIを効果的に最小化する新しいリンクスケジューリング戦略を提示する。
実際の環境インタラクションなしで効率的な意思決定ができるように、世界モデルの想像力を活用します。
物理ベースのチャネルモデリング、光線追跡、シーンジオメトリを統合した現実的なシミュレータを使用して、実験の信頼性を高めました。
Limitations:
提案されたモデルの性能は、使用されるシミュレータの精度に依存する可能性があります。実際の環境でのパフォーマンス評価がさらに必要です。
世界モデルの複雑さにより、計算コストが増加する可能性があります。リアルタイム適用のための追加の最適化が必要な場合があります。
MmWave V2X環境に特化したモデルであるため、他のワイヤレスネットワーク環境への一般化の可能性に関する追加の研究が必要です。
👍