PRIX: Learning to Plan from Raw Pixels for End-to-End Autonomous Driving
Created by
Haebom
作者
Maciej K. Wozniak, Lianhang Liu, Yixi Cai, Patric Jensfelt
概要
PRIX(Plan from Raw Pixels)は、カメラデータのみを使用して自律走行の安全な経路を予測する効率的なエンドツーエンドのアーキテクチャです。従来の高価なLiDARセンサーと計算量の多いBEVの特徴表現への依存を排除し、生のピクセル入力から直接安全な経路を予測する視覚的特徴抽出器と生成計画ヘッドを活用します。コアコンポーネントであるContext-aware Recalibration Transformer(CaRT)は、さまざまなレベルの視覚的特徴を効果的に向上させ、より強力な計画を可能にします。 NavSimとnuScenesのベンチマークで最先端のパフォーマンスを達成し、より大きなマルチモーダル拡散プランナーと同様のパフォーマンスを見せながら、推論速度とモデルサイズの面ではるかに効率的です。したがって、実際の展開に適した実用的なソリューションです。