PRIX: Learning to Plan from Raw Pixels for End-to-End Autonomous Driving
Created by
Haebom
作者
Maciej K. Wozniak, Lianhang Liu, Yixi Cai, Patric Jensfelt
概要
PRIX(Plan from Raw Pixels)は、カメラデータのみを使用して自律走行の安全な経路を予測する効率的なエンドツーエンドのアーキテクチャです。従来の大規模モデル、高価なLiDARセンサー、計算量の多いBED(Bird's Eye View)特徴表現への依存性をなくし、生ピクセル入力から直接経路を予測する生成型計画ヘッドと視覚特徴抽出器を活用します。コアコンポーネントであるContext-aware Recalibration Transformer(CaRT)は、マルチレベルの視覚的特徴を効果的に向上させ、より強力な計画を可能にします。 NavSimとnuScenesのベンチマークで最先端のパフォーマンスを実現し、大規模なマルチモーダル拡散計画モデルと同様のパフォーマンスを見せながら、推論速度とモデルサイズの面ではるかに効率的です。したがって、実際の展開に適した実用的なソリューションとして評価されます。ソースコードは公開される予定です。