本論文は、自律走行におけるセンサデータ(LiDARおよびカメラ)の不完全性問題を解決するために、観測されていない領域の占有および意味情報を推論する意味占有予測(SOP)に焦点を当てています。既存のトランスベースSOP法の空間構造モデリングの欠如の問題を解決するために、局所空間コンテキストをアテンションに統合する新しいメカニズムである空間認識ウィンドウアテンション(SWA)を提案します。 SWAは、LiDARベースのSOPベンチマークで最先端のパフォーマンスを達成し、カメラベースのSOPにも適用可能であることを示しています。