Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

LSD-3D: Large-Scale 3D Driving Scene Generation with Geometry Grounding

Created by
  • Haebom

作者

Julian Ost、Andrea Ramazzina、Amogh Joshi、Maximilian B omer、Mario Bijelic、Felix Heide

概要

本論文はロボット学習のための大規模なシーンデータ生成の問題を扱う。既存のニューラルネットワークベースの再構成方法は、実際の環境に基づいて大規模な屋外シーンを再構成するのに役立ちますが、静的環境に限定され、シーンや軌跡の多様性が不足しているという制限があります。一方、最近の画像またはビデオ拡散モデルは制御可能性を提供するが、幾何学的基盤と因果関係が不足している。本研究は、これらの限界を克服するために、正確な幾何学情報を持つ大規模な3D走行シーンを直接生成する方法を提示する。提案された方法は、プロキシ幾何学および環境表現生成と学習された2D画像辞書情報からのスコア蒸留とを組み合わせて高い制御性を提供し、地図レイアウトを条件として現実的で幾何学的に一貫した複雑な走行シーンの3D生成を可能にする。

Takeaways、Limitations

Takeaways:
正確な幾何学情報を持つ大規模な3D走行シーンを直接生成する新しい方法を提示
高い制御性を提供し、プロンプトベースのジオメトリと高忠実度のテクスチャと構造を生成する
マップレイアウトを条件に、現実的で幾何学的に一貫した3D生成が可能
オブジェクトの永続性と明示的な3D幾何推定による因果的新しいビュー合成
Limitations:
提案手法の性能評価に関する具体的な内容の欠如
大規模データセットの一般化パフォーマンスの検証が必要
実際のロボットシステムに適用可能性に関するさらなる研究が必要
👍