EarthCrafter: Scalable 3D Earth Generation via Dual-Sparse Latent Diffusion
Created by
Haebom
作者
Shang Liu, Chenjie Cao, Chaohui Yu, Wen Qian, Jing Wang, Fan Wang
概要
この論文では、地理的に広大な地域(数千平方キロメートル)の3Dモデルを作成することの難しさについて説明します。これを解決するために、50,000の600m x 600mサイズのアメリカ本土のグローバル航空写真で構成される大規模な3D航空データセットAerial-Earth3Dを提示します。このデータセットには、マルチビュー画像、奥行きマップ、法線、セマンティックセグメンテーション、カメラの位置情報が含まれ、品質管理を通じて地形の多様性を保証します。これに基づいて、論文は、希少分離潜在拡散を用いた大規模な3D地球生成のためのEarthCrafterフレームワークを提案します。 EarthCrafterは、構造とテクスチャ生成を分離し、高解像度の幾何学的なボクセルと2Dガウススプラット(2DGS)を圧縮された潜在空間に変換するデュアルレア3D-VAEを使用して計算コストを削減します。さらに、意味、画像、またはその両方を組み合わせた入力で訓練された条件認識フローマッチングモデルを使用して、潜在的なジオメトリとテクスチャの特徴を独立して柔軟にモデル化します。実験の結果、EarthCrafterは大規模な生成から優れたパフォーマンスを発揮し、セマンティック誘導都市レイアウトの作成から無条件の地形合成まで、さまざまなアプリケーションをサポートしています。